Está en la página 1de 45

Estimación

PARA UNA MEJOR COMPRENSION SE


RECOMIENDA VER ESTE ARCHIVO EN MODO
“PRESENTACION” DE PowerPoint

Aunque adaptado, el archivo está diseñado para


acompañar el dictado de las clases. Por sí solo
puede no resultar suficientemente claro.

Las hojas señaladas con una equis


X dentro un círculo pueden ser pasadas
por alto en una primera lectura
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

Antes, un poco de ejercitación sobre la curva normal

Tenemos una población entre 31 y 35 años


con media de estatura 170 cm., desvío
estándar 12 cm. y distribución normal

μ  170 cm.
σ  12 cm.
normal

2
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

μ  170 cm. ¿Qué proporción de personas tienen entre


188 cm. y 200 cm. de altura?
σ  12 cm. 1) Tenemos que averiguar la distancia que hay, en desvíos
estándar, entre 200 cm. y la media. Es decir, el puntaje z (*).
normal La distancia en cm. es 200–170=30 cm. Si el desvío
estándar es 12 cm., la distancia en desvíos estándar es
30 cm. / 12 cm. = 2,5, es decir z=2,5.
¿Cuál es el área (proporción de casos) que hay entre la media y z=2,5?
Observando la tabla de áreas bajo la curva normal sabemos que para z=2,5 la
proporción es 0,49379.
2) Ahora tenemos que averiguar lo mismo para 188 cm.
La distancia en desvíos estándar a la media es 18 cm. / 12 cm. = 1,5, es decir
z=1,5, y para este z el área es 0,433193.
3) Como el puntaje z implica distancias con relación a la
media, al área que corresponde a z=2,5 le restamos el
área de z=1,5, es decir 0,49379 – 0,43319 = 0,0606.
0,49379 La proporción de personas que tienen
0,43319 entre 188 cm. y 200 cm. de altura es
0,0606 0,0606 (6,06%)
(*) recordando que el puntaje z es la distancia
entre un valor y la media de la distribución en
unidades de desvío estándar.
x μ
z
188 cm. 200 cm. σ
z=1,5 z=2,5 3
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

μ  170 cm. ¿Qué proporción de personas tienen entre


164 cm. y 182 cm. de altura?
σ  12 cm. 1) Tenemos que averiguar la distancia que hay, en desvíos
estándar, entre 182 cm. y la media (puntaje z).
normal La distancia en cm. es 12. Si el desvío estándar es 12 cm., la
distancia en desvíos estándar es = 1, es decir z=1.
¿Cuál es el área (proporción de casos) que hay entre la media y z=1?
Observando la tabla de áreas bajo la curva normal sabemos que para z=1 la
proporción es 0,34134.
2) Ahora tenemos que averiguar lo mismo para 164 cm.
La distancia a la media es –6 cm. En desvíos estándar es -6 cm. / 12 cm. = -0,5,
es decir z=-0,5, y para este z el área es 0,19146.
3) Como son áreas que están a lados distintos de
0,19146 la media hay que sumarlas, lo que da...
0,34134 + 0,19146 = 0,5328.
0,34134
En tanto la curva normal es simétrica, a los
efectos de la magnitud de las áreas es
0,5328 indiferente que el puntaje z sea negativo o
positivo.

La proporción de personas que tienen


entre 164 cm. y 182 cm. de altura es
164 cm. 182 cm. 0,5328 (53,28%)
z=-0,5 z=1 4
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

μ  170 cm. ¿Qué proporción de personas tienen entre


146 cm. y 194 cm. de altura?
σ  12 cm. 1) Tenemos que averiguar la distancia que hay, en desvíos
estándar, entre 194 cm. y la media (puntaje z).
normal La distancia en cm. es 24. Si el desvío estándar es 12 cm. la
distancia en desvíos estándar es 2, es decir z=2.
¿Cuál es el área (proporción de casos) que hay entre la media y z=2?
Observando la tabla de áreas bajo la curva normal sabemos que para z=2 la
proporción es 0,47725.
2) Ahora tenemos que averiguar lo mismo para 146 cm.
La distancia a la media es –24 cm. En desvíos estándar, –24 cm/12 cm.=-2,
es decir z=-2, por lo que el área es la misma que para z=2.
3) Como son áreas que están a lados distintos de la media,
hay que sumarlas, lo que da 0,47725 + 0,47725 = 0,9545.

0,9545 En tanto la curva normal es simétrica, a los


efectos de la magnitud de las áreas es
indiferente que el puntaje z sea negativo o
0,47725 positivo. Es decir, el área que corresponde a
0,47725 z=2 es igual a la de z=_2

La proporción de personas que tienen


entre 146 cm. y 194 cm. de altura es
146 cm. 194 cm. 0,9545 (95,45%)
z=-2 z=2 5
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
X

La búsqueda en las tablas habituales de áreas bajo la curva normal


de la proporción que corresponde a un determinado puntaje z no es
el único mecanismo para averiguarla, ni tampoco el mejor cuando el
valor buscado no aparece en tabla, ya que la distancia entre dos
proporciones no es lineal y, por lo tanto, la interpolación no es
sencilla. Por otro lado las tablas presentan las proporciones
redondeadas a 5 o 6 decimales. Por lo general ello es más que
suficiente, pero a veces podemos desear una mayor precisión.

6
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
X Supongamos que se desea averiguar el área
correspondiente al puntaje z=2,133.
Si la tabla que disponemos es como la que se incluye, solo tenemos las
áreas para 2,13 y para 2,14.
z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0 0,000000 0,003989 0,007978 0,011967 0,015953 0,019939 0,023922 0,027903 0,031881 0,035856
0,1 0,039828 0,043795 0,047758 0,051717 0,055670 0,059618 0,063559 0,067495 0,071424 0,075345
------ ------ ------ ------ ------ ------ ------ ------ ------ ------ ------
1,6 0,445201 0,446301 0,447384 0,448449 0,449497 0,450529 0,451543 0,452540 0,453521 0,454486
1,7 0,455435 0,456367 0,457284 0,458185 0,459071 0,459941 0,460796 0,461636 0,462462 0,463273
1,8 0,464070 0,464852 0,465621 0,466375 0,467116 0,467843 0,468557 0,469258 0,469946 0,470621
1,9 0,471284 0,471933 0,472571 0,473197 0,473810 0,474412 0,475002 0,475581 0,476148 0,476705
2 0,477250 0,477784 0,478308 0,478822 0,479325 0,479818 0,480301 0,480774 0,481237 0,481691
2,1 0,482136 0,482571 0,482997 0,483414 0,483823 0,484222 0,484614 0,484997 0,485371 0,485738
2,2 0,486097 0,486447 0,486791 0,487126 0,487455 0,487776 0,488089 0,488396 0,488696 0,488989
2,3 0,489276 0,489556 0,489830 0,490097 0,490358 0,490613 0,490863 0,491106 0,491344 0,491576
2,4 0,491802 0,492024 0,492240 0,492451 0,492656 0,492857 0,493053 0,493244 0,493431 0,493613
2,5 0,493790 0,493963 0,494132 0,494297 0,494457 0,494614 0,494766 0,494915 0,495060 0,495201
2,6 0,495339 0,495473 0,495603 0,495731 0,495855 0,495975 0,496093 0,496207 0,496319 0,496427
2,7 0,496533 0,496636 0,496736 0,496833 0,496928 0,497020 0,497110 0,497197 0,497282 0,497365
2,8 0,497445 0,497523 0,497599 0,497673 0,497744 0,497814 0,497882 0,497948 0,498012 0,498074
2,9 0,498134 0,498193 0,498250 0,498305 0,498359 0,498411 0,498462 0,498511 0,498559 0,498605
------ ------ ------ ------ ------ ------ ------ ------ ------ ------ ------
5 0,500000 0,500000 0,500000 0,500000 0,500000 0,500000 0,500000 0,500000 0,500000 0,500000

Podríamos hacer una interpolación lineal a partir de las dos proporciones


que conocemos, lo que nos da 0,48355, pero en realidad el valor de la
proporción para z=2,133 es algo menor a 0,483538.

7
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
X Puede suceder que el puntaje z SI figure en la tabla pero,
extrañamente, queremos una mayor precisión. Como ejemplo, el
área en tabla para z=1,65 es 0,450529 pero la exacta es
0,45052854906359.
Muchas planillas de cálculo y algunos programas de procesamiento
nos brindan el área para cualquier valor de z con precisión. En la
planilla de cálculo más difundida, el «Excel» de Microsoft, la función
=DISTR.NORM.ESTAND(#) (donde # es el puntaje z) nos brinda la
distribución normal estándar acumulada para el z indicado.
Entonces =DISTR.NORM.ESTAND(#)-0,5 nos da la proporción para
un solo lado de la media, para una sola cola.

Si escribimos Si escribimos
=DISTR.NORM.ESTAND(2) =DISTR.NORM.ESTAND(2)-0,5
el resultado es 0,977249937963813 el resultado es 0,477249937963813 8
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
X
A la inversa, también podemos averiguar que puntaje z corresponde
a determinada proporción usando la función del «Excel»
=DISTR.NORM.INV(# + 0,5;0;1) (donde # = proporción). Si queremos
averiguar el puntaje z para la proporción 0,475 escribimos
=DISTR.NORM.INV(0,475 + 0,5;0;1) lo que nos da, redondeando a
dos decimales, un z de 1,96.

En la mayoría de los libros sobre estadística se incluyen tablas de


áreas bajo la curva normal y su uso, por lo general, es más que
suficiente. Pero emplear el «Excel» tiene 4 ventajas.

Trabajar con puntajes z no incluidos en las tablas.

Trabajar con proporciones no incluidas en las tablas.

Trabajar con precisión en los cálculos.

...y, lo que no es menor, comodidad. Por lo general solemos


tener más a mano el «Excel» que las tablas, y su consulta es
mucho más rápida.
9
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
Retomando lo visto sobre las relaciones entre las medidas
de las distribuciones muestrales y los parámetos, si
MASCR...
medias proporciones

Media aritmética μx  μ μp  P
σ 2
PQ
Varianza σ 2x  σ 2
p
n n
σ2 PQ
Error estándar σx  σp 
n n
Puede ser tratada como Puede ser tratada como
Forma normal si n ≥ 30, normal si n ≥ 30,
incluso para poblaciones incluso para poblaciones
no normales no normales, y si np ≥ 5
y nq ≥ 5

10
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

Y si MASSR...
medias proporciones

Media aritmética μx  μ μp  P
σ Nn 2
PQ N  n
Varianza σ 2
 σ 2
p 
x
n N 1 n N 1
σ2 N  n PQ N  n
Error estándar σx   σp  
n N 1 n N 1
Puede ser tratada como Puede ser tratada como
Forma normal si n ≥ 30, normal si n ≥ 30,
incluso para poblaciones no incluso para poblaciones no
normales normales, y si np>5 y nq>5
Si n > 1, entonces
Nn < 1 varianza MASsr < varianza MAScr
N 1

Pero, en la medida que N se distancia de n, N n puede ser irrelevante
N 1 11
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

n  30 Forma: normal ¿Qué podemos deducir sobre la distribución


muestral de medias (MASCR) que se
μx  ? Media distribución muestral obtendría, sabiendo que...?
n  44 Tamaño muestras

σ x  7,5 cm.
μ? Media población

Error estándar
σ 2  2475 cm 2
Varianza población

σ2 2475 cm 2
Error estándar

σx    56,25 cm 2  7,5cm
44 44
12
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

Normal Tenemos entonces una distribución muestral de


medias (MASCR) con muestras n=44 de la que
μx  ? conocemos su forma (normal) y su error estándar.
¿Qué proporción de muestras tienen medias que
σ x  7,5 cm. se alejan en no más o menos 15 cm. de la media
de la distribución?
Sabiendo que la distribución puede ser tratada
como normal, para conocer la proporción de
muestras que se hallan entre la media y las
distancias solicitadas (errores) debemos con-
vertir estas distancias en unidades de error
estándar (puntaje z).
Aunque no conocemos los valores
ni la media, si conocemos la x ¿¿¿¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿

magnitud del error (e=15 cm.) Distancia a la


media en cm. (e) -15 15
e - 15 cm. Distancia a la
z   2 media en errores
σ x 7,5 cm. estándar (z) -2 2
e 15 cm.
z  2
σ x 7,5 cm. 13
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

Acudiendo a la tabla de áreas bajo la curva


normal sabemos que entre la media z=2
(errores estándar) se halla el 47,7725% de las 95,45%
muestras.
47,7725% 47,7725%
Y como estamos ante z=2 por arriba de
la media y z=-2 por debajo, sumamos
las áreas...
¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿
... y la respuesta es que 95,45% Distancia a la
de las muestras de 44 casos media en cm. (e) -15 15
tienen medias que no se alejan Distancia a la
en más o en menos de 15 cm. media en errores -2 2
de la media de la distribución estándar (z)
muestral o, lo que es lo mismo,
de la media poblacional.

14
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

Sabiendo esto (que 95,45% de todas las muestras posibles de 44 años tienen
medias que no se alejan en ± 15 años de la media de la población), si
extraemos una muestra de 44 casos con media = 67 cm., y si a la media de la
muestra le restamos 15 cm. y le sumamos 15 cm. tendremos dos valores...

a  x  error  67  15  52
b  x  error  67  15  82
donde
a: valor inferior del intervalo de confianza
b: valor superior del intervalo de confianza

...que nos permiten afirmar, con una confianza de 95,45% que la media de la
población se halla entre 52 cm. y 82 cm.

...y si la muestra nos arroja una media de 74 cm., la conclusión será que la
media de la población está entre 59 cm. y 89 cm., con la misma confianza.

15
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
Conozcamos ahora la media de esta
distribución muestral de medias (y de la
población). Es 70 cm.
...la línea roja grafica el
intervalo construido con
la muestra de media=67
cm. que nos permitió
afirmar que la media
poblacional es un valor
que se halla entre 52 cm.
y 82 cm. Como vemos,
46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 91 94 este intervalo incluye a la
media poblacional

...la línea azul grafica el intervalo construido con la muestra de media=74 cm.
con la que afirmamos que la media poblacional es un valor que se halla entre
59 cm. y 89 cm. Este intervalo también incluye a la media poblacional.
...pero también, aunque muy poco probable, podríamos haber extraído una
muestra con media=86 cm. (línea verde) y entonces nuestra afirmación sería
que la media poblacional está entre 71 cm. y 101 cm. Si bien este intervalo no
incluye a la media poblacional, la conclusión NO es incorrecta...
...siempre y cuando acompañemos al intervalo con su confianza
correspondiente. 16
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

Estimación
Procedimiento para la inferencia de valores
poblacionales a partir de valores muestrales

Se estiman parámetros a partir de estadísticos

Puntual Por intervalos

Se considera el valor Ubica al parámetro


de la muestra dentro de un
razonablemente intervalo de valores
representativo del asociado a una
parámetro medida de
probabilidad
17
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

Estimador
Un estimador es una función, una regla o fórmula algebraica
usada para estimar un parámetro. Contiene variables aleatorias
y puede tener también constantes conocidas

theta o zeta mayúscula, es la notación general de


θ parámetro.

Si le agregamos un acento circunflejo es la notación general


θ̂ de estimador puntual.

Si a la notación de un parámetro le agregamos el acento


circunflejo, estamos hablando del estimador de ese parámetro.
Ejemplos:

μ̂ = estimador puntual de la media poblacional

P̂ = estimador puntual de la proporción poblacional


18
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

Estimador

arquero Sesgado Eficiente


(baja
dispersión)

SI NO

SI SI
θ
NO NO

NO SI

19
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

Estimador
Principales cualidades desesables de un estimador
insesgado
Un estimador es insesgado cuando la media de su distribución
muestral es igual al parámetro poblacional, lo que puede
expresarse como...
μ θ̂  θ Parámetro
Media de la distribución muestral del estimador
Sabemos que...
μx  μ x  μ̂ insesgado
entonces
μp  P p  P̂ insesgado
eficiente Un estimador es eficiente cuando la
dispersión de su distribución muestral es
2
σ θ̂
baja pequeña.
20
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

Estimador
Principales cualidades desesables de un estimador
eficiente
Como ejemplo, en algunas (pocas) situaciones el promedio de la
distribución muestral de medianas es igual a la media aritmética de la
población (md=). Lo que implica que, en estos casos, la mediana
muestral es un estimador insesgado de la media poblacional. Sin
embargo, la distribución de medianas muestrales tiene una variabilidad
mayor que la distribución de medias, por lo que no es aconsejable
utilizarla como estimador de  al disponer de otro estimador más eficiente,
un estimador con menor varianza: la media muestral.
Distribuciones muestrales de
medianas y medias
μ md  μ
obtenidas de un mismo μx  μ
espacio muestral
σ 2md  σ 2x

21
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

Estimador
Principales cualidades desesables de un estimador

Que un estimador sea insesgado y eficiente no implica que el


valor de una muestra cualquiera sea igual al parámetro. Es muy
probable que no lo sea pero, por ser insesgado y eficiente,
también es muy probable que esté razonablemente cercano al
mismo.

x  μ̂ insesgado x μ
aunque no implica que
p  P̂ insesgado pP

22
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

Volvamos un poco atrás, a la distribución muestral de medias (n44),


cuando todavía no conocíamos la media poblacional pero si el error
estándar (7,5 cm). Y supongamos que tenemos una muestra con
media de 66 cm. y deseamos realizar una estimación de la media
poblacional con una confianza del 90%.
Lo primero que vamos a hacer es averiguar el puntaje z que
corresponde a la mitad de la confianza deseada. Entonces k(confianza
en proporciones)/2=0,45 y buscamos en la tabla de áreas bajo la curva
normal, si lo tiene, el puntaje z de la proporción 0,45 lo que nos da
1,645.
Pero también lo podemos calcular en el «Excel» con la función
=DISTR.NORM.INV(# + 0,5;0;1) (donde #=proporción). Entonces, para
este caso, escribimos =DISTR.NORM.INV(0,45 + 0,5;0;1) lo que nos
da, redondeando a tres decimales, un z de 1,645.
Es decir, a 1,645 errores estándar para «abajo» de la media
encontramos al 45% de las muestras, y a 1,645 errores estándar para
«arriba» a otro 45%.
O sea, 90 % de las muestras no se alejan en menos o en más de 1,645
errores estándar de la media de la distribución muestral de medias o,
como sabemos, de la media de la población 23
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

90%

45% 45%

Z= - 1,645 Z= 1,645
¿Pero, a cuanto equivale z=1,645 en cm.?
Si 1 error estándar es 7,5 cm. entonces
z 1,645 = 7,5 cm. x 1,645 = 12,34 cm.

90%

45% 45%

- 12,34 cm + 12,34 cm

Ahora sabemos que 45% de todas las muestras posibles de n=44 tiene una media
igual o menor a la media poblacional, sin alejarse en más de 12,34 cm.
Y que otro 45% tiene una media igual o mayor a la media poblacional sin alejarse
en más de 12,34 cm.
Es decir, 90% de todas las muestras posibles tiene medias que están a una
distancia máxima de 12,34 cm. de la media poblacional (la que se desconoce).
24
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

90%

45% 45%

- 12,34 cm + 12,34 cm

Entonces, si nuestra muestra pertence a ese 90% de muestras con medias que
están a una distancia máxima de 12,34 cm. de la media poblacional, bastará con
restar y sumar a la media muestral 12,34 cm. para obtener dos valores entre los
cuales estimamos que está la media poblacional.
66 cm.  12,34 cm.  53,66 cm.
66 cm.  12,34 cm.  78,34 cm.
La media poblacional es un valor que se halla entre 53,66 cm. y 78.34 cm., pero
esta es una conclusión incorrecta o, al menos, incompleta.
Porque también es posible que nuestra muestra no pertenezca a ese 90% y, por lo
tanto, su media esté a una distancia aún mayor de la media poblacional. Por ese
motivo la estimación mediante intervalos siempre debe estar acompañada por la
confianza (la probabilidad de que lo que se afirma sea cierto).
Conclusión correcta: con una confianza de 90%, la media poblacional es un valor
que se halla entre 53,66 cm. y 78,34 cm.
25
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

¿Qué es lo que hemos estado haciendo?

1) Tomamos el estimador puntual de la media poblacional: la media muestral.


2) Multiplicamos el error estándar de la distribución muestral de medias por
el puntaje z que corresponde a la mitad de la confianza elegida. Este
producto es el error de estimación.
3) Y restamos y sumamos el error de estimación a la media muestral
obteniendo dos valores que son los límites del intervarlo de confianza.

IC μ, k  x  z k/ 2 .σx


δ  error de estimación
26
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

Llevemos esta fórmula a una notación general

IC μ, k  x  z k/ 2 .σx

IC θ, k  θ̂  z k/2  σ θ̂

Y tenemos la fórmula general de


estimación mediante intervalo de
confianza.
27
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

Fórmula general de estimación mediante IC


(IC: intervalo de confianza)

IC θ, k   θ̂  z  k/2  σ θ̂
δ  error de estimación

θ = parámetro

k = confianza

θ̂ = estimador puntual del parámetro

z  k/2  = área bajo la curva normal equivalente a la mitad


de la confianza deseada

σ θ̂ = error estándar del estadístico

28
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

Fórmula general de estimación mediante IC

IC θ, k   θ̂  z k/2  σθ̂


δ  error de estimación
3 son los datos que necesitamos para la estimación,
señalados en colores. Entonces...

Remplazamos θ̂ por el valor del estadístico de nuestra muestra.


z k/2  se calcula como vimos en páginas anteriores,
dependiendo de la confianza con la que deseamos hacer la
estimación.
El problema se nos presenta con el error estándar, ya que
desconocemos su magnitud.
29
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

En todos los ejercicios o ejemplos anteriores siempre tuvimos el dato


de la variabilidad o dispersión poblacional, ya sea la varianza, el
desvío estándar o el P.Q, y con ellos podíamos calcular el error
estándar.

El problema es que normalmente desconocemos esos datos.

No nos queda otra que realizar una estimación del error estándar a
partir de los datos de nuestra muestra.

Podríamos pensar que, así como sucede con la media o la


proporción, un estimador insesgado de la varianza poblacional es la
varianza muestral, pero no siempre un estadístico es el mejor
estimador de su propio parámetro, y esto sucede con la varianza de
la muestra, que es un estimador sesgado de la varianza poblacional.

30
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
X
EDAD SEXO
Partamos de esta 1 V
población. 2 V
3 V
4 M
varianza 5 M cuasivarianza

σ2  2 edad edad S 2  2,5


Población
P.Q  0,24 sexo sexo S2  0,3

A continuación, con MASCR contruimos 3 espacios muestrales, uno


con n=2, el siguiente con n=3 y finalmente otro con n=4. En cada uno
de ellos calculamos la varianza y la cuasivarianza de la edad de
cada muestra y a partir de ellas construimos 3 distribuciones
muestrales de varianzas y otras 3 de cuasivarianzas. Repetimos el
procedimiento para la proporción de varones (artificio binario).
Y luego hacemos lo mismo pero con MASSR.
31
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
X

En resumen, construimos 24 distribuciones muestrales.


MASCR MASSR
n=2 n=3 n=4 n=2 n=3 n=4
dm varianzas dm varianzas dm varianzas dm varianzas dm varianzas dm varianzas
edad edad edad edad edad edad
dm muestral dm muestral dm muestral dm muestral dm muestral dm muestral
varianzas p(v) varianzas p(v) varianzas p(v) varianzas p(v) varianzas p(v) varianzas p(v)
dm dm dm dm dm dm
cuasivarianzas cuasivarianzas cuasivarianzas cuasivarianzas cuasivarianzas cuasivarianzas
edad edad edad edad edad edad
dm muestral dm muestral dm muestral dm muestral dm muestral dm muestral
cuasivarianzas cuasivarianzas cuasivarianzas cuasivarianzas cuasivarianzas cuasivarianzas
p(v) p(v) p(v) p(v) p(v) p(v)

Veamos ahora sus medias aritméticas

32
varianza cuasivarianza
X
σ2  2 edad edad S 2  2,5
Población
P.Q  0,24 sexo sexo S2  0,3
Media aritmética de distribuciones de varianzas muestrales (edad)
MAScr MASsr
n=2 n=3 n=4 n=2 n=3 n=4
v 1 1,333 1,5 1,25 1,667 1,875
Media aritmética de distribuciones de varianzas muestrales (p varones)
MAScr MASsr
n=2 n=3 n=4 n=2 n=3 n=4
v 0.12 0.16 0.18 0.15 0,2 0,225
Media aritmética de distribuciones de cuasivarianzas muestrales (edad)
MAScr MASsr
n=2 n=3 n=4 n=2 n=3 n=4
cuasivarianzas 2 2 2 2,5 2,5 2,5
Media aritmética de distribuciones de cuasivarianzas muestrales (p varones)
MAScr MASsr
n=2 n=3 n=4 n=2 n=3 n=4
cuasivarianzas 0.24 0.24 0.24 0,3 0,3 0,3
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

SUMA DE DESVIOS O
ERRORES CUADRADOS

ó  varianza ó  cuasivarianza
N n N 1 n 1
varianza  N
 cuasivarianza
N 1

cuasivarianza  ( N - 1)
 varianza
N

34
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

Si MASCR
El estimador insesgado de la pqn
varianza poblacional es la
ˆ  s
2 2
PQ 
cuasivarianza muestral.
n 1
Si MASSR

Sˆ  s
2 2 El estimador insesgado de la cuasivarianza
poblacional es la cuasivarianza muestral
cuasivarianza  ( N - 1)
y como... varianza 
N
Podemos estimar de manera insesgada la varianza poblacional
multiplicando la cuasivarianza muestral por la cantidad de elementos de
la población menos uno y luego dividiéndola por la cantidad de
elementos de la población. Entonces...
Estimador insesgado de la varianza poblacional

N 1 pqn N  1
ˆ  s 
2 2
PQ  
N n 1 N
35
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

Estimación del error estándar dist. muestral de medias


MASCR

Relación error estándar


 2
desconocido
con valores poblacionales
x 
n

 s
ˆ 2 2
estimador

Remplazando la varianza poblacional por 2


s
ˆ x 
su estimador insesgado (cuasivarianza
muestral), obtenemos el estimador del
error estándar n
36
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

Estimación error estándar dist. muestral de medias

MASSR

Relación error estándar  N  n desconocido


2
con valores poblacionales x  
n N 1
estimador ˆ 
2 s 2
 N  1
N
s 2  N  1 s 2  N  1 N  n 
N N n N s2  N  n
ˆ x    
n N 1 n N  1 nN

s2 N  n s2
ˆ x     (1  f ) Donde f=n/N
n N n 37
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

Estimación error estándar dist. muestral de proporciones


MASCR
Relación error estándar
PQ desconocido
con valores poblacionales p 
n
pqn
estimador PQ 
n 1
Remplazando PQ por su estimación
insesgada, obtenemos el estimador del pqn
error estándar de la dist. muestral de
proporciones
ˆ p  n 1
pqn pq n
ˆ p  ˆ p 
( n  1)n n 1
38
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

Estimación error estándar dist. muestral de proporciones


MASSR
Relación error estándar PQ N  n
con valores poblacionales  p   desconocido
n N 1
pqn N  1
estimador PQ  
n 1 N
Remplazando PQ por su estimación insesgada

pqn  N  1
n  1 N N n pqn N  1 N  n 
ˆ p   ˆ p 
n N 1  n  1 Nn N  1
pq N  n Nn n
ˆ p   donde 1 f 1
n 1 N n N
39
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

Estimación error estándar

Error
MASC
estánda MASSR
R
r

2 2
ˆ x  s s
 (1  f )
n n
pq pq
ˆ p   1  f 
n 1 n 1
N n
f  n/ N 1  f  
N
40
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

Se cuenta con una muestra seleccionada mediante MASCR


cuyos estadísticos son:
n  45 x 35 años s  90 años
2 2

Se desea estimar la media poblacional de la edad mediante


intervalo y con una confianza de 95,5%

IC μ, k   x  z  k/2  σ̂ x
2
σ̂ x  s
n

IC P, 0.955 35  2


2
s  35  2 90 
n 45
 35  2 1,4142  35  2,8284
Con una confianza de 95,5% podemos afirmar
35-2,8284=32,1716
que la media de edad de la población es un
35+2,8284=37,8284
valor que se halla entre 32,1 años y 38,9 años.
El redondeo del valor inferior debe ser menor a su estimación y el del valor superior
debe ser mayor a su estimación.
41
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

Se cuenta con una muestra seleccionada mediante MASCR


cuyos estadísticos son:
n=90 personas instrucción baja=36 personas
Se desea estimar la proporción poblacional de personas con baja
instrucción, mediante intervalo y con una confianza de 95,5%

IC P, k   x  z  k/2  σ̂ p σ̂ p  pq
n -1
IC P, 0.955 0,40  2 pq 
n -1
0,40  2 0,24 0,4  2  0,05193 0,4  0,10386
89
Con una confianza de 95,5% podemos afirmar
0,4-0,10386=0,29614 que la proporción de personas con baja
0,4+0,10386=0,50386 instrucción en la población es un valor que se
halla entre 0,296 (29,6%) y 0,504 (50,4%).

42
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

Estimación de medias y proporciones con MASSR


El procedimiento es similar. Solo cambia la
estimación del error estándar
En lugar de usar... s 2
σ̂ x 
n
IC μ, k   x  z  k/2  σ̂ x
 1  f 
2
σ̂ x  s
Se usa... n

En lugar de usar...
σ̂ x  pq
n -1
IC P, k   x  z  k/2  σ̂ p
σ̂ x  pq  1  f 
Se usa... n -1
n Nn
1 f 1 
N N
43
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales

Estimación medias y proporciones con


MASCR y MASSR

fórmula general IC(, k)  θ̂  z k 2  σ̂ ˆ


Selección
Medida a estimar
MAScr MASsr
2 2
s s
Media aritmética IC(,k)= x  z k 2  x  z k 2  (1  f )
n n
p.q p.q
Proporción IC(P,k)= p  z k 2  p  z k 2  (1  f )
n -1 n -1

44
Final

También podría gustarte