Documentos de Académico
Documentos de Profesional
Documentos de Cultura
μ 170 cm.
σ 12 cm.
normal
2
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
6
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
X Supongamos que se desea averiguar el área
correspondiente al puntaje z=2,133.
Si la tabla que disponemos es como la que se incluye, solo tenemos las
áreas para 2,13 y para 2,14.
z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0 0,000000 0,003989 0,007978 0,011967 0,015953 0,019939 0,023922 0,027903 0,031881 0,035856
0,1 0,039828 0,043795 0,047758 0,051717 0,055670 0,059618 0,063559 0,067495 0,071424 0,075345
------ ------ ------ ------ ------ ------ ------ ------ ------ ------ ------
1,6 0,445201 0,446301 0,447384 0,448449 0,449497 0,450529 0,451543 0,452540 0,453521 0,454486
1,7 0,455435 0,456367 0,457284 0,458185 0,459071 0,459941 0,460796 0,461636 0,462462 0,463273
1,8 0,464070 0,464852 0,465621 0,466375 0,467116 0,467843 0,468557 0,469258 0,469946 0,470621
1,9 0,471284 0,471933 0,472571 0,473197 0,473810 0,474412 0,475002 0,475581 0,476148 0,476705
2 0,477250 0,477784 0,478308 0,478822 0,479325 0,479818 0,480301 0,480774 0,481237 0,481691
2,1 0,482136 0,482571 0,482997 0,483414 0,483823 0,484222 0,484614 0,484997 0,485371 0,485738
2,2 0,486097 0,486447 0,486791 0,487126 0,487455 0,487776 0,488089 0,488396 0,488696 0,488989
2,3 0,489276 0,489556 0,489830 0,490097 0,490358 0,490613 0,490863 0,491106 0,491344 0,491576
2,4 0,491802 0,492024 0,492240 0,492451 0,492656 0,492857 0,493053 0,493244 0,493431 0,493613
2,5 0,493790 0,493963 0,494132 0,494297 0,494457 0,494614 0,494766 0,494915 0,495060 0,495201
2,6 0,495339 0,495473 0,495603 0,495731 0,495855 0,495975 0,496093 0,496207 0,496319 0,496427
2,7 0,496533 0,496636 0,496736 0,496833 0,496928 0,497020 0,497110 0,497197 0,497282 0,497365
2,8 0,497445 0,497523 0,497599 0,497673 0,497744 0,497814 0,497882 0,497948 0,498012 0,498074
2,9 0,498134 0,498193 0,498250 0,498305 0,498359 0,498411 0,498462 0,498511 0,498559 0,498605
------ ------ ------ ------ ------ ------ ------ ------ ------ ------ ------
5 0,500000 0,500000 0,500000 0,500000 0,500000 0,500000 0,500000 0,500000 0,500000 0,500000
7
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
X Puede suceder que el puntaje z SI figure en la tabla pero,
extrañamente, queremos una mayor precisión. Como ejemplo, el
área en tabla para z=1,65 es 0,450529 pero la exacta es
0,45052854906359.
Muchas planillas de cálculo y algunos programas de procesamiento
nos brindan el área para cualquier valor de z con precisión. En la
planilla de cálculo más difundida, el «Excel» de Microsoft, la función
=DISTR.NORM.ESTAND(#) (donde # es el puntaje z) nos brinda la
distribución normal estándar acumulada para el z indicado.
Entonces =DISTR.NORM.ESTAND(#)-0,5 nos da la proporción para
un solo lado de la media, para una sola cola.
Si escribimos Si escribimos
=DISTR.NORM.ESTAND(2) =DISTR.NORM.ESTAND(2)-0,5
el resultado es 0,977249937963813 el resultado es 0,477249937963813 8
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
X
A la inversa, también podemos averiguar que puntaje z corresponde
a determinada proporción usando la función del «Excel»
=DISTR.NORM.INV(# + 0,5;0;1) (donde # = proporción). Si queremos
averiguar el puntaje z para la proporción 0,475 escribimos
=DISTR.NORM.INV(0,475 + 0,5;0;1) lo que nos da, redondeando a
dos decimales, un z de 1,96.
Media aritmética μx μ μp P
σ 2
PQ
Varianza σ 2x σ 2
p
n n
σ2 PQ
Error estándar σx σp
n n
Puede ser tratada como Puede ser tratada como
Forma normal si n ≥ 30, normal si n ≥ 30,
incluso para poblaciones incluso para poblaciones
no normales no normales, y si np ≥ 5
y nq ≥ 5
10
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
Y si MASSR...
medias proporciones
Media aritmética μx μ μp P
σ Nn 2
PQ N n
Varianza σ 2
σ 2
p
x
n N 1 n N 1
σ2 N n PQ N n
Error estándar σx σp
n N 1 n N 1
Puede ser tratada como Puede ser tratada como
Forma normal si n ≥ 30, normal si n ≥ 30,
incluso para poblaciones no incluso para poblaciones no
normales normales, y si np>5 y nq>5
Si n > 1, entonces
Nn < 1 varianza MASsr < varianza MAScr
N 1
Pero, en la medida que N se distancia de n, N n puede ser irrelevante
N 1 11
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
σ x 7,5 cm.
μ? Media población
Error estándar
σ 2 2475 cm 2
Varianza población
σ2 2475 cm 2
Error estándar
σx 56,25 cm 2 7,5cm
44 44
12
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
14
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
Sabiendo esto (que 95,45% de todas las muestras posibles de 44 años tienen
medias que no se alejan en ± 15 años de la media de la población), si
extraemos una muestra de 44 casos con media = 67 cm., y si a la media de la
muestra le restamos 15 cm. y le sumamos 15 cm. tendremos dos valores...
a x error 67 15 52
b x error 67 15 82
donde
a: valor inferior del intervalo de confianza
b: valor superior del intervalo de confianza
...que nos permiten afirmar, con una confianza de 95,45% que la media de la
población se halla entre 52 cm. y 82 cm.
...y si la muestra nos arroja una media de 74 cm., la conclusión será que la
media de la población está entre 59 cm. y 89 cm., con la misma confianza.
15
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
Conozcamos ahora la media de esta
distribución muestral de medias (y de la
población). Es 70 cm.
...la línea roja grafica el
intervalo construido con
la muestra de media=67
cm. que nos permitió
afirmar que la media
poblacional es un valor
que se halla entre 52 cm.
y 82 cm. Como vemos,
46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 91 94 este intervalo incluye a la
media poblacional
...la línea azul grafica el intervalo construido con la muestra de media=74 cm.
con la que afirmamos que la media poblacional es un valor que se halla entre
59 cm. y 89 cm. Este intervalo también incluye a la media poblacional.
...pero también, aunque muy poco probable, podríamos haber extraído una
muestra con media=86 cm. (línea verde) y entonces nuestra afirmación sería
que la media poblacional está entre 71 cm. y 101 cm. Si bien este intervalo no
incluye a la media poblacional, la conclusión NO es incorrecta...
...siempre y cuando acompañemos al intervalo con su confianza
correspondiente. 16
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
Estimación
Procedimiento para la inferencia de valores
poblacionales a partir de valores muestrales
Estimador
Un estimador es una función, una regla o fórmula algebraica
usada para estimar un parámetro. Contiene variables aleatorias
y puede tener también constantes conocidas
Estimador
SI NO
SI SI
θ
NO NO
NO SI
19
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
Estimador
Principales cualidades desesables de un estimador
insesgado
Un estimador es insesgado cuando la media de su distribución
muestral es igual al parámetro poblacional, lo que puede
expresarse como...
μ θ̂ θ Parámetro
Media de la distribución muestral del estimador
Sabemos que...
μx μ x μ̂ insesgado
entonces
μp P p P̂ insesgado
eficiente Un estimador es eficiente cuando la
dispersión de su distribución muestral es
2
σ θ̂
baja pequeña.
20
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
Estimador
Principales cualidades desesables de un estimador
eficiente
Como ejemplo, en algunas (pocas) situaciones el promedio de la
distribución muestral de medianas es igual a la media aritmética de la
población (md=). Lo que implica que, en estos casos, la mediana
muestral es un estimador insesgado de la media poblacional. Sin
embargo, la distribución de medianas muestrales tiene una variabilidad
mayor que la distribución de medias, por lo que no es aconsejable
utilizarla como estimador de al disponer de otro estimador más eficiente,
un estimador con menor varianza: la media muestral.
Distribuciones muestrales de
medianas y medias
μ md μ
obtenidas de un mismo μx μ
espacio muestral
σ 2md σ 2x
21
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
Estimador
Principales cualidades desesables de un estimador
x μ̂ insesgado x μ
aunque no implica que
p P̂ insesgado pP
22
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
90%
45% 45%
Z= - 1,645 Z= 1,645
¿Pero, a cuanto equivale z=1,645 en cm.?
Si 1 error estándar es 7,5 cm. entonces
z 1,645 = 7,5 cm. x 1,645 = 12,34 cm.
90%
45% 45%
- 12,34 cm + 12,34 cm
Ahora sabemos que 45% de todas las muestras posibles de n=44 tiene una media
igual o menor a la media poblacional, sin alejarse en más de 12,34 cm.
Y que otro 45% tiene una media igual o mayor a la media poblacional sin alejarse
en más de 12,34 cm.
Es decir, 90% de todas las muestras posibles tiene medias que están a una
distancia máxima de 12,34 cm. de la media poblacional (la que se desconoce).
24
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
90%
45% 45%
- 12,34 cm + 12,34 cm
Entonces, si nuestra muestra pertence a ese 90% de muestras con medias que
están a una distancia máxima de 12,34 cm. de la media poblacional, bastará con
restar y sumar a la media muestral 12,34 cm. para obtener dos valores entre los
cuales estimamos que está la media poblacional.
66 cm. 12,34 cm. 53,66 cm.
66 cm. 12,34 cm. 78,34 cm.
La media poblacional es un valor que se halla entre 53,66 cm. y 78.34 cm., pero
esta es una conclusión incorrecta o, al menos, incompleta.
Porque también es posible que nuestra muestra no pertenezca a ese 90% y, por lo
tanto, su media esté a una distancia aún mayor de la media poblacional. Por ese
motivo la estimación mediante intervalos siempre debe estar acompañada por la
confianza (la probabilidad de que lo que se afirma sea cierto).
Conclusión correcta: con una confianza de 90%, la media poblacional es un valor
que se halla entre 53,66 cm. y 78,34 cm.
25
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
IC θ, k θ̂ z k/2 σ θ̂
IC θ, k θ̂ z k/2 σ θ̂
δ error de estimación
θ = parámetro
k = confianza
28
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
No nos queda otra que realizar una estimación del error estándar a
partir de los datos de nuestra muestra.
30
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
X
EDAD SEXO
Partamos de esta 1 V
población. 2 V
3 V
4 M
varianza 5 M cuasivarianza
32
varianza cuasivarianza
X
σ2 2 edad edad S 2 2,5
Población
P.Q 0,24 sexo sexo S2 0,3
Media aritmética de distribuciones de varianzas muestrales (edad)
MAScr MASsr
n=2 n=3 n=4 n=2 n=3 n=4
v 1 1,333 1,5 1,25 1,667 1,875
Media aritmética de distribuciones de varianzas muestrales (p varones)
MAScr MASsr
n=2 n=3 n=4 n=2 n=3 n=4
v 0.12 0.16 0.18 0.15 0,2 0,225
Media aritmética de distribuciones de cuasivarianzas muestrales (edad)
MAScr MASsr
n=2 n=3 n=4 n=2 n=3 n=4
cuasivarianzas 2 2 2 2,5 2,5 2,5
Media aritmética de distribuciones de cuasivarianzas muestrales (p varones)
MAScr MASsr
n=2 n=3 n=4 n=2 n=3 n=4
cuasivarianzas 0.24 0.24 0.24 0,3 0,3 0,3
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
SUMA DE DESVIOS O
ERRORES CUADRADOS
ó varianza ó cuasivarianza
N n N 1 n 1
varianza N
cuasivarianza
N 1
cuasivarianza ( N - 1)
varianza
N
34
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
Si MASCR
El estimador insesgado de la pqn
varianza poblacional es la
ˆ s
2 2
PQ
cuasivarianza muestral.
n 1
Si MASSR
Sˆ s
2 2 El estimador insesgado de la cuasivarianza
poblacional es la cuasivarianza muestral
cuasivarianza ( N - 1)
y como... varianza
N
Podemos estimar de manera insesgada la varianza poblacional
multiplicando la cuasivarianza muestral por la cantidad de elementos de
la población menos uno y luego dividiéndola por la cantidad de
elementos de la población. Entonces...
Estimador insesgado de la varianza poblacional
N 1 pqn N 1
ˆ s
2 2
PQ
N n 1 N
35
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
s
ˆ 2 2
estimador
MASSR
s2 N n s2
ˆ x (1 f ) Donde f=n/N
n N n 37
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
pqn N 1
n 1 N N n pqn N 1 N n
ˆ p ˆ p
n N 1 n 1 Nn N 1
pq N n Nn n
ˆ p donde 1 f 1
n 1 N n N
39
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
Error
MASC
estánda MASSR
R
r
2 2
ˆ x s s
(1 f )
n n
pq pq
ˆ p 1 f
n 1 n 1
N n
f n/ N 1 f
N
40
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
IC μ, k x z k/2 σ̂ x
2
σ̂ x s
n
IC P, k x z k/2 σ̂ p σ̂ p pq
n -1
IC P, 0.955 0,40 2 pq
n -1
0,40 2 0,24 0,4 2 0,05193 0,4 0,10386
89
Con una confianza de 95,5% podemos afirmar
0,4-0,10386=0,29614 que la proporción de personas con baja
0,4+0,10386=0,50386 instrucción en la población es un valor que se
halla entre 0,296 (29,6%) y 0,504 (50,4%).
42
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
En lugar de usar...
σ̂ x pq
n -1
IC P, k x z k/2 σ̂ p
σ̂ x pq 1 f
Se usa... n -1
n Nn
1 f 1
N N
43
Facultad de Ciencias Sociales - Carrera de Sociología
Materia: Muestreo Aplicado a Ciencias Sociales
44
Final