Documentos de Académico
Documentos de Profesional
Documentos de Cultura
E08 Muestreo Irrestricto R01
E08 Muestreo Irrestricto R01
ISBN 978-9968-9634-3-5.
© Manuel Pontigo Alvarado.
2
1 n 1 1 n
x xi ( x1 x2 ... xn ) s2 (x i x ) 2
n i 1 n n 1 i 1
Las cantidades x y s valor medio muestral y varianza muestral se llaman
2
intervalo.
Estos números se dividen por n para obtener las frecuencias relativas
cuya suma es 1 o 100%. Que se grafican para obtener un figuras llamadas
Histograma y Polígono de Frecuencias.
10
Regresa
11
Objetivo primario:
Explorar a las familias de niños recién nacidos en un Hospital de la Seguridad
Social en una cabecera de provincia de Costa Rica en las variables: Peso al
nacimiento, Talla, Sexo, Nivel de Ingresos, Hábitos Higiénicos, Hábitos
Nutricionales.
Objetivos secundarios:
Caracterizar la población de niños recién nacidos en un Hospital de la Seguridad
Social en una cabecera de provincia de Costa Rica.
Población:
Los niños unitocos recién nacidos desde el 1 de enero hasta el 31 de diciembre de
un año específico.
Probabilidad del muestreo:
Confiabilidad de 99% con un nivel de precisión de 2,5% sobre el promedio de
peso.
14
z2 s2 2,5758 2 0,2886
n n 266
d 2
3,3915 0,025 2
x i
1 0 0 ... 0 1
px I 01
0,511
266 266
Para Nivel Económico 1 pNE1 =0,188 o 18,8%. Los estimadores derivados de la
varianza deberán considerarse aproximados.
Estadístico 0=Ma/1=fe Centímetros Kilogramos N.E. 1 N.E. 2 N. E. 3 N.E. 4 HH. 1 HH. 2 HH. 3 NN. 1 NN.2 NN.3
Media 0,511 53,060 3,448 0,188 0,305 0,312 0,195 0,113 0,718 0,169 0,331 0,470 0,199
Error típico 0,031 0,095 0,033 0,024 0,028 0,028 0,024 0,019 0,028 0,023 0,029 0,031 0,025
Mediana 1,000 53,000 3,441 0,000 0,000 0,000 0,000 0,000 1,000 0,000 0,000 0,000 0,000
Moda 1,000 52,000 3,344 0,000 0,000 0,000 0,000 0,000 1,000 0,000 0,000 0,000 0,000
Desviación estándar 0,501 1,548 0,539 0,391 0,461 0,464 0,397 0,317 0,451 0,376 0,471 0,500 0,400
Varianza de la muestra 0,251 2,396 0,291 0,153 0,213 0,215 0,158 0,100 0,203 0,141 0,222 0,250 0,160
Curtosis -2,013 -0,846 0,388 0,585 -1,280 -1,344 0,388 4,093 -1,058 1,159 -1,488 -2,000 0,296
Coeficiente de asimetría -0,045 0,077 -0,086 1,606 0,854 0,816 1,544 2,462 -0,975 1,775 0,723 0,121 1,514
Rango 1 6 2,777 1 1 1 1 1 1 1 1 1 1
Mínimo 0 50 2,085 0 0 0 0 0 0 0 0 0 0
Máximo 1 56 4,862 1 1 1 1 1 1 1 1 1 1
Suma 136 14114 917,206 50 81 83 52 30 191 45 88 125 53
Cuenta 266 266 266 266 266 266 266 266 266 266 266 266 266
21
25,0
El Histograma de
Frecuencias es una forma 20,0
Frecuencia Relativa %
práctica de observar 15,0
Peso en Kilos
campana de Gaus.
El coeficiente de curtosis 0,3883 indica una curva ligeramente
achatada y el coeficiente de asimetría de –0,0858 una cola
izquierda ligeramente más larga, siempre con respecto a una
Distribución Normal sin que las diferencias sean significantes.
22
Las sociólogas del estudio quieren probar que los niños de menor
peso al nacer provienen de familias de pocas ventajas sociales.
Para esto, necesitan conocer el peso que separe al 25% de los pesos
más ligeros.
Se puede proceder de dos formas:
•Determinando el valor que separa al primer cuarto o 25% de
los datos o primer cuartil;
•Utilizando la distribución Normal Estándar separar el 25%
mediante probabilidades.
Para este segundo caso, es insoslayable que la distribución de los
pesos al nacimiento sea normal puesto que se hará inferencia
sobre datos particulares. Por tanto, es necesario hacer una prueba
que asegure que la aproximación mediante la Distribución Normal
Estándar es posible.
23
Probabilidades
ambas distribuciones 0,60
acumulativas. 0,40
O solicitándolos a la HE mediante:
1,3626 s 1,3626 s
Pr x25% z X 25 % x25% z 1 α
n n
1,3626 0,5346 1,3626 0,5346
Pr 3,090 1,96 X 3,090 1,96 0,95
266 266
Pr 3,002 X 25% 3,178 95%
Porcentaje
como variables continuas, máxime 15,0
¿El nivel económico no tiene relación con la talla de los Bebés? Ho; T1
= T2 = T3 = T4.
¿El nivel económico no tiene relación con la talla de los Bebés? Ho; P1
= P2 = P3 = P4.
χ 241 i
i 1 fei 66,5 66,5
83 66,5 0,5 2
52 66,5 0,5 2
13,5940
66,5 66,5
Para obtener una visione más precisa sobre las relaciones que guardan
entre sí las variables de tipo cualitativo, se acostumbra ir condensando la
información en Cuadros de Orden Inferior hasta llegar a Cuadros de Dos
Entradas.
En este ejemplo con tres variables el nivel subsecuente es la combinación de
dos variables resultando en los siguientes Cuadros de Resultados.
Nivel Económico con Hábitos Higiénicos;
Nivel Económico con Hábitos Nutricionales;
Y Hábitos Higiénicos con Hábitos Nutricionales.
Habrá notado que se usan para los mismos cuadros los nombres de Tablas
de n Entradas y Cuadros de Resultados. Tablas de n Entradas se refiere al
proceso de acomodar los datos en una forma determinada y Cuadros de
Resultados a la presentación de los resultados en respuesta a hipótesis del
estudio
39
20% 19%
Eficiente
Suficiente
En ocasiones, el comportamiento
Nivel con Hábitos Nutricionales % de los niveles de una variable
presenta magnitud y tendencias
20,00
diferentes en presencia de los
15,00
niveles de otras variables. Esta
10,00 condición se conoce como
5,00 Interacción, fenómeno que
0,00 Eficiente
Suficiente
muchas veces interesa a los
Bajo
Medio
Bajo Medio
Deficiente
H.Nutricionales
investigadores y puede ser
Nivel Económ ico
Alto Alto
valorado mediante pruebas de 2
en tablas de contingencia, como
se verá más adelante.
41
h c
χ (2h1)( c 1)
foij feij 0,5 2
ni . n. j
En donde: feij
n..
El total par hileras es ni.; el total para columnas es n.j; y el total general es n...
La prueba se valora con (c – 1)(h – 1) grados de libertad
Ho; ¿Los Hábitos Higiénicos son Independientes 43
Porcentajes
Medio Bajo 8 60 13 81 15,0
Esperados 9,1 58,2 13,7
X² parciales 0,0442 0,0308 0,0030 0,0780 10,0
Medio Alto 11 59 13 83
5,0
Esperados 9,4 59,6 14,0
X² parciales 0,1386 0,0002 0,0209 0,1596 0,0
Alto 8 32 12 52 Bajo Medio Bajo Medio Alto Alto
Esperados 5,9 37,3 8,8
X² parciales 0,4560 0,6270 0,8305 1,9135 Nivel Econónico
S. H. Higiénicos 30 191 45 266
Suma Chi-cuadradas parciales 3,4317 Deficiente Suficiente Eficiente
Probablida de la chi-cuadrada 0,7530
Porcenajes
Medio Bajo
Esperado 23,4 38,1 19,5 25,00
Chi-parcial 1,5624 0,3337 0,2029 2,0990 20,00
Medio Alto 16 43 24 83 15,00
Esperado 24,0 39,0 20,0 10,00
Chi-parcial 2,3576 0,3134 0,6240 3,2950 5,00
Alto 16 25 11 52 0,00
Esperado 15,1 24,4 12,5 N. Def. N. Suf. N. Efi.
Chi-parcial 0,0133 0,0002 0,0817 0,0952
Hábitos Nutricionales
S. H. Nutricionales 77 125 64 266
Suma de chi-parciales 5,4125
H. Def. H. Suf. H. Efi.
Probabilidad de la prueba 0,0000
Porcenajes
Suficiente 58 93 40 191 25,00
55,2895 89,7556 45,9549 20,00
0,0884 0,0839 0,6475 0,8198
15,00
Eficiente 0 32 13 45
10,00
13,0263 21,1466 10,8271
5,00
12,0455 5,0690 0,2585 17,3730
0,00
S. H. Nutricionales 77 125 64 266
N. Def. N. Suf. N. Efi.
Suma de chi-parciales 43,8954
Probabilidad de la prueba 0,0000 Hábitos Nutricionales
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,8871
Coeficiente de determinación R^2 0,7869
R^2 ajustado 0,7836
Error típico 0,2507
Observaciones 266
ANÁLISIS DE VARIANZA
Fuente de Grados de Suma de Promedio de Estadístico Probabilida Valores Críticos
La variación Libertad Cuadrados Cuadrados F F 0,05 0,01
Regresión 4 60,5786 15,1446 240,8962 0,0000 2,4062 3,3918
Residuos 261 16,4085 0,0629
Total 265 76,9871
yˆ i 2,2176 0,0189( N i )
Esto es, cada aumento de una unidad en el nivel económico se refleja
en 0,0189 kilos de peso del recién nacido.
Las variables restantes no influyen en el peso o su influencia ha sido
absorbida por el Nivel Económico.
49
Muestreo Sistemático.
0,3218
50
N c.v i 2,6950
ni nT E i ; para el estrato N1 : n1 56 18
18,9250
N i c.v i
i 1
Elección de la muestra.
El estudiante habrá comprendido que en esta técnica de muestreo
es necesario contar con un listado que identifique a la unidad
muestral y el estrato al que pertenece.
n 10 3 4 2 2 2 960
Muestras. Con una etapa que no se hace al azar.
59
Muestreo de Razón y Regresión
Este tipo de muestreo se aplica a variables que están relacionadas sea de
manera casual o de manera causal. El objetivo es, fundamentalmente, reducir
el costo del muestreo utilizando, nuevamente, la propiedad de eficiencia
estadística de los estimadores.
Esto quiere decir que vuelve a entrar en juego la técnica del Análisis de la
varianza en la modalidad de regresión.
Únicamente como ejemplo, suponiendo que se utiliza la relación del nivel
económico con el peso de la diapositiva 8,47 para obtener una muestra. La
varianza o cuadrado medio del error para el peso del los bebés fue entonces, el
tamaño de muestra sería:
z 2 S E2 2,5758 2 0,0629
n 2 57
d 0,086 2
Cantidad muy parecida a la que se obtendría del muestreo estratificado.
Cuando se analiza un factor como es el caso, el ANDEVA y la regresión
suelen ser idénticos. La diferencia se debe a la concurrencia de más factores en
la regresión múltiple.
Tamaño de muestra para variables cuantitativas 60
Proporción p 0,500
Tamaño de la población 0
Nivel de Confianza
1,0% 2,0% 3,0% 4,0% 5,0% 6,0% 7,0% 8,0% 9,0% 10,0%
Precisión -2,576 -2,326 -2,170 -2,054 -1,960 -1,881 -1,812 -1,751 -1,695 -1,645
0,5% 265.396 216.476 188.372 168.716 153.659 141.496 131.321 122.597 114.975 108.222
1,0% 66.349 54.119 47.093 42.179 38.415 35.374 32.831 30.650 28.744 27.056
1,5% 29.489 24.053 20.931 18.747 17.074 15.722 14.592 13.622 12.775 12.025
2,0% 16.588 13.530 11.774 10.545 9.604 8.844 8.208 7.663 7.186 6.764
2,5% 10.616 8.660 7.535 6.749 6.147 5.660 5.253 4.904 4.599 4.329
3,0% 7.373 6.014 5.233 4.687 4.269 3.931 3.648 3.406 3.194 3.007
3,5% 5.417 4.418 3.845 3.444 3.136 2.888 2.681 2.502 2.347 2.209
4,0% 4.147 3.383 2.944 2.637 2.401 2.211 2.052 1.916 1.797 1.691
4,5% 3.277 2.673 2.326 2.083 1.898 1.747 1.622 1.514 1.420 1.337
5,0% 2.654 2.165 1.884 1.688 1.537 1.415 1.314 1.226 1.150 1.083
5,5% 2.194 1.790 1.557 1.395 1.270 1.170 1.086 1.014 951 895
6,0% 1.844 1.504 1.309 1.172 1.068 983 912 852 799 752
6,5% 1.571 1.281 1.115 999 910 838 778 726 681 641
7,0% 1.355 1.105 962 861 784 722 671 626 587 553
7,5% 1.180 963 838 750 683 629 584 545 511 481
8,0% 1.037 846 736 660 601 553 513 479 450 423
8,5% 919 750 652 584 532 490 455 425 398 375
9,0% 820 669 582 521 475 437 406 379 355 335
9,5% 736 600 522 468 426 392 364 340 319 300
10,0% 664 542 471 422 385 354 329 307 288 271
62