Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ejercicio 1:
Se ha realizado un estudio para conocer los niveles de hemoglobina en una población
de niños, se realiza un estudio con una muestra de 400 niños y se halla una hemoglobina
promedio de 13 mg/dl y 1.8 de desviación estándar. ¿Cuál es el intervalo de confianza
de 95%?
SOLUCION
Datos:
Tamaño de la muestra: 400
Promedio de la muestra: 13 mg/dl
Desviación estándar: 1.8 mg/dl
CALCULO CON STATA
Recuerde:
Estadisticas / Sumarios, tablas, y test estadísticos / / Sumarios y estadísticas
descriptivas /Calculo de IC normal.
Con lo que se desplega la siguiente ventana: donde Hay que colocar los datos.
Página 1 de 16
Universidad Peruana Cayetano Heredia
Escuela de Postgrado Víctor Alzamora Castro
Unidad de Servicios Académicos
Estadística para la investigación
Con lo que se puede concluir que en base a un estudio de una muestra de 400 personas,
se tiene un promedio de Hemoglobina de 13 mg/dl e IC 95 % de 12.8 – 13.18).
Página 2 de 16
Universidad Peruana Cayetano Heredia
Escuela de Postgrado Víctor Alzamora Castro
Unidad de Servicios Académicos
Estadística para la investigación
Ejercicio 2:
Se ha realizado un estudio para conocer la prevalencia de parasitosis en una población
de niños, se realiza un estudio con una muestra de 100 niños y se halla que 30 tienen
parásitos. ¿Cuál es el intervalo de confianza de 95%?
SOLUCION
Datos:
Tamaño de la muestra: 100
Proporción de la muestra: 0.3 ( 30%) o 30 individuos
Obtiene luego:
Página 3 de 16
Universidad Peruana Cayetano Heredia
Escuela de Postgrado Víctor Alzamora Castro
Unidad de Servicios Académicos
Estadística para la investigación
Página 4 de 16
Universidad Peruana Cayetano Heredia
Escuela de Postgrado Víctor Alzamora Castro
Unidad de Servicios Académicos
Estadística para la investigación
Ejercicio 3:
1.- El nivel sérico del colesterol para la población general de varones entre 20 y 70 años de
edad, de los Estados Unidos de Norteamérica es aproximadamente normal con una media de
210 mg/dl. y una desviación estándar de 45 mg/dl. Se toma una muestra de 25 varones adultos
hipertensos y fumadores, al promediar el nivel de colesterol de esta muestra resulta en 230
mg/dl.
PROPOSITO DE LA INVESTIGACION
H0: no hay diferencia entre la media del colesterol de los adultos varones adultos de la
población y la media del colesterol de los adultos varones de los varones
adultos fumadores e hipertensos
H1: hay diferencia entre la media del colesterol de los adultos varones adultos de la
población y la media del colesterol de los adultos varones de los varones
adultos fumadores e hipertensos
Se está comparando la media del nivel sérico del colesterol para la población general de
varones entre 20 y 70 años de edad, de los Estados Unidos de Norteamérica que es
aproximadamente normal con una media de 210 mg/dl. y una desviación estándar de 45 mg/dl
contra la media de una muestra de 25 varones adultos fumadores e hipertensos. Se compara
la media de una población con parámetros conocidos (μ σ) y de distribución normal. Contra
una muestra. En situaciones como esta corresponde utilizar la prueba Z.
x
z
n
Página 5 de 16
Universidad Peruana Cayetano Heredia
Escuela de Postgrado Víctor Alzamora Castro
Unidad de Servicios Académicos
Estadística para la investigación
Para el ejemplo decidimos utilizar un alfa (α) de 0.05 o lo que sea equivalente al alfa de 0.05,
para el ejemplo dado que es una distribución del tipo normal la implicada, demos de tener en
cuenta, la siguiente figura:
x 230 210 20
z 2.22
45 9
n 25
5.- Obtener el Valor P y los intervalos de confianza
Para obtener el valor P, vamos a la tabla de la Prueba Z, y buscamos el área para el valor de z
=2.22, como podemos apreciar, e la tabla siguiente que para este valor de Z, le corresponde
Página 6 de 16
Universidad Peruana Cayetano Heredia
Escuela de Postgrado Víctor Alzamora Castro
Unidad de Servicios Académicos
Estadística para la investigación
IC 95% = X ± 1.96 * σ/√n = 230 ± 1.96 *45/√25 = 230 ± 1.96 * 9 = 230 ± 17.64 : 212.36 – 247.64
6.- La decisión
La prueba z=2.22, cae fuera del rango esperado para el alfa 0.05 (zona de rechazo), si
hubiera caído dentro del intervalo -1,96 a 1.96 no rechazaría.
El IC de confianza del IC para la media del Pueblo ( 89.1 - 98.4 ) , no incluye a 100 ( μ
de la población).
El valor P ( p=0.0164) es menor que el alfa (α= 0.05) establecido.
Página 7 de 16
Universidad Peruana Cayetano Heredia
Escuela de Postgrado Víctor Alzamora Castro
Unidad de Servicios Académicos
Estadística para la investigación
Ejercicio 4:
DMG 38 25 63
SOLUCION
1.- Establecer las Hipótesis nula y alterna (H0 y H1), para nuestro ejemplo:
H0 (hipotesis nula): El uso de probioticos No está asociado al desarrollo de Diabetes
Gestacional. O NO hay diferencia hay diferencia en la aparición de DMG en mujeres
obesas y con sobrepeso que utilizan probioticos comparado con las que no lo utilizan.
H1 (hipotesis alterna): El uso de probioticos está asociado al desarrollo de Diabetes
Gestacional. O Hay diferencia hay diferencia en la aparición de DMG en mujeres obesas
y con sobrepeso que utilizan probioticos comparado con las que no lo utilizan.
Página 8 de 16
Universidad Peruana Cayetano Heredia
Escuela de Postgrado Víctor Alzamora Castro
Unidad de Servicios Académicos
Estadística para la investigación
Dado que la tabla es de dos por dos , los grados de libertad serán (2-1) X (2-1) = 1
Para el ejemplo decidimos utilizar un alfa (α) de 0.05, para la distribución chi cuadrado
con 1 grado de libertad, sera la siguiente figura, que correspondería a la Distribución Chi
Cuadrado
Chi_curva
Esta curva tiene un comportamiento similar que la distribución normal, solo que es
asimetrica
Oi Ei
2
2
c Ei
Página 9 de 16
Universidad Peruana Cayetano Heredia
Escuela de Postgrado Víctor Alzamora Castro
Unidad de Servicios Académicos
Estadística para la investigación
Dado que la prueba chi cuadrado compara los valores obtenidos contra los esperados,
debemos establecer una manera de calcular
Para hacer los cálculos, se debe proceder de la siguiente manera, en primer lugar
establece los valores obtenidos, para cada casillero, retomamos la tabla y sitiamos a los
casilleros: a, b, c, d.
Usa Placebo total
Probioticos
DMG 38 25 63
a b
c d
DMG 63
a b
No DMG 348
c d
Al asumir que la hipótesis nula es la correcta, se debe calcular el valor que se espera
por azar:
Para el casillero a: sera el elemento del margen inferior: 207 al que lo multiplicamos
por el margen lateral: 63, y lo dividimos entre el total: 411. , como se muestra en el
gráfico siguiente:
Página 10 de 16
Universidad Peruana Cayetano Heredia
Escuela de Postgrado Víctor Alzamora Castro
Unidad de Servicios Académicos
Estadística para la investigación
Vea que sus sumas reproducen los mismos valores de los margenes, igual que el total.
Página 11 de 16
Universidad Peruana Cayetano Heredia
Escuela de Postgrado Víctor Alzamora Castro
Unidad de Servicios Académicos
Estadística para la investigación
Luego corresponde aplicar la siguiente formula, el cálculo es para cada casillero: a, b,c
y d.
Oi Ei
2
2
c Ei
Cpn la formula
Para leer esta escogemos los grados de libertad (n) , para el ejemplo es n=1, significa
que vamos a leer la fila 1, note que esta tabla en su primera fila tiene los valores de
probabilidad (p), dado que nos ha salido 2.95, la probabilidad estará entre 0.05 y 0.10,
por lo que el Valor p no es menor que 0.05
El cálculo exacto del valor P, que es posible los paquetes da, 0.086
CALCULO EN STATA
Para obtener el calculo con STATA, usted debe colocar en la ventana de comando:
cci 38 25 169 179
Para obtener el calculo solo presiona enter y obtendrá;
Página 12 de 16
Universidad Peruana Cayetano Heredia
Escuela de Postgrado Víctor Alzamora Castro
Unidad de Servicios Académicos
Estadística para la investigación
Como apoyo adjuntamos un excel, que permite apreciar estos cálculos. Se halla en el
MATERIAL DE APOYO de este capitulo
Página 13 de 16
Universidad Peruana Cayetano Heredia
Escuela de Postgrado Víctor Alzamora Castro
Unidad de Servicios Académicos
Estadística para la investigación
Ejercicio 5:
Una empresa utilizaba para la fabricación de pinturas cierto producto químico, detectó
que algunos empleados comenzaron a tener ciertos problemas de salud relacionados
con alteraciones respiratorias. Se sospecha que un producto químico pudiera tener algo
que ver con los problemas respiratorios. Para valorar esta hipótesis se seleccionó al
azar a 500 empleados de la empresa, los cuales fueron clasificados en base a su nivel
de exposición al producto y si tenían o no los síntomas de tales alteraciones
respiratorias. Los resultados se presentan en la siguiente tabla:
Página 14 de 16
Universidad Peruana Cayetano Heredia
Escuela de Postgrado Víctor Alzamora Castro
Unidad de Servicios Académicos
Estadística para la investigación
Contacto Contacto
No contacto Total
directo limitado
Sí 305 × 235 106 × 235 89 × 235
alteraciones 500 500 500 235
respiratorias = 143.35 = 49.89 = 41.83
No 305 × 265 106 × 265 89 × 265
alteraciones 500 500 500 265
respiratorias = 161.65 = 56.18 = 47.17
Total 305 106 89 500
Se plantea el contraste de hipótesis:
H0: Las variables son independientes (No existe relación entre ellas)
H1: Las variables no son independientes (Existe relación entre ellas)
Calculamos el Chi 2:
donde los grados de libertad se han calculado teniendo en cuenta que la tabla tiene 2
filas y 3 columnas: g = (2 − 1) · (3 − 1) = 2
al hacer los cálculos obtenemos el valor de X2 = 61.39
Por otro lado podemos apreciar en el grafico que la distribución Chi 2 para dos grados
de libertad encierra entre 0 a 5.99 un área de 0.95, quedando a la derecha el 0.05 (5%)
Página 15 de 16
Universidad Peruana Cayetano Heredia
Escuela de Postgrado Víctor Alzamora Castro
Unidad de Servicios Académicos
Estadística para la investigación
Para obtener el valor P del Chi2: 61.39 de acuerdo a la tabla será menor que 0.005.
Siendo el valor P menor que 0.05 , ( el valor calculado con EXCEL es 2.37 x 10 -14 ), de
igual manera se rechaza la hipótesis nula.
Página 16 de 16