Está en la página 1de 16

Universidad Peruana Cayetano Heredia

Escuela de Postgrado Víctor Alzamora Castro


Unidad de Servicios Académicos
Estadística para la investigación

Autoformación: Estadística Inferencial a

Ejercicio 1:
Se ha realizado un estudio para conocer los niveles de hemoglobina en una población
de niños, se realiza un estudio con una muestra de 400 niños y se halla una hemoglobina
promedio de 13 mg/dl y 1.8 de desviación estándar. ¿Cuál es el intervalo de confianza
de 95%?

SOLUCION
Datos:
Tamaño de la muestra: 400
Promedio de la muestra: 13 mg/dl
Desviación estándar: 1.8 mg/dl
CALCULO CON STATA

Recuerde:
Estadisticas / Sumarios, tablas, y test estadísticos / / Sumarios y estadísticas
descriptivas /Calculo de IC normal.

Con lo que se desplega la siguiente ventana: donde Hay que colocar los datos.

Página 1 de 16
Universidad Peruana Cayetano Heredia
Escuela de Postgrado Víctor Alzamora Castro
Unidad de Servicios Académicos
Estadística para la investigación

Que luego de colocar OK, debe dar:

Con lo que se puede concluir que en base a un estudio de una muestra de 400 personas,
se tiene un promedio de Hemoglobina de 13 mg/dl e IC 95 % de 12.8 – 13.18).

Página 2 de 16
Universidad Peruana Cayetano Heredia
Escuela de Postgrado Víctor Alzamora Castro
Unidad de Servicios Académicos
Estadística para la investigación

Ejercicio 2:
Se ha realizado un estudio para conocer la prevalencia de parasitosis en una población
de niños, se realiza un estudio con una muestra de 100 niños y se halla que 30 tienen
parásitos. ¿Cuál es el intervalo de confianza de 95%?

SOLUCION
Datos:
Tamaño de la muestra: 100
Proporción de la muestra: 0.3 ( 30%) o 30 individuos

CALCULO CON STATA


Se procede como el ejemplo previo:
Estadisticas / Sumarios, tablas, y test estadísticos / / Sumarios y estadísticas
descriptivas /Calculo de IC normal.
Con lo que se desplega la siguiente ventana: donde Hay que colocar los datos.

Obtiene luego:

Página 3 de 16
Universidad Peruana Cayetano Heredia
Escuela de Postgrado Víctor Alzamora Castro
Unidad de Servicios Académicos
Estadística para la investigación

Con lo que se puede decir,


En un estudio con una muestra de 100 niños, se halla 30% de parasitosis con IC (21 -
39%).

Página 4 de 16
Universidad Peruana Cayetano Heredia
Escuela de Postgrado Víctor Alzamora Castro
Unidad de Servicios Académicos
Estadística para la investigación

Ejercicio 3:
1.- El nivel sérico del colesterol para la población general de varones entre 20 y 70 años de
edad, de los Estados Unidos de Norteamérica es aproximadamente normal con una media de
210 mg/dl. y una desviación estándar de 45 mg/dl. Se toma una muestra de 25 varones adultos
hipertensos y fumadores, al promediar el nivel de colesterol de esta muestra resulta en 230
mg/dl.

Haga el análisis, y describa los pasos necesarios

PROPOSITO DE LA INVESTIGACION

Comparar el colesterol de una muestra de varones adultos fumadores e hipertensos, con el


nivel promedio del colesterol de los adultos varones en general, con media y desviación estándar
poblacionales conocidas(parámetros).

1.- Establecer las Hipótesis nula y alterna (H0 y H1)

Para este caso:

 H0: no hay diferencia entre la media del colesterol de los adultos varones adultos de la
población y la media del colesterol de los adultos varones de los varones
adultos fumadores e hipertensos
 H1: hay diferencia entre la media del colesterol de los adultos varones adultos de la
población y la media del colesterol de los adultos varones de los varones
adultos fumadores e hipertensos

2.- Elección de la prueba estadística apropiada

Se está comparando la media del nivel sérico del colesterol para la población general de
varones entre 20 y 70 años de edad, de los Estados Unidos de Norteamérica que es
aproximadamente normal con una media de 210 mg/dl. y una desviación estándar de 45 mg/dl
contra la media de una muestra de 25 varones adultos fumadores e hipertensos. Se compara
la media de una población con parámetros conocidos (μ σ) y de distribución normal. Contra
una muestra. En situaciones como esta corresponde utilizar la prueba Z.

x 
z 

n

3.- Nivel de significación o criterios

Página 5 de 16
Universidad Peruana Cayetano Heredia
Escuela de Postgrado Víctor Alzamora Castro
Unidad de Servicios Académicos
Estadística para la investigación

Para el ejemplo decidimos utilizar un alfa (α) de 0.05 o lo que sea equivalente al alfa de 0.05,
para el ejemplo dado que es una distribución del tipo normal la implicada, demos de tener en
cuenta, la siguiente figura:

4.- Aplicar de la prueba a los datos obtenidos


Se debe aplicar la prueba Z, recordar que la muestra es de 25 individuos, y colesterol promedio
de la muestra=230 mg/dl. El colesterol de la población tiene una media (μ) de 210 mg/dl. y
una desviación estándar (σ) de 45 mg/dl.

x  230  210 20
z     2.22
 45 9
n 25
5.- Obtener el Valor P y los intervalos de confianza

Para obtener el valor P, vamos a la tabla de la Prueba Z, y buscamos el área para el valor de z
=2.22, como podemos apreciar, e la tabla siguiente que para este valor de Z, le corresponde

Página 6 de 16
Universidad Peruana Cayetano Heredia
Escuela de Postgrado Víctor Alzamora Castro
Unidad de Servicios Académicos
Estadística para la investigación

Un área de 0.0132 , que multiplicado por 2 = 0.0264,

Entonces el valor p = 0.0264

De forma similar podemos calcular el IC95% para el IQ de los habitantes de X, de acuerdo a la


fórmula:

IC 95% = X ± 1.96 * σ/√n = 230 ± 1.96 *45/√25 = 230 ± 1.96 * 9 = 230 ± 17.64 : 212.36 – 247.64

IC 95% = ( 212.36 – 247.64) no incluye a 210, la media poblacional.

6.- La decisión

Luego de los resultados, rechazaríamos la hipótesis nula, ya sea por :

 La prueba z=2.22, cae fuera del rango esperado para el alfa 0.05 (zona de rechazo), si
hubiera caído dentro del intervalo -1,96 a 1.96 no rechazaría.
 El IC de confianza del IC para la media del Pueblo ( 89.1 - 98.4 ) , no incluye a 100 ( μ
de la población).
 El valor P ( p=0.0164) es menor que el alfa (α= 0.05) establecido.

Todas estas maneras de ver son equivalentes.

Página 7 de 16
Universidad Peruana Cayetano Heredia
Escuela de Postgrado Víctor Alzamora Castro
Unidad de Servicios Académicos
Estadística para la investigación

Ejercicio 4:

En el estudio de Callaway y col. Un ensayo clínico aleatorio doble ciego controlado


contra placebo, donde se comparó el uso de Probióticos para la prevención de la
diabetes mellitus gestacional en mujeres obesas y con sobrepeso. (Diabetes
Care 2019 Mar; 42 (3): 364-371). Se administró probióticos ( Lactobacillus
rhamnosus y Bifidobacterium animalis subespecies lactis ) administrados a partir del
segundo trimestre en mujeres obesas y con sobrepeso. A las 28 semanas para
detectar si había desarrollado la Diabetes Mellitus Gestacional (DMG) por medio de
una prueba oral de tolerancia a la glucosa (OGTT) a las 28 semanas de gestación.

Completaron el estudio 411 mujeres. La DMG se produjo en el 12,3% (25 de 204) en


el brazo de placebo y en el 18,4% (38 de 207) en el brazo de probióticos. Resumimos
los datos en la siguiente tabla::

Usa Placebo total


Probioticos

DMG 38 25 63

No DMG 169 179 348

total 207 204 411

SOLUCION

Al realizar el ejercicio bajo la forma propuesta, se contestan las preguntas.


Recuerde. se desea evaluar si el uso de Probióticos previene la aparición de diabetes
mellitus gestacional (DMG) en mujeres obesas y con sobrepeso.

1.- Establecer las Hipótesis nula y alterna (H0 y H1), para nuestro ejemplo:
H0 (hipotesis nula): El uso de probioticos No está asociado al desarrollo de Diabetes
Gestacional. O NO hay diferencia hay diferencia en la aparición de DMG en mujeres
obesas y con sobrepeso que utilizan probioticos comparado con las que no lo utilizan.
H1 (hipotesis alterna): El uso de probioticos está asociado al desarrollo de Diabetes
Gestacional. O Hay diferencia hay diferencia en la aparición de DMG en mujeres obesas
y con sobrepeso que utilizan probioticos comparado con las que no lo utilizan.

Página 8 de 16
Universidad Peruana Cayetano Heredia
Escuela de Postgrado Víctor Alzamora Castro
Unidad de Servicios Académicos
Estadística para la investigación

2.- Elección de la prueba estadística apropiada


En el ejemplo se está comparando si hay asociación entre dos variables cualitativas le
corresponde la prueba chi cuadrado.

Dado que la tabla es de dos por dos , los grados de libertad serán (2-1) X (2-1) = 1

3.- Nivel de significación o criterios

Para el ejemplo decidimos utilizar un alfa (α) de 0.05, para la distribución chi cuadrado
con 1 grado de libertad, sera la siguiente figura, que correspondería a la Distribución Chi
Cuadrado

Chi_curva

Esta curva tiene un comportamiento similar que la distribución normal, solo que es
asimetrica

4.- Aplicar de la prueba a los datos obtenidos

Oi  Ei 
2

 2
c  Ei
Página 9 de 16
Universidad Peruana Cayetano Heredia
Escuela de Postgrado Víctor Alzamora Castro
Unidad de Servicios Académicos
Estadística para la investigación

Dado que la prueba chi cuadrado compara los valores obtenidos contra los esperados,
debemos establecer una manera de calcular

Para hacer los cálculos, se debe proceder de la siguiente manera, en primer lugar
establece los valores obtenidos, para cada casillero, retomamos la tabla y sitiamos a los
casilleros: a, b, c, d.
Usa Placebo total
Probioticos

DMG 38 25 63

a b

No DMG 169 179 348

c d

total 207 204 411

Entonces los valores obtenidos serán:


a: 38, b: 25, c: 169 y d: 117

Luego calculamos los valores esperados, para cada casillero:


Usa Placebo total
Probioticos

DMG 63

a b

No DMG 348

c d

total 207 204 411

Al asumir que la hipótesis nula es la correcta, se debe calcular el valor que se espera
por azar:

Para el casillero a: sera el elemento del margen inferior: 207 al que lo multiplicamos
por el margen lateral: 63, y lo dividimos entre el total: 411. , como se muestra en el
gráfico siguiente:

Página 10 de 16
Universidad Peruana Cayetano Heredia
Escuela de Postgrado Víctor Alzamora Castro
Unidad de Servicios Académicos
Estadística para la investigación

Esperado de a = (207*63)/411 = 31.73


De igual manera, para b, c y d:

Esperado de b = (204*63)/411 = 31.27


Esperado de c = (207*348)/411 = 175.27
Esperado de d = (204*348)/411 = 173.73
Estos esperados los podemos colocar en la siguiente tabla:

Vea que sus sumas reproducen los mismos valores de los margenes, igual que el total.

Página 11 de 16
Universidad Peruana Cayetano Heredia
Escuela de Postgrado Víctor Alzamora Castro
Unidad de Servicios Académicos
Estadística para la investigación

Luego corresponde aplicar la siguiente formula, el cálculo es para cada casillero: a, b,c
y d.

Oi  Ei 
2

 2
c  Ei
Cpn la formula

Calculo de a : (38 – 31.73)² /31.73 =1.24


Calculo de b : (25 – 31.27)² /30.27 =0.22
Calculo de c : (169 -175.27)² /175.27 =1.26
Calculo de d : (179 -172.73)² /172.73 =0.23
Para obtener el chi2 se suma los valores previos: 2.95

5.- Obtener el Valor P


Para obtener el valor P, vamos a la tabla del chi cuadrado :

Para leer esta escogemos los grados de libertad (n) , para el ejemplo es n=1, significa
que vamos a leer la fila 1, note que esta tabla en su primera fila tiene los valores de
probabilidad (p), dado que nos ha salido 2.95, la probabilidad estará entre 0.05 y 0.10,
por lo que el Valor p no es menor que 0.05

El cálculo exacto del valor P, que es posible los paquetes da, 0.086

CALCULO EN STATA
Para obtener el calculo con STATA, usted debe colocar en la ventana de comando:
cci 38 25 169 179
Para obtener el calculo solo presiona enter y obtendrá;

Página 12 de 16
Universidad Peruana Cayetano Heredia
Escuela de Postgrado Víctor Alzamora Castro
Unidad de Servicios Académicos
Estadística para la investigación

Donde se puede apreciar que chi cuadrado es 2.95 y el p=0.086


6.- La decisión
Luego de los resultados, no rechazaríamos la hipótesis nula:

Como apoyo adjuntamos un excel, que permite apreciar estos cálculos. Se halla en el
MATERIAL DE APOYO de este capitulo

Página 13 de 16
Universidad Peruana Cayetano Heredia
Escuela de Postgrado Víctor Alzamora Castro
Unidad de Servicios Académicos
Estadística para la investigación

Ejercicio 5:
Una empresa utilizaba para la fabricación de pinturas cierto producto químico, detectó
que algunos empleados comenzaron a tener ciertos problemas de salud relacionados
con alteraciones respiratorias. Se sospecha que un producto químico pudiera tener algo
que ver con los problemas respiratorios. Para valorar esta hipótesis se seleccionó al
azar a 500 empleados de la empresa, los cuales fueron clasificados en base a su nivel
de exposición al producto y si tenían o no los síntomas de tales alteraciones
respiratorias. Los resultados se presentan en la siguiente tabla:

a) Cual es la hipótesis de trabajo.


b) ¿Tenemos evidencias que indiquen, a nivel de significación 0.05, la existencia de
relación entre el nivel de exposición y la presencia de síntomas de alteraciones
respiratorias entre los empleados? Plantea y resuelve el contraste de hipótesis
adecuado tanto por el método de las regiones de aceptación/rechazo, como por el
método del p-value. Explica las conclusiones obtenidas.
SOLUCION

a) Cual es la hipótesis de trabajo.


Esperaríamos que, al tener mayor exposición al producto, haya una mayor
frecuencia de alteraciones respiratorias. Evaluando la tabla podríamos decir que sí
podría haber una asociación dado que con un contacto limitado o sin contacto, la
frecuencia de trabajadores sin alteraciones respiratorias es mayor. Mientras que, en
un contacto directo, hay una mayor frecuencia de alteraciones respiratorias.

H0 : La frecuencia de alteraciones respiratoria será similar cuando hay contacto


directo, contacto limitado o No contacto.
H1 : La frecuencia de alteraciones respiratoria No será similar cuando hay contacto
directo, contacto limitado o No contacto.

b) ¿Tenemos evidencias que indiquen, a nivel de significación 0.05, la existencia de


relación entre el nivel de exposición y la presencia de síntomas de alteraciones
respiratorias entre los empleados?

Página 14 de 16
Universidad Peruana Cayetano Heredia
Escuela de Postgrado Víctor Alzamora Castro
Unidad de Servicios Académicos
Estadística para la investigación

 Para resolver el contraste de hipótesis debemos calcular los valores esperados:

Contacto Contacto
No contacto Total
directo limitado
Sí 305 × 235 106 × 235 89 × 235
alteraciones 500 500 500 235
respiratorias = 143.35 = 49.89 = 41.83
No 305 × 265 106 × 265 89 × 265
alteraciones 500 500 500 265
respiratorias = 161.65 = 56.18 = 47.17
Total 305 106 89 500
Se plantea el contraste de hipótesis:
H0: Las variables son independientes (No existe relación entre ellas)
H1: Las variables no son independientes (Existe relación entre ellas)

Calculamos el Chi 2:

donde los grados de libertad se han calculado teniendo en cuenta que la tabla tiene 2
filas y 3 columnas: g = (2 − 1) · (3 − 1) = 2
al hacer los cálculos obtenemos el valor de X2 = 61.39

Por otro lado podemos apreciar en el grafico que la distribución Chi 2 para dos grados
de libertad encierra entre 0 a 5.99 un área de 0.95, quedando a la derecha el 0.05 (5%)

Página 15 de 16
Universidad Peruana Cayetano Heredia
Escuela de Postgrado Víctor Alzamora Castro
Unidad de Servicios Académicos
Estadística para la investigación

Para obtener el valor P del Chi2: 61.39 de acuerdo a la tabla será menor que 0.005.
Siendo el valor P menor que 0.05 , ( el valor calculado con EXCEL es 2.37 x 10 -14 ), de
igual manera se rechaza la hipótesis nula.

Página 16 de 16

También podría gustarte