Está en la página 1de 15

UNIDAD IV

Recuperado de: https://knoji.com/images/user/Data%20Softdrink%20Gender.jpg


SESIÓN 15

Prueba de Chi cuadrado: prueba de bondad de


ajuste.
Prueba de Chi cuadrado: Prueba de
independencia y prueba de homogeneidad.

Indicadores de Logro:

a) Identifica la prueba no paramétrica “CHI Cuadrado”


construyendo tablas de contingencia para su desarrollo.
b) Conoce, desarrolla e interpreta ejercicios aplicando la prueba
de homogeneidad y de la independencia.
Recuperado de http://image.slidesharecdn.com/chisquareusingexcel-140903114147-phpapp02/95/chi-square-using-
excel-8-638.jpg?cb=1409744576http://image.slidesharecdn.com/chisquareusingexcel-140903114147-phpapp02/95/chi-
square-using-excel-8-638.jpg?cb=1409744576

PRUEBA 𝑿𝟐

Supuesto: las variables no están relacionadas:


Prueba no paramétrica para datos cualitativos.
Prueba de Bondad de Ajuste

Consiste en determinar si los datos de cierta muestra corresponden a


cierta distribución poblacional. En este caso es necesario que los valores
de la variable en la muestra y sobre la cual queremos realizar la
inferencia esté dividida en clases de ocurrencia, la variable de estudio,
se tiene que categorizar asignando sus valores a diferentes clases o
grupos

O1 + O2 + O3 +O4 +O5 +6 ………….. = n


E1 + E2 + E3 +E4 +E5 +E6 ………… = n

E=nxp
Características

1. El valor del estadístico se podrá aproximar por una distribución Chi-cuadrado


cuando el tamaño muestral «n» sea grande (n > 30).

2. Las observaciones son obtenidas mediante muestreo aleatorio a partir de una


población particionada en categorías.

k – 1 grados de libertad.
Ejemplo:

En cierta máquina Expendedora de Refrescos existen 4 canales que expiden el mismo


tipo de bebida. Estamos interesados en averiguar si la elección de cualquiera de estos
canales se hace de forma aleatoria o por el contrario existe algún tipo de preferencia
en la selección de alguno de ellos por los consumidores. La siguiente tabla muestra el
número de bebidas vendidas en cada uno de los 4 canales durante una semana.
Contrastar la hipótesis de que los canales son seleccionados al azar a un nivel de
significación del 5%.
Canal Número de bebidas consumidas
por este expendedor
HO= f0=fe
1 13
HA= fo≠ fe
2 22
3 18
Ei= n x p= 70* ¼ = 17.5 4 17

X2t =7.81
Ejemplo:

El administrador de un hospital suponía que los ingresos al servicio de cirugía


provenían equivalentemente de tres fuentes: a) consulta externa, b) urgencias
o c) traslados desde otros hospitales. Nivel de significancia= 0.05

Al estudiar el origen de los internamientos en cirugía en los últimos tres años,


encontró lo siguiente

¿Qué tan razonable era la suposición del administrador del hospital?


Prueba de Homogeneidad

De varias muestras cualitativas, consiste en comprobar si varias muestras de una


carácter cualitativo proceden de la misma población (por ejemplo: ¿estas tres
muestras de alumnos provienen de poblaciones con igual distribución de aprobados?.
Es necesario que las dos variables medibles estén representadas mediante
categorías con las cuales construiremos una tabla de contingencia.
El Director de compras de una fábrica grande debe decidir por la compra de una de
las cuatro marcas que hay en el mercado. Para probar si existe diferencia
significativa en la calidad de las máquinas, obtiene una muestra de la producción de
150 artículos para cada una de ellas y observa el número de defectuosos. Los
resultados se dan en la siguiente tabla:
Solución
M A Q U I N A S
CALIDAD A B C D Total
Defectuosos 21 16.5 12 16.5 15 16.5 18 16.5 66
Buenos 129 133.5 138 133.5 135 133.5 132 133.5 534
Total 150 150 150 150 600

H 0 : p A  pB  pC  pD ( La proporción de defectuosos son las mismas en cada una de las máquinas)


H1 : Al menos en una de las máquinas la proporción de defectuosos no es la misma.
Nivel de significancia   0.05

( 21  16 .5 ) 2 (129  133 .5 ) 2 (132  133 .5 ) 2


2    ....................................   3.064
16 .5 133 .5 133 .5

Re gla de decisión : Re chazar H 0 si  2  Vt ( Valor hallado en la tabla  2 con 3 g..l


en este caso Vt  7.815 . Por lo tan to no rechazaremos H 0
Conclusión : La proporción de defectuosos sí es la misma .
Ejemplo:
Estamos interesados en estudiar la fiabilidad de cierto componente informático con
relación al distribuidor que lo suministra. Para realizar esto, tomamos una muestra
de los 3 distribuidores y se comparó los productos defectuosos de cada lote. Nivel
de significancia=0.05. La siguiente tabla muestra el número de defectuosos en cada
uno de los distribuidores

Componente Componente
defectuoso correcto
Distribuidor 1 16 84
Distribuidor 2 24 76
Distribuidor 3 19 81
Prueba de Independencia

Consistente en comprobar si dos características cualitativas están relacionadas


entre sí (por ejemplo: ¿el color de ojos está relacionado con el color de los
cabellos?). Aunque conceptualmente difiere del anterior, operativamente
proporciona los mismos resultados. Este tipo de contrastes se aplica cuando
deseamos comparar una variable en dos situaciones o poblaciones diferentes,

Ejemplo: deseamos estudiar si existen diferencias en las dos poblaciones respecto


a la variable de estudio.
Se tiene la siguiente información obtenida de una muestra de 5,000 fallecidos.

DIAGNÓSTICO
Total
Muerte por cáncer de pulmón Muerte por otras causas

Fumadores 348 301 3,152 3199 3,500


No Fumadores 82 129 1,418 1371 1,500
Total 430 4,570 5,000

Se desea probar la hipótesis de que el fumar y la muerte por cáncer


pulmonar son independientes con α = 0.01

Solución
H 0 : No existe relación entre el hábito de fumar y la muerte por cáncer pulmonar
H1 : Si existe relación entre el hábito de fumar y la muerte por cáncer pulmonar
Nivel de significancia   0.01

(348  301) 2 (3,152  3,199) 2 ( 82  129 ) 2 (1,418  1,371) 2


2      26.764
301 3,199 129 1,371

Re gla de decisión : Re chazar H 0 si  2  Vt ( Valor hallado en la tabla  2 con 1 g ..l


En este caso Vt  6.635 Por lo tan to rechazaremos H 0
Conclusión : Ambos factores están relacionados.
Ejemplo:

Para estudiar la dependencia entre la práctica de algún deporte y la depresión, se


seleccionó una muestra aleatoria simple de 100 jóvenes, con los siguientes
resultados:

Deportista No deportista
Sin depresión 38 9
Con depresión 31 22

Determinar si existe independencia entre la actividad del sujeto y su estado de


ánimo. Nivel de significación (5%)

También podría gustarte