Está en la página 1de 34

¿Todos los detergentes serán iguales?

¿Alguno de ellos nos proporcionara


mayor blancura?

¿Se podrá determinar si existe diferencia


significativa entre los tipos de
detergentes?
SITUACIÓN PROBLEMA:
Supongamos una empresa que tiene
cuatro tiendas ubicadas en cuatro
zonas de Lima, el gerente de la
empresa conoce que la distribución
del porcentaje de sus clientes es
20%, 30%, 40% y 10% en sus tiendas
respectivamente; pero sospecha que
debido a un cambio de imagen se ha
producido una modificación en la
distribución porcentual de sus
clientes, ¿como podríamos verificar si
se produjo este cambio o no?. Este
es un típico caso donde es útil usar la
prueba de bondad de ajuste.
APLICACIONES DE LA DISTRIBUCIÓN
CHI-CUADRADO
LOGRO DE SESIÓN:

o Al término de la sesión, el estudiante resuelve ejercicios de


pruebas de hipótesis de Chi-Cuadrado, aplicando los
diferentes casos hipotéticos según el tipo de variables y su
relación entre las variables, demostrando dominio de tema
y la presentación de ejercicios en el tiempo establecido.
USOS DE LA CHI-CUADRADO:

Para hacer inferencias acerca de la varianza poblacional. Es decir,


para calcular Intervalos de Confianza y Prueba de hipótesis para la
varianza poblacional.

Para hacer pruebas de Bondad de Ajuste. O sea, para probar si un


conjunto de datos sigue una distribución pre-determinada.

Para hacer análisis de tablas de contingencia.


TEMAS RELACIONADOS:

Ajuste de distribuciones: Es un contraste de significación para


saber si los datos de una muestra son conformes a una ley de
distribución teórica que sospechamos que es la correcta.

Homogeneidad de varias muestras cualitativas: Sirve para


contrastar la igualdad de procedencia de un conjunto de muestras de
tipo cualitativo.

Tablas de contingencia: Es un contraste para determinar la


dependencia o independencia de caracteres cualitativos.
PRUEBA DE BONDAD DE AJUSTE:

Esta prueba se usa cuando se quiere probar la hipótesis


de que unos datos muéstrales provienen de una
determinada distribución.
Para esta prueba es necesario agrupar o distribuir las
observaciones de la muestra en intervalos de clase,
preferiblemente del mismo tamaño.
PRUEBA DE BONDAD DE AJUSTE:

El estadístico de prueba es:


K
(Oi  Ei ) 2
X 
2

i 1 Ei
Donde:
Oi = Total de valores que caen en el intervalo i.
Ei = Número esperado de valores en el intervalo i.
k = Número de intervalos de clase en que se distribuyen las observaciones.
El número esperado de observaciones para ese intervalo está dado por:
Ei =nPi
Donde:
Pi es la probabilidad de que una observación quede en el intervalo i, de acuerdo con
la función de densidad que se esté analizando, y n es el número total de
observaciones.
PRUEBA DE BONDAD DE AJUSTE:

Las pruebas de hipótesis son:

H0: La forma de la distribución es una distribución …


H1: La forma de la distribución no es una distribución …

Debe de rechazarse H0 si:

Donde:
k es el número de intervalos de clase.
p es el número de parámetros de la distribución que se va analizar.
α: nivel de significancia.
Si la frecuencia esperada en una celda es menor que 5, se combina
esta celda con la celda anterior o con las que sea necesario para
ser mayor o igual a 5.
…CONTINUACIÓN:

k
(Oi  Ei ) 2
Si la hipótesis nula es cierta  
2

i 1 Ei
entonces:
tiene una distribución X2 con k-p-1 grados de libertad.

(son k-p-1 grados de libertad, porque si sabemos k-1 de las pi, también
sabemos la k-ésima, pues su suma es 1 y los “p” parámetros es cero).

Finalmente, para hacer la prueba se compara el valor computado de


X2 con el valor X2 k-p-1, α obtenido de la tabla de la distribución Ji
Cuadrado con k-p-1 grados de libertad.

Se Rechazo la hipótesis nula al nivel de significancia α(100)% si


observamos que X2 > X2 k-p-1, α
CHI-CUADRADO: REGIÓN DE RECHAZO HO
EJEMPLO:

El número de defectos por unidad observada en una muestra de 100 radios


dio la siguiente distribución de frecuencias:

Número de defectos 0 1 2 3 4 5 6 7

Número de radios 28 32 15 10 6 4 3 2

Verificar si la distribución de estos datos se aproxima a la distribución


Poisson con un nivel de significancia de 5%
SOLUCIÓN:

1. Ho: La distribución de los datos es Poisson.


2. H1: La distribución de los datos no es Poisson.
3. Nivel de significancia: α = 0.05
4. Estadístico de prueba:
k
(Oi  Ei ) 2
 
2

i 1 Ei

Donde: Los esperados Eij  nPi


5. Regla de decisión: Rechazar H0 si: X2 > X2 k-p-1, α

Cálculos:
 Valor crítico: K = 5, p =1, luego: X2 k-p-1, α = X2 5-1-1, 0.05 = X2 3, 0.05 =
7.815
 Estadístico de Prueba:
El parámetro de la distribución Poisson es la media, que es desconocida y
debe estimarse a través de los datos: 𝑥 = 1.68
TABLA DE PROBABILIDAD DE LA
DISTRIBUCIÓN CHI CUADRADO
Nivel de significancia:  = 0.05

Grados de
Libertad:
gl = 3

 χ2 = 7.8147
Región de
Rechazo de H0

χ2 = 7.8147
SOLUCIÓN: CONTINUACIÓN …

Número de (Oi  Ei ) 2
pi = P[X = x] Ei = npi Oi
defectos: x Ei
0 0.18637 18.6374 28 4.703356
1 0.31311 31.31083 32 0.015169
2 0.26301 26.3011 15 4.855872
3 10
0.14729 14.72861 1.518119
4 6
0.06186 8.986175 4.024636
5 4 = 15
6 0.02079 0.08986 3
7 0.00582 2
0.00140
Total 15.11715

Luego, el valor estadístico es:


X2 = 15.11715

= 7.815 15.117

Conclusión: Se rechaza Ho, es decir, los datos no se ajustan a una distribución


Poisson, con un nivel de significancia del 5%
EJEMPLO

La Pasta Italiana es una cadena de restaurantes ubicados a lo largo de la costa peruana, el


propietario, desea añadir filete a su menú. Antes de hacerlo, decide contratar a Mognolia, para
que lleve a cabo una encuesta entre personas adultas para saber cual es su platillo favorito
cuando comen fuera de casa. Magnolia seleccionó una muestra de 120 adultos y les pidió que
indicaran su comida favorita cuando salen a cenar.
Plato favorito Frecuencia
Pollo 32
Pescado 24
Carne 35
Pasta 29
Total 120

¿Es razonable concluir que no hay preferencia entre los cuatro platillos?
SOLUCIÓN:

Paso1. Formule las hipótesis nula y alterna.

Ho: No hay diferencia entre las proporciones de adultos


que eligen cada platillo.

H1: Existe diferencia entre las proporciones de adultos


que eligen cada platillo.

Continue …
PRUEBA DE INDEPENDENCIA DE DOS VARIABLES:

Las Hipótesis nula y alternativa:

H0: Las variables son independientes entre sí


H1: Las variables no son independientes entre sí
PRUEBA DE INDEPENDENCIA DE DOS VARIABLES:

Se debe usar la prueba chi


cuadrada para poner a prueba si
existe o no una relación entre
las variables
En la Prueba de
Independencia de dos
variables:

Los datos se refieren


a dos variables de
escala nominal

Cada variable tiene


dos o más
categorías
PRUEBA DE INDEPENDENCIA DE DOS VARIABLES:

O un agente de seguros tal vez quiera determinar


si diferentes grupos ocupacionales tienden a sufrir
diferentes tipos de lesiones en el trabajo

Venta de seguros, una


profesión y una carrera
con proyección de futuro.
Al director de una campaña le
puede interesar si la afiliación
a un partido se relaciona con
el nivel educativo

Por ejemplo:
David Plouffe, director de la
campaña presidencial de Barack
Obama
PRUEBA DE INDEPENDENCIA DE DOS VARIABLES:

El propósito de la prueba chi


cuadrada en tales
aplicaciones no es identificar
la naturaleza exacta de una
relación entre las variables
nominales;

La meta de esta técnica es


simplemente probar si las variables
son o no independientes entre sí.
PROCEDIMIENTO DE LA PRUEBA

Las frecuencias La tabla de


observadas reflejarán frecuencias
Una tabla de esperadas se
una clasificación
contingencias construye
cruzada de los
tiene r filas y k suponiendo que la
integrantes de una
columnas. hipótesis nula es
sola muestra
verdadera

Crear la tabla de Comparar las tablas de Medir la diferencia entre


contingencias frecuencias observadas y estas tablas mediante el
de frecuencias esperadas estadístico de prueba χ2
ESTADISTICO DE PRUEBA:

El estadístico chi cuadrado ( χ2) de la prueba


se calcula:

χ  
2
r c O ij  Eij  2

0
i1 j1 Eij

o r: Número de filas en la tabla de contingencia


o c: Número de columnas en la tabla de contingencia
o Oij: Frecuencia observada en la fila i, columna j
o Eij: Frecuencia esperada en la fila i, columna j
o gl = (r – 1) (c – 1) (gl = df)
ESTADISTICO DE PRUEBA:

Las frecuencias esperadas cuando se pone a prueba la


independencia de las variables:

La frecuencia esperada en la fila i,


columna j es:
Eij = Ri(Cj)/n

Donde:
Ri: total de la fila i.
Cj: total de la columna j.
n : El número total de observaciones
EJEMPLO:

Una investigadora de
seguridad de tránsito
observó 500 vehículos en
una señal de alto en un
vecindario suburbano y
registró:

 El tipo de vehículo (auto, camioneta, camión de carga)


 El comportamiento del conductor frente a la señal de alto (alto total, casi
detenido, no respeta la señal)
Conducta en la señal de alto
Avanza sin No respeta Total
Detenido
motor la señal
Sedán 183 107 60 350
Tipo de Camioneta 54 27 19 100
vehículo Camión de
14 20 16 50
carga
Total 251 154 95 500

Con un nivel de confianza de 0.05, ¿puede haber alguna relación entre el comportamiento del
conductor y el tipo de vehículo que conduce?
SOLUCIÓN:
Formulamos las hipótesis nula y
alternativa:

H0: La conducta del conductor y el tipo


de vehículos son independientes.
H1: Existe una relación entre las
variables anteriores.

La tabla de las frecuencias observadas refleja las intersecciones de las


diversas categorías de las dos variables.
Por ejemplo: se observaron 183 personas que conducían sedán y estaban
detenidos en la señal de alto.

La tabla de contingencia tiene r = 3 filas y c = 3 columnas


SOLUCIÓN:
Conducta en la señal de alto
Avanza sin No respeta Total
Detenido
motor la señal
Sedán 183 107 60 350
Tipo de Camioneta 54 27 19 100
vehículo
Camión de
14 20 16 50
carga
Total 251 154 95 500

Fila i = 1, columna j = 1: Fila i = 1, columna j = 2: Fila i = 1, columna j = 3:

Fila i = 2, columna j = 1: Fila i = 2, columna j = 2: Fila i = 2, columna j = 3:

Fila i = 3, columna j = 1: Fila i = 3, columna j = 2: Fila i = 3, columna j = 3:

R1C1 350(251) R1C2 350(154) R1C3 350(95)


E11    175.7 E12    107.8 E13    66.5
n 500 n 500 n 500
R2C2 100(154) R2C3 100(95)
R C 100(251)
E 21  2 1   50.2 E 22    30.8 E 23    19
n 500 n 500 n 500

R3C2 50(154) R3C3 50(95)


R C 50(251)
E31  3 1   25.1 E32    15.4 E33    9.5
n 500 n 500 n 500
SOLUCIÓN:

Conducta en la señal de alto


OBSERVADO Avanza sin No respeta Total
Detenido
motor la señal
Sedán 183 107 60 350
Tipo de Camioneta 54 27 19 100
vehículo Camión de
14 20 16 50
carga
Total 251 154 95 500

Conducta en la señal de alto


ESPERADO Avanza sin No respeta Total
Detenido
motor la señal
Sedán 175.7 107.8 66.5 350
Tipo de Camioneta 50.2 30.8 19 100
vehículo Camión de
25.1 15.4 9.5 50
carga
Total 251 154 95 500
SOLUCIÓN:

Determinamos el valor del estadístico de prueba χ2:

χ  
2
r c O ij  Eij 
2


183  175.7  107  107.8 60  66.5 54  50.2 
2

2

2

2

0
i1 j1 Eij 175.7 107.8 66.5 50.2
27 - 30.8 2  19  192  14  25.12  20  15.42  16  9.52  χ 2  12.431
0
30.8 19 25.1 15.4 9 .5

Para determinar el valor crítico de la prueba χ2, tomamos el


nivel de significancia de 0.05 y calculamos los grados de
libertad:

df = (r – 1) (c – 1) = (3 – 1) (3 – 1) = 2 x 2 = 4 → df = 4
TABLA DE PROBABILIDAD DE LA
DISTRIBUCIÓN CHI CUADRADO
Nivel de significancia:  = 0.05

Grados de
Libertad:
gl = 4

 χ2 = 9.49
Región de
Rechazo de H0

χ2 = 9.49
SOLUCIÓN:

Observamos que el valor


El valor crítico de χ2 es 9.49 calculado de χ2 cae en la
región crítica, por lo tanto:
La hipótesis nula se rechaza
con un nivel de significancia
de 0.05.
Concluimos que existe una
R.A. R.C. relación entre las variables.

α = 0.05

Χ2 = 9.49

Χ02 = 12.431
¿ QUÉ HEMOS APRENDIDO HOY?

 ¿CÓMO RESOLVER PROBLEMAS


APLICANDO LA DISTRIBUCIÓN CHI-
CUADRADO
 CON RESPECTO A LA SITUACIÓN
PROBLEMA, CON UN NIVEL DE
SIGNIFICACIÓN DEL 5%, ¿SE HABRÁ
PRODUCIDO UNA MODIFICACIÓN EN
LA DISTRIBUCIÓN PORCENTUAL DE
SUS CLIENTES O NO?.
BIBLIOGRAFÍA BÁSICA:
Estimado estudiante, puedes revisar los siguientes textos que se encuentran en
tu biblioteca:

Nro. CÓDIGO AUTOR TÍTULO AÑO

PROBABILIDAD Y
519.2 SCHEAFFER Mc.
1 ESTADÍSTICA 2005
SCHE CLAVE
PARA INGENIERÍA

LEVINE- ESTADÍSTICA
519.5
2 KREHBIEL- PARA 2006
LEVI/P
BERENSON ADMINISTRACIÓN.

WILLIAM W.
HINES
DOUGLAS C.
PROBABILIDAD Y
519.2 MONTGOMERY
3 ESTADÍSTICA 2011
HINE DAVID M.
PARA INGENÍERIA
GOLDSMAN
CONNIE M.
BORROR