Está en la página 1de 19

Unidad 3

Sesin presencial 3

Pruebas Chi
cuadrado

Estadstica Inferencial

Logros
Al terminar la sesin, ser capaz de:
Determinar si dos variables (en escala nominal u
ordinal) estn relacionadas.
Entender qu es un valor esperado y el
fundamento de las aplicaciones de la chicuadrado.
Tomar decisiones en el mbito de su especialidad
usando las aplicaciones de la chi-cuadrado.

Temas a desarrollar:

Prueba de independencia de
variables
Prueba de Bondad de Ajuste:
Distribucin de Poisson

Motivacin
Si a un joven recin egresado le
ofrecieran un prstamo para qu
lo utilizara?

Si a una persona mayor edad le


ofrecieran un prstamo para qu
lo utilizara?

la eleccin sera la misma?

Prueba de Independencia
EDAD DEL
CLIENTE

ESTN
RELACIONADOS?

MOTIVO DEL
PRSTAMO

USOS DE LA DISTRIBUCION CHI


CUADRADO
Permite comparar las frecuencias observadas
(obtenidas de la muestra) con las frecuencias
esperadas (valores tericos) segn un modelo
supuesto.
Esta caracterstica de la distribucin Chi-cuadrado
permite efectuar las siguientes pruebas:
1. Prueba de independencia
2. Pruebas de bondad de ajuste: distribucin de Poisson
3. Prueba de homogeneidad de proporciones
4. Prueba de bondad de ajuste: distribucin multinomial

PRUEBA DE INDEPENDENCIA
Esta prueba permite evaluar si dos variables cualitativas
(escala nominal u ordinal) estn relacionadas.

Ejemplo: El director de Mercadotecnia de


un diario de la capital se pregunta: Estar
relacionado el sector donde vive el lector y
la seccin del peridico que lee primero?

PRUEBA DE INDEPENDENCIA
Caractersticas:
Relacionar dos variables de escala nominal u
ordinal.
Seleccionar una muestra de n elementos,
donde cada uno de ellos es clasificado segn
dos criterios diferentes.
El inters es saber si los dos criterios de
clasificacin estn estadsticamente
relacionados.
Cada uno de los criterios tiene diferentes
niveles, digamos, r niveles del primer
criterio y c niveles del segundo criterio.

Procedimiento de la prueba
1. Plantear la Hiptesis
H0: Las variables son independientes (No estn relacionadas)
H1: Las variables no son independientes (Estn relacionadas)

2. Estadstica de prueba:
r

O e n

(Oij eij ) 2

i 1 j 1

eij

[(2c 1)*(r 1)]

3. Regla de decisin:
Rechazar Ho si:
2
2
cal
crit
[ ; ( r 1) ( c 1)]

4. Conclusin

1-
2
crit
9

Ejemplo 1
El jefe de una planta industrial desea determinar si existe relacin entre el rendimiento en el trabajo y turno laboral
del empleado. Se tom una muestra aleatoria de 382 empleados y se obtuvo las frecuencias que se presentan en
la siguiente tabla de contingencia:

Con un nivel de significacin de 0.01, la calificacin del rendimiento del trabajador est asociada con el turno en
Turno laboral
el que labora el empleado?

Rendimient
o en el
trabajo Maana Tarde Noche
Deficiente
21
58
27
Promedio
26
77
58
Muy bueno
7
47
61
Total
54
182
146

Total
106
161
115
382

Ejemplo 2
De acuerdo a una encuesta de participacin en los
deportes, publicada en un diario local, las actividades
deportivas en las que participa la gente cambia con
la edad. La siguiente tabla proporciona los resultados
de una encuesta realizada a 767 personas,
clasificadas por actividad deportiva (la que practica
con regular frecuencia) y gnero. La evidencia que
proporcionan estos datos es suficiente para afirmar
que el gnero y la actividad deportiva estn
relacionadas? Use =0,05

Sexo
Masculin
o
Femenino

Actividad deportiva
Caminat Nataci
Ciclismo Aerbicos
a
n
85

28

60

179

81

138

106

90

Ejercicio:
Se realiz una encuesta para saber si existe una
brecha de gnero en la confianza que la gente le
tiene a la polica. Los resultados de una muestra se
listan en la tabla adjunta. Use un nivel de significacin
del 5% para probar la afirmacin de que s existe una
relacin entre el gnero y la confianza en la polica.

Gnero
Masculino
Femenino

Confianza en la polica
Muy poca o
Mucha
Regular
ninguna
115
56
29
175
94
31

Unidad 3
Sesin presencial 3

Pruebas Bondad de
ajuste
Distribucin de
Poisson
Estadstica Inferencial

Motivacin
El gerente de un banco est muy ocupado y no puede
revisar todos los correos que le llegan pero es de su
inters revisar los correos de los clientes VIP.

Cada 30 min cuenta el nmero de correos de clientes VIP que le llegan


a su computadora

30 min

30 min

30 min

30 min

Cul es la distribucin del nmero de correos de clientes


VIP que llegan al computador cada 30 min?

Estadstica Inferencial

14

Cmo modelar probabilsticamente el nmero


de correos de clientes VIP que llegan cada 30
min ?
De los correos que le llegaron durante la ltima semana, registr la
cantidad de ellos que le llegaron en 100 intervalos de 30 minutos cada
uno.

Cul es la tasa promedio de llegada de correos VIP en 30 min?

Estadstica Inferencial

15

Bondad de ajuste: Distribucin


de Poisson

1. Hiptesis:

Ho: La variable X tiene distribucin de Poisson


H1: La variable X no tiene distribucin de Poisson

2. Estadstico de
prueba:
ox

i i

ei n pi

o e

i 1

ei

c2

Adems: Oi ei n

Si el valor e < 5 entonces agrupar con una o ms


categoras hasta obtener frecuencias esperadas
mayores o iguales a 5.

3. Regin
2
2
crtica

4.
Rechazar Ho si: c
crit , k m 1
Decisin
5.
:Conclusi

Ejemplo 1:
Suponga que X: el nmero de llamadas telefnicas
que ingresan al conmutador de una empresa
durante intervalos de un minuto tiene una
distribucin de Poisson. Use un nivel de
significacin del 10% y los siguientes datos para
0
1
2
3las 4 llamadas
5
6
probar Xla hiptesis
de que
que
Nmero
de una distribucin de Poisson.
ingresan
sigue
intervalos
de un min

15

31

20

15

13

Ejemplo 2:

Al parecer el nmero de accidentes


automovilsticos por da en una determinada
ciudad sigue una distribucin de Poisson. A
continuacin se presentan los datos de una
muestra de 80 das del ao anterior Estos datos
apoyan la creencia de que el nmero de
accidentes por da sigue una distribucin de
Poisson? Use un nivel de significacin del 5%.
Nmero de
accidentes

Nmero de
das

34

25

11

Ejercicio:
Un asesor de direccin pretende estudiar la
intensidad de los conflictos organizativos por ao a
partir de los datos recogidos sobre 64 empresas:
Nmero de
conflictos

Nmero de
empresas

0
1
2
3
4

9
11
12
24
8

Identifique la distribucin de probabilidades para


la variable nmero de conflictos organizativos
por ao, luego pruebe que la variable sigue esa
distribucin.
Use = 0.01