Está en la página 1de 101

ESTADISTICA APLICADA

Semana 09
Practica Prueba Chi-cuadrado

SEMESTRE 2020 - II
1 Hipótesis Estadística

2 Formulación de Hipótesis

Temas a
Desarrollar 3 Contraste de Hipótesis

4 Pruebas: - z Distribución Normal


(Normalidad) – t de Student – Chi cuadrado

5 - Bondad de Ajuste – Independencia


- Homogeneidad
Recordemos la sesión anterior

DISTRIBUCIÓN DE MUESTREO PARA LA MEDIA


DISTRIBUCIÓN DE MUESTREO PARA LA MEDIA

DISTRIBUCIÓN DE MUESTREO PARA UNA PROPORCIÓN


DISTRIBUCIÓN DE MUESTREO PARA UNA PROPORCIÓN

DISTRIBUCIÓN DE MUESTREO PARA DIFERENCIAS ENTRE MEDIAS


DISTRIBUCIÓN DE MUESTREO PARA DIFERENCIAS ENTRE MEDIAS

DISTRIBUCIÓN DE MUESTREO PARA DIFERENCIAS ENTRE PROPORCIONES


DISTRIBUCIÓN DE MUESTREO PARA DIFERENCIAS ENTRE PROPORCIONES

USO DE TABLAS DE CONTINGENCIAS


USO DE TABLAS DE CONTINGENCIAS

En la modalidad virtual participamos a través del chat, para ello usamos la opción “Levantar la mano”.
Valor critico del Chi-cuadrado (de tabla)

α = nivel de significancia
1- α = nivel de confianza

X2 α : v = Probabilidad del Chi cuadrado teórico para un nivel de significancia: α y


v: grados de libertad

X2 α: v = X2 α : (r-1) Para una Prueba de Bondad de Ajuste, donde r es el número de clases


X2 α: v = X2 α : (r-1)*(k-1) Para una Prueba de Asociación, donde r es el número de filas y
k el numero de columnas
Regla de Decisión para el Chi-cuadrado

Región de aceptación Región de aceptación


Se acepta la hipótesis nula si el Se acepta la hipótesis nula si el
valor del Chi cuadrado de Prueba
α del área valor del Chi cuadrado de Prueba
α del área
es menor al Chi cuadrado teórico es menor al Chi cuadrado teórico
(de tabla) (de tabla)
• •
X 2
X 2
X 2
X 2

α -v α -v

X2f (de formula) < X2t (de tabla) X2t (de tabla) < X2f (de formula)

Se acepta la hipótesis nula (h0) Se rechaza la hipótesis nula (h0)


Se rechaza la hipótesis alternativa (h1) Se acepta la hipótesis alternativa (h1)
PRUEBA DE BONDAD DE AJUSTE
DISTRIBUCION DE PATRON UNIFORME
O
PRUEBA PARA UN AJUSTE UNIFORME
En cierta máquina Expendedora de Refrescos existen 4 canales que expiden el
mismo tipo de bebida. Estamos interesados en averiguar si la elección de cualquiera
de estos canales se hace de forma aleatoria o por el contrario existe algún tipo de
preferencia en la selección de alguno de ellos por los consumidores. La siguiente
tabla muestra el número de bebidas vendidas en cada uno de los 4 canales durante
una semana. Contrastar la hipótesis de que los canales son seleccionados al azar a
un nivel de significación del 5%.
 
Canal Número de bebidas consumidas
mediante este expendedor
1 13
2 22
3 18
4 17
Planteamiento de la hipótesis nula y alternativa.
Hipótesis Nula: H0: La elección de cualquiera de los canales se hace en forma aleatoria.
Hipótesis Alternativa: H1: La elección de cualquiera de los canales se hace con alguna preferencia.
• Probabilidad de ocurrencia pi = 1/4 = 0.25 Para frecuencias igualmente esperadas
• Total de Probabilidad de Ocurrencia p1 + p2 + ........ + p4 = 1

• Frecuencia esperada Ei = nO * pi = 70 * 1/4 = 17.5 i = 1, 2,...., 4


• Frecuencias igualmente esperadas. E1 + E2 + ........ + E4 = nE
Siendo: nO = nE
Valor estadistico Chi-cuadrado de prueba
Canal Serie Observada Serie Esperada
pi fei foi-fei (foi-fei)2 (foi-fei)2 /fei
i foi
1 13 0.25 17.5 -4.5 20.25 1.157143

2 22 0.25 17.5 4.5 20.25 1.157143

3 18 0.25 17.5 0.5 0.25 0.014286

4 17 0.25 17.5 -0.5 0.25 0.014286

70 1.00 70.0 0.0 X2 = 2.342857


Valor estadistico Chi-cuadrado de prueba (formula)
Canal Serie Observada Serie Esperada X  2 =
i foi fei
1 13 17.5 ( 𝒇 𝒐 𝟏 − 𝒇 𝒆 𝟏)𝟐+
  ( 𝒇 𝒐 − 𝒇 𝒆 )𝟐
( 𝒇 𝒐 − 𝒇 𝒆 )𝟐
( 𝒇 𝒐 − 𝒇 𝒆 )𝟐

  X2
𝟐 𝟐  
+ 𝟑 𝟑  
+ 𝟒 𝟒

2 22 17.5 𝒇 𝒆𝟏 𝒇 𝒆𝟐 𝒇 𝒆𝟑 𝒇 𝒆𝟒

3 18 17.5 ( 𝟏𝟑 −𝟏𝟕 .𝟓 )𝟐+


  ( 𝟐𝟐 −𝟏𝟕 . 𝟓 ) +
𝟐 𝟐
  ( 𝟏𝟖 −𝟏𝟕 . 𝟓 )+
  ( 𝟏𝟕 − 𝟏𝟕 .𝟓 )
𝟐

  X2 𝟏𝟕 . 𝟓 𝟏𝟕 .𝟓 𝟏𝟕 .𝟓 𝟏𝟕 . 𝟓
4 17 17.5

  X2

Grados de Libertad Nivel de significancia  = 0,05


G.L. = Nº de filas - 1 Nivel de confianza 1+ = 0,95
Siendo: Nº de filas = 4 El chi-cuadrado de tabla es:
Entonces G.L. = 4 - 1 = 3 X2α ; (n-1) = X20.05 ; (4-1) = X20.05 ; 3 = 7.8147
El Valor Critico del Chi-cuadrado (de tabla) para el nivel de significancia del 5%?

X2 α:(k-1) = X20.05:3 = 7.8147

Regla de decisión

X 2
< X
2
0,05 - 3

𝟐  .𝟑𝟒 <𝟕 . 𝟖𝟏𝟒𝟕 Se acepta H0

Como el 2.34 es menor a 7.81 se acepta la 0,05 del área


hipótesis nula (H0) y se concluye con un  = 0,05
que “la elección de cualquiera de los canales se •
realiza en forma aleatoria”.   X2 = 2.34 X20,05 - 5 = 7.81
La siguiente tabla muestra las frecuencias observadas al lanzar un dado 200 veces.
Ensayar la hipótesis de que el dado está bien hecho al nivel de significación del 0.05.

Cara 1 2 3 4 5 6

Frecuencia Observada 38 31 28 36 37 30

Planteamiento de la hipótesis nula y alternativa.


Hipótesis Nula: H0: El dado esta bien hecho.
Hipótesis Alternativa: H1: El dado no esta bien hecho.

Probabilidad de ocurrencia pi = 1/6 = 0.1667 Para frecuencias igualmente esperadas.


Total de Probabilidad de Ocurrencia p1 + p2 + ........ + p6 = 1

Frecuencia esperada Ei = nO * pi = 200 * 1/6 = 33.34 i = 1, 2,...., 6


Obteniendo: E1 + E2 + ........ + E6 = nE Siendo: nO = nE
Valor estadistico Chi-cuadrado de prueba (formula)
Serie Observada Serie Esperada
Caras del Dado i foi P(x) fei foi-fei (foi-fei)2 (foi-fei)2/fe

1 38 0.1666 33.33 4.667 21.78 0.6533


2 31 0.1667 33.33 -2.333 5.44 0.1633
3 28 0.1667 33.33 -5.333 28.44 0.8533
4 36 0.1667 2.667 7.11 0.2133
33.33
5 37 0.1667 3.667 13.44
33.33 0.4033
6 30 0.1666
33.33 -3.333 11.11 0.3333
200 1.00
200 0.0 X2 = 2.6200
𝟐 𝟐 𝟐 𝟐 𝟐
( 𝒇 𝒐 𝟏 − 𝒇 𝒆 𝟏)𝟐 +
  ( 𝒇 𝒐 𝟐 − 𝒇 𝒆𝟐  
) + ( 𝒇 𝒐𝟑 − 𝒇 𝒆 𝟑 )  
+ ( 𝒇 𝒐 𝟒 − 𝒇 𝒆𝟒 )   ( 𝒇 𝒐𝟓 − 𝒇 𝒆 𝟓 )+
+   ( 𝒇 𝒐𝟔 − 𝒇 𝒆 𝟔 )
  X2 𝒇 𝒆𝟏 𝒇 𝒆𝟐 𝒇 𝒆𝟑 𝒇 𝒆𝟒 𝒇 𝒆𝟓 𝒇 𝒆𝟔
( 𝟑𝟖 −𝟑𝟑 . 𝟑𝟐 )𝟐+
 
𝟐
( 𝟑𝟏 −𝟑𝟑 . 𝟑𝟑 )+
  ( 𝟐𝟖 − 𝟑𝟑. 𝟑𝟑 )𝟐+
  ( 𝟑𝟔 − 𝟑𝟑. 𝟑𝟑 )𝟐+
  ( 𝟑𝟕 − 𝟑𝟑. 𝟑𝟑 )𝟐+
  ( 𝟑𝟎 −𝟑𝟑 . 𝟑𝟐 )𝟐
  X2 𝟑𝟑 .𝟑𝟐 𝟑𝟑 .𝟑𝟑 𝟑𝟑 .𝟑𝟑 𝟑𝟑 .𝟑𝟑 𝟑𝟑 .𝟑𝟑 𝟑𝟑 .𝟑𝟐
X  2 =
  X2 Valor estadistico Chi-cuadrado de prueba (formula)
Grados de Libertad
G.L. = Nº de filas - 1
Siendo: Nº de filas = 6
Entonces G.L. = 6 - 1 = 5

Nivel de significancia de  = 0,05


Nivel de confianza de 1- = 0,95
El chi-cuadrado de tabla es:
X20.05 - 5 = 11.0705
0,05 del área

Regla de decisión
Aplicación: X2 Obtenido de formula= 2.62 •
X2 Crítico o de tabla = 11,0705 X2 = 2.62 X20,05 - 5 = 11.0705
X 2
< X 2
0,05 - 5
Se acepta H0
𝟐  .𝟔𝟐<𝟏𝟏.𝟎𝟕𝟎𝟓 Como el 2.62 es menor a 11.07 se acepta H 0 y se concluye con un  = 0,05 que el dado
esta bien hecho, significativamente las frecuencias son iguales.  
PRUEBA DE BONDAD DE AJUSTE
DISTRIBUCION DE PATRON ESPECIFICO
Una empresa embotelladora de gaseosas ha instalado una máquina mezcla
saborizantes, agua gasificada, colorantes y edulcorantes a razón de 4:9:1:2. Se
encuentra que una botella que contiene 510 mililitros de gaseosa esta compuesta
por 130 ml., de saborizante, 340 de agua gasificada, 15 ml., de colorantes y 25 ml.,
de edulcorante. A un nivel de significancia de 0.05 pruebe la hipótesis de que la
máquina mezcla los componentes de acuerdo a la especificación técnica.

Probabilidad de ocurrencia: a partir de la razón propuesta.


Componentes Razón Pi 𝑅𝑛
  𝑖=
𝑃
Saborizantes 4 0.25 ∑ 𝑅𝑛
Agua Gasificada 9 0.56 𝑃
  𝑖=𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑜𝑐𝑢𝑟𝑟𝑒𝑛𝑐𝑖𝑎
Colorantes 1 0.06 𝑅
  𝑛 =𝑅𝑎𝑧 ó 𝑛 𝑑𝑒𝑙 𝑡𝑖𝑝𝑜 𝑐𝑜𝑚𝑝𝑜𝑛𝑒𝑛𝑡𝑒
Edulcorantes
TOTAL
2
16
0.13
1.0 ∑ 𝑅𝑛=𝑇𝑜𝑡𝑎𝑙𝑑𝑒𝑙𝑡𝑖𝑝𝑜𝑐𝑜𝑚𝑝𝑜𝑛𝑒𝑛𝑡𝑒
 

Planteamiento de la Hipótesis: H0: La máquina mezcla los componentes a razón de 4: 9: 1: 2.


H1: La máquina mezcla no los componentes a razón de 4: 9: 1: 2.
Valor estadistico Chi-cuadrado de prueba (formula)
Componentes fo Pi fe fo-fe (fo-fe)2 (fo-fe)2 /fe
Saborizantes 130 0.25 127.5 2.5 6.25 0.049020
Agua Gasificada 340 0.56 285.6 54.4 2959.36 10.361905
Colorantes 15 0.06 30.6 -15.6 243.36 7.952941
Edulcorantes 25 0.13 66.3 -41.3 1705.69 25.726848
TOTAL 510 1.00 510 0.00   X2 44.090713

  X2

  X
2 X  2 =
  X2

Grados de Libertad Nivel de significancia de  = 0,05


G.L. = Nº de filas - 1 Entonces el Nivel de confianza de: 1-  = 0,95
Siendo: Nº de filas = 4
Entonces G.L. = 4 - 1 = 3
Grados de Libertad: G.L. = 3

Nivel de significancia de  = 0,05


El chi-cuadrado de tabla es:
X20.05 - 3 = 7,8147

Regla de decisión
Aplicación: X2 Obtenido de formula= 44,09
X2 Crítico o de tabla = 7,8147
0,05 del área
X 2
> X 2
0,05 - 3

𝟒𝟒
  .𝟎𝟗>𝟕 .𝟖𝟏𝟒𝟕
Se rechaza H0
X20,05 - 3 = 7,8147
X2 = 44.09

Como el 44.09 es mayor a 7.814 se rechaza H 0 y se concluye con un  = 0,05 que ña maquina no mezcla
los componentes a razón de 4; 9; 1; 2.  
Una conocida entidad financiera trata de seguir una política de extender un 60% de
sus créditos a empresas comerciales; un 10% a personas naturales y un 30% a
prestatarios extranjeros. Con la finalidad de determinar si la política se estaba
siguiendo, el gerente de mercado selecciona aleatoriamente 85 créditos que se
aprobaron recientemente. Encuentra que 62 de tales créditos se otorgaron a
negocios, 10 a personas naturales y 13 a prestatarios extranjeros. Al nivel del 10%.
¿parece que el patrón de cartera deseado se preserva?.

Planteamiento de la Hipótesis:
H0: Se mantuvo el patrón deseado de: 60% de créditos comerciales, 10% de prestamos personales
y 30% de créditos extranjeros..
H1: No se mantuvo el patrón deseado de los créditos.
Valor estadistico Chi-cuadrado de prueba (formula)

Tipos de Créditos fo Pi fe fo-fe (fo-fe)2 (fo-fe)2 /fe


Comercial 62 0.6 51 11 121 2.372549
Personal 10 0.1 8.5 1.5 2.25 0.264706
Extranjero 13 0.3 25.5 -12.5 156.25 6.127451
TOTAL 85 1.0 85 0   X2 8.764706

X  2 =   X2

  X2   X2
Grados de Libertad
G.L. = Nº de filas - 1 Nivel de significancia de  = 0,1
Siendo: Nº de filas = 3 Entonces el Nivel de confianza de: 1-  = 0,9
Entonces G.L. = 3 - 1 = 2
El chi-cuadrado de tabla es:

El chi-cuadrado de tabla (teórico) es: X2α - GL = X20.1 - 2 X20.1 - 2 = 4.6052


Grados de Libertad: G.L. = 2
Nivel de significancia de  = 0,1
El chi-cuadrado de tabla es:

X20.1 - 2 = 4.6052

Regla de decisión
Aplicación: X2 Obtenido de formula= 8.76 0,1 del área
X2 Crítico o de tabla = 4.6052
X 2
> X 2
0,01 - 3

𝟖  .𝟕𝟔 >𝟒 .𝟔𝟎𝟓𝟐 X20,01 - 3 = 4.72


Se rechaza H0 X2 = 8.76
Como el 4.72 es menor que 8.76 se rechaza H 0 y se concluye con un  = 0,1 que no se mantuvo el patrón
deseado de los créditos.
PRUEBA DE BONDAD DE AJUSTE
DISTRIBUCION DE AJUSTE A LA DIUSTRIBUCIÒN BINOMIAL
Una moneda fue lanzada al aire 1000 series, de 5 veces cada serie y se
observó el número de caras de cada serie. El número de series en los que se
presentaron el numero de caras se muestra en la siguiente tabla.
Numero de Caras 0 1 2 3 4 5 Total
Numero de Series 38 144 342 287 164 25 1000

Ajustar una distribución binomial a los datos con un α = 0.05 

Planteamiento de la Hipótesis: H0 : Los datos se ajustan a una distribución binomial.


H1 : Los datos no se ajustan a una distribución binomial.
Para obtener los valores esperados se tiene que utilizar la formula de la
DISTRIBUCIÓN BINOMIAL: 
  𝑛 𝑛!
 𝑃( 𝑥 )=𝐶 𝑛𝑥∗ 𝑝 ∗𝑞
𝑥 (𝑛 − 𝑥)
𝐶 𝑥=
𝑥 ! ( 𝑛− 𝑥 ) !
  𝑛! 𝑥 (𝑛 − 𝑥)
𝑃(𝑥)= ∗ 𝑝 ∗𝑞
𝑥 !(𝑛 − 𝑥 ) !

n = es el número de experimentos. n =5
x = es el número de aciertos. x = 0; 1; 2; 3; 4; 5.

p = es la probabilidad de éxito, "cara" al lanzar la moneda.


q = 1 - p = fracaso, “sello”

Son las probabilidades respectivas de cara y sello en un solo lanzamiento de la moneda.

Para calcular el valor de p, se sabe que   𝜇=𝑛∗ 𝑝 en una distribución binomial.

Siendo n = 5 por lo que   𝜇=5 ∗ 𝑝


Numero de Caras “x” 0 1 2 3 4 5 Total
Numero de Series “fi” 38 144 342 287 164 25 1000

Para la distribución de frecuencias observada, la media del número de caras es:


𝑓𝑖∗𝑥  
 
𝜇=

∑𝑓𝑖 𝜇= ¿ ¿
 𝜇= 2470 =2.47
1000
 𝑝= 𝜇  𝑝= 2.47 =0.494
Para calcular el valor de p, se sabe que  5 5 𝑞=1
  − 𝑝 −1
𝑞=1
  −0.494
𝑞=0.506
 
Así pues, la distribución binomial ajustada viene dada por: P(x)
𝑛 𝑥 (𝑛 − 𝑥)
 𝑃( 𝑥)=𝐶 𝑥 ∗ 𝑝 ∗ 𝑞
5 𝑥 (5 − 𝑥)
 𝑃( 𝑥 )=𝐶 𝑥 ∗0.494 ∗0.506
A partir de esta fórmula se calcula la probabilidad de ocurrencia para obtener caras esperadas.
  = 5!
𝑃 (𝑥)
𝑥 ! (5 − 𝑥 ) !
∗ 0.494 𝑥 ∗ 0.506(5− 𝑥) 𝑥=0
  ;1;2 ;3 ;4 ;5
Utilizando la fórmula de la distribución binomial:
x 0 1 2 3 4 5 Total
P(x) 0.0332 0.1619 0.3162 0.3087 0.1507 0.0294 1.0
Probabilidad de:
  (0 )= 5! 0 ( 5 −0 )
0 caras y 5 sellos x=0 𝑃 ∗0.494 ∗0.506 =0.03317   0.0332
0 ! ( 5 −0 ) !

  (1) = 5! 1 ( 5− 1)
1 cara y 4 sellos x=1 𝑃 ∗0.494 ∗ 0.506 = 0.16191945   0.1619
1 ! ( 5 −1 ) !

  (2) = 5!
2 caras y 3 sellos x=2 𝑃 ∗ 0.4942 ∗ 0.506 (5 −2 )=0.31615893   0.3162
2 ! (5 − 2)!

  (3) = 5!
3 caras y 2 sellos x=3 𝑃 ∗ 0.4943 ∗ 0.506( 5 − 3) = 0.3086611   0.3087
3 ! ( 5− 3 ) !

  (4 )= 5!
4 caras y 1 sello x=4 𝑃 ∗ 0.494 4 ∗ 0.506 (5 −4 )=0.1506705   0.1507
4 ! ( 5 −4 ) !

  (5) = 5! 5 ( 5 − 5)
5 caras y 0 sellos x=5 𝑃 ∗ 0.494 ∗ 0.506 =0.0294195   0.0294
5 ! ( 5− 5 ) !
Valor estadistico Chi-cuadrado de prueba (formula)
Numero de Serie Observada Serie Esperada
fo P(x) fe fo-fe (fo-fe)2 (fo-fe)2 /fe
Caras
0 38 0.0332 33.2 4.8 23.4 0.693976
1 144 0.1619 161.9 -17.9 320.41 1.979061
2 342 0.3162 316.2 25.8 665.64 2.105123
3 287 0.3087 1.525397
308.7 -21.7 470.89
4 164 0.1507
150.7 13.3 176.89 1.173789
5 25 0.0294
29.4 -4.4 19.36 0.658503
1000 1.00
1000 0.0 X2 = 8.135849

X  2 =   X2

  X2
  X2
Grados de Libertad
G.L. = Nº de filas - 1 Nivel de significancia de  = 0,05
Siendo: Nº de filas = 6 Entonces el Nivel de confianza de: 1-  = 0,95
Entonces G.L. = 6 - 1 = 5
El chi-cuadrado de tabla es:

El chi-cuadrado de tabla (teórico) es: X2α - GL = X20.05 - 5 X20.05 - 5 = 11.0705


Grados de Libertad
G.L. = Nº de filas - 1
Siendo: Nº de filas = 6
Entonces G.L. = 6 - 1 = 5

Nivel de significancia de  = 0,05


Nivel de confianza de 1- = 0,95
El chi-cuadrado de tabla es:
X20.05 - 5 = 11.0705
0,05 del área
Regla de decisión
Aplicación: X2 Obtenido de formula= 8,14
X 2
= 11,0705

Crítico o de tabla
X20,05 - 5 = 11.0705
X 2
< X 2
0,05 - 5
X2 = 8.14

𝟖  .𝟏𝟒 <𝟏𝟏. 𝟎𝟕𝟎𝟓 Como el 8.14 es menor a 11.07 se acepta H 0 y se concluye con un  = 0,05 que al
lanzar la moneda salga cara o sello se ajusta a una distribución binomial, es igualmente
Se acepta H0 probable.  
5.- Una encuesta sobre 320 familias con 5 niños dio la
distribución que aparece en la siguiente tabla. ¿Es el resultado
consistente con la hipótesis de que el nacimiento de varón o
mujer son igualmente posibles? Use α = 0.05.

Número de niños 5 4 3 2 1 0
Número de niñas 0 1 2 3 4 5
Número de familias 18 56 110 88 40 8

Planteamiento de la Hipótesis: H0 : El nacimiento de niños y niñas es igualmente probable.


H1 : El nacimiento de niños y niñas no es igualmente probable.
Este experimento tiene un comportamiento binomial, puesto que se tienen dos posibles
resultados y la probabilidad de ocurrencia de éxito se mantiene constante en todo el
experimento.

Para obtener los valores esperados se tiene que utilizar la formula de la distribución binomial: 
 𝑃( 𝑥 )=𝐶 𝑛 𝑥 (𝑛 − 𝑥)   𝑛 𝑛!
𝑥 ∗ 𝑝 ∗ 𝑞 𝐶 𝑥 =
𝑥 ! ( 𝑛− 𝑥 ) !
  𝑛!
𝑃(𝑥)= ∗ 𝑝 𝑥 ∗ 𝑞(𝑛 − 𝑥) probabilidad de ocurrencia
𝑥 !(𝑛 − 𝑥 ) !

n = es el número de experimentos. n =5
x = es el número de aciertos. x = 0; 1; 2; 3; 4; 5.

Como se quiere ver si es igualmente probable el nacimiento de niños y niñas


p = 0.5 es la probabilidad de éxito, “niño" nacimiento de varón.
q = 1 - p = 0.5 fracaso, “niña” nacimiento de una mujer
Utilizando la fórmula de la distribución binomial:
x 0 1 2 3 Total4 5
P(x) 0.0313 0.1563 0.3125 0.3125 0.1563 0.0313 1.0

Probabilidad de:

  (0 )= 5! 0 ( 5 − 0)
𝑃 ∗0.5 ∗ 0.5 =0.03125   0.0313
0 niños y 5 niñas x=0 0 ! ( 5 −0 ) !

  (1) = 5! 1 ( 5 −1 )
1 niño y 4 niñas x=1 𝑃 ∗0.5 ∗0.5 =0.15625   0.1563
1 ! ( 5 −1 ) !

  (2) = 5! 2 ( 5 − 2)
2 niños y 3 niñas x=2 𝑃 ∗ 0.5 ∗ 0.5 =0.3125   0.3125
2 ! (5 − 2)!

  (3) = 5!
3 niños y 2 niñas x=3 𝑃 ∗ 0.53 ∗0.5 (5 −3 ) =0.3 125   0.3125
3 ! ( 5− 3 ) !

  (4 )= 5! 4 (5 − 4 )
4 niños y 1 niña x=4 𝑃 ∗ 0.5 ∗ 0.5 =0.15625   0.1563
4 ! ( 5 −4 ) !

  (5) = 5! 5 ( 5 −5 )
5 niños y 0 niñas x=5 𝑃 ∗ 0.5 ∗0.5 =0.03125   0.0313
5 ! ( 5− 5 ) !
Valor estadistico Chi-cuadrado de prueba (formula)
Numero de Serie Observada Serie Esperada
fo P(x) fe fo-fe (fo-fe)2 (fo-fe)2 /fe
Niños-16
0 18 0.0313 10 8 64.0 6.4
1 56 0.1563 50 6 36.0 0.72
2 110 0.3125 100 10 100.0 1.0
3 88 0.3125 1.44
100 -12 144.0
4 40 0.1563
50 -10 100.0 2.0
5 8 0.0313
10 -2 4.0 0.4
320 1.00
320 0.0 X2 = 11.96

X  2 =   X2

  X2   X2
Grados de Libertad
G.L. = Nº de filas - 1 Nivel de significancia de  = 0,05
Siendo: Nº de filas = 6 Entonces el Nivel de confianza de: 1-  = 0,95
Entonces G.L. = 6 - 1 = 5
El chi-cuadrado de tabla es:

El chi-cuadrado de tabla (teórico) es: X2α - GL = X20.05 - 5 X20.05 - 5 = 11.0705


Grados de Libertad
G.L. = Nº de filas - 1
Siendo: Nº de filas = 6
Entonces G.L. = 6 - 1 = 5

Nivel de significancia de  = 0,05


Nivel de confianza de 1- = 0,95

El chi-cuadrado de tabla es:


X20.05 - 5 = 11.0705 0,05 del área

Regla de decisión
Aplicación: X2 Obtenido de formula = 11.96 •
X2 Crítico o de tabla = 11,0705 X20,05 - 5 = 11.0705
X 2
> X20,05 - 5 X2 = 11.96

11.96 > 11.0705 Como el 11.96 es mayor a 11.07 se rechaza H 0 y se concluye con un  = 0,05 que el
Se rechaza H0 nacimiento de hombres o mujeres no es igualmente probable.  
PRUEBA DE BONDAD DE AJUSTE
DISTRIBUCION DE POISSON
Se propone que el número de defectos en las tarjetas de circuito impreso sigue
una distribución Poisson. Se reúne una muestra aleatoria de 60 tarjetas de
circuito impreso y se observa el número de defectos. Los resultados obtenidos
son los siguientes:
Número de Defectos 0 1 2 3 o más
Circuitos 32 15 9 4

¿Muestran estos datos suficiente evidencia para decir que provienen de una
distribución Poisson?. Haga la prueba de la bondad del ajuste con un α = 5% 

Planteamiento de la Hipótesis:
H0 : La forma de la distribución de los defectos provienen de una distribución de Poisson.
H1 : La forma de la distribución de los defectos no provienen de una distribución de Poisson
donde  λ : (lambda): = np
  λ𝑥 𝑒− λ
𝑃(𝑥)= e : base de logaritmos naturales = 2.71828
𝑥! x!: factorial de x
La media de la DISTRIBUCIÓN POISSON propuesta en este ejemplo es desconocida y
debe estimarse a partir de los datos contenidos en la muestra.
x (defectos) 0 1 2 3 o más ( 32 ) ( 0 ) + ( 15 ) ( 1 ) + ( 9 ) ( 2 ) +( 4)(3)
Circuitos 32 15 9 4
𝜇= λ
   
¿
60

 𝜇= λ=0.75

A partir de la distribución Poisson con parámetro 0.75 pueden calcularse las probabilidades
asociadas con el valor de x. Esto es la fórmula de la Poisson es:
  0.75 𝑥 ( 2.71828)− 0.75
𝑃(𝑥)= probabilidad de ocurrencia
𝑥!

Con esta fórmula se calcula la probabilidad de ocurrencia, mismas que se multiplican por 60
para obtener los valores esperados.
Utilizando la fórmula de la distribución de Poisson:
x 0 1 2 3 Total
P(x) 0.4724 0.3543 0.1329 0.0404 1.0

Probabilidad de:
0 −0.75

0 defectos x=0  𝑃(0 )= 0.75 (2.71828) = 0.472366791   0.4724


0!
1 − 0.75

1 defecto x=1  𝑃(1) = 0.75 (2.71828) =0.35427509   0.3543


1!

2 − 0.75

2 defectos x=2  𝑃(2) = 0.75 (2.71828) =0.13285316   0.1329


2!
3 −0.75

3 defectos a mas x=3  𝑃(3) = 0.75 (2.71828) =0.03321329   0.0404


3!

  1 – ( 0.4724 + 0.3543 + 0.1329 ) = 1 – 0.9596   0.0404


Valor estadistico Chi-cuadrado de prueba (formula)
Numero de Serie Observada Serie Esperada
fo P(x) fe fo-fe (fo-fe)2 (fo-fe)2 /fe
Defectos
0 32 0.4724 28.3 3.7 13.69 0.483746
1 15 0.3543 21.3 -6.3 39.69 1.863380
2 9 0.1329 8.0 1.0 1.0 0.125
3 a más 4 0.0404 1.066667
2.4 1.6 2.56
60 1.00
60 0.0 X2 = 3.5425

X  2 =   X2

  X2   X2
Grados de Libertad
G.L. = Nº de filas - 1 Nivel de significancia de  = 0,05
Siendo: Nº de filas = 4 Entonces el Nivel de confianza de: 1-  = 0,95
Entonces G.L. = 4 - 1 = 3
El chi-cuadrado de tabla es:

El chi-cuadrado de tabla (teórico) es: X2α - GL = X20.05 - 3 X20.05 - 3 = 7.8147


Grados de Libertad
G.L. = Nº de filas - 1
Siendo: Nº de filas = 4
Entonces G.L. = 4 - 1 = 3

Nivel de significancia de  = 0,05


Nivel de confianza de 1- = 0,95
El chi-cuadrado de tabla es:
X20.05 - 3 = 7.8147 0,05 del área
Regla de decisión
Aplicación: X2 Obtenido de formula = 3.5425
X2 Crítico o de tabla = 7,8147

X20,05 -3 = 7.8147
X 2
< X 2
0,05 - 5
X2 = 3.54

Como el 3.5425 es menor a 7.8147 se acepta H 0 y se concluye con un  = 0,05 que la
Se acepta H0
forma de distribución de los defectos proviene de una distribución de Poisson.  
PRUEBA DE BONDAD DE AJUSTE
PRUEBA DE NORMALIDAD O DISTRIBUCION NORMAL
Las especificaciones para la producción de tanques de aire para inmersión requieren que los
tanques se llenen a una presión promedio de 600 libras por pulgada cuadrada (psi). Se
permite una desviación estándar de 10 psi. Las especificaciones de seguridad permiten una
distribución normal en los niveles de llenado. Usted acaba de ser contratado por AQUA
LUNG, un importante fabricante de equipos de inmersión. Su primera tarea es determinar si
los niveles de llenado se ajustan a una distribución normal. La empresa esta segura que la
media de 600 psi., y la desviación estándar de 10 psi., prevalecen. Solo queda por probar la
naturaleza de la distribución. En este esfuerzo se mide n = 1000 tanques y se halla la
distribución presentada en la siguiente tabla, siendo el nivel de significancia de  = 0,05:
PSI Frecuencia Real
0 y por debajo de 580 20
580 y por debajo de 590 142
590 y por debajo de 600 310
600 y por debajo de 610 370
610 y por debajo de 620 128
620 y por encima 30
1 000
Planteamiento de la Hipótesis:
H0 : Los niveles de llenado están distribuidos normalmente.
H1 : Los niveles de llenado no están distribuidos normalmente.

Para determinar la probabilidad de ocurrencia se debe utilizar los intervalos de psi.,

 𝒛= 𝑿 − 𝝁   𝝁= 𝟔𝟎𝟎 𝒑𝒔𝒊 . 𝒎𝒆𝒅𝒊𝒂


𝝈  𝝈 =𝟏𝟎 𝒑𝒔𝒊 . 𝒅𝒆𝒔𝒗𝒊𝒂𝒄𝒊𝒐𝒏 𝒆𝒔𝒕𝒂𝒏𝒅𝒂𝒓

0 y por debajo de 580 𝑃(0<


  𝑋 <580)
𝟓𝟖𝟎 − 𝟔𝟎𝟎
 
𝒛= =− 𝟐 𝑷 ( 𝒛=− 𝟐 )=𝟎 . 𝟒𝟕𝟕𝟐
𝟏𝟎  
 = 0.0228 0.5

𝑃(580< 𝑋 <590) 0.4772


580 y por debajo de 590   0.0228

𝟓𝟗𝟎 −𝟔𝟎𝟎 0.1359 0.3413


 
𝒛= =− 𝟏 𝑷 ( 𝒛=− 𝟏 ) =𝟎 . 𝟑𝟒𝟏𝟑
𝟏𝟎  
x = 580
   x = 590
 =
600    
 = 0.1359 Z = -2
 
Z = -1
590 y por debajo de 600 𝑃(590<
  𝑋 <600)
𝟔𝟎𝟎 − 𝟔𝟎𝟎
 
𝒛= =𝟎 𝑷 ( 𝒛=𝟎 ) =𝟎 . 𝟎
𝟏𝟎  
=  0.3413
0.5 0.5

600 y por debajo de 610 𝑃(600<


  𝑋 <610) 0.0228 0.4772 0.4772 0.0228
𝟔𝟏𝟎 − 𝟔𝟎𝟎 0.1359 0.3413
 
𝒛= =𝟏 𝑷 ( 𝒛=𝟏 ) =𝟎 .𝟑𝟒𝟏𝟑
0.3413 0.1359
𝟏𝟎  
𝑃
  ( 600< 𝑋 < 610 )= 0.3413− 0= 0.3413
 x = 580
  x = 590

  =
600  x = 620  
x = 610 
Z = -2 Z = -1 Z=0 Z=1 Z=2

610 y por debajo de 620 𝑃(610<


  𝑋 <620)
𝟔𝟐𝟎 − 𝟔𝟎𝟎
 
𝒛= =𝟐 𝑷 ( 𝒛=𝟐 ) =𝟎 . 𝟒𝟕𝟕𝟐
𝟏𝟎  
𝑃
  ( 600< 𝑋 < 610 )= 0.4772− 0.3413= 0.1359
620 y por encima 𝑃(620<
  𝑋 <𝑎 𝑚𝑎𝑠)

𝑷 ( 𝒛> 𝟐 ) =𝟎 . 𝟓
 
 𝑃 ( 600< 𝑋 < 610 )= 0.5− 0.4772= 0.0228
Valor estadistico Chi-cuadrado de prueba (formula)
Libras por pulgada
Serie Observada Serie Esperada
cuadrada P(x) fo-fe (fo-fe)2 (fo-fe)2 /fe
PSI fo fe
0 < X < 580 20 0.0228 22.80 -2.8 7.84 0.3438596
580 < X < 590 142 0.1359 135.90 6.1 37.21 0.2738042
590 < X < 600 310 0.3413 341.30 -31.3 979.69 2.8704658
600 < X < 610 370 0.3413 341.30 28.7 823.69 2.4133899
610 < X < 620 128 0.1359
135.90 -7.9 62.41 0.4592347
620 < X 30 0.0228
22.80 7.2 51.84 2.2736842
1 000 1.00
1000 0.0 X2 = 8.6344384
X  2 =   X2

  X2   X2
Grados de Libertad
G.L. = Nº de filas - 1 Nivel de significancia de  = 0,05
Siendo: Nº de filas = 6 Entonces el Nivel de confianza de: 1-  = 0,95
Entonces G.L. = 6 - 1 = 5
El chi-cuadrado de tabla es:

El chi-cuadrado de tabla (teórico) es: X2α - GL = X20.05 - 5 X20.05 - 5 = 11.0705


Grados de Libertad
G.L. = Nº de filas - 1
Siendo: Nº de filas = 6
Entonces G.L. = 6 - 1 = 5

Nivel de significancia de  = 0,05


Nivel de confianza de 1- = 0,95
El chi-cuadrado de tabla es:
X20.05 - 5 = 11.0705
0,05 del área
Regla de decisión
Aplicación: X2 Obtenido de formula = 8.63
X2 Crítico o de tabla = 11,0705

X20,05 - 5 = 11.0705
X 2
< X2
0,05 - 5
X2 = 8.63
Se acepta H0 Como el 8.63 es menor a 11.07 se acepta H 0 y se concluye con un  = 0,05 que los
niveles de llenado de los tanques de inmersión están distribuidos normalmente.  
PRUEBA DE INDEPENDENCIA
Una muestra aleatoria de 200 hombres casados, todos retirados, se clasifica de acuerdo
con la educación y el número de hijos:
Pruebe la hipótesis, con un nivel de significancia de 0.05, de que el tamaño de la
familia es independiente del nivel de instrucción del padre.
Número de hijos
Educación 0-1 2-3 Más de 3
Elemental 14 37 32
Secundaria 19 42 17
Universidad 12 17 10

Planteamiento de la hipótesis nula y alternativa.


Hipótesis Nula: H0: El tamaño de la familia es independiente del nivel de instrucción del padre.
Hipótesis Alternativa: H1: El tamaño de la familia no es independiente del nivel de instrucción del padre.
a) Calcule el valor X2 de la muestra.

Número de hijos
Educación 0-1 2-3 Mas de 3 Valor Mg. Filas
Elemental 14 37 32 83
Secundaria 19 42 17 78
Universidad 12 17 10 39
Valor Mg. Columnas 45 96 59 200

 𝒇 = 𝑪 𝒕 ∗ 𝑹𝒕
𝒆
𝒏
  = Total por fila
 𝑒 = 𝑛● 𝑗 ∗ 𝑛𝑖 ●   = Total por columna
𝑖𝑗
𝑛   = Total por fila
  = Frecuencia esperada en una celda
Numero de hijos
Educación Valor Mg. Filas
0-1 2-3 Mas de 3
Elemental 14 37 32 83
Secundaria 19 42 17 78
Universidad 12 17 10 39
Valor Mg. Columnas 45 96 59 200
Frecuencias esperadas: fe Numero de hijos
Educación
0-1 2-3 Mas de 3
𝑪𝒕∗ 𝑹𝒕
𝒇  𝒆 = Elemental (45*83)/200 (96*83)/200 (59*83)/200
𝒏
Secundaria (45*78)/200 (96*78)/200 (59*78)/200
𝑛● 𝑗 ∗ 𝑛𝑖 ● Universidad (45*39)/200 (96*39)/200 (59*39)/200
𝑒  𝑖 𝑗 =
𝑛 Numero de hijos
Educación
0-1 2-3 Mas de 3
Elemental 18.675 39.84 24.485 83
Secundaria 17.55 37.44 23.01 78
Universidad 8.775 18.72 11.505 39
45 96 59 200
Frecuencias observadas: fo Numero de hijos
Educación
0-1 2-3 Mas de 3
Elemental 14 37 32
Secundaria 19 42 17
Universidad 12 17 10
Frecuencias esperadas: fe Numero de hijos
Educación
0-1 2-3 Mas de 3
Elemental 18.675 39.84 24.485
Secundaria 17.55 37.44 23.01
Universidad 8.775 18.72 11.505

(𝒇  ¿ ¿𝒐 − 𝒇 𝒆 )𝟐 Numero de hijos


¿ Educación
𝒇𝒆 0-1 2-3 Mas de 3
Elemental (14-18.675)2/18.675 (37-39.84)2/39.84 (32-24.485)2/24.485
Secundaria (19-17.55)2/17.55 (42-37.44)2/37.44 (17-23.01)2/23.01
Universidad (12-8.775)2/8.775 (17-18.72)2/18.72 (10-11.505)2/11.505
Numero de hijos
Educación
0-1 2-3 Mas de 3
Elemental (14-18.675)2/18.675 (37-39.84)2/39.84 (32-24.485)2/24.485
Secundaria (19-17.55)2/17.55 (42-37.44)2/37.44 (17-23.01)2/23.01
Universidad (12-8.775)2/8.775 (17-18.72)2/18.72 (10-11.505)2/11.505

X  2   = Frecuencia observada en una celda


  = Frecuencia esperada en una celda

  X2

1.170315 0.202450 2.306523


0.119801 0.555385 1.569757
1.185256 0.158034 0.196873

X 2
= 7.464393
Grados de Libertad G.L. = (Nº de Columnas – 1)*(Nº de filas – 1)
Gl = (r-1)*(k-1) r =3 k =3
Gl = (3-1)*(3-1) = 4
Nivel de significancia de  = 0,05 Entonces el Nivel de confianza de: 1-  = 0,95
El chi-cuadrado de tabla es:

El chi-cuadrado de tabla (teórico) es: X2α - GL = X20.05 - 4 X20.05 - 4 = 9.4877


c) Si el nivel de significancia es 0.05, ¿debe rechazarse la hipótesis nula?

Nivel de significación
α =0.05
Grados de libertad
r =3 k =3
r-1 k-1 =2
=2
Gl = (r-1)*(k-1) = 4

Regla de decisión
0,05 del área

X 2
= 7.464393

X 2
= 9.4877

0,05 - 4 X20,05 -4 = 9.4877
X2 = 7.46
X 2
< X 2
0,05 - 4
Como el 7.46 es menor a 9.48 se acepta H 0 y se concluye con
un  = 0,05 que el tamaño de la familia es independiente del
Se acepta la hipótesis nula nivel de instrucción del padre
PRUEBA DE INDEPENDENCIA
La directora de investigación de productos de una fábrica. En su proyecto actual, debe
determinar si existe alguna relación entre la clasificación de efectividad que los
consumidores asignan a un nuevo producto y el sitio (urbano o rural) en el cual se utiliza.
De los 100 consumidores a quienes se les practico la encuesta, 75 vivían en zonas
urbanas y 25 en zonas rurales, en la tabla de contingencia se resumen las clasificaciones
realizadas. Pruebe la hipótesis, con un nivel de significancia de 10%.
Atributo B: Ubicación
Atributo A Clasificación Urbano Rural Total
Encima del promedio 20 11 31
Promedio 40 8 48
Debajo del promedio 15 6 21

Planteamiento de la hipótesis nula y alternativa.


Hipótesis Nula: H0: La clasificación y la ubicación son independientes.
Hipótesis Alternativa: H1: La clasificación y la ubicación no son independientes.
a) Calcule el valor X2 de la muestra.

Atributo B: Ubicacion
Atributo A: Clasificación Urbano Rural Valor Mg. Filas

Encima del promedio 20 11 31


Promedio 40 8 48
Debajo del promedio 15 6 21
Valor Mg. Columnas 75 25 100

 𝒇 = 𝑲 𝒕 ∗ 𝑹𝒕
𝒆
𝒏
  = Total por fila
  = Total por columna
  = Total por fila
  = Frecuencia esperada en una celda
Atributo B: Ubicacion
Atributo A: Clasificación Urbano Rural Valor Mg. Filas

Encima del promedio 20 11 31


Promedio 40 8 48
Debajo del promedio 15 6 21
Valor Mg. Columnas 75 25 100

Frecuencias esperadas: fe Atributo A: Clasificación Urbano Rural


𝑹𝒕 ∗ 𝑪𝒕
𝒇  𝒆 = Encima del promedio (75*31)/100 (25*31)/100
𝒏
Promedio (75*48)/100 (25*48)/100
Debajo del promedio (75*21)/100 (25*21)/100

23.3 7.7 31
36.0 12.0 48
15.7 5.3 21
75 25 100
Frecuencias observadas: fo Frecuencias esperadas: fe
Atributo B: Ubicacion Atributo B: Ubicacion
Atributo A: Clasificación Urbano Rural Atributo A: Clasificación Urbano Rural
Encima del promedio 20 11 Encima del promedio 23.3 7.7
Promedio 40 8 Promedio 36.0 12.0
Debajo del promedio 15 6 Debajo del promedio 15.7 5.3

X  2
  = Frecuencia observada en una celda
  = Frecuencia esperada en una celda

  X2

  X2

  X2
Grados de Libertad G.L. = (Nº de Columnas – 1)*(Nº de filas – 1)
Gl = (r-1)*(k-1) r =3 k =2
Gl = (3-1)*(2-1) = 2
Nivel de significancia de  = 0,05 Entonces el Nivel de confianza de: 1-  = 0,95
El chi-cuadrado de tabla es:

El chi-cuadrado de tabla (teórico) es: X2α - GL = X20.1 - 2 X20.1 - 2 = 4.6052


Nivel de significación
α =0.1
Grados de libertad
r =3 k =2
r-1 k-1 =1
=2
Gl = (r-1)*(k-1) = 2

Regla de decisión
0,1 del área

X 2
= 3.76

X 2
0,1 - 2 = 4.6052
X2 = 3.76 X20,1 - 2 = 4.61

X 2
< X 2
0,1 - 2
Como el 3.76 es menor a 4.61 se acepta H 0 y se concluye con
un  = 0,1 que el tamaño de la clasificación y la ubicación son
Se acepta la hipótesis nula independientes.
Ejercicios a Desarrollar

1. Una agencia de publicidad intenta determinar la composición demográfica del mercado para
un nuevo producto. Seleccionaron al azar 75 personas de cada uno de 5 grupos de edad y les
presentaron el producto. Los resultados de la encuesta son los siguientes:

Grupo de Edad
Actividad Futura
18-29 30-39 40-49 50-59 60-69
Compra Frecuente 40 183 12 5 7
Compra alguna vez 24 26 2 2 0
Nunca compra 48 70 2 0 1

Desarrolle una tabla de frecuencias observadas y esperadas para este problema.


a) Calcule el valor X2 de la muestra.
b) Establezca las hipótesis nula y alternativa.
c) Si el nivel de significancia es 0.01, ¿debe rechazarse la hipótesis nula?
a) Calcule el valor X2 de la muestra.

Grupo de Edad Valor Mg.


Actividad Futura
18-29 30-39 40-49 50-59 60-69 Filas
Compra Frecuente 40 183 12 5 7 247
Compra alguna vez 24 26 2 2 0 54
Nunca compra 48 70 2 0 1 121
Valor Mg. Columnas 112 279 16 7 8 422

 𝒇 = 𝑪 𝒕 ∗ 𝑹𝒕   = Total por columna


𝒆
𝒏   = Total por fila
  = Total por fila
  = Frecuencia esperada en una celda
Grupo de Edad Valor Mg.
Actividad Futura
18-29 30-39 40-49 50-59 60-69 Filas
Compra Frecuente 40 183 12 5 7 247
Compra alguna vez 24 26 2 2 0 54
Nunca compra 48 70 2 0 1 121
Valor Mg. Columnas 112 279 16 7 8 422

Frecuencias esperadas: fe
Grupo de Edad
Actividad Futura
𝑪𝒕∗ 𝑹𝒕 18-29 30-39 40-49 50-59 60-69
𝒇  𝒆 =
𝒏 Compra Frecuente (112*247)/422 (279*247)/422 (16*247)/422 (7*247)/422 (8*247)/422
Compra alguna vez (112*54)/422 (279*54)/422 (16*54)/422 (7*54)/422 (8*54)/422
 𝑒 = 𝑛● 𝑗 ∗ 𝑛𝑖 ●
𝑖𝑗
𝑛
Nunca compra (112*121)/422 (279*121)/422 (16*121)/422 (7*121)/422 (8*121)/422
65.5545 163.3009 9.3649 4.0972 4.6825 247
14.3318 35.7014 2.0474 0.8957 1.0237 54
32.1137 79.9976 4.5877 2.0071 2.2938 121
112 279 16 7 8 422
Frecuencias observadas: fo
Grupo de Edad
Actividad Futura
18-29 30-39 40-49 50-59 60-69
Compra Frecuente 40 183 12 5 7
Compra alguna vez 24 26 2 2 0
Nunca compra 48 70 2 0 1

Frecuencias esperadas: fe 65.5545 163.3009 9.3649 4.0972 4.6825


14.3318 35.7014 2.0474 0.8957 1.0237
𝟐 32.1137 79.9976 4.5877 2.0071 2.2938
 ( 𝒇 𝒐 𝟏 − 𝒇 𝒆 𝟏)
𝒇 𝒆𝟏
Valor estadistico Chi-cuadrado de prueba (formula)
Grupo de Edad
Actividad Futura
18-29 30-39 40-49 50-59 60-69
Compra Frecuente (40-65.55)2/65.55 (183-163.3)2/163.3 (12-9.36)2/9.36 (5-4.1)2/4.1 (7-4.68)2/4.68
Compra alguna vez (24-14.33)2/14.33 (26-35.7)2/35.7 (2-2.05)2/2.05 (2-0.9)2/0.9 (0-1.02)2/1.02
Nunca compra (48-32.11)2/32.11 (70-79.99)2/79.99 (2-4.59)2/4.59 (0-2.01)2/2.01 (1-2.29)2/2.29
Grupo de Edad
Actividad Futura
18-29 30-39 40-49 50-59 60-69
Compra Frecuente (40-65.55)2/65.55 (183-163.3)2/163.3 (12-9.36)2/9.36 (5-4.1)2/4.1 (7-4.68)2/4.68
Compra alguna vez (24-14.33)2/14.33 (26-35.7)2/35.7 (2-2.05)2/2.05 (2-0.9)2/0.9 (0-1.02)2/1.02
Nunca compra (48-32.11)2/32.11 (70-79.99)2/79.99 (2-4.59)2/4.59 (0-2.01)2/2.01 (1-2.29)2/2.29

X
 2   = Frecuencia observada en una celda
  = Frecuencia esperada en una celda

  X2

Valor estadistico Chi-cuadrado de prueba (formula)


Grupo de Edad
Actividad Futura
18-29 30-39 40-49 50-59 60-69
Compra Frecuente 9.9617 2.3763 0.7414 0.1989 1.1470
Compra alguna vez 6.5222 2.6362 0.0011 1.3613 1.0237
Nunca compra 7.8587 1.2494 1.4596 2.0071 0.7298

X2 = 39.2747
b) Establezca las hipótesis nula y alternativa.
Hipótesis Nula: H0: Existe relación entre los grupo de edad y el nuevo producto.
Hipótesis Alternativa: Ha: No existe relación entre los grupo de edad y el nuevo producto.

c) Si el nivel de significancia es 0.01, ¿debe rechazarse la hipótesis nula?

α =0.01
r =3 k =5
r-1 =2 k-1 =4

Gl = (r-1)*(k-1) = 8

X 2
0,01 - 8 = 20,090

X 2
> X 2
0,01 - 8

Se rechaza la hipótesis nula

X20,01 - 8 = 20,090 X2 = 39.2747


2. Se estudia a 1040 estudiantes de los niveles de educación primaria y secundaria y a los
cuales se aplica un instrumento que mide el aprendizaje de la matemática, en las dimensiones
de aprendizaje conceptual, procedimental y actitudinal.
TABLA DE CONTINGENCIA
NIVEL DE EDUCACIÓN

Primaria Secundaria

Conceptual 180 100


APRENDIZAJE
Procedimental 190 280
Actitudinal 170 120

Variables:
APRENDIZAJE categorías: Conceptual, Procedimental, Actitudinal.
NIVEL DE EDUCACIÓN categorías: Primaria, Secundaria.
Tabla de frecuencias observadas (fo):

NIVEL DE EDUCACIÓN
TOTAL
Primaria Secundaria
Conceptual 180 100 280

APRENDIZAJE Procedimental 190 280 470


Actitudinal 170 120 290

  TOTAL 540 500 1040

La Chi-cuadrada es una comparación entre las tablas de frecuencias


observadas y la denominada tabla de frecuencias esperadas (la tabla que
esperaríamos encontrar si las variables fueran estadísticamente
independientes o no estuvieran relacionadas).
Tabla de frecuencias esperadas (fe):
La frecuencia esperada de cada celda, casilla o recuadro, se calcula mediante la
siguiente fórmula aplicada a la tabla de frecuencias observadas:
n = es el número total de frecuencias observadas.
eij = [(marginal de columna)*(marginal de fila)] / n.

NIVEL DE EDUCACIÓN
Valor Marginal
Primaria Secundaria de filas

Conceptual (280)(540)/1040 (280)(500)/1040 280


APRENDIZAJE Procedimental (470)(540)/1040 (470)( 500)/1040 470

Actitudinal (290)(540)/1040 (290)(500)/1040 290

Valor Marginal de columnas


540 500 1040
Frecuencia observada: NIVEL DE EDUCACIÓN
TOTAL
Primaria Secundaria

180 100 280


APRENDIZAJE Conceptual
190 280 470
Procedimental
Actitudinal 170 120 290
TOTAL 540 500 1040

Frecuencia esperada: NIVEL DE EDUCACIÓN


TOTAL
Primaria Secundaria

Conceptual 145,4 134,6 280


APRENDIZAJE
Procedimental 244,0 226,0 470
Actitudinal 150,6 139,4 290
 TOTAL 540 500 1040

(𝒇  ¿ ¿𝒐 − 𝒇 𝒆 )𝟐 Donde:
¿ fo: frecuencia observada en cada celda
𝒇𝒆
fe: frecuencia esperada en cada celda
Celda fo fe fo-fe (fo-fe)2 (fo-fe)2 /fe
Primaria Conceptual 180 145,4 34,6 1197,16 8,23
Procedimental 190 244,4 -54,4 2959,36 12,11
Actitudinal 170 150,6 19,4 376,36 2,50
Secundaria Conceptual 100 134,6 -34,6 1197,16 8,69
Procedimental 280 226,0 54,0 2916,00 12,80
Actitudinal 120 139,4 -19,4 376,36 2,70
47,33
  X2

X  2   X2

Para saber si el valor de X2 es o no significativo, debemos calcular los


grados de libertad.
Grados de Libertad G.L. = (Nº de filas - 1)(Nº de columnas - 1).
Siendo: Nº de filas = 3 y Nº de columnas = 2;
Entonces G.L. = (3-1)(2-1) = 2.
Luego, acudimos a la “tabla de distribución de Chi-cuadrado”, eligiendo
nuestro nivel de confianza ( = 0,05 ó  = 0,01).

Para el nivel de significancia de  = 0,05 y G.l. = 2,

El chi-cuadrado de tabla es: X2 = 5,9915


H0: Las dimensiones de aprendizaje de matemática son determinantes en el nivel de educación
H1: Las dimensiones de aprendizaje de matemática no son determinantes en el nivel de educación

Aplicación:
X2 Obtenido de formula = 47,33 X 2
> X
2
0,05 - 2

X2 Crítico o de tabla = 5,9915 Se rechaza la hipótesis nula

Si el valor obtenido de X2 es igual o superior al valor de la “tabla”, decimos


que las variables están relacionadas o no son independientes.
EJERCICIOS A DESARROLLAR
1. Estamos interesados en comprobar la perfección de un dado cúbico (un dado
normal de 6 caras). Para esto realizamos 100 lanzamientos del dado anotando los
puntos obtenidos en cada lanzamiento. A la vista de los resultados obtenidos,
¿podemos concluir que el dado no es perfecto?. Nivel de significación (5%)
 
Puntuación en el dado Número de veces que se obtiene la puntuación.
1 14
2 22
3 18
4 17
5 20
6 9
2. Para estudiar la dependencia entre la práctica de algún deporte y la depresión, se
seleccionó una muestra aleatoria simple de 100 jóvenes, con los siguientes
resultados:
Determinar si existe independencia entre la actividad del sujeto y su estado de
ánimo. Nivel de significación (5%)

  Sin Depresión Con Depresión

Deportista 38 9

No Deportista 31 22
3. Estamos interesados en estudiar la fiabilidad de cierto componente informático
con relación al distribuidor que nos lo suministra. Para realizar esto, tomamos una
muestra de 100 componentes de cada uno de los 3 distribuidores que nos sirven el
producto comprobando el número de defectuosos en cada lote. La siguiente tabla
muestra el número de defectuosos en para cada uno de los distribuidores.

Componentes Componentes
  Defectuosos Correctos  
Distribuidor 1 16 94 100
Distribuidor 2 24 76 100
Distribuidor 3 9 81 100
  49 251 300
4. Un estudio que se realizó con 81 personas referente a la relación entre la cantidad
de violencia vista en la televisión y la edad del televidente produjo los siguientes
resultados.
¿Indican los datos que ver violencia en la televisión depende de la edad del
televidente, a un nivel de significación del 5%?
  16 - 34 34 - 55 55 o mas
Poca Violencia 8 12 21
Mucha Violencia 18 15 7
5. Estamos interesados en estudiar la relación entre cierta enfermedad y la
adicción al tabaco. Para realizar esto seleccionamos una muestra de 150
individuos, 100 individuos no fumadores y 50 fumadores. La siguiente tabla
muestra las frecuencias de enfermedad en cada grupo (Completar la tabla).
Realizar un contraste de homogeneidad y obtener las conclusiones sobre la
relación entre las variables.
  Padecen la No Padecen la  
Enfermedad Enfermedad

Fumadores 12 88 100

No Fumadores 25 25 50

  37 113 150
6. Estamos interesados en estudiar la fiabilidad de cierto componente
informático con relación al distribuidor que nos lo suministra. Para realizar
esto, tomamos una muestra de 100 componentes de cada uno de los 3
distribuidores que nos sirven el producto comprobando el número de
defectuosos en cada lote. La siguiente tabla muestra el número de
defectuosos en para cada uno de los distribuidores. El nivel de significación
del 5%,.
Componentes Componentes
Distribuidor
Defectuosos Correctos
1 16 94
2 24 76
3 9 81
Un investigador quiere estudiar si hay asociación entre la práctica deportiva y la sensación
de bienestar. Extrae una muestra aleatoria de 100 sujetos. Los datos aparecen a
continuación.

Sensación de Práctica deportiva Total


Bienestar Sí no

Sí 20 25 45
No 10 45 55
Total 30 70 100
Contraste la hipótesis de independencia entre bienestar y práctica de deporte (alfa = 0,01).
Se desea estudiar hasta qué punto existe relación entre el tiempo de residencia de
inmigrantes en nuestro país y su percepción de integración. Se dispone de una muestra
pequeña de 230 inmigrantes a los que se les evaluó en ambas variables obteniéndose la
siguiente tabla de frecuencias observadas. ¿Confirman estos datos la hipótesis
planteada con un nivel de confianza del 95%?

Tiempo de residencia Grado de integración Total


Bajo Alto
Más tiempo 40 90 130
Menos tiempo 90 10 100
Total 130 100 230
Un politólogo cree que, durante los últimos años, la composición étnica de la ciudad
donde vive ha cambiado. Las cifras más actuales (reunidas hace unos cuántos años)
muestran que los habitantes de dicha ciudad presentan la siguiente composición étnica:
53% noruegos, 32% suecos, 8% irlandeses, 5% alemanes y 2% italianos. Para verificar
esta idea, este científico social obtiene una muestra aleatoria de 750 habitantes, con los
resultados que se presentan en la siguiente tabla:

Países Noruegos Suecos Irlandeses Alemanes Italianos

frecuencia 399 193 63 82 13

a). ¿Cuál es la hipótesis nula?


b). ¿Cuál es la hipótesis alterna?
c). ¿Cuál es la conclusión?. Utilice  = 0,05.
Una universidad está pensando en implantar uno de los tres sistemas de calificaciones
siguientes: (1) todas las calificaciones son aprobados-reprobado; (2) todas las calificaciones
están en el sistema 4.0 y (3) 90% de las calificaciones están en el sistema 4.0 y 10% son a
probados-reprobado. Se realiza una encuesta para determinar si existe una relación entre el
área de interés de cada alumno y su presencia para algún sistema de calificación. Se elige
una muestra aleatoria de 200 estudiantes del área ingeniería, 200 de ciencias, y 100 de
bellas artes. Se pregunta a cada alumno cuál de los tres calificaciones prefieren. Los
resultados aparecen en la siguiente tabla:

Sistema de Calificación
Aprobado-Reprobado 4,0 4,0 y Aprobado-reprobado

Bellas Artes 26 55 19
Ciencias 24 118 58
Ingeniería 20 112 68

a). ¿Cuál es la hipótesis nula?


b). ¿Cuál es la hipótesis alterna?
c). ¿Cuál es la conclusión?. Utilice  = 0,05.
Debido a la inflación galopante, el gobierno está considerando la imposición de un control de
precios y salarios. Un economista del gobierno, interesado en determinar si existe una
relación entre el empleo y la actitud hacia este control, reúne los siguientes datos. Los datos
muestran, para cada tipo de empleo, el número de individuos en la muestra que están a favor
o contra de los controles.
Actitud hacia el control de precios y salarios
A favor En contra
Obreros 90 60
Empresarios 100 150
Profesionales 110 90

a). ¿Cuál es la hipótesis nula?


b). ¿Cuál es la hipótesis alterna?
c). ¿Cuál es la conclusión?. Utilice  = 0,05.
Ejercicio 1: (Aplicación en Ciencias de la salud)

El número de alumnos por semana que sufren algún tipo de accidente en un colegio durante 36
semanas del periodo escolar es la siguiente:

Nº alumnos accidentados (X) 0 1 2 3 4 o más


Nº de semanas con X accidentes (ni) 6 8 10 6 6

Probar si la muestra de datos se ajusta a una distribución de Poisson con intensidad λ, con un
nivel de significación de 5%
1. (Aplicación en Ciencias de la Salud) En una ciudad la distribución habitual del grupo
sanguíneo es de un 35%, 10%, 6% y un 49% para los grupos A, B, AB y O respectivamente.
En Antofagasta, se realizó el estudio en una muestra de 200 individuos obteniéndose una
distribución de 100, 60, 36, y 20 individuos para los grupos A, B AB y O respectivamente.
Verifique si la muestra de datos de la ciudad de Antofagasta se ajusta a la distribución
habitual del grupo sanguíneo en dicha ciudad usando un nivel de significación de 0.01.
2. (Aplicación en Ciencias de la Salud) Con el fin de conocer si un cierto tipo de bacterias se
distribuyen al azar en un determinado cultivo o si, por el contrario, lo hacen con algún tipo
de preferencia (el centro, los extremos, etc...), se divide un cultivo en 576 áreas iguales y se
cuenta el número de bacterias en cada área.
Los resultados son los siguientes:
no de bactérias 0 1 2 3 ≥4
no de áreas 229 211 93 35 8
¿Se ajustan los datos a una distribución de Poisson de intensidad λ? Use un nivel de
significación de 0.05
3. (Aplicación en Ciencias de la Salud) La siguiente tabla recoge la distribución de los
triglicéridos en suero, expresados en mg/dl en 90 niños de 6 años:
Nivel de triglicéridos Frecuencias
Menos de 20 5
20 – 30 11
30 – 40 15
40 – 50 24
50 – 60 18
60 – 70 12
70 o más 5
Contrastar la hipótesis de que los datos se ajustan a una distribución Normal de media μ y
varianza σ2 con un nivel de significación de 0.05
Ejercicio 1: (Aplicación en Ciencias de la ingeniería)
Una empresa minera hizo un estudio para verificar si el tipo de trabajo se relaciona con el
grado de silicosis de los trabajadores. Para lo cual se elige una muestra aleatoria de 300
trabajadores y se clasifican en la tabla siguiente:

Grado de Silicosis
Tipo de Trabajo Total
I II III
Oficina 42 24 30 96
Terreno 54 78 72 204
Total 96 102 102 300

a) Probar la hipótesis de que el tipo de trabajo afecta el grado de silicosis del trabajador
con un nivel de significación de 5%
b) Determine el grado de relación
1. (Aplicación en Ciencias de la Salud)
Una institución ambiental hizo un estudio para determinar si el sector habitacional se relaciona con
el grado de contaminación por plomo. Una muestra aleatoria de 300 personas a las que se les
examinó entregó los siguientes resultados:

Grado de Contaminaciòn
Sector Habitacional
Alto Medio Bajo
Gran Vìa 18 6 12
Goviefi 42 24 30
Playa Blanca 36 72 60

a) ¿Cree usted que el sector habitacional se relaciona con el grado de contaminación por plomo?
Use una confiabilidad de 99% en su conclusión.
b) Determine el grado de relación entre las variables analizadas e interprete el resultado.
2. (Aplicación en Ciencias del Mar) Se desea comparar la efectividad de dos análisis de
laboratorio para detectar la presencia de bacterias en equinodermos (erizo rojo), para ello
se selecciona dos muestras independientes de Loxechinus albus (erizo rojo comestible) en un
sector de caleta coloso y los resultados de los análisis fueron los siguientes:

Dirección de la Bacteria
Análisis Total
Si No
1 11 39 50
2 8 42 50
Total 19 81 100

a) Pruebe la hipótesis de que la detección de la bacteria es independiente del tipo de


análisis usado, con un nivel de significación de 0.05
b) Determine el grado de relación entre las variables
3. (Aplicación en Ciencias del Mar) La siguiente tabla muestra la distribución de una
muestra aleatoria de 400 truchas cafés de un gran río., según la longitud y el sector
donde fueron extraídas.

Sector del Rio


Longitud
Alto Centro Bajo
Bajo el Promedio 67 64 25
Promedio 42 76 56
Sobre el Promedio 10 23 37

a) Pruebe la hipótesis de que existe alguna relación entre la longitud de las truchas y el
sector del río donde fueron extraídas, usando un nivel de significación de 0.05.
b) ¿Cuál es el grado de relación entre las variables?.
EJERCICIO: (APLICACIÓN EN CIENCIAS DE LA INGENIERÍA)
En un proceso de fabricación de tornillos, el fabricante quería determinar si la proporción de
tornillos defectuosos producidos por tres máquinas variaba de una máquina a otra. Para
verificar esto se seleccionaron muestras de 400 tornillos de la producción de cada máquina y
se contó el número de tornillos defectuosos en cada una, obteniendo la siguiente tabla de
frecuencias.

Maquinas
Calidad Total
1 2 3
Defectuosos 16 24 9 49
No Defectuosos 384 376 391 1151
Total 400 400 400 1200

Pregunta: Realizando la prueba de hipótesis adecuada, verifique si la proporción de tornillos


defectuosos no varía entre las diferentes máquinas. Use un nivel de significación de 0.05.
1. (Aplicación en Ciencias de Ingeniería) Se desea probar si la distribución proporcional
del rendimiento en una gran compañía variaba según el coeficiente intelectual de los
trabajadores, para lo cual se toma una muestra para cada nivel del CI y se clasifica según el
rendimiento en la compañía en la siguiente tabla.

Rendimiento
Coeficiente Intelectual
Deficiente Regular Bueno
Bajo el Promedio 67 64 25
Promedio 42 76 56
Sobre el Promedio 10 23 37

Verifique la hipótesis que la distribución proporcional del rendimiento en la compañía es el


mismo para cada nivel de CI. Use un nivel de significación de 5%
2. (Aplicación en Ciencias de Ingeniería) Con el propósito de decidir si la opinión sobre el
nivel de las carreras de ingeniería, que tienen los académicos y los alumnos, son
concordantes, se procede a encuestar a 100 académicos y a 200 alumnos, obteniéndose los
siguientes resultados:

Deficiente Regular Bueno Excelente


Académico 36 55 4 5
Alumnos 80 93 14 13

Pruebe la hipótesis que la distribución proporcional de la opinión entre los académicos y


los alumnos es la misma, usando una significación de 0.05
3. (Aplicación en Ciencias de la salud) El Servicio nacional de salud desea verificar si la
distribución proporcional del estado nutricional de los niños no varía en tres ciudades de
la región, para lo cual toma una muestra de niños de las tres ciudades y los clasifica
según estado nutricional obteniendo la siguiente tabla:

Ciudad
Total
Lima Huacho Cañete
Estado Nutricional Obeso 82 70 62 214
Sobrepeso 93 62 67 222
Normal 25 18 21 64

Flaco 16 15 18 49

Total 216 165 168 549


Realice el análisis estadístico correspondiente destacando las hipótesis que usted deberá
probar con una significación de 0.05 y los pasos que ha seguido para lograr su
conclusión.
GRACIAS

También podría gustarte