Documentos de Académico
Documentos de Profesional
Documentos de Cultura
SEMANA N° 15
ÍNDICE
Pág.
1. INTRODUCCIÓN ............................................................................................................................... 3
Actividad 1 .............................................................................................................................................15
5. GLOSARIO ........................................................................................................................................19
1. INTRODUCCIÓN
2. CONTENIDO TEMÁTICO
Mediante esta prueba se comprueba si es que un conjunto de datos sigue o se distribuyen conforme a una
distribución teórica conocida.
∑𝑘
𝑖=1(𝑂𝑖−𝐸𝑖)
2
La fórmula es: 𝜒𝑐2 = ~𝜒(𝑘−𝑚−1) , donde
𝐸𝑖 2
Ejemplo:
Supongamos el experimento de lanzar un dado 60 veces. Se sabe que las frecuencias teoricas, para este caso ,
son de 10 veces cada cara y las frecuencias reales son los resultados del lanzamiento. ¿con base en un nivel de
significacion del 5%, permite suponer que el dado no es perfecto?
Tabla 3.1.1
de valores para el experimento de lazar un dado
Caras Oi Pi Ei (Oi - Ei)2/Ei
1 7 0,17 10 1
2 14 0,17 10 2
3 8 0,17 10 0
4 5 0,17 10 3
5 16 0,17 10 4
6 10 0,17 10 -
60 9
Fuente: Datos del problema
Solucion.
En el problema nos da las frecuencias observadas para cada ves que se obtiene cara. Las frecuencias esperadas
se obtienen multiplicando la probabilidad de obtener un suceso al lanzar un dado (i=1,2,3,4,5,6), p(i) = 1/6.
Entonces el valor esperado es Ei = n*pi Ei = 60*1/6 = 10.
Realizamos el procedimiento para comprobar la Hipótesis.
1) Ho: Fo = Fe; o Ho: Oi = Ei
H1: Fo ≠ Fe o H1: Oi ≠ Ei
Ho: El dado no está cargado
H1: el dado está cargado
2) α = 0,05
∑𝑘
𝑖=1(𝑂𝑖−𝐸𝑖)
2
3)EP: 𝜒𝑐2 = =9
𝐸𝑖 2
4) Región critica
Grados de libertad = k-m-1 = 6 – 0 - 1=5
2
𝜒2 < 𝜒0,05 es decir 9 < 11,07 (ver tabla ji-cuadrado)
Gráfica de distribución
Chi-cuadrada; df=5
0,16
0,14
0,12
0,10
Densidad
0,08
0,06
0,04
0,02
0,05
0,00
0 11,07
X
5) Por lo tanto no se rechaza la Ho, por lo que se acepta la hipótesis de que la diferencia no es significativa.
Podemos afirmar al 5%, que las diferencias que presentan las frecuencias reales, con relación a las frecuencias
teóricas no nos dan base para decir que el dado está cargado.
Ejemplo.
El gerente de una empresa sospecha que el día de la semana influye en la cantidad de trabajadores que llegan
tarde al trabajo. Para probar su conjetura selecciona una muestra de 50 semanas y realiza un conteo del número
de tardanzas para cada día laboral, la información que obtiene es la siguiente:
día Lunes Martes Miércoles Jueves Viernes Sábado
frecuencia 18 8 7 4 3 10
Este caso sigue una distribución uniforme discreta, donde asumiremos que la probabilidad de que un trabajador
llegue tarde es cualquier día es la misma 1/6
1) Ho: La probabilidad de que un trabajador llegue tarde al trabajo en cualquier día de la semana es la misma
e igual a 1/6.
H1: La probabilidad de que un trabajador llegue tarde al trabajo en cualquier día de la semana no es la misma.
2) α = 0,05
∑𝑘
𝑖=1(𝑂𝑖−𝐸𝑖)
2
3) EP: 𝜒𝑐2 = = 17,44 (ver tabla adjunta)
𝐸𝑖 2
Tabla 3.1.2
Valor observado y esperado de las tardanzas de los trabajadores
Día frecuencia Pi Ei (Fe - Ei)2/Ei
Lunes 18 0,167 8,333 11,213
Martes 8 0,167 8,333 0,013
Miércoles 7 0,167 8,333 0,213
Jueves 4 0,167 8,333 2,253
Viernes 3 0,167 8,333 3,413
Sábado 10 0,167 8,333 0,333
Suma 50 1,00 17,44
Fuente: datos del problema
Nota: ejercicio tomado de (Daza Portocarrero, pág. 392)
4) Región critica
Grados de libertad = k-m-1 = 6 – 0 - 1=5
2
𝜒0,05;5 = 11,07
2
𝜒2 > 𝜒0,05 es decir 17,44 > 11,07 (ver tabla ji-cuadrado)
Gráfica de distribución
Chi-cuadrada; df=5
0,16
0,14
0,12
0,10
Densidad
0,08
0,06
0,04
0,02
0,05
0,00
0 11,07
X
si P. valor ≤ α, aceptar H1
si P. valor > α, aceptar H0
Tabla 3.1.3
Frecuencias observadas para la duración de las baterías suponiendo
normalidad
Li Ls xi fi hi
1,5 1,9 1,7 2 0,05
2 2,4 2,2 1 0,025
2,5 2,9 2,7 4 0,1
3 3,4 3,2 15 0,375
3,5 3,9 3,7 10 0,25
4 4,4 4,2 5 0,125
4,5 4,9 4,7 3 0,075
Suma 40 1
Nota: Datos tomados de Walpole, et alt 2012, pág. 23
Solución
Averiguamos a que distribución es más probable que se ajuste el tiempo de duración de las baterías, para ello
elaboramos un histograma de frecuencias.
La distribución de la duración de las baterías es aproximadamente normal, sigue una asimetría negativa (-0.36)
por lo que los valores se tienden a reunir más en la parte derecha de la media, además la curtosis es (36) por lo
que es una distribución leptocurtica.
Figura 1.
Histograma de frecuencia para la duración de las baterías
Para poder hallar el valor de las probabilidades correspondientes a cada una de las
categorías de la variable, asumiendo una distribución normal debemos hallar la media
̅ = 3.41 y desviación estándar 𝒔𝟐 = 0.7 Las frecuencias esperadas para
de la muestra 𝒙
las 7 clases (celdas) se obtienen calculando las áreas bajo la curva normal hipotética
que caen entre los diversos límites de clase.
Tabla 3.1.4
Frecuencias observadas y esperadas para la duración de las baterías suponiendo
normalidad
Li Ls xi fi Z Ei
1,45 1,95 1,7 2 0,016 0,6
1,95 2,45 2,2 1 7 0,067 2,7 10,1
2,45 2,95 2,7 4 0,170 6,8
2,95 3,45 3,2 15 0,267 10,7
3,45 3,95 3,7 10 0,257 10,3
3,95 4,45 4,2 5 0,152 6,1 8,3
4,45 4,95 4,7 3 8 0,055 2,2
Suma 40
Nota: Datos tomados de Walpole, et alt 2012, pág. 23
Para calcular los valores de Z estandarizado, corresponde a los límites de los intervalos,
por ejemplo: P [1,45 < X < 1,95] cuando el promedio es 3,41 y s = 0.7. utilizando la
tabla Z, se halla los valores.
1,95−3,41 1,45−3,41
𝑃 [𝑍 ≤ ] − 𝑃 [𝑍 ≤ ] = 𝜑(−2,09) − 𝜑(−2,8)
0,7 0,7
Gráfica de distribución
Chi-cuadrada; df=1
1,6
1,4
1,2
1,0
Densidad
0,8
0,6
0,4
0,2
0,05
0,0
0 3,841
X
2
5) decisión: Como el valor de 𝜒2 < 𝜒0,05 2,715 < 3,841. No rechazamos la Ho. No existe suficiente
evidencia estadística para rechazar la Ho a un nivel del 5%, por lo tanto se concluye que la duración de las
baterías si se distribuyen normalmente.
Se realiza la prueba de independencia cuando estamos interesados en saber si dos variables categóricas son
independientes o están relacionadas. Se dice que dos variables categóricas son independientes si la distribución
de una variable no depende de la distribución de la otra.
2
(𝑂𝑖𝑗 −𝐸𝑖𝑗 )
El estadístico de prueba es: 𝜒2 = ∑𝐹𝑖=1 ∑𝐶𝑗=1 𝐸𝑖𝑗
2
~𝜒(𝐹−1)(𝐶−1) , donde
Ejemplo. Suponga que deseamos determinar si las opiniones de los votantes residentes de la región
Lambayeque respecto a una nueva reforma fiscal son independientes de sus niveles de ingreso.
Los sujetos de una muestra aleatoria de 1,371 votantes registrados de la región Lambayeque se clasifican de
acuerdo con su posición en las categorías de ingreso bajo, medio o alto, y si están a favor o no de la nueva
reforma fiscal. Las frecuencias observadas se presentan en la tabla adjunta, la cual se conoce como tabla de
contingencia
10
4) Región critica
2 2
𝜒(2−1)(3−1);0.05 = 𝜒(2);0,05 =5,991
También se puede usar: si p-valor ≤ 0,05, se rechaza la Ho
si p-valor > 0,05, no se rechaza la Ho
Gráfica de distribución
Chi-cuadrada; df=2
0,5
0,4
Densidad
0,3
0,2
0,1
0,05
0,0
0 5,991
X
Nivel de ingreso
Reforma fiscal
Bajo Medio Alto
A favor 233 187 278
En contra 225 180 268
𝐹 𝐶 2
2
(𝑂𝑖𝑗 − 𝐸𝑖𝑗 ) 2
𝜒 = ∑∑ ~𝜒(𝐹−1)(𝐶−1)
𝐸𝑖𝑗
𝑖=1 𝑗=1
𝐹 𝐶 2
2
(𝑂𝑖𝑗 − 𝐸𝑖𝑗 ) (280 − 233)2 (222 − 187)2 (196 − 278)2 (178 − 225)2
𝜒 = ∑∑ = + + + +
𝐸𝑖𝑗 233 187 278 225
𝑖=1 𝑗=1
5) decisión. Como el valor de 𝜒2 es mayor que el valor Chi – cuadrado de la tabla, es decir 80 > 5,99. Quiere
decir que existe suficiente evidencia estadística para rechazar la Ho a un nivel del 5%, por lo tanto se concluye
las opiniones de los votantes depende su nivel del nivel de ingreso.
Si vemos el p-valor es menor que 5%, por lo que se rechaza la Ho.
Corrección de yates
Si la tabla de contingencia es del orden 2x2, o si el tamaño de muestra es menor que 50, se debe emplear el estadístico
Chi cuadrado de Pearson corregido.
𝐹 𝑘
2
(|𝑂𝑖 − 𝐸𝑖 | − 0,5)2 2
𝜒 = ∑∑ ~𝜒(𝐹−1)(𝐶−1)
𝐸𝑖
𝑖=1 𝑖=1
Se debe utilizar para casos cuando los grados de libertad =1 cuando n < 50, en aquellos casos en que algunas
o todas las frecuencias esperadas sean menores que 5.
Coeficiente de contingencia
Entonces si se quiere medir el grado asociación.
𝝌𝟐
𝑪=√ 𝟐 𝟎≤𝑪≤𝟏
𝝌 +𝒏
𝟖𝟐
𝑪=√ = 𝟎, 𝟐𝟑𝟖
𝟖𝟐 + 𝟏, 𝟑𝟕𝟏
Esta prueba se realiza cuando se quiere demostrar que dos o más muestras proceden de la misma población, o
dos o más poblaciones tienen la misma distribución. Para que dos o más poblaciones tengan la misma
distribución sus respectivas proporciones son similares o homogéneas.
En la prueba de homogeneidad, al contrario de la de independencia se extraen dos muestras o más muestras
provenientes de dos o más poblaciones; algunas ves, de una muestra se pueden obtener dos o más categorías
y el interés es el de probar si las poblaciones tienen cierta identidad con respecto a la característica analizadas.
Estadístico de prueba es el mismo solo difiere en cómo se recolectan los datos y se interpretan los resultados.
𝐹 𝑘
2
(𝑂𝑖𝑗 − 𝐸𝑖𝑗)2 2
𝜒 = ∑∑ ~𝜒(𝐹−1)(𝐶−1)
𝐸𝑖
𝑖=1 𝑖=1
Ejemplos. En una tienda que venden lavadoras y aspiradoras eléctricas y tienen 3 vendedores. Las ventas
realizadas en un mes por dichos vendedores, son las siguientes:
Tabla.
Distribución de los artículos vendidos según clasificación de los vendedores
Clasificación
Atributos Total
1 2 3
Lavadoras 20 8 15 43
Aspiradoras 17 16 5 38
Total 37 24 20 81
¿demuestra este resultado que la habilidad de cada vendedor depende del articulo vendido? Pruebe la hipótesis
de homogeneidad al nivel del 5%
Solución
1) Ho: las muestras se extraen de la misma población
H1: las muestras se extraen de poblaciones diferentes
2) α =0.05
3)EP:
𝐹 𝑘
2
(𝑂𝑖𝑗 − 𝐸𝑖𝑗)2 2
𝜒 = ∑∑ ~𝜒(𝐹−1)(𝐶−1)
𝐸𝑖
𝑖=1 𝑖=1
Tabla.
Valores esperados de los artículos vendidos según clasificación
de los vendedores
Clasificación
Atributos
1 2 3
Lavadoras 19,64 12,74 10,62
Aspiradoras 17,36 11,26 9,38
4) Región critica
2
El valor de Chi cuadrado en la tabla es 𝜒0,05;2 = 5,99
Si calculamos el p-valor = 0,022 < 0.05. Entonces rechazamos la Ho.
Gráfica de distribución
Chi-cuadrada; df=2
0,5
0,4
Densidad
0,3
0,2
0,1
0,05
0,0
0 5,991
X
5) conclusión. Como el valor calculado 𝝌𝟐𝒄 > 𝝌𝟐𝟎,𝟎𝟓;𝟐 7,63 > 5,991. Rechazamos la Ho. Las muestras se extraen
de poblaciones diferentes. También podemos contestar que la habilidad de cada vendedor no depende del
artículo, al nivel del 5%.
4. ACTIVIDADES Y EVALUACIÓN
Actividad 1
Problema 1. Los siguientes datos muestran el efecto de cierto tipo de fumigación sobre el deterioro de la fruta.
Deterioro de la Proceso
fruta Sin fumigar Fumigada Total
Deteriorada 8 2 10
Sana 16 14 30
Total 24 16 40
Problema 2. Una estadística de accidentes leves, ocurrido en dos fábricas Ay B muestran que, de 102
accidentes, 59 han tenido lugar en la fábrica A y 43 en la fábrica B. Formulemos la hipótesis de que no existe
relación entre el número de accidentes y el hecho de que ocurra en la fábrica A o en la fábrica B.
Problema 3. José Mamani de la CIA de electrodomésticos “Racso” tiene que visitar 6 clientes por día. Dada
la siguiente distribución de frecuencias del número de ventas hechas por el señor Mamani. ¿podemos concluir
que los datos se ajustan a una distribución teórica conocida? Utilice un nivel de significancia del 2%
Nº de ventas 0 1 2 3 4 5 6
Nº de días 20 45 70 55 30 20 10
Problema 4. El administrador de la sucursal del Banco de la Nación, que se encuentra ubicado en el distrito
de Jesús Cajamarca, desea saber si es que el número de clientes por hora que llegan a la agencia bancaria sigue
una distribución teórica conocida. para ello toma una muestra de 400 horas obteniendo lo siguiente
Nº de llegadas
0 1 2 3 4 5 6 o más total
por hora
Numero de
10 60 80 100 90 50 10 400
horas
a un nivel de significancia del 1% pruebe si el número de clientes que llegan por hora se ajusta a una
distribución teórica.
Problema 5. El ingeniero de cierta fábrica de tubos, está interesado en saber a qué distribución teórica se ajusta
el espesor de los tubos fabricados. Para ello selecciona de manera aleatoria 53 tubos obteniendo la siguiente
tabla de frecuencias:
Problema 6. El administrador de un supermercado, desea saber que distribución teórica sigue el tiempo que
el cliente tiene que esperar delante de la caja antes de realizar el pago por la compra. Para ello selecciona una
muestra de 500 clientes y encuentra la siguiente información.
tiempo de nº de
espera clientes
1-2 90
2-3 110
3-4 96
4-5 97
5-6 107
Total 500
Pruebe con un nivel de significancia del 2% si el tiempo de espera del cliente en la caja sigue la distribución
teórica.
Problema 7. En los experimentos de Mendel con guisantes, observó que 315 lisos y amarillo, 108 lisos y
verdes, 101 rugosos y amarillos y 32 rugosos y verdes. De acuerdo con su teoría, estos números deberían
presentarse en la proporción 9:3:3:1. ¿hay alguna evidencia que permite dudar de su teoría al nivel de
significancia del 1% y 5%.
Problema 8. Se presenta la manera en que las personas hacen sus declaraciones de impuestos y su nivel de
estudios. La hipótesis nula es que la manera en que las personas hacen sus declaraciones de impuestos (usando
software o sólo lápiz y papel) es independiente de su nivel de estudios. La tabla 12.5 es una tabla de
contingencia.
nivel de estudios
manera preparatoria licenciatura maestría
computadora 23 35 42
papel y lapiz 45 30 25
Problema 9. Una empresa de teléfonos celulares realiza una encuesta para determinar la proporción de
personas que tienen teléfono celular en los distintos grupos de edad. En la tabla 12.14 se muestran los
resultados obtenidos en 100 hogares. Probar la hipótesis de que, en los diferentes grupos de edad, las
proporciones de personas que tienen teléfono celular son las mismas.
Grupos de edad
teléfono celular 18-24 25 54 >=65
si 50 80 70 50
no 200 170 180 200
Rubrica de evaluación
5. GLOSARIO
6. REFERENCIAS