Carlos Valenzuela ¿QUE ES LA DISTRIBUCION CHI CUADRADO? La distribucion chi-cuadrado es una prueba de hipótesis que compara la distribución observada de los datos con una distribución esperada de los datos. Entre sus usos están : intervalos de confianza y pruebas de hipótesis para las varianzas o desviaciones estándar. PROPIEDADES DE LA DISTRIBUCIÓN CHI CUADRADO Ejemplo de 𝑋 2 para 5 muestras 1. La media La media es igual al número de grados de libertad (que es igual al tamaño de las muestras menos ) μ=ν=n–1 2. La varianza es igual a dos veces el número de grados de libertad (por lo tanto la desviación estándar es la raíz cuadrada de 2ν ; donde ν son los grados de libertad ). 𝜎 2 = 2𝑣 3. El máximo valor ocurre cuando 𝑋2 = 𝑣 − 2 4. Conforme los grados de libertad (tamaño de la muestra) aumenta, la distribución chi-cuadrado se aproxima a la distribución normal. 2 SOBRE EL GRAFICO DE 𝑋 La distribución χ2, como otras distribuciones por ejemplo la t de student y la z-normal estándar, se construye de forma que el área total bajo la curva sea igual a 1. El área bajo la curva entre 0 y un valor particular de la estadística chi-cuadrada es la probabilidad asociada con ese valor. Por ejemplo, en la figura, el área sombreada representa la probabilidad acumulada para una χ2 igual a un valor A. El grafico de esta distribución depende de el nivel de confianza. EJEMPLO La vice decanatura de la facultad de ingeniería de la universidad quiere tener datos estaditicos a cerca del comportamiento de los estudiantes en cuanto a perdidas y retiros de materias en el área de las matemáticas . En los últimos 3 años se han ofrecido 66 diurnos y 66 cursos nocturnos; al analizar los cursos tomados al azar se resume asi : Diurnos #estudiantes #estudiantes #estudiantes Nocturnos #estudiantes #estudiantes #estudiantes matriculados retirados que pierden matriculados retirados que pierden A 33 7 8 A 23 7 4 B 27 10 4 B 18 3 6 C 21 6 4 C 44 10 12 D 41 13 7 D 31 6 8 E 32 8 5 E 30 4 7 F 36 6 9 F 37 8 9 G 18 5 3 G 26 5 7 H 29 6 9 H 23 3 5 I 26 4 8 I 24 6 7 J 31 11 5 J 28 5 4 K 30 7 7 K 28 6 4 El vicedecano quiere saber si las desviaciones estándar del numero de estudiantes que retira de noche por curso es inferior a 3. Solución 1. 𝐻0 : 𝜎 2 = 9 ; 𝐻𝑎 : 𝜎 2 < 9 2. 𝑆𝑥 2 = 4,41 ; 𝑔𝑙 = 𝑛 − 1 = 10 𝛼 3. 1 − 𝛼 % = 99% → 𝛼 = 0,01 → 2 = 0,005 (𝑛−1)𝑆𝑥 2 10∗4,41 4. 𝑋2 = = = 4,909 9 9 5. 𝑋 2 𝛼; 𝑛 − 1 = 𝑋 2 0,01,10 = 23,20 6. 𝑋 2 1 − 𝛼 ; 𝑛 − 1 = 𝑋 2 0,99,10 = 2,55
7. Conclusion: Ya que el estadístico de prueba se encuentra en la región de aceptación ,
entonces aceptamos 𝐻0 , es decir que la desviación estándar del numero de estudiantes que retira de noche por curso es inferior a 3. EJEMPLO Leche caribe tiene 2 plantas de producción , uno de sus principales productos es el queso . Este se fabrica en cada planta preparando la leche y luego vertiéndola en los moldes ; después de aproximadamente 6 horas se retiran los cubos del queso listos para despacho. Una muestra de 12 cubos tomados al azar se inspeccionan cada dia en la planta C , esta arrojo una deviación estándar de 0,5Lb y peso medio de 17,5Lb . De la plata G se toman 15 cubos , estos arrojan un peso medio de 17,5Lb y desviación estándar de 0,4Lb. 1.Esime la varianza por intervalos de confianza de los pesos de los cubos de queso en cada platna. SOLUCION 𝛼 𝛼 1 − 𝛼 = 0,90 → 𝛼 = 0,1 → = 0,05 → 1 − = 0,95 2 2 2 𝑛−1 𝑆𝑋 (𝑛−1)𝑆𝑥 2 FORMULA : ≤ 𝜎2 ≤ 𝑋2 𝛼 𝑋 2 𝛼−1 ;𝑛−1 1− 2 ;𝑛−1