Probabilidad y Estadística

Probabilidad y Estadística
Tema 15 Análisis de datos discretos

Objetivo de aprendizaje del tema
Al finalizar el tema serás capaz de:

Explicar la prueba de hipótesis Chi-Cuadrada para datos agrupados.

Aplicar las pruebas de bondad de ajuste de la inferencia estadística.

D.R. UNIVERSIDAD TECMILENIO

Derechos Reservados. Universidad Tec Milenio.

el reclutador observó que los egresados de universidades públicas obtenían mejor calificación que los egresados de universidades privadas. para determinar el valor de su media poblacional. a través de datos muestrales. ingresos y edades. De hecho en los últimos años. ¿Será cierto que dependiendo del tipo de universidad. ¿cuál es la universidad que en teoría está preparando mejor a sus alumnos? D.Probabilidad y Estadística Introducción al tema En una empresa de desarrollo de software. más aún.R. de personas que estudiaron en una universidad pública. de dos medias o proporciones poblacionales. el egresado saldrá mejor preparado?. sino en escala nominal u ordinal y si no se hacen suposiciones acerca de la forma de población origen? Te invito a que juntos conozcamos la distribución de probabilidad Chi-Cuadrada y a que exploremos las técnicas permiten realizar pruebas de bondad de ajuste a datos en los niveles nominal u ordinal. D. las contrataciones de recién egresados ha sido en su mayoría. UNIVERSIDAD TECMILENIO Introducción al tema Las pruebas de hipótesis hasta ahora se han aplicado a datos en escala de intervalo. .R. ¿Pueden aplicarse pruebas si los datos no están en escala de intervalo. como pesos. pública o privada. Universidad Tec Milenio. de una proporción o bien. UNIVERSIDAD TECMILENIO Derechos Reservados.

El valor calculado es siempre positivo Las distribuciones no son simétricas. Zn. es una distribución de varianzas muestrales Si a cada muestra se le calcula su varianza. independientes y distribuidas. entonces: D. ….Probabilidad y Estadística Distribución Chi-Cuadrada También llamada JiCuadrado o Chi-Cuadrata de Pearsons. UNIVERSIDAD TECMILENIO Distribución Chi-Cuadrada Existe una familia de distribuciones ji cuadrada cada una con un grado de libertad (ver gráfica 15. tienen colas estrechas que se extienden a la derecha. es decir. se obtendrá la distribución muestral de varianzas. son variables aleatorias. El área bajo la curva y sobre el eje horizontal es igual a 1 Al aumentar los grados de libertad. Esto significa que presenta un sesgo positivo. existe un número infinito de distribuciones. Si Z1.R.R. Z2. Universidad Tec Milenio. se aproxima a la curva normal.1). D. . UNIVERSIDAD TECMILENIO Derechos Reservados. en consecuencia.

Probabilidad y Estadística Distribución Chi-Cuadrada • Familia de Curvas Chi-Cuardada para distintos grados de libertad. aunque también puede utilizarse para niveles de datos nominal y de razón. Ideada por Karl Pearson a principios de 1900. . UNIVERSIDAD TECMILENIO Prueba de Bondad de Ajuste Las pruebas de bondad de ajuste Chi-Cuadrada es una de las pruebas no paramétricas más utilizadas. Universidad Tec Milenio. D. D.R. Es apropiada para los niveles de datos tanto nominal como ordinal.R. UNIVERSIDAD TECMILENIO Derechos Reservados.

UNIVERSIDAD TECMILENIO Derechos Reservados. a través de una prueba de hipótesis. UNIVERSIDAD TECMILENIO Frecuencias esperadas iguales • El estadístico utilizado para realizar la prueba de bondad de ajuste es: Donde: fe = Frecuencia observada en una categoría específica fo = Frecuencia esperada en una categoría específica D.R. D. . A esta prueba no paramétrica se le conoce como Prueba de Bondad de Ajuste.R. Universidad Tec Milenio.Probabilidad y Estadística Prueba de Bondad de Ajuste Es considerada como una prueba para estimar la diferencia entre una distribución observada y una teórica.

que se enlistan en la siguiente tabla: D. Universidad Tec Milenio. UNIVERSIDAD TECMILENIO Derechos Reservados. • H1: Existe diferencia entre el número de frecuencias observadas y el número de frecuencias esperadas. • Se utilizará el nivel del 5%. UNIVERSIDAD TECMILENIO Frecuencias esperadas iguales Paso 1: Plantear la hipótesis nula y alternativa • H0: No existe diferencia entre el número de frecuencias observadas y de frecuencias esperadas.Probabilidad y Estadística Frecuencias esperadas iguales • Supongamos que existen algunas dudas respecto al funcionamiento correcto de una de las máquinas tragamonedas de un casino en Las Vegas.R. Paso 2: Seleccionar el nivel de significación. Se acciona 120 veces la palanca de la máquina y se registran los resultados. . Paso 3: Identificar el estadístico de prueba • El estadístico adecuado es el estadístico Chi-Cuadrado. D. pues se está analizando la diferencia que existe entre una frecuencia observada y una frecuencia esperada.R.

. D. lo obtenemos de la tabla: – De la tabla. UNIVERSIDAD TECMILENIO Frecuencias esperadas iguales • Obtenemos el valor crítico de Chi-Cuadrada con 5 grados de libertad y con un nivel de significancia de 0. donde k es representa al número de categorías. para obtener el valor correcto debemos considerar los grados de libertad de la prueba definidos como k-1. los grados de libertad son 5. • En una prueba de Chi-Cuadrada.Probabilidad y Estadística Frecuencias esperadas iguales Paso 4: Formular la región de decisión • La regla de decisión requiere identificar un valor crítico en la curva Chi-Cuadrada que separe la región de rechazo de la región de aceptación.R. D. • En nuestro caso.R.07. UNIVERSIDAD TECMILENIO Derechos Reservados. se utiliza un valor de Chi-Cuadrada de 11. pues existen 6 categorías.05. Universidad Tec Milenio.

.07 Valor crítico D. UNIVERSIDAD TECMILENIO Derechos Reservados. • Con la muestra seleccionada.R. UNIVERSIDAD TECMILENIO Frecuencias esperadas iguales Paso 5: Tomar la muestra y llegar a una decisión.R. se calcula el valor de Chi-Cuadrada a través de las frecuencias observadas y las frecuencias esperadas.Probabilidad y Estadística Frecuencias esperadas iguales • Gráficamente Región de rechazo Región de aceptación 11. Universidad Tec Milenio. • Sustituyendo en la fórmula tenemos: D.

Universidad Tec Milenio. se rechaza con un nivel del 0.Probabilidad y Estadística Frecuencias esperadas iguales Dado que 34. UNIVERSIDAD TECMILENIO Derechos Reservados. .40 queda en la región de rechazo. reveló estadísticas respecto a adultos mayores residentes de centros de asistencia que fueron hospitalizados: D. la hipótesis nula que indica no existe diferencia entre el número de frecuencias observadas y el número de frecuencias esperadas.05 o 5%. durante un periodo de dos años. UNIVERSIDAD TECMILENIO Frecuencias esperadas desiguales • • La Chi-Cuadrada también puede utilizarse cuando las frecuencias esperadas son desiguales. D.R. Un estudio de admisiones a hospitales.R. Esto indica que la máquina tragamonedas en estudio si presenta una alteración en la ventanilla izquierda.

. UNIVERSIDAD TECMILENIO Derechos Reservados. UNIVERSIDAD TECMILENIO Frecuencias esperadas desiguales Paso 1: Plantear la hipótesis nula y alternativa. • Se utilizará el nivel del 5%. Seleccionaron 400 adultos mayores en centros de asistencia locales que necesitaron hospitalización y se determinó el número de veces que cada uno fue admitido en su hospital. Paso 3: Identificar el estadístico de prueba. D.R.R. Paso 2: Seleccionar el nivel de significación. • H1: Existe diferencia entre la experiencia local y nacional. pues se está analizando la diferencia que existe entre una frecuencia observada y una frecuencia esperada. D. • El estadístico adecuado es el estadístico Chi-Cuadrado. Universidad Tec Milenio.Probabilidad y Estadística Frecuencias esperadas desiguales • La administradora de un hospital local desea comparar su existencia con la experiencia nacional. • H0: No existe diferencia entre la experiencia local y nacional.

UNIVERSIDAD TECMILENIO Frecuencias esperadas desiguales • Gráficamente Región de rechazo Región de aceptación 12. lo obtenemos de la tabla (12. • En nuestro caso. UNIVERSIDAD TECMILENIO Derechos Reservados.59). pues existen 7 categorías. . los grados de libertad son 6.59 Valor crítico D.R. Universidad Tec Milenio.R. D. • Obtenemos el valor crítico de Chi-Cuadrada con 5 grados de libertad y con un nivel de significancia de 0.05.Probabilidad y Estadística Frecuencias esperadas desiguales Paso 4: Formular la región de decisión.

R. • El número de frecuencias observadas que resulta del estudio de los adultos mayores locales no puede compararse directamente con los porcentajes dados para los hospitales de la nación. como se ve en la siguiente tabla: D. • Sustituyendo en la fórmula tenemos: D. UNIVERSIDAD TECMILENIO Derechos Reservados. • Sin embargo.Probabilidad y Estadística Frecuencias esperadas desiguales Paso 5: Tomar la muestra y llegar a una decisión. Universidad Tec Milenio. . UNIVERSIDAD TECMILENIO Frecuencias esperadas desiguales Paso 5: Tomar la muestra y llegar a una decisión.R. los porcentajes pueden convertirse en frecuencias esperadas.

05 o 5%. la Chi-Cuadrada no debe aplicarse si más de 20% de las celdas tienen frecuencias esperadas de menos de cinco.R. la hipótesis nula que indica no existe diferencia entre el número de frecuencias observadas y el número de frecuencias esperadas.379 queda en la región de aceptación. las frecuencias esperadas en cada celda deben ser cinco o más. UNIVERSIDAD TECMILENIO Derechos Reservados. Para más de dos celdas.Probabilidad y Estadística Frecuencias esperadas desiguales Dado que 2. Universidad Tec Milenio. Esto indica los resultados de la experiencia local con respecto a los adultos mayores de centros de asistencia hospitalizados es similar a la de otras partes del país. UNIVERSIDAD TECMILENIO Limitaciones de la Chi-Cuadrada Dos reglas de aceptación general respecto a pequeñas frecuencias de celda son: Si sólo hay dos celdas. . D. D.R. se acepta con un nivel del 0.

diferencia aplicable de acuerdo a la proporción de la población para el análisis muestral de las frecuencias observadas. Universidad Tec Milenio. conocidas como Pruebas de Bondad de Ajuste. D.Probabilidad y Estadística Cierre La distribución de probabilidad Chi-Cuadrada es una distribución que se aproxima a la normal conforme aumenta el tamaño de la muestra. Es de hecho. y la segunda en donde la frecuencia de observaciones esperada es distinta. para realizar pruebas de hipótesis a datos de nivel ordinal. una distribución de probabilidad de las diferencias entre valores observados y esperados. utilizando el estadístico de la Chi-Cuadrada.R. . UNIVERSIDAD TECMILENIO Derechos Reservados. D. como lo vimos durante el tema.R. lo revisamos en dos partes: La primera en donde la frecuencia de observaciones esperada era uniforme para cada categorías. UNIVERSIDAD TECMILENIO Cierre Dichas pruebas de bondad de ajuste. sino. no solamente de la media o la desviación estándar.

Probabilidad y Estadística Referencias bibliográficas • • • Devore. (6a. (7a. Edición de contenido: Lic. Ed). Probabilidad y estadística para ingeniería y ciencias.R.R. Ed). Verónica Montes de Oca Pinzón. Universidad Tec Milenio.. Mendenhall. Alejandro Calderas González. México: Cengage Learning. México: Cengage Learning. Probabilidad y estadística (2a. MC y MED. UNIVERSIDAD TECMILENIO Derechos Reservados. México: McGraw Hill. Ed. José de Jesús Romero Álvarez. MATI D. D. W. (2002). . Arcelia Ramos Monobe. J.). et al. Spiegel. Capítulos: 8 y 9 Wakerly. (2008). UNIVERSIDAD TECMILENIO Créditos Diseño de contenido: Ing. M. PMP Coordinador académico: Lic. MA. D. Armando Calzada Mezura. Edición de texto: Lic. Estadística matemática con aplicaciones.(2004). MEE Diseño Gráfico: Lic.

Sign up to vote on this title
UsefulNot useful