Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Unidad 1
Unidad 1
Un investigador médico puede decidir con base en evidencia experimental si beber café
incrementa el riesgo de cáncer en los seres humanos; un ingeniero quizá tenga que decidir con
base en datos muestrales si hay una diferencia entre la precisión de un tipo de medidor y la de
otro; o tal vez un sociólogo desee reunir los datos apropiados que le permitan decidir si el tipo de
sangre y el color de ojos de un individuo son variables independientes. En cada uno de estos casos
el científico o el ingeniero postulan o conjeturan algo acerca de un sistema. Además, cada uno
debe utilizar datos experimentales y tomar decisiones basadas en ellos. En cada caso la conjetura
se puede expresar en forma de hipótesis estadística. Los procedimientos que conducen a la
aceptación o al rechazo de hipótesis estadísticas como éstas comprenden un área importante de la
inferencia estadística.
Una hipótesis estadística es una aseveración o conjetura respecto a una o más poblaciones.
El rechazo de una hipótesis implica que fue refutada por la evidencia de la muestra. En otras
palabras, el rechazo significa que existe una pequeña probabilidad de obtener la información
muestral observada cuando, de hecho, la hipótesis es verdadera. El rechazo de una hipótesis
tiende a casi “descartar” la hipótesis. Por otro lado, es muy importante enfatizar que la aceptación
o, más bien, la falta de rechazo no descarta otras posibilidades. Como resultado, el analista de
datos establece una conclusión firme cuando se rechaza una hipótesis.
Lo anterior implica que cuando el analista de datos formaliza la evidencia experimental con base
en la prueba de hipótesis, es muy importante el planteamiento formal de la hipótesis.
-La muestra tiene que ser lo suficientemente grande para que sea
válida la distribución chi cuadrado, de lo contrario su valor se
sobreestima y da lugar al rechazo de la hipótesis nula cuando no
debiera ser así.
Fig
ura 2. Distribución de chi cuadrado para vatios grados de libertad. Fuente: Wikimedia
Commons.
Grados de libertad
A medida que aumentan los grados de libertad, la distribución chi-
cuadrado tiende a la normalidad, como se aprecia de la figura.
k = (f – 1)⋅ (c – 1)
Además, la hipótesis nula es evaluada con un cierto nivel de significación, esto es,
una medida del error que se cometería al rechazarla siendo cierta.
Por lo general este nivel se establece de 1%, 5 % o 10 % y cuanto menor sea, más
fiable el resultado de la prueba.
Y si se utiliza la prueba chi cuadrado de contingencia, que como hemos dicho sirve
para comprobar la independencia entre dos variables X e Y, las hipótesis son:
La sumatoria se lleva a cabo desde la primera clase i = 1 hasta la última, que es i =k.
Además:
–fe es la frecuencia esperada o teórica (es necesario calcularla a partir de los datos).
Para aceptar o rechazar la hipótesis nula, se calcula χ2 para los datos observados y se
compara con un valor llamado chi cuadrado crítico, el cual depende de los grados
de libertad k y el nivel de significación α:
χ2crítico = χ2k, α
p=1–α
Estos valores de chi cuadrado crítico se determinan mediante tablas que contienen el
valor del área acumulada. Por ejemplo, para k = 1, que representa 1 grado de libertad
y α = 0.05, que equivale a p = 1- 0.05 = 0.95, el valor de χ2 es 3.841.
Figura 3. Tabla de valores de la distribución chi cuadrado. Fuente: F. Zapata.
Criterio de aceptación de Ho
El criterio para aceptar Ho es:
-Si χ2 < χ2crítico se acepta Ho, de lo contrario se rechaza (ver figura 1).
Ejemplo de cálculo
En la siguiente aplicación se utilizará la prueba chi cuadrado como prueba de
independencia.
Supóngase que los investigadores desean conocer si la preferencia por el café negro
está relacionada con el género de la persona, y especificar la respuesta con un nivel
de significancia de α = 0.05.
Para ello se dispone de una muestra de 100 personas entrevistadas y sus respuestas:
Paso 1
Establecer las hipótesis:
Paso 2
Calcular las frecuencias esperadas para la distribución, para lo cual se requieren los
totales añadidos en la última fila y en la columna de la derecha de la tabla. Cada
celda en el recuadro rojo tiene un valor esperado fe, que se calcula multiplicando el
total de su fila F por el total de su columna C, dividido por el total de la muestra N:
fe = (F x C) /N
Paso 3
Seguidamente hay que calcular el estadístico chi cuadrado para esta distribución, de
acuerdo a la fórmula dada:
Paso 4
Determinar χ2crítico, sabiendo que los datos registrados están en f = 2 filas y c = 2
columnas, por lo tanto, el número de grados de libertad es:
k = (2-1)⋅(2-1) = 1.
Lo cual significa que debemos buscar en la tabla mostrada arriba el valor de χ2k, α =
χ21; 0.05 , el cual es:
χ2crítico = 3.841
Paso 5
Comparar los valores y decidir:
χ2 = 2.9005
χ2crítico = 3.841
Dado que χ2 < χ2crítico se acepta la hipótesis nula y se concluye que la preferencia por el
café negro no está vinculada con el género de la persona, con un nivel de
significación de 5%.
Referencias
1. Chi Square Test for Independence. Recuperado de: saylordotorg.github.io.
2. Med Wave. Estadística aplicada a las ciencias de la salud: la prueba ji-cuadrado.
Recuperado de: medwave.cl.
3. Probabilidades y Estadística. Prueba de bondad de ajuste chi cuadrado.
Recuperado de: probabilidadesyestadistica.com.
4. Triola, M. 2012. Elementary Statistics. 11th. Edition. Addison Wesley.
APA
5. UNAM. Prueba chi cuadrado. Recuperado de: asesorias.cuautitlan2.unam.mx.