Está en la página 1de 16

Hipótesis estadísticas: conceptos generales

Un investigador médico puede decidir con base en evidencia experimental si beber café
incrementa el riesgo de cáncer en los seres humanos; un ingeniero quizá tenga que decidir con
base en datos muestrales si hay una diferencia entre la precisión de un tipo de medidor y la de
otro; o tal vez un sociólogo desee reunir los datos apropiados que le permitan decidir si el tipo de
sangre y el color de ojos de un individuo son variables independientes. En cada uno de estos casos
el científico o el ingeniero postulan o conjeturan algo acerca de un sistema. Además, cada uno
debe utilizar datos experimentales y tomar decisiones basadas en ellos. En cada caso la conjetura
se puede expresar en forma de hipótesis estadística. Los procedimientos que conducen a la
aceptación o al rechazo de hipótesis estadísticas como éstas comprenden un área importante de la
inferencia estadística.

Una hipótesis estadística es una aseveración o conjetura respecto a una o más poblaciones.

El rechazo de una hipótesis implica que fue refutada por la evidencia de la muestra. En otras
palabras, el rechazo significa que existe una pequeña probabilidad de obtener la información
muestral observada cuando, de hecho, la hipótesis es verdadera. El rechazo de una hipótesis
tiende a casi “descartar” la hipótesis. Por otro lado, es muy importante enfatizar que la aceptación
o, más bien, la falta de rechazo no descarta otras posibilidades. Como resultado, el analista de
datos establece una conclusión firme cuando se rechaza una hipótesis.

Lo anterior implica que cuando el analista de datos formaliza la evidencia experimental con base
en la prueba de hipótesis, es muy importante el planteamiento formal de la hipótesis.

La hipótesis nula y la hipótesis alternativa La estructura de la prueba de hipótesis se establece


usando el término hipótesis nula, el cual se refiere a cualquier hipótesis que se desea probar y se
denota con H0 . El rechazo de H0 conduce a la aceptación de una hipótesis alternativa, que se
denota con H1 . La comprensión de las diferentes funciones que desempeñan la hipótesis nula
(H0 ) y la hipótesis alternativa (H1 ) es fundamental para entender los principios de la prueba de
hipótesis. La hipótesis alternativa H1 por lo general representa la pregunta que se responderá o la
teoría que se probará, por lo que su especificación es muy importante. La hipótesis nula H0 anula
o se opone a H1 y a menudo es el complemento lógico de H1.

rechazar H0 a favor de H1 debido a evidencia suficiente en los datos o

no rechazar H0 debido a evidencia insuficiente en los datos.


Observe que las conclusiones no implican una “aceptación de H0 ” formal y literal. La aseveración
de H0 a menudo representa el “status quo” contrario a una nueva idea, conjetura, etcétera,
enunciada en H1 ; en tanto que no rechazar H0 representa la conclusión adecuada.

Chi-cuadrado (χ²): distribución,


cómo se calcula, ejemplos
Por
Fanny Zapata

La prueba chi cuadrado o ji-cuadrado (χ2, donde χ es la letra


griega llamada “chi”) se utiliza para determinar el comportamiento
de cierta variable y también cuando se quiere saber si dos o más
variables son independientes estadísticamente.
Para comprobar el comportamiento de una variable, la prueba a
realizar se llama prueba chi cuadrado de ajuste. Para saber si dos
o más variables son independientes estadísticamente la prueba se
llama chi cuadrado de independencia, también llamada de
contingencia.

Figura 1. Pruebas de hipótesis mediante chi cuadrado

Estas pruebas forman parte de la teoría estadística de decisiones,


en la cual se estudia una población y se toman decisiones acerca
de esta, analizando una o varias muestras extraídas de ella. Para
ello es preciso hacer ciertas suposiciones con respecto a las
variables, llamadas hipótesis, las cuales pueden ser o no ciertas.

Hay algunas pruebas para contrastar estas conjeturas y


determinar cuáles son válidas, dentro de un cierto margen de
confianza, entre ellas la prueba chi-cuadrado, que puede aplicarse
para comparar dos y más poblaciones.

Como veremos, suelen plantearse dos tipos de hipótesis acerca de


algún parámetro poblacional en dos muestras: la hipótesis nula,
llamada Ho (las muestras son independientes), y la hipótesis
alternativa, denotada como H1, (las muestras están
correlacionadas) que es contraria de aquella.
¿Cuándo se usa la prueba chi-cuadrado?
La prueba chi cuadrado se aplica a variables que
describen cualidades, como por ejemplo sexo, estado civil, grupo
sanguíneo, color de ojos y preferencias de diversos tipos.

La prueba está pensada cuando se desea:

-Comprobar si una distribución es apropiada para describir una


variable, lo cual se denomina bondad del ajuste. Mediante la
prueba de chi cuadrado se puede saber si hay diferencias
significativas entre la distribución teórica seleccionada y la
distribución de frecuencias observada.

-Conocer si dos variables X e Y son independientes desde el punto


de vista estadístico. Esto se conoce como prueba de
independencia.

Dado que se aplica a variables cualitativas o categóricas, la prueba


chi cuadrado se utiliza ampliamente en ciencias sociales,
administración y medicina.

Condiciones para aplicarla


Hay dos requerimientos importantes para aplicarla correctamente:

-Los datos deben estar agrupados en frecuencias.

-La muestra tiene que ser lo suficientemente grande para que sea
válida la distribución chi cuadrado, de lo contrario su valor se
sobreestima y da lugar al rechazo de la hipótesis nula cuando no
debiera ser así.

La regla general es que si en los datos agrupados aparece una


frecuencia con valor menor a 5, esta no se use. Si hay más de una
frecuencia menor a 5, entonces deben combinarse en una para
obtener una frecuencia con valor numérico mayor a 5.
Distribución chi cuadrado
χ2 es una distribución continua de probabilidades. En realidad hay
diferentes curvas, dependiendo de un parámetro k llamado grados
de libertad de la variable aleatoria.

Sus propiedades son:

-El área bajo la curva es igual a 1.

-Los valores de χ2 son positivos.

-La distribución es asimétrica, es decir, posee sesgo.

Fig
ura 2. Distribución de chi cuadrado para vatios grados de libertad. Fuente: Wikimedia
Commons.

Grados de libertad
A medida que aumentan los grados de libertad, la distribución chi-
cuadrado tiende a la normalidad, como se aprecia de la figura.

Para una distribución dada, los grados de libertad se determinan a


través de la tabla de contingencia, que es la tabla donde se
registran las frecuencias observadas de las variables.

Si una tabla tiene f filas y c columnas, el valor de k es:

k = (f – 1)⋅ (c – 1)

Formulación de las hipótesis


Cuando la prueba chi cuadrado es de ajuste, se formulan las siguientes hipótesis:

-Ho: la variable X tiene distribución de probabilidad f(x) con los parámetros


específicos y1, y2…, yp

-H1: X tiene otra distribución de probabilidad.

La distribución de probabilidad que se supone en la hipótesis nula puede ser, por


ejemplo, la conocida distribución normal, y los parámetros serían la media μ y la
desviación estándar σ.

Además, la hipótesis nula es evaluada con un cierto nivel de significación, esto es,
una medida del error que se cometería al rechazarla siendo cierta.

Por lo general este nivel se establece de 1%, 5 % o 10 % y cuanto menor sea, más
fiable el resultado de la prueba.

Y si se utiliza la prueba chi cuadrado de contingencia, que como hemos dicho sirve
para comprobar la independencia entre dos variables X e Y, las hipótesis son:

-Ho: las variables X e Y son independientes.

-H1: X e Y son dependientes.


De nuevo se requiere especificar un nivel de significación para conocer la medida
del error al tomar la decisión.

¿Cómo se calcula la estadística chi-cuadrado?


La estadística chi cuadrado se calcula de la siguiente manera:

La sumatoria se lleva a cabo desde la primera clase i = 1 hasta la última, que es i =k.

Además:

–fo es una frecuencia observada (proviene de los datos obtenidos).

–fe es la frecuencia esperada o teórica (es necesario calcularla a partir de los datos).

Para aceptar o rechazar la hipótesis nula, se calcula χ2 para los datos observados y se
compara con un valor llamado chi cuadrado crítico, el cual depende de los grados
de libertad k y el nivel de significación α:

χ2crítico = χ2k, α

Si por ejemplo queremos realizar la prueba con un nivel de significación del 1 %,


entonces α = 0.01, si va a ser con 5% entonces α = 0.05 y así sucesivamente. Se
define p, el parámetro de la distribución, como:

p=1–α

Estos valores de chi cuadrado crítico se determinan mediante tablas que contienen el
valor del área acumulada. Por ejemplo, para k = 1, que representa 1 grado de libertad
y α = 0.05, que equivale a p = 1- 0.05 = 0.95, el valor de χ2 es 3.841.
Figura 3. Tabla de valores de la distribución chi cuadrado. Fuente: F. Zapata.

Criterio de aceptación de Ho
El criterio para aceptar Ho es:

-Si χ2 < χ2crítico se acepta Ho, de lo contrario se rechaza (ver figura 1).

Ejemplo de cálculo
En la siguiente aplicación se utilizará la prueba chi cuadrado como prueba de
independencia.

Supóngase que los investigadores desean conocer si la preferencia por el café negro
está relacionada con el género de la persona, y especificar la respuesta con un nivel
de significancia de α = 0.05.

Para ello se dispone de una muestra de 100 personas entrevistadas y sus respuestas:
Paso 1
Establecer las hipótesis:

-Ho: el género y la preferencia por el café negro son independientes.


-H1: el gusto por el café negro está relacionado con el género de la persona.

Paso 2
Calcular las frecuencias esperadas para la distribución, para lo cual se requieren los
totales añadidos en la última fila y en la columna de la derecha de la tabla. Cada
celda en el recuadro rojo tiene un valor esperado fe, que se calcula multiplicando el
total de su fila F por el total de su columna C, dividido por el total de la muestra N:

fe = (F x C) /N

Los resultados son los siguientes para cada celda:

-C1: (36 x 47) / 100 = 16.92


-C2: (64 x 47) / 100 = 30.08
-C3: (36 x 53) / 100 = 19.08
-C4: (64 x 53) / 100 = 33.92

Paso 3
Seguidamente hay que calcular el estadístico chi cuadrado para esta distribución, de
acuerdo a la fórmula dada:

Paso 4
Determinar χ2crítico, sabiendo que los datos registrados están en f = 2 filas y c = 2
columnas, por lo tanto, el número de grados de libertad es:

k = (2-1)⋅(2-1) = 1.

Lo cual significa que debemos buscar en la tabla mostrada arriba el valor de χ2k, α =
χ21; 0.05 , el cual es:

χ2crítico = 3.841

Paso 5
Comparar los valores y decidir:

χ2 = 2.9005

χ2crítico = 3.841

Dado que χ2 < χ2crítico se acepta la hipótesis nula y se concluye que la preferencia por el
café negro no está vinculada con el género de la persona, con un nivel de
significación de 5%.

Referencias
1. Chi Square Test for Independence. Recuperado de: saylordotorg.github.io.
2. Med Wave. Estadística aplicada a las ciencias de la salud: la prueba ji-cuadrado.
Recuperado de: medwave.cl.
3. Probabilidades y Estadística. Prueba de bondad de ajuste chi cuadrado.
Recuperado de: probabilidadesyestadistica.com.
4. Triola, M. 2012. Elementary Statistics. 11th. Edition. Addison Wesley.

APA
5. UNAM. Prueba chi cuadrado. Recuperado de: asesorias.cuautitlan2.unam.mx.

También podría gustarte