Está en la página 1de 13

Test de Hipótesis No Paramétricos

Cuando trabajamos con variables aleatorias cualitativas o categorizadas o son cuantitativas pero
no se conoce su distribución, se aplican métodos estadísticos denominados NO PARAMÉTRICOS.

Esta situación se presenta habitualmente cuando se trabaja con variables de conteo univariadas,
es decir, cuando se recuentan casos. Como por ejemplo, en las encuestas políticas, de opinión, de
marketing, de medición de audiencias (rating), trabajos de sociología, psicología, nutricionismo,
medicina, etc. Tal es el caso también de las tablas de contingencia, en las que el análisis es
bivariado, es decir que tenemos dos variables aleatorias X e Y.

Dentro de los métodos no paramétricos, se destacan los tests de hipótesis introducidos por Karl
Pearson hacia 1896, aplicando la distribución Chi-Cuadrado. Las principales versiones de este test
se utilizan para los siguientes casos no parametricos:

 Medir el ajuste de la distribución de una población o muestra a una función de


distribución teórica conocida (Bondad de Ajuste)
 Probar si existe independencia entre dos variables aleatorias (Independencia)
 Detectar homogeneidad entre dos muestras o poblaciones (Homogeneidad de
Proporciones)

Bondad de Ajuste
En el primer caso se emplea un test Chi-Cuadrado para decidir cuándo un conjunto de datos de
una muestra se apega a una distribución de probabilidad dada. Se desea verificar que la variable
aleatoria X de la cual proviene una muestra aleatoria tiene una distribución teórica conocida F(X).
Las hipótesis para este test son:

Ho = La variable X sigue una distribución F(X).

vs.

Ha = La variable X no sigue una distribución F(X).

Dado un nivel de significancia 𝛼 se define un valor crítico para el rechazo de la Ho propuesta.


Para ello utilizamos una tabla , donde los grados de libertad son k = m – r – 1 , siendo m las
categorías o clases que vamos a comparar y r la cantidad de parámetros que se están
estimando
Se toma una muestra de tamaño n, se clasifican los valores observados en A 1, A2,…, Am conjuntos,
clases o categorías distintas. Para cada conjunto, clase o categoría distinta, sean:
̅ ̅̅̅ ̅̅̅̅ los valores esperados correspondientes a la distribución teórica ̅̅̅̅̅̅̅
los valores empíricos observados en la muestra

El estadístico de contraste para realizar el test es

̅
∑ ̅

Donde r es la cantidad de parámetros que caracterizan a la distribución y que deben estimarse a


partir de la muestra, y m es la cantidad de conjuntos, clases o categorías.

Regla de decisión: finalmente comparamos el estadístico de contraste con el valor teórico crítico
tabular , y decidimos rechazar o no rechazar H0 de acuerdo a donde se ubique el estadístico.

p – valor: recordemos que otra opción es no definir ningún valor de α , y (en el caso de trabajar
con un software estadístico en una computadora) observar el valor del p – valor que nos entrega
el ordenador. Si este es muy pequeño, por ejemplo inferior al 1%, podemos rechazar H0. En caso
contrario decidimos no rechazarla.

Observación importante: para que el test Chi-Cuadrado no paramétrico funcione bien tenemos
que verificar que cada frecuencia o valor esperado sea por lo menos 5. Si no es así podemos
colapsar o unificar las últimas categorías, clases o conjuntos hasta que sus valores esperados
sumen 5 o más.

Ejemplo del Test de Bondad de Ajuste


Se propone que el número de accidentes que ocurren en una fábrica sigue una distribución de
Poisson. Se toman 60 días al azar y se analizan los accidentes ocurridos:
Accidentes por Frecuencia
día observada
0 32
1 15
2 9
3 ó más 4
Total 60
¿Muestran estos datos suficiente evidencia estadística para decir que siguen una distribución de
Poisson?

Nivel de significación 𝛼 = 0,05

Solución:

Ho = La variable Accidentes Ocurridos tiene distribución de Poisson

vs.

Ha = La variable Accidentes Ocurridos no tiene la distribución de Poisson

Dado que el parámetro 𝜆 es desconocido, se lo debe estimar a partir de los datos de la muestra. Lo
calculamos 𝜆= 0,75

Con este valor estimado de λ construimos el modelo correspondiente de la distribución de Poisson


y calculamos las probabilidades y los valores teóricos esperados:

𝜆
{ }

Accidentes por Frecuencia Frecuencia


Probabilidad
día esperada observada
0 0,472 28,32 32
1 0,354 21,24 15
2 0,133 7,98 9
3 ó más 0,041 2,46 4
Total 1 60 60

Como la frecuencia esperada para más de 3 accidentes es menor a 5, se combinan las dos últimas
celdas, obteniendo:
(Observada -
Accidentes Frecuencia Frecuencia
Esperada)^2 /
por día esperada observada
Esperada
0 28,32 32 0,47819209
1 21,24 15 1,833220339
2 ó más 10,44 13 0,627739464
Total 60 60 2,939151893
Grados de libertad: gl = 3-1-1=1, donde r = 1 dado que la media de la muestra fue utilizada como
estimador del único parámetro de la distribución de Poisson a partir de los datos.

Valor crítico teórico tabular = 3,84146

Regla de decisión: como el estadístico 2,94 es menor que el valor teórico tabular crítico 3,84, no
se rechaza Ho. Podemos asumir en consecuencia que la distribución de los accidentes es Poisson.

Test Chi Cuadrado


Otro ejemplo de Test de Bondad de Ajuste contra Poisson
Queremos saber si el movimiento que se registra en el buffete de una universidad sigue una
distribución de Poisson. Para ello hemos tomado registros de la cantidad de clientes que llegan a la
misma en intervalos de 1 minuto.

X : cantidad de clientes que llegan por minuto a la cafetería de la Universidad

En la siguiente tabla se muestran la cantidad de clientes (xi) que llegaron en una cantidad fi de
intervalos de 1 minuto, así como el resto de los cálculos necesarios para construir el modelo de
Poisson y calcular el correspondiente estadístico Chi- Cuadrado.

xi obs (fi) xi . fi pk est=pk.446 esperados observados (obs-esp)2/esp


0 15 0 0,04510985 20,1189919 20,11 15 1,298463451
1 55 55 0,13977984 62,3418091 62,34 55 0,864222008
2 105 210 0,21656473 96,5878703 96,58 105 0,734069165
3 110 330 0,22368644 99,764153 99,76 110 1,051098637
4 80 320 0,17328176 77,2836657 77,28 80 0,09573499
5 45 225 0,10738807 47,8950789 47,89 45 0,174401754
6 20 120 0,05545976 24,735052 24,73 20 0,904686615
7 10 70 0,02455009 10,9493408 10,94 10 0,080767824
8 3 24 0,00950903 4,24102829 6,15 6 0,003658537
9 2 18 0,00327391 1,4601647
10 1 10 0,00101447 0,45245462
SUMA 446 1382 0,99961796 445,829609 Chi obs = 5,207102982

Lambda estimado= 3,0987

Tomamos α = 0.05 (ó dejamos el p-value)

Tomamos α = 0.05 (ó dejamos el p-value)


Ho : X ~ Poisson (3,0987) vs Ha : X no es Poisson

Cantidad de categorías que quedaron después de agrupar las 3 últimas para que la
frecuencia esperada sea al menos 5 : n = 9 categorías

Valor crítico tabular :

Regla de decisión :

Como y podemos asumir que


efectivamente X ~ Poisson (3,0987)
Homogeneidad

(Las muestras provienen de poblaciones iguales)


Del mismo modo que la Prueba de Bondad de Ajuste, en este caso debemos comparar las
frecuencias observadas en cada una de las muestras y para cada categoría con las
frecuencias bajo el supuesto de homogeneidad en las poblaciones. En este caso las
frecuencias observadas corresponde al número de individuos de la muestra i en la clase j,
i.e., nij. Tenemos m muestras de un tamaño ni cada una, es decir que ∑ ,y
tenemos k clases o categorías en cada una de las muestras. El estadístico de contraste
será

( )
∑∑

Donde eij es la frecuencia esperada bajo el supuesto de homogeneidad, que puede


representarse como ni . pj , es decir, el número de individuos en la muestra i por la
probabilidad de que ocurra la característica j en la población. Para el cálculo de las
probabilidades de pertenecer un individuo a cada una de las categorías podemos utilizar:
. Por lo tanto : ⋅ Observar que este valor será la suma de n*k
números no negativos.
El numerador de cada término es la diferencia entre la frecuencia observada y la
frecuencia esperada. Por tanto, cuanto más cerca estén entre sí ambos valores más
pequeño será el numerador, y viceversa. El denominador permite relativizar el tamaño del
numerador. Las ideas anteriores sugieren que, cuanto menor sean el valor del estadístico
, más coherentes serán las observaciones obtenidas con los valores esperados. Por
el contrario, valores grandes de este estadístico indicarán falta de concordancia entre las
observaciones y lo esperado. En este tipo de contraste se suele rechazar la hipótesis nula
(los valores observados son coherentes con los esperados) cuando el estadístico es mayor
que un determinado valor crítico. Notas: (1) El valor del estadístico se podrá
aproximar por una distribución Chi-cuadrado cuando el tamaño muestral n sea grande
(n > 30), y todas las frecuencias esperadas sean iguales o mayores a 5 (en ocasiones
deberemos agrupar varias categorías a fin de que se cumpla este requisito). (2) Las
observaciones son obtenidas mediante muestreo aleatorio en cada muestra a partir de
una población particionada en categorías. Concretamente, usaremos el estadístico de
contraste

Con (m-1)(k – 1) grados de libertad (df).

EJEMPLO de Test de Homogeneidad de Proporciones:


Estamos interesados en estudiar la confiabilidad de cierto insumo informático con
relación al distribuidor que lo provée. Para esto, tomamos una muestra de 100 insumos
de cada uno de los 3 distribuidores que nos traen el producto comprobando el número de
defectuosos en cada lote. La siguiente tabla muestra el número de defectuosos en para
cada uno de los distribuidores, o valores observados.

Distrib / Defect Defectuosos Buenos Marg Distrib


Distr 1 16 94 100
Distr 2 24 76 100
Distr 3 9 81 100
Marginal Defect 49 251 300

Ho : Las proporciones de insumos defectuosos no dependen de los distribuidores, sus


proporciones son homogéneas y están igualmente repartidas

vs
Ha : Las proporciones de insumos defectuosos dependen de los distribuidores, sus
proporciones no son homogéneas y no están igualmente repartidas
Debemos realizar un test de homogeneidad para concluir si entre los distribuidores
existen diferencias de confiabilidad referente al mismo insumo. Calculemos los valores
esperados correspondientes:

Distrib / Defect Defectuosos Buenos Marg Distrib


Distr 1 16.33 83.66 100
Distr 2 16.33 83.66 100
Distr 3 16.33 83.66 100
Marginal Defect 49 251 300

El estadístico del contraste será entonces, teniendo en cuenta que los df son (m-1).(k-1) =
(3-1).(2-1) = 2 :

Este valor del estadístico de contraste Chi-Cuadrado es mayor que el valor tabular crítico
para el nivel de significación del 5%, que es

por lo tanto Rechazamos Ho y debemos concluir que no existe homogeneidad y por lo


tanto que hay diferencias significativas entre los tres distribuidores.

Independencia
Ahora queremos verificar si dos variables aleatorias, X e Y pertenecientes a la misma población
están relacionadas entre si, o no lo están. Planteamos entonces las hipótesis correspondientes

Ho = Existe independencia entre X e Y.

vs.

Ha = No existe independencia entre X e Y.

Se toma una muestra aleatoria de n datos bidimensionales de las variables X e Y, y se clasifican en


m categorías o clases A1, A2,…, Am para X, y en k categorías B1, B2,…, Bk para Y.

Se forma a partir de esos datos una TABLA DE CONTINGENCIA con las frecuencias conjuntas
observadas.

Se calculan las frecuencias conjuntas esperadas, y el estadígrafo de prueba.

Para calcular las frecuencias esperadas aplicamos la siguiente formula

En base al nivel de significación 𝛼 establecido, se busca en la tabla el valor crítico teórico . Se


lo compara y se rechaza, o no, Ho. Los grados de libertad en este test de independencia se
calculan asi

n = (filas – 1) . (columnas – 1) = (m – 1) . (k – 1)
el estadístico de contraste Chi-Cuadrado se calcula de manera análoga al caso de la bondad de
ajuste siguiendo la siguiente expresión

( )
∑ ∑ [ ]
Donde es la frecuencia esperada de la categoría AiBj

TABLA DE CONTINGENCIA

X/Y B1 B2 … Bk Total
A1 n11 n12 … n1k n1.
A2 n21 n22 … n2k n2.
… … … …
Am nm1 nm2 … nmk nm.
Total n.1 n.2 n.k n

Ejemplo de Test de Independencia


Una empresa minera hizo un estudio para verificar si el tipo de trabajo se relaciona con el grado
de silicosis de los trabajadores. Se toma una muestra al azar de 300 trabajadores y se registraron
las observaciones en la siguiente tabla de contingencia:

Grado Silicosis
Tipo de Trabajo Total
I II III
Oficina 42 24 30 96
Terreno 54 78 72 204
Total 96 102 102 300
¿Es posible establecer con estos datos que el tipo de trabajo afecta el grado de silicosis de los
trabajadores?

Nivel de significancia 𝛼 = 0,05.

Solución

Ho = Existe independencia entre el tipo de trabajo y el grado de silicosis

vs.

Ha = No existe independencia entre el tipo de trabajo y el grado de silicosis

Se calcula el estadístico de contraste luego de evaluar los valores esperados de cada categoría,
según se muestra en la siguiente tabla:
Tipo de Trabajo -
nij eij (nij - eij)2 / eij
Grado Silicosis
Oficina - I 42 30.7 4.142
Oficina - II 24 32.6 2.287
Oficina - III 30 32.6 0.214
Terreno - I 54 65.3 1.949
Terreno - II 78 69.4 1.076
Terreno - III 72 69.4 0.100
Total 150.00 161.28 8.59
Grados de libertad: (2-1) . (3-1)= 2

Valor crítico teórico tabular 5,9915

Regla de decisión: como el estadístico de contraste 8,59 es mayor a 5,9915 que es el valor critico
tabular teórico, se rechaza Ho. No existe independencia entre las variables, es decir que existe
alguna relación entre ellas.

Otro ejemplo Test de Independencia


Queremos saber si existe o no una relación entre los resultados de las cursadas de Algebra Lineal y
Análisis Matemático I de los alumnos del Profesorado en Matemática de la UNPA UARG.
Comenzamos definiendo las variables

X : Resultado de la cursada de Algebra Lineal

Y : Resultado de la cursada de Análisis Matemático I

Tabla de contingencia (Valores Observados) DATA

X (ALGLIN) / Y (AM1) Aprobados Desaprobados Marg ALGLIN


Aprobados 5 6 11
Desaprobados 30 29 59
Marg AM1 35 35 70

Ho : X e Y son independientes vs Ha : X e Y no son independientes

Valores esperados = Marg AM1 . Marg ALGIN / Total

Tabla de Valores Esperados

X (ALGLIN) / Y (AM1) Aprobados Desaprobados Marg ALGLIN


Aprobados 5,5 5,5 11
Desaprobados 29,5 29,5 59
Marg AM1 35 35 70
Estadístico Chi Cuadrado (Observado)

En este caso tenemos 4 categorías. Los df son (filas – 1).(columnas – 1) = 1

Tomamos α = 0.05 (ó dejamos el p-value). En este caso el estadístico de contraste vale :

∑ = 0,1078

El valor crítico tabular es

Regla de decisión :

Como y podemos asumir que


efectivamente X e Y son independientes.

Homogeneidad
(Las muestras provienen de poblaciones iguales)
Del mismo modo que la Prueba de Bondad de Ajuste, en este caso debemos comparar las
frecuencias observadas en cada una de las muestras y para cada categoría con las frecuencias bajo
el supuesto de homogeneidad en las poblaciones. En este caso las frecuencias observadas
corresponde al número de individuos de la muestra i en la clase j, i.e., nij. Tenemos m muestras de
un tamaño ni cada una, es decir que ∑ , y tenemos k clases o categorías en cada una
de las muestras. El estadístico de contraste será

( )
∑∑

Donde eij es la frecuencia esperada bajo el supuesto de homogeneidad, que puede representarse
como ni . pj , es decir, el número de individuos en la muestra i por la probabilidad de que ocurra la
característica j en la población. Para el cálculo de las probabilidades de pertenecer un individuo a
cada una de las categorías podemos utilizar: . Por lo tanto : ⋅ Observar
que este valor será la suma de n.k números no negativos.

El numerador de cada término es la diferencia entre la frecuencia observada y la frecuencia


esperada. Por tanto, cuanto más cerca estén entre sí ambos valores más pequeño será el
numerador, y viceversa. El denominador permite relativizar el tamaño del numerador. Las ideas
anteriores sugieren que, cuanto menor sean el valor del estadístico , más coherentes serán
las observaciones obtenidas con los valores esperados. Por el contrario, valores grandes de este
estadístico indicarán falta de concordancia entre las observaciones y lo esperado. En este tipo de
contraste se suele rechazar la hipótesis nula (los valores observados son coherentes con los
esperados) cuando el estadístico es mayor que un determinado valor crítico. Notas: (1) El valor del
estadístico se podrá aproximar por una distribución Chi-cuadrado cuando el tamaño
muestral n sea grande (n > 30), y todas las frecuencias esperadas sean iguales o mayores a 5 (en
ocasiones deberemos agrupar varias categorías a fin de que se cumpla este requisito). (2) Las
observaciones son obtenidas mediante muestreo aleatorio en cada muestra a partir de una
población particionada en categorías. Concretamente, usaremos el estadístico de contraste

Con (m-1)(k – 1) grados de libertad (df).

Ejemplo de Test de Homogeneidad de Proporciones:


Estamos interesados en estudiar la confiabilidad de cierto insumo informático con relación al
distribuidor que lo provée. Para esto, tomamos una muestra de 100 insumos de cada uno de los 3
distribuidores que nos traen el producto comprobando el número de defectuosos en cada lote. La
siguiente tabla muestra el número de defectuosos en para cada uno de los distribuidores, o
valores observados.

Distrib / Defect Defectuosos Buenos Marg Distrib


Distr 1 16 94 100
Distr 2 24 76 100
Distr 3 9 81 100
Marginal Defect 49 251 300

Ho : Las proporciones de insumos defectuosos no dependen de los distribuidores, sus


proporciones son homogéneas y están igualmente repartidas

vs

Ha : Las proporciones de insumos defectuosos dependen de los distribuidores, sus proporciones


no son homogéneas y no están igualmente repartidas

Debemos realizar un test de homogeneidad para concluir si entre los distribuidores existen
diferencias de confiabilidad referente al mismo insumo. Calculemos los valores esperados
correspondientes :

Distrib / Defect Defectuosos Buenos Marg Distrib


Distr 1 16.33 83.66 100
Distr 2 16.33 83.66 100
Distr 3 16.33 83.66 100
Marginal Defect 49 251 300

El estadístico del contraste será entonces, teniendo en cuenta que los df son (m-1).(k-1) = (3-1).(2-
1) = 2 :

Este valor del estadístico de contraste Chi-Cuadrado es mayor que el valor tabular crítico para el
nivel de significación del 5%, que es

por lo tanto Rechazamos Ho y debemos concluir que no existe homogeneidad y por lo tanto que
hay diferencias significativas entre los tres distribuidores.

También podría gustarte