Está en la página 1de 15

Instituto Tecnolgico de Len

4 PRUEBAS DE BONDAD DE AJUSTE Y


PRUEBAS NO PARAMTRICAS
En la unidad 2 se analizaron datos a escala de intervalo, en la unidad 3 se
realizaron pruebas de hiptesis respecto de una sola media de poblacin y dos
medias de poblacin. Para estas pruebas supusimos que las poblaciones siguen
una distribucin de probabilidad normal. Sin embargo hay pruebas en las cuales
no es necesaria una suposicin respecto a la forma de la poblacin. A estas se les
conoce como no paramtricas. Esto significa que no es necesario suponer una
poblacin normal.
Algunos experimentos generan respuestas que pueden ser ordenadas o
clasificadas, pero el valor real de la respuesta no puede ser medido
numricamente excepto con una escala arbitraria que se puede crear. Puede ser
que el experimentador diga slo si una observacin es mayor que otra. Quiz
pueda clasificar todo un conjunto de observaciones sin saber en realidad los
valores numricos exactos de las mediciones. Por ejemplo:

La experiencia de ventas de cuatro vendedores son clasificadas de la mejor


a la peor.
Las caractersticas de comestible y sabor de cinco marcas de fibra de
pasitas son clasificadas en una escala arbitraria de 1 a 5.
Cinco diseos de automvil son clasificados del ms atractivo al menos
atractivo.

Cmo pueden analizarse estos datos? Los mtodos de muestra pequea vistos
en la unidad 3 son vlidos slo cuando la(s) poblacin(es) muestreada(s) es (son)
normal(es) o aproximadamente normal(es).
Los datos formados por rangos de escalas arbitrarias de 1 a 5 no satisfacen la
suposicin de normalidad. En algunas aplicaciones, las tcnicas son vlidas si las
muestras se toman al azar de entre poblaciones cuyas varianzas son iguales.
Cuando los datos no parecen satisfacer stas y otras suposiciones similares,
puede usarse un mtodo alternativo, es decir, mtodos estadsticos no
paramtricos. Los mtodos no paramtricos por lo general satisfacen las
hiptesis en trminos de distribuciones poblacionales ms que parmetros por
ejemplo medias y desviaciones estndar. Es frecuente que las suposiciones
paramtricas sean sustituidas por suposiciones ms generales acerca de las
distribuciones poblacionales y las clasificaciones de las observaciones se usen a
veces en lugar de las mediciones reales.

Material didctico/Pruebas de Bondad de Ajuste


Elabor: Lic. Lilia Anglica Vzquez Gutirrez

Pgina 1

Instituto Tecnolgico de Len


4.1.1 PRUEBA DE BONDAD DE AJUSTE: frecuencias esperadas
iguales.
La prueba de bondad de ajuste es una de las pruebas estadsticas de uso ms
comn. La primera situacin de esta prueba supone el caso en que las frecuencias
esperadas de las celdas son iguales.
Como su nombre lo indica, el propsito de la prueba de bondad de ajuste es
comparar una distribucin observada con una distribucin esperada. Un ejemplo
describir la situacin de una prueba de hiptesis.
Ejemplo 1: La seora Jan Kilpatrick es la gerente de marketing de un fabricante
de tarjetas deportivas. Ella planea iniciar la venta de una serie de tarjetas con
fotografas y estadsticas de juego de ex jugadores de las Ligas Mayores de
Bisbol. Uno de los problemas es la seleccin de ex jugadores. En una exhibicin
de tarjetas de bisbol en Southwyck Mall el pasado fin de semana, instalo un
puesto y ofreci tarjetas de los siguientes seis jugadores miembros del Saln de la
Fama: Tom Seaver, Nolan Ryan, Ty Cobb, George Brett, Hank Aaron y Johnny
Bench. Al final del da vendi un total de 120 tarjetas. El nmero de tarjetas
vendidas de cada jugador aparece en la tabla 4.1. La seora Kilpatrick puede
concluir que las ventas no son iguales por cada jugador?
Jugador
Tom Seaver
Nolan ryan
Ty Cobb
George Brett
Hank Aaron
Johnny Bench
Total

Tarjetas vendidas
13
33
14
7
36
17
120

Tabla 4.1 Nmero de tarjetas vendidas de cada jugador

Si no hay una diferencia significativa en la popularidad de los jugadores, se


esperara que las frecuencias observadas (fo) fueran iguales, o casi iguales. Es
decir, se esperara vender igual nmero de tarjetas de Tom Seaver que de Nolan
Ryan. Por lo tanto, cualquier discrepancia en las frecuencias observada y
esperada puede atribuirse al muestreo (casualidad).
Qu sucede con el nivel de medicin en este problema? Observe que, cuando se
vende una tarjeta, la medicin de la tarjeta se basa en el nombre del jugador. No
hay un orden natural para los jugadores. Ningn jugador es mejor que otro. En
consecuencia, se utiliza una escala nominal para evaluar cada observacin.

Material didctico/Pruebas de Bondad de Ajuste


Elabor: Lic. Lilia Anglica Vzquez Gutirrez

Pgina 2

Instituto Tecnolgico de Len


Como hay 120 tarjetas en la muestra, se espera que (f e) sea 20 tarjetas, es decir,
la frecuencia esperada, fe, aparecer en cada una de las seis categoras (tabla
4.2).
Estas categoras se denominan celdas. Un anlisis del conjunto de frecuencias
observadas en la tabla 4.1 indica que la tarjeta de George Brett no se vende con
frecuencia, en tanto que las de Hank Aaron y Nolan Ryan se venden con ms
frecuencia. Se debe a la casualidad la diferencia en las ventas, o es posible
concluir que hay una preferencia por las tarjetas de ciertos jugadores?
Jugador
Tom Seaver
Nolan ryan
Ty Cobb
George Brett
Hank Aaron
Johnny Bench
Total

Tarjetas
vendidas, fo
13
33
14
7
36
17
120

Nmero vendido
esperado, fe
20
20
20
20
20
20
120

Tabla 4.2 Frecuencias observadas y esperadas de las 120 tarjetas vendidas

SOLUCIN: Emplearemos el mismo procedimiento sistemtico de cinco pasos


visto en la unidad 3 de nuestro curso de estadstica.
Paso 1: Formulacin de hiptesis. La hiptesis nula, Ho, es que no hay
diferencia entre el conjunto de frecuencias observadas y el conjunto de
frecuencias esperadas, es decir, cualquier diferencia entre los dos conjuntos de
frecuencias se puede atribuir al muestreo (casualidad). La hiptesis alternativa, H1,
es que hay una diferencia entre los conjuntos observado y esperado de
frecuencias. Si rechazamos Ho, significa que las ventas no se distribuyen de igual
forma entre las seis categoras (celdas).
Paso 2: Seleccionar el nivel de significancia. Seleccionamos el nivel de
significancia, para este problema tomaremos 0.05. La probabilidad de que
rechacemos la hiptesis nula verdadera es 0.05.

Paso 3: Calcular el estadstico de prueba o contraste. El estadstico de prueba


sigue la distribucin ji cuadrada, designada como:

Material didctico/Pruebas de Bondad de Ajuste


Elabor: Lic. Lilia Anglica Vzquez Gutirrez

Pgina 3

Instituto Tecnolgico de Len


Con k 1 grados de libertad, donde:
k es el nmero de categoras.
es una frecuencia observada en una categora en particular.
es una frecuencia esperada en una categora en particular.
De las 120 tarjetas vendidas en la muestra, se cuenta el nmero de veces que se
vendieron Tom Seaver y Nolan Ryan, y cada uno de los dems jugadores. Los
conteos se registran en la tabla 4.1 Los siguientes son los clculos para ji
cuadrada. (Observe una vez ms que las frecuencias esperadas son las mismas
para cada celda).
Columna 1: Determine las diferencias entre cada
y . Es decir,
. La
suma de estas diferencias es cero.
Columna 2: Eleve al cuadrado la diferencia entre cada frecuencia observada y
esperada, es decir
.
Columna 3: Divida el resultado de cada observacin entre la frecuencia
esperada. Es decir,
resultado es el valor de
Jugador

Tom
Seaver
Nolan ryan
Ty Cobb
George
Brett
Hank
Aaron
Johnny
Bench
Total

Tarjetas
Nmero
vendidas, vendido
fo
esperado,
fe

. Finalmente, sume estos valores. El


, que es 34.40.
(1)

(2)

(3)

13

20

-7

49

49/20 = 2.45

33
14
7

20
20
20

13
-6
-13

169
36
169

169/20 = 8.45
36/20 = 1.80
169/20 = 8.45

36

20

16

256

256/20 = 12.80

17

20

-3

120

120

9/20 = 0.45
34.40

PASO 4: Formular la regla de decisin. Recordemos que la regla de decisin en


las pruebas de hiptesis debemos determinar un nmero que separe la regin
donde no se rechaza la Ho de la regin de rechazo. Este nmero se denomina
valor crtico. El nmero de grados de libertad en este tipo de problema se
encuentra mediante k 1, donde k es el nmero de categoras. En este problema
en particular hay seis. Como hay seis categoras, hay k 1 = 6 1 = 5 grados de
libertad. Como ya se mencion, una categora se denomina celda, por lo que hay
seis celdas. El valor crtico para cinco grados de libertad y el nivel de significancia
0.05 es de 11.070, el cual se obtiene de las tablas ji cuadrada.
Material didctico/Pruebas de Bondad de Ajuste
Elabor: Lic. Lilia Anglica Vzquez Gutirrez

Pgina 4

Instituto Tecnolgico de Len


La regla de decisin es rechazar Ho si el valor calculado de ji cuadrada es mayor
que 11.070. Si es menor o igual a 11.070, no se rechaza H o. En la grfica
siguiente se muestra la regla de decisin.

No se
Rechaza Ho

Regin de rechazo
0.05
11.070
Valor crtico

Escala de

La regla de decisin indica que si hay diferencias grandes entre las frecuencias
observada y esperada, lo que genera una
calculada mayor que 11.070, se debe
rechazar la hiptesis nula. El razonamiento es que es probable que esas
diferencias pequeas entre las frecuencias observada y esperada se deban a la
casualidad. Recuerde que las 120 observaciones son una muestra de la
poblacin.
PASO 5: Tomar una decisin. La
calculada de 34.40 est en la regin de
rechazo ms all del valor crtico de 11.070. Por tanto, la regla decisin es
rechazar Ho con un nivel de significancia de 0.05. La diferencia entre las
frecuencias observada y esperada no se debe a la casualidad. Ms bien, las
diferencias entre fo y fe son lo bastante grandes para considerarse relevantes. La
posibilidad de que estas diferencias se deban a un error de muestreo es muy
pequea. Por tanto, se concluye que es improbable que las ventas de tarjetas
sean las mismas entre los seis jugadores.

PRUEBA DE BONDAD DE AJUSTE: frecuencias esperadas desiguales.


Las frecuencias esperadas (fe) en la distribucin de las tarjetas de bisbol fueron
iguales (20). De acuerdo con la hiptesis nula, se esperaba que una fotografa de
Tom Seaver se vendiera de manera aleatoria 20 veces, una de Johnny Bench, 20
veces de 120 intentos, etc. La prueba ji cuadrada tambin es til si las frecuencias
esperadas no son iguales.
El siguiente ejemplo ilustra el caso de frecuencias desiguales y tambin presenta
un uso prctico de la prueba de bondad de ajuste ji cuadrada para determinar si
una experiencia local difiere de una experiencia ms amplia, la nacin
estadounidense (por ejemplo).
Ejemplo 2: Consideremos un estudio sobre participacin en el mercado realizado
por la empresa Scott Marketing Research. A lo largo de los aos las
participaciones en el mercado se han estabilizado en 30% para la empresa A, 50%
para la empresa B y 20% para la empresa C. Recin la empresa C ha elaborado
un nuevo y mejorado producto para sustituir a uno de sus productos en el mercado
Material didctico/Pruebas de Bondad de Ajuste
Elabor: Lic. Lilia Anglica Vzquez Gutirrez

Pgina 5

Instituto Tecnolgico de Len


y pidi a la empresa Scott Marketing que determinara si el nuevo producto
modificara su participacin en el mercado.
SOLUCIN: Scott realizar un estudio muestral y calcular la proporcin que
prefiere el producto de cada empresa. Despus aplicar una prueba de hiptesis
para ver si el nuevo producto modifica las participaciones en el mercado. (En este
caso, la poblacin de inters es multinomial, es decir cada cliente se clasifica
como cliente de alguna de las empresas A, B o C, de ah surge lo multinomial).
Denotamos las proporciones as:
PA = participacin en el mercado de la empresa A
PB = participacin en el mercado de la empresa B
PC = participacin en el mercado de la empresa C
Vamos a suponer que el nuevo producto de la empresa C no modifica las
participaciones en el mercado, es decir que son iguales; entonces, las hiptesis
nula y alternativa seran las siguientes:
Ho: PA = 0.30, PB = 0.50 y PC = 0.20
H1: Las proporciones poblacionales NO son PA = 0.30, PB = 0.50 y PC
= 0.20
Si los resultados muestrales llevan al rechazo de Ho Scott Marketing tendr
evidencias de que la introduccin del nuevo producto afecta las participaciones del
mercado.
Consideremos que para este estudio la empresa de investigacin de mercado ha
empleado un panel de 200 consumidores. A cada individuo se le pide que indique
su preferencia entre el producto de la empresa A, el de la empresa B o el nuevo
producto de la empresa C. Las respuestas obtenidas se presentan a continuacin
en forma resumida:
Producto de la empresa A = 48
Producto de la empresa B = 98 Frecuencias observadas (fo)
Producto de la empresa C = 54
Ahora se realiza la prueba de bondad de ajuste para determinar si la muestra de
las 200 preferencias de los clientes coincide (se ajusta o sea apega) con la
hiptesis nula.
Dicha prueba de bondad de ajuste se basa en la comparacin de los resultados
observados con los resultados esperados, bajo la suposicin de que la hiptesis
nula es verdadera. Por tanto, el siguiente paso consiste en calcular las
preferencias esperadas en los 200 clientes, con el supuesto de que PA = 0.30, PB =
0.50 y PC = 0.20.
Material didctico/Pruebas de Bondad de Ajuste
Elabor: Lic. Lilia Anglica Vzquez Gutirrez

Pgina 6

Instituto Tecnolgico de Len


FRECUENCIAS ESPERADAS:
Producto de la empresa A 200(0.30) = 60
Producto de la empresa B 200(0.50) = 100
Producto de la empresa C 200(0.20) = 40
Como podemos observar, la frecuencia esperada de cada categora se encuentra
multiplicando el tamao de la muestra, 200, por la proporcin hipottica de cada
categora.
Como ya se mencion antes, en la prueba de bondad de ajuste lo que interesa
son las diferencias entre frecuencias observadas y esperadas, es decir entre lo
que se tiene (observado) y lo que se esperaba tener (esperado).
Se requiere de un estadstico de prueba o de contraste para poder decir si se
rechaza o no la hiptesis nula, dicho estadstico se calcula con la siguiente
frmula:

Donde: fo = frecuencia observada en la categora 1


fe = frecuencia esperada en la categora 1
Nota: el estadstico de prueba tiene una distribucin ji cuadrada con k-1 grados de
libertad, siempre que en todas las categoras las frecuencias esperadas sean 5 o
ms.
Veamos cmo desarrollar la formula anterior del estadstico de prueba:
Categora

Empresa A
Empresa B
Empresa C

Proporcin
Hipottica

0.30
0.50
0.20

Frecuencia
Observada
(fo)

Frecuencia
esperada
(fe)

Diferencia

48
98
54
200

60
100
40

-12
-2
14

(fo-fe)

Cuadrado
de la
diferencia
2
(fo-fe)

144
4
196

Cuadrado
de la
diferencia
dividido
entre fe
2
(fo-fe) /fe
2.4
0.04
4.90
=7.34

Como ya sabemos, la prueba de bondad de ajuste siempre es una prueba de una


cola, en la que el rechazo se presenta en la cola superior de la distribucin ji
cuadrada.
Ahora debemos obtener el valor crtico usando las tablas de distribucin ; as
que considerando que tenemos un nivel de significancia de 0.05 y que los grados
de libertad son K-1 o sea 3-1, el valor de las tablas es:
5.991
Material didctico/Pruebas de Bondad de Ajuste
Elabor: Lic. Lilia Anglica Vzquez Gutirrez

Pgina 7

Instituto Tecnolgico de Len


Por medio de la grfica podemos ver que decisin es la que deberemos tomar
respecto de la hiptesis nula; por lo que graficamos tanto el valor crtico como el
estadstico de contraste quedando de la siguiente manera:

Como lo vimos anteriormente, la regla de rechazo de la cola superior es:


Rechazar Ho si

5.991

En la grfica podemos ver claramente que la regla de rechazo se cumple, es decir


, por lo tanto rechazamos Ho.
Y se concluye que el nuevo producto de la empresa C s modifica la estructura de
la participacin de mercado.

4.1.2 PRUEBA
DE
CONTINGENCIA

INDEPENDENCIA

TABLAS

DE

Otra aplicacin importante de la distribucin ji cuadrada es el empleo de datos


muestrales para probar la independencia de dos variables.
Para ilustrar la prueba de independencia se considera la prueba de independencia
realizada por la cervecera Cuauhtmoc Moctezuma de Mxico. Esta cervecera
produce y distribuye tres tipos de cerveza: ligera, clara y oscura. Al analizar los
segmentos de mercado de las tres cervezas, el grupo de investigacin de mercado
de la empresa se pregunt si las preferencias de los consumidores por estos tipos
de cerveza diferan entre hombres y mujeres. En caso de que las preferencias
fueran independientes del gnero del consumidor, iniciaran una campaa
publicitaria para todas las cervezas de la Cuauhtmoc Moctezuma. Pero, si las
preferencias por los distintos tipos de cerveza dependan del gnero del
consumidor, la empresa ajustara sus promociones a los mercados.
Para determinar si la preferencia por un tipo de cerveza (ligera, clara u oscura) era
independiente del gnero del consumidor (hombre o mujer) se us una prueba de
independencia. Las hiptesis para esta prueba de independencia fueron:

Material didctico/Pruebas de Bondad de Ajuste


Elabor: Lic. Lilia Anglica Vzquez Gutirrez

Pgina 8

Instituto Tecnolgico de Len


: La preferencia por un tipo de cerveza es independiente del gnero del
consumidor.
: La preferencia por un tipo de cerveza NO es independiente del gnero
del consumidor
Para describir la situacin a estudio usaremos la siguiente tabla:

Gnero Hombre
mujer

Ligera
Celda (1,1)
Celda (2,1)

Cerveza preferida
Clara
Celda (1,2)
Celda (2,2)

Oscura
Celda (1,3)
Celda (2,3)

Despus de identificar la poblacin como todos los consumidores de cerveza,


hombres y mujeres, se toma una muestra y a cada individuo se le pide que indique
cul de las tres cervezas Cuauhtmoc Moctezuma prefiere. Cada individuo
pertenecer a una de las seis celdas de la tabla. As, por ejemplo, se puede tener
un individuo que sea hombre y que prefiera la cerveza clara (celda (1,2)), o una
mujer que prefiera la cerveza ligera (celda (2,1)), o una mujer que prefiera la
cerveza oscura (celda (2,3)), etc.
Dado que en la tabla se han enumerado todas las posibles combinaciones de
cerveza preferida y gnero o, en otras palabras, todas las posibles contingencias,
a la tabla anterior se le llama TABLA DE CONTINGENCIA. Como en la prueba de
independencia se usa el formato de las tablas de contingencia, a esta prueba
tambin se le suele llamar prueba de tabla de contingencia.
Suponga que toma una muestra aleatoria simple de 150 consumidores de
cerveza. Cada individuo de la muestra prueba los tres tipos de cerveza y despus
se le pide que indique cul prefiere o cul es su primera eleccin. En la siguiente
tabla se tabulan las respuestas obtenidas en el estudio:

Gnero Hombre
Mujer
Total

Ligera
20
30
50

Cerveza preferida
Clara
40
30
70

Oscura
20
10
30

Total
80
70
150

4.3 Tabla con frecuencias observadas

Los datos para la prueba de independencia se obtienen contando las cantidades o


frecuencias correspondientes a cada celda o categora. De las 150 personas que
formaban la muestra, 20 hombres prefirieron la cerveza ligera, 40 hombres
prefirieron la cerveza clara, 20 hombres prefirieron la cerveza oscura, etc.
Los datos de esta tabla son las frecuencias observadas para cada una de las seis
clases o categoras. Si determina las frecuencias esperadas bajo la suposicin de
independencia entre cerveza preferida y gnero del consumidor, se puede
Material didctico/Pruebas de Bondad de Ajuste
Elabor: Lic. Lilia Anglica Vzquez Gutirrez

Pgina 9

Instituto Tecnolgico de Len


emplear la distribucin ji cuadrada para establecer si existe diferencia significativa
entre las frecuencias observadas y las esperadas.
Las frecuencias esperadas para las celdas de la tabla de contingencia se basan
en la idea siguiente:
Primero, se supone que la hiptesis nula es verdadera, es decir, que la cerveza
preferida es independiente del gnero del consumidor.
Segundo, se observa que en toda la muestra de 150 consumidores de cerveza, 50
prefirieron la cerveza ligera, 70 la clara y 30 la oscura. En trminos de
proporciones se concluye que 50/150 = 1/3 de los consumidores prefiri la cerveza
ligera, 70/150 =7/15 prefirieron la cerveza ligera y 30/150 =1/5 prefiri la oscura. Si
la suposicin de independencia es correcta, estas proporciones sern las que se
observen tanto entre los hombres como entre las mujeres. Por consiguiente, bajo
la suposicin de independencia, es de esperarse que en la muestra de 80
consumidores del sexo masculino, (1/3)(80)=26.67 prefieran la cerveza ligera,
(7/15)(80)=37.33 prefieran la cerveza clara y (1/5)(80)=16 prefieran la oscura.
Aplicando las proporciones correspondientes a los 70 consumidores del sexo
femenino, se obtienen las frecuencias esperadas que se muestran a continuacin.

Gnero Hombre
Mujer
Total

Ligera
26.67
23.33
50

Cerveza preferida
Clara
37.33
32.67
70

Oscura
16.00
14.00
30

Total
80
70
150

4.4 Tabla con frecuencias esperadas

Sea
la frecuencia esperada en el renglon i columna j de la tabla de
contingencia. Mediante dicha notacin, ahora se reconsiderar el calculo de la
frecuencia esperada correspondiente a los hombres (rengln i=1) que prefieren la
cerveza clara (columna j=2); es decir, la frecuencia esperada
. Siguiendo el
argumento anterior para el clculo de las frecuencias esperadas, se ve que

Observe que en esta expresin, 80 es el nmero total de hombres (total del


rengln 1), 70 es la cantidad total de individuos que prefieren la cerveza clara
(total de la columna 2) y 150 es el tamao total de la muestra. De lo que se ve
que:

Material didctico/Pruebas de Bondad de Ajuste


Elabor: Lic. Lilia Anglica Vzquez Gutirrez

Pgina 10

Instituto Tecnolgico de Len


La generalizacin de esta expresin lleva a la frmula siguiente para obtener las
frecuencias esperadas en una tabla de contingencia para una prueba de
independencia.
FRECUENCIAS ESPERADAS EN UNA TABLA DE CONTINGENCIA BAJO LA SUPOSICIN DE
INDEPENDENCIA

Al aplicar esta frmula para los consumidores hombres que prefieren cerveza
oscura, se encuentra que la frecuencia esperada es
, tal
como vemos en la tabla de frecuencias esperadas anterior.
El procedimiento de prueba para comparar las frecuencias esperadas con las
frecuencias observadas es semejante a los clculos para la prueba de bondad de
ajuste vista al principio de esta unidad. En concreto, el valor ji cuadrada que se
basa en frecuencias observadas y esperadas se calcula como se indica a
continuacin:

ESTADSTICO DE PRUEBA PARA INDEPENDENCIA:

Donde:
= frecuencia observada en la categora del rengln i columna j de la tabla de
contingencia.
= frecuencia esperada en la categoria del rengln i columna j de la tabla de contingencia,
basada en la suposicin de independencia.
Nota: Si una tabla de contingencia tiene n renglones y m columnas, el estadstico de prueba
tiene una distribucin ji cuadrada con (n-1)(m-1) grados de libertad, siempre y cuando en
todas las categoras las frecuencias esperadas sean cinco o ms.

La doble sumatoria de la ecuacin anterior indica que el clculo debe hacerse con
todas las celdas que aparecen en la tabla de contingencia. En las frecuencias
esperadas que aparecen en la tabla de ellas, se ve que en cada categora la
frecuencia esperada es de 5 o ms. Por tanto se puede proceder a calcular el
estadstico de prueba ji cuadrada, como veremos a continuacin.

Material didctico/Pruebas de Bondad de Ajuste


Elabor: Lic. Lilia Anglica Vzquez Gutirrez

Pgina 11

Instituto Tecnolgico de Len


CLCULO DEL ESTADSTICO DE PRUEBA JI-CUADRADA PARA
DETERMINAR SI LA PREFERENCIA POR UN TIPO DE CERVEZA ES
INDEPENDIENTE DEL GNERO DEL CONSUMIDOR
Cerveza
preferida
Hombre
Hombre
Hombre
Mujer
Mujer
Mujer

Ligera
Clara
Oscura
Ligera
Clara
Oscura
Total

Frecuencia
observada

Frecuencia
esperada

20
40
20
30
30
10
150

26.67
37.33
16.00
23.33
32.67
14.00

Diferencia
(

(
-6.67
2.67
4.00
6.67
-2.67
-4.00

44.44
7.11
16.00
44.44
7.11
16.00
2
X=

1.67
0.19
1
1.90
0.22
1.14
6.12

Como se observa, el valor del estadstico de prueba es X2= 6.12. El nmero de


grados de libertad para la distribucin ji cuadrada adecuada se obtiene
multiplicando el nmero de renglones menos 1 por el nmero de columnas menos
1. Debido a que se tienen dos renglones y tres columnas, los grados de libertad
son (2-1)(3-1)=2.
Como ocurre en la prueba de bondad de ajuste, en la prueba de independencia se
rechaza Ho si las diferencias entre frecuencias observadas y esperadas dan un
valor grande del estadstico de prueba. De manera que la prueba de
independencia es tambin una prueba del extremo superior.
Considerando un nivel de significancia de 0.05 y por medio de las tablas de
distribucin
se obtiene el valor crtico, para este caso en particular se tiene que
=5.992, contra
= 6.12 se rechaza la hiptesis nula y se concluye que la
preferencia por una cerveza no es independiente del gnero del consumidor.
Mediante una comparacin informal de las frecuencias observadas y esperadas se
obtiene una idea de la dependencia entre cerveza preferida y gnero.
Al observar las tablas de frecuencias observas y esperadas resalta que en los
consumidores de sexo masculino las frecuencias observadas en la preferencia por
cervezas clara y oscura son ms altas que las frecuencias esperadas, mientras
que en las mujeres la frecuencia observada en la preferencia por cerveza ligera es
mayor que en la frecuencia esperada. Dichas observaciones permiten comprender
las diferentes preferencias por cerveza entre los hombres y las mujeres.
A continuacin se resumen los pasos para una prueba de tabla de contingencia
para independencia.

Material didctico/Pruebas de Bondad de Ajuste


Elabor: Lic. Lilia Anglica Vzquez Gutirrez

Pgina 12

Instituto Tecnolgico de Len

1. Establecer las hiptesis nula y alternativa:


: La preferencia por un tipo de cerveza es independiente del gnero del consumidor.
: La preferencia por un tipo de cerveza NO es independiente del gnero del consumidor
2. Seleccionar una muestra aleatoria y anotar en cada celda de la tabla de contingencias las
frecuencias observadas.
3. Emplear la ecuacin dada para calcular las frecuencias esperadas de cada celda.
4. Utilizar la ecuacin correspondiente para calcular el estadstico de prueba o contraste.
5. Regla de rechazo: Rechazar Ho si

Donde: es el nivel de significancia, y los n renglones y las m columnas dan los (n-1)(m-1) grados
de libertad.

El estadstico de prueba para las pruebas ji cuadrada de esta seccin requiere una
frecuencia esperada de cinco o ms en cada categora. Si en una categora la
frecuencia esperada es menor que cinco, es conveniente combinar dos categoras
adyacentes para tener una frecuencia esperada de cinco o ms en cada categora.
LIMITACIONES DE JI CUADRADA
Si en una celda existe una frecuencia esperada pequea inusual, ji cuadrada
puede generar una conclusin errnea. Esto sucede debido a que f e aparece en el
denominador y, al dividirlo entre un nmero muy pequeo, hace el cociente muy
grande.
Cmo proceder cuando las frecuencias de las celdas son pequeas: para ms de
dos celdas, no se deber utilizar ji cuadrada si ms de 20% de las celdas f e tiene
frecuencias esperadas menores de 5. Consideremos los siguientes datos:
Nivel de administracin
Capataz
Supervisor
Gerente
Gerencia de nivel medio
Asistente de vicepresidente
Vicepresidente
Vicepresidente ejecutivo
Total

fo
30
110
86
23
5
5
4
263

fe
32
113
87
24
2
4
1
263

Observemos en la tabla anterior que tres de las siete celdas, o sea el 43%, tienen
frecuencias esperadas (fe) menores que 5.

Material didctico/Pruebas de Bondad de Ajuste


Elabor: Lic. Lilia Anglica Vzquez Gutirrez

Pgina 13

Instituto Tecnolgico de Len


Si realizamos la prueba de bondad de ajuste haciendo caso omiso a que tres
celdas son pequeas, el resultado sera:
Nivel de administracin
Capataz
Supervisor
Gerente
Gerencia de nivel medio
Asistente de vicepresidente
Vicepresidente
Vicepresidente ejecutivo

fo
30
110
86
23
5
5
4

fe
32
113
87
24
2
4
1

(fo-fe)
-2
-3
-1
-1
3
1
3

(fo-fe)2
4
9
1
1
9
1
9

(fo-fe)2/ fe
0.125
0.080
0.011
0.042
4.500
0.250
9.000
= 14.008

Para esta prueba, con un nivel de significancia de 0.05, rechace H o si el valor


calculado de ji cuadrada es mayor que 12.592. Como vemos, el valor calculado es
14.01, por tanto, se rechaza la hiptesis nula de que las frecuencias observadas
representan una muestra aleatoria de la poblacin de los valores esperados.
Retomando la tabla anterior notemos que ms de 98% del valor calculado de ji
cuadrada se explica por las tres categoras de vicepresidentes ([4.500 + 0.250 +
9.000] / 14.008 = 0.9815). Lo cual es lgico, pues a estas tres categoras se les
dio mucha ponderacin.
El dilema anterior se resuelve al combinar categoras si es lgico hacerlo. En el
ejemplo anterior combinaremos tres categoras de vicepresidentes, lo que
satisface la directriz de 20%. As tenemos:
Nivel de administracin
Capataz
Supervisor
Gerente
Gerencia de nivel medio
Vicepresidente
Total

fo
30
110
86
23
14
263

fe
32
113
87
24
7
263

El valor calculado de ji cuadrado con las categoras combinadas es 7.26 como


veremos a continuacin.
Nivel de administracin
Capataz
Supervisor
Gerente
Gerencia de nivel medio
Asistente de vicepresidente

fo
30
110
86
23
14

fe
32
113
87
24
7

(fo-fe)
-2
-3
-1
-1

(fo-fe)2
4
9
1
1

49

Material didctico/Pruebas de Bondad de Ajuste


Elabor: Lic. Lilia Anglica Vzquez Gutirrez

(fo-fe)2/ fe
0.125
0.080
0.011
0.042
7.000
= 7.258
Pgina 14

Instituto Tecnolgico de Len


Este valor es menor que el valor crtico de 9.488 para el nivel de significancia 0.05.
Por tanto, la hiptesis nula no se rechaza con el nivel de significancia de 0.05.
Esto indica que no hay una diferencia relevante entre la distribucin observada y la
esperada.

Material didctico/Pruebas de Bondad de Ajuste


Elabor: Lic. Lilia Anglica Vzquez Gutirrez

Pgina 15

También podría gustarte