Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Cmo pueden analizarse estos datos? Los mtodos de muestra pequea vistos
en la unidad 3 son vlidos slo cuando la(s) poblacin(es) muestreada(s) es (son)
normal(es) o aproximadamente normal(es).
Los datos formados por rangos de escalas arbitrarias de 1 a 5 no satisfacen la
suposicin de normalidad. En algunas aplicaciones, las tcnicas son vlidas si las
muestras se toman al azar de entre poblaciones cuyas varianzas son iguales.
Cuando los datos no parecen satisfacer stas y otras suposiciones similares,
puede usarse un mtodo alternativo, es decir, mtodos estadsticos no
paramtricos. Los mtodos no paramtricos por lo general satisfacen las
hiptesis en trminos de distribuciones poblacionales ms que parmetros por
ejemplo medias y desviaciones estndar. Es frecuente que las suposiciones
paramtricas sean sustituidas por suposiciones ms generales acerca de las
distribuciones poblacionales y las clasificaciones de las observaciones se usen a
veces en lugar de las mediciones reales.
Pgina 1
Tarjetas vendidas
13
33
14
7
36
17
120
Pgina 2
Tarjetas
vendidas, fo
13
33
14
7
36
17
120
Nmero vendido
esperado, fe
20
20
20
20
20
20
120
Pgina 3
Tom
Seaver
Nolan ryan
Ty Cobb
George
Brett
Hank
Aaron
Johnny
Bench
Total
Tarjetas
Nmero
vendidas, vendido
fo
esperado,
fe
(2)
(3)
13
20
-7
49
49/20 = 2.45
33
14
7
20
20
20
13
-6
-13
169
36
169
169/20 = 8.45
36/20 = 1.80
169/20 = 8.45
36
20
16
256
256/20 = 12.80
17
20
-3
120
120
9/20 = 0.45
34.40
Pgina 4
No se
Rechaza Ho
Regin de rechazo
0.05
11.070
Valor crtico
Escala de
La regla de decisin indica que si hay diferencias grandes entre las frecuencias
observada y esperada, lo que genera una
calculada mayor que 11.070, se debe
rechazar la hiptesis nula. El razonamiento es que es probable que esas
diferencias pequeas entre las frecuencias observada y esperada se deban a la
casualidad. Recuerde que las 120 observaciones son una muestra de la
poblacin.
PASO 5: Tomar una decisin. La
calculada de 34.40 est en la regin de
rechazo ms all del valor crtico de 11.070. Por tanto, la regla decisin es
rechazar Ho con un nivel de significancia de 0.05. La diferencia entre las
frecuencias observada y esperada no se debe a la casualidad. Ms bien, las
diferencias entre fo y fe son lo bastante grandes para considerarse relevantes. La
posibilidad de que estas diferencias se deban a un error de muestreo es muy
pequea. Por tanto, se concluye que es improbable que las ventas de tarjetas
sean las mismas entre los seis jugadores.
Pgina 5
Pgina 6
Empresa A
Empresa B
Empresa C
Proporcin
Hipottica
0.30
0.50
0.20
Frecuencia
Observada
(fo)
Frecuencia
esperada
(fe)
Diferencia
48
98
54
200
60
100
40
-12
-2
14
(fo-fe)
Cuadrado
de la
diferencia
2
(fo-fe)
144
4
196
Cuadrado
de la
diferencia
dividido
entre fe
2
(fo-fe) /fe
2.4
0.04
4.90
=7.34
Pgina 7
5.991
4.1.2 PRUEBA
DE
CONTINGENCIA
INDEPENDENCIA
TABLAS
DE
Pgina 8
Gnero Hombre
mujer
Ligera
Celda (1,1)
Celda (2,1)
Cerveza preferida
Clara
Celda (1,2)
Celda (2,2)
Oscura
Celda (1,3)
Celda (2,3)
Gnero Hombre
Mujer
Total
Ligera
20
30
50
Cerveza preferida
Clara
40
30
70
Oscura
20
10
30
Total
80
70
150
Pgina 9
Gnero Hombre
Mujer
Total
Ligera
26.67
23.33
50
Cerveza preferida
Clara
37.33
32.67
70
Oscura
16.00
14.00
30
Total
80
70
150
Sea
la frecuencia esperada en el renglon i columna j de la tabla de
contingencia. Mediante dicha notacin, ahora se reconsiderar el calculo de la
frecuencia esperada correspondiente a los hombres (rengln i=1) que prefieren la
cerveza clara (columna j=2); es decir, la frecuencia esperada
. Siguiendo el
argumento anterior para el clculo de las frecuencias esperadas, se ve que
Pgina 10
Al aplicar esta frmula para los consumidores hombres que prefieren cerveza
oscura, se encuentra que la frecuencia esperada es
, tal
como vemos en la tabla de frecuencias esperadas anterior.
El procedimiento de prueba para comparar las frecuencias esperadas con las
frecuencias observadas es semejante a los clculos para la prueba de bondad de
ajuste vista al principio de esta unidad. En concreto, el valor ji cuadrada que se
basa en frecuencias observadas y esperadas se calcula como se indica a
continuacin:
Donde:
= frecuencia observada en la categora del rengln i columna j de la tabla de
contingencia.
= frecuencia esperada en la categoria del rengln i columna j de la tabla de contingencia,
basada en la suposicin de independencia.
Nota: Si una tabla de contingencia tiene n renglones y m columnas, el estadstico de prueba
tiene una distribucin ji cuadrada con (n-1)(m-1) grados de libertad, siempre y cuando en
todas las categoras las frecuencias esperadas sean cinco o ms.
La doble sumatoria de la ecuacin anterior indica que el clculo debe hacerse con
todas las celdas que aparecen en la tabla de contingencia. En las frecuencias
esperadas que aparecen en la tabla de ellas, se ve que en cada categora la
frecuencia esperada es de 5 o ms. Por tanto se puede proceder a calcular el
estadstico de prueba ji cuadrada, como veremos a continuacin.
Pgina 11
Ligera
Clara
Oscura
Ligera
Clara
Oscura
Total
Frecuencia
observada
Frecuencia
esperada
20
40
20
30
30
10
150
26.67
37.33
16.00
23.33
32.67
14.00
Diferencia
(
(
-6.67
2.67
4.00
6.67
-2.67
-4.00
44.44
7.11
16.00
44.44
7.11
16.00
2
X=
1.67
0.19
1
1.90
0.22
1.14
6.12
Pgina 12
Donde: es el nivel de significancia, y los n renglones y las m columnas dan los (n-1)(m-1) grados
de libertad.
El estadstico de prueba para las pruebas ji cuadrada de esta seccin requiere una
frecuencia esperada de cinco o ms en cada categora. Si en una categora la
frecuencia esperada es menor que cinco, es conveniente combinar dos categoras
adyacentes para tener una frecuencia esperada de cinco o ms en cada categora.
LIMITACIONES DE JI CUADRADA
Si en una celda existe una frecuencia esperada pequea inusual, ji cuadrada
puede generar una conclusin errnea. Esto sucede debido a que f e aparece en el
denominador y, al dividirlo entre un nmero muy pequeo, hace el cociente muy
grande.
Cmo proceder cuando las frecuencias de las celdas son pequeas: para ms de
dos celdas, no se deber utilizar ji cuadrada si ms de 20% de las celdas f e tiene
frecuencias esperadas menores de 5. Consideremos los siguientes datos:
Nivel de administracin
Capataz
Supervisor
Gerente
Gerencia de nivel medio
Asistente de vicepresidente
Vicepresidente
Vicepresidente ejecutivo
Total
fo
30
110
86
23
5
5
4
263
fe
32
113
87
24
2
4
1
263
Observemos en la tabla anterior que tres de las siete celdas, o sea el 43%, tienen
frecuencias esperadas (fe) menores que 5.
Pgina 13
fo
30
110
86
23
5
5
4
fe
32
113
87
24
2
4
1
(fo-fe)
-2
-3
-1
-1
3
1
3
(fo-fe)2
4
9
1
1
9
1
9
(fo-fe)2/ fe
0.125
0.080
0.011
0.042
4.500
0.250
9.000
= 14.008
fo
30
110
86
23
14
263
fe
32
113
87
24
7
263
fo
30
110
86
23
14
fe
32
113
87
24
7
(fo-fe)
-2
-3
-1
-1
(fo-fe)2
4
9
1
1
49
(fo-fe)2/ fe
0.125
0.080
0.011
0.042
7.000
= 7.258
Pgina 14
Pgina 15