Está en la página 1de 19

AYUDA SPSS - CHI CUADRADO-NOTAS METODOLGICA

1/19

AYUDA SPSS
CHI CUADRADO NOTAS METODOLGICAS
Rubn Jos Rodrguez
Octubre de 2004
INTRODUCCIN
Chi Cuadrado de Pearson es un estadstico no paramtrico y es una potente herramienta para
pruebas de significacin de la hiptesis nula de independencia estadstica entre variables
categoriales en tablas de contingencia. Para poder realizar una correcta aplicacin e
interpretacin de Chi Cuadrado se han desarrollado estas Notas Metodolgicas que sistematizan
las consideraciones de los principales tratadistas en la materia. Se hace hincapi en los anlisis
de los residuos (diferencias entre las frecuencia observadas y esperadas), especficamente en
los residuos tipificado corregidos (o residuos ajustados), dado que nos permiten interpretar con
precisin el significado de la asociacin detectada, en trminos del puntaje standardizado Z.
Tambin se desarrolla formulas alternativas del Chi Cuadrado de Pearson para ciertas
condiciones de uso. Se compara la Prueba de Independencia de la Ley del producto o de la
probabilidad compuesta en el marco de la Teora matemtica de la probabilidad 'a prior' de Pierre
Simn Laplace, con los resultados de Chi Cuadrado. Se expone la Regla de Hans Zeizel para
calcular los porcentajes de celdas. Se introduce la nocin de celda falsificadora de la hiptesis
nula (y las celdas verificadoras de la hiptesis alternativa o del investigador). Se realizar una
lectura de los porcentajes de celdas y se interpreta la diferencia porcentual. Se utiliza la prueba t
de diferencia de media de proporciones para muestras independientes como va alternativa
de establecer la significacin estadstica de la diferencia entre porcentajes condicionales o de
celdas. Por ltimo se expone el caso TITANIC (ver Ayuda SPSS - Chi Cuadrado_Caso TITANIC)
para ejemplificar lo desarrollado es estas notas metodolgicas y brindar una definicin e
interpretacin del P-value. Se resume el modelo Chi Cuadrado, se formulan las hiptesis
estadsticas (nula y del investigador), se establecen las reglas de decisin de Pearson y Fisher, y
se adjunta la tabla de Chi Cuadrado para identificar el Chi Cuadrado terico segn determinados
grados de libertad y nivel de significacin.
Notas I [RJR]:
a) Razn de Verosimilitud Ji-cuadrado: La razn de verosimilitud Ji-cuadrado es
una alternativa al estadstico Ji-cuadrado (X2 = Chi cuadrado) de Pearson para
contrastar la hiptesis de independencia entre las variables. Mientras el estadstico Jicuadrado de Pearson se basa en las diferencias entre las frecuencias observadas y las
frecuencias esperadas, la razn de verosimilitud Ji-cuadrado se basa en el
cociente entre ellas(si) el p-valor asociado a la razn de verosimilitud Ji-cuadrado
(Significance=0,00000) tambin es menor que P = 0,05. En consecuencia, al nivel
de significacin 0,005, tambin se rechazar la hiptesis nula de independencia entre
las variablespodra suceder que, para un mismo nivel de significacin, el p-valor
asociado a uno de estas test, fuera menor que el nivel de significacin, mientras que
el p-valor asociado a la otra prueba fuera mayor, en dicho caso, debera optarse por
el ms conservador (por el que presente menor p-valor).
Ferrn Aranaz, Magdalena (1996). SPSS para Windows. Programacin y anlisis
estadstico. Madrid, Editorial McGraw-Hill. 1996. ISBN 84-481-0589-3, pgs. 144145.
b) El Test de la Razn de Verosimilitudes: Como alternativa al contraste Chicuadrado, S. Wiks (1935), (The Likelihood test of independence in contingency

AYUDA SPSS - CHI CUADRADO-NOTAS METODOLGICA

2/19

tables, Annals of Mathematical Statistics, N 6, pg. 190), ha propuesto el siguiente


estadstico:

F
G 2 2 Fi * ln i
Ei
siendo :
Fi : Frecuencias observadas (fo ), es decir, la cantidad de casos
o de valores que se han registrado para cada valor de la variable,
si es una tabla de contingencia.
E i : Frecuencias esperadas (f e ), suponiendo que la hiptesis
nula que se ensaya es verdadera.
(en general), se obtienen resultados muy similares en todos los casos y, por lo tanto,
el uso de uno u otro procedimiento sera, en principio, indiferente. Ello no obstante, el
test de la razn de verosimilitud presenta una ventaja con respecto al Chicuadrado: No requiere que todas frecuencias esperadas sean mayores de 5
Garca, Roberto M. (1995). Contraste Chi-cuadrado. Buenos Aires, Cuadernos de
UADE n 123, Departamento de Matemtica y Mtodos Cuantitativos, UADE, 1995,
ISBN 987-519-1-012-8, pg. 27.
c)

Chi cuadrado de la razn de verosimilitud Likelihood ratio chi square

Estadstico de bondad de ajuste similar al Chi cuadrado de Pearson. Para tamaos de


muestra grandes, los dos estadsticos son equivalentes. La ventaja del chi cuadrado
de la razn de verosimilitud es que puede subdividirse en una serie de partes
interpretables por separado que, sumadas, equivalen al total.
Diccionario Estadstico, http://www.estadistico.com/dic.html?p=122
d)

cuando se pide el test de Ji-Cuadrado al programa, SPSS proporciona adems la


Razn de Verosimilitud (Likelihood Ratio), y el Mantel-Haenzel Test (Asociacin
lineal por lineal). El primero de estos est basado en la teora de mxima
verosimilitud, y su valor es dos veces la suma de las frecuencias observadas de cada
celda multiplicadas por el logaritmo neperiano de la frecuencia observada dividida
entre la frecuencia terica. Con grandes tamaos de muestra adopta valores similares
al test Ji-Cuadrado. El Mantel-Haenzel Test es una medida de avocacin que analiza
la relacin existente entre las filas y columnas de una tabla; y se calcula multiplicando
el coeficiente de correlacin de Pearson por el nmero de casos menos uno. Como ha
sealado Norusis, hay que tener en cuenta que nicamente debe ser utilizado con
variables ordinales y de intervalo (Norusis, 1990:131).
Daz de Rada, Vidal (1999): Tcnicas de anlisis de datos para investigadores
sociales. Aplicaciones prcticas con SPSS para Windows: Madrid, Ra-Ma, 1999, p.
171. [RJR]
Nota II [RJR]:
Anlisis de los Residuos: La prueba de la Ji-cuadrada que hemos explicado
en 6.3.1. sirve para ver si la relacin entre un par de variables es estadsticamente
significativa. El anlisis de los residuos va a utilizar las ideas de la ji-cuadrada para

AYUDA SPSS - CHI CUADRADO-NOTAS METODOLGICA

3/19

estudiar de una manera pormenorizada la tabla: en lugar de ver si las dos variables
estn relacionadas estudiamos la relacin entre cada pareja de categoras.
Bsicamente, el anlisis de los residuos (diferencia entre valor observado (fo),
Oij) y el valor esperado (fe), Eij) es una aplicacin de la Ji-cuadrada al estudio de las
parejas de categoras: observamos las frecuencias obtenidas y las comparamos con
las esperadassi la pareja de categoras no estuviera relacionada el clculo se
realiza segn el procedimiento explicado en 6.3.1. De la magnitud del residuo
concluiremos sobre la relacin entre las categorasCada casilla de la tabla
incluye el nmero de casos, o valores observados (COUNT), los valores esperados
(EXPECTED), la diferencia entre observados y esperados (RESID), los residuos
estandarizados (SRESID) y estos mismos residuos ajustados segn procedimiento de
Haberman (ASRESID). Veamos el clculo de cada uno de estos valores:

Los residuos (RESID):

(RESID) R ij (Oij Eij )


donde Oij y Eij son los valores observados y esperados, respectivamente, en casilla
definida por la fila i y la columna j.
Snchez Carrin, Juan Javier (1995): Manual de anlisis estadstico de los datos,
2 ed. Revisada, Madrid, Alianza Editorial, 1999, captulo 6: Las tablas de
contingencia: relacin entre variables nominales (ordinales), pp. 341-344. [RJR].
La diferencia entre un valor observado y el valor pronosticado por el modelo. El valor
pronosticado es el nmero de casos que se esperaran en la casilla si no hubiera
relacin entre las dos variables. Un residuo positivo indica que hay ms casos en la
casilla de los que habra en ella si las variables de fila y columna fueran
independientes.
SPSS 11.51, Ayuda contextual, Tablas de Contingencia, Chi Cuadrado, Mostrar en
las celdas, Residuos. [RJR]

Los residuos estandarizados (SRESID):

(SRESID) SR ij (Oij Eij ) / Eij


Estos residuos eliminan el efecto que sobre el valor del residuo puedan tener
los marginales de ambas variables
Snchez Carrin (1995: 341-344). [RJR]
El residuo dividido por una estimacin de su error tpico. Los residuos tipificados, que
son conocidos tambin como los residuos de Pearson o residuos estandarizados,
tienen una media de 0 y una desviacin tpica de 1.
SPSS 11.51, Ayuda contextual, Tablas de Contingencia, Chi Cuadrado, Mostrar en
las celdas, Residuos tipificados. [RJR]

Los residuos ajustados (ASRESID):

AYUDA SPSS - CHI CUADRADO-NOTAS METODOLGICA

4/19

(SRESID) AR ij SRij / Vij


donde Vij es la varianza estimada de SRij ,de valor igual a:

Vij 1 (Oi. / n) 1 (O. j / n)


siendo Oi. y O.j son las frecuencias observadas, respectivamente, en la fila i y la
columna j, y n el tamao de la muestraCuanto mayor sea el valor absoluto del
residuo ajustado, mayor ser la relacin entre la pareja de categoras.
Snchez Carrin (1995: 341-344). [RJR]
El residuo de una casilla (valor observado menos valor pronosticado) dividido por
una estimacin de su error tpico. El residuo tipificado resultante viene expresado en
unidades de desviacin tpica, por encima o por debajo de la media.
SPSS 15.0, Ayuda contextual, Tablas de Contingencia, Chi Cuadrado, Mostrar en
las celdas, Residuos tipificados corregidos [RJR].
Los Residuos tipificados corregidos de Haberman (1973). Estos residuos se
distribuyen normalmente con media 0 y desviacin tpica 1. Se calculan dividiendo el
residuo de cada casilla por su Error Tpico (ES o SE), que en tablas bidimensionales se
obtienen como la raz cuadrada de: mij (1-ni) (1-nj)/n2 .
La gran utilidad de los Residuos tipificados corregidos radica en que, puesto que
se distribuye normalmente con media cero y desviacin tpica uno, N (0,1), son
fcilmente interpretables: utilizando un nivel de confianza de 0,95, podemos afirmar
que los residuos mayores de 1,96 delatan casillas con ms casos de los que debera
haber en esa casilla si las variables estudiadas fueran independientes; mientras que
los residuos menores de -1,96 delatan casillas con menos casos de los que cabra
esperar bajo la condicin de independencia.
En tablas de contingencia con variables nominales, una vez que hemos establecido
que entre dos variables existe asociacin significativa (mediante el estadstico Chicuadrado) y que hemos cuantificado esa asociacin con algn ndice de asociacin
(Coeficiente de Contingencia, CC), los residuos tipificados corregidos constituyen la
mejor herramienta disponible para poder interpretar con precisin el significado de la
asociacin detectadaLos distintos porcentajes pueden ayudarnos a intuir posibles
pautas de asociacin, pero son los Residuos tipificados corregidos los que nos

permite interpretar de forma precisa la relacin existente entre las


variablesBasta con fijarnos en aquellos (puntajes z) que son mayores que
+1,96 o menores que -1,96.. [Ver ejemplo Tabla 5 y 6 en Nota IV d)]
Gua 10.0 SPSS para el Anlisis de Datos, captulo 12: Anlisis de variables
categricas, p. 39 y 41. (En lnea):
http://www.uca.es/serv/sai/manuales/spss/Pantalla/12contin.pdf [Consulta: 10 de
octubre de 2004]

AYUDA SPSS - CHI CUADRADO-NOTAS METODOLGICA

5/19

Nota III: [RJR]


Prueba Estadstica de Fisher: Prueba estadstica ideada para el caso de tablas
dicotmicas en las que no se pueda aplicar el test X2 por ser la frecuencia o
frecuencias de alguna de sus casillas ms bajas que lo permitido por dicho test, es
decir, inferiores a cinco.
Frmula:

P=

(a+b)!(c+d)!(a+c)!(b+d)!
N! a! b! c! d!

Tiene el inconveniente de la dificultad de su clculo por el nmero de factoriales (!)


que comprende la frmula (El paquete estadstico SPSS calcula automticamente esta
prueba).
Sierra Bravo, Restituto (1991): Diccionario Prctico de Estadstica, Madrid,
Editorial Paraninfo, 1991, p. 379. [RJR]
En caso de tablas de 2 X 2 (las dos variables dicotmicas o dicotomizadas mediante
un punto de corte), p-value asociado al estadstico Ji-cuadrado de Pearson puede ser
poco preciso. En el caso de que el nmero total de observaciones en la muestra sea
grande, una alternativa al estadstico Ji-cuadrado de Pearson, que incorpora una
correccin por continuidad y, por lo tanto, un p-value ms preciso, es Jicuadrado por Correccin de Continuidad de Yates puede ser poco preciso. En el
caso de que el nmero total de observaciones en la muestra sea grande, una
alternativa al estadstico. Si el tamao muestral es pequeo, mediante la prueba
de la probabilidad exacta de Fisher, se puede calcular la probabilidad exacta de
observar un conjunto particular de frecuencias en una tabla 2 X 2. El propio
programa SPSS optar por una u otra de las pruebas en funcin del tamao
muestral y de las frecuencias esperadas en las celdas
Ferrn Aranaz, Magdalena (1996): SPSS para Windows. Programacin y Anlisis
Estadstico, Madrid, McGraw-Hill, 1996, captulo 7: Tablas de contingencia y medidas
de asociacin, p. 145. [RJR]
Nota IV: [RJR]
Pruebas de independencia:

Es necesario sistematizar las distintas opciones estadstico-metodolgicas de analizar la


independencia estadstica entre dos variables, dado que en la bibliografa segn sea la disciplina
que trate estadstica o metodologa- no desarrollan de modo exhaustivo los diferentes modos
alternativos de analizar o probar la existencia o no de independencia estadstica: Existen cinco
modos alternativos para analizar la independencia estadstica:
a) Una manera es calculando la proporcin entre la frecuencia condicional de una celda y la
frecuencia marginal de columna, comparndola con la proporcin entre la
correspondiente frecuencia marginal, de esa fila, y la frecuencia total. Si se da una
igualdad entre ambas proporciones, se comprueba que ambas variables son independientes. Es
decir, que la distribucin condicin es igual a la distribucin marginal, o lo que es lo mismo, la
distribucin bivariada se comporta del mismo modo que la distribucin univariada. Por lo que
la conclusin es que la introduccin de la segunda variable en las columnas no afecta, no
modifica las distribuciones condicionales. En caso contrario, que se de una desigualdad entre
las proporciones, se sostiene la No independencia entre las categoras, y generalizando, entre
las variables comparadas. Obsrvese que no se afirma la dependencia entre las variables, sino
la No independencia entre las mismas.

AYUDA SPSS - CHI CUADRADO-NOTAS METODOLGICA

6/19

b) Otro modo de comprobar lo mismo es recurrir a la Prueba de independencia, en el marco de la


Teora de Clsica de la Probabilidad formulada por Jean Batiste Laplace, donde se compara la
probabilidad simple de un evento con su probabilidad condicional.
En las siguientes tablas se dan simblicamente, y se expresan analticamente ambos casos.
TABLA I
Variable X
Variable Y

Total

a+b

c+d

Total

a+c

b+d

[Elaboracin propia][RJR]
a) Igualdad de proporciones entre distribuciones condicionales y marginales:

SI:

d
cd

Independencia
bd
n

a) Un segundo mtodo de la clculo lo brinda la Prueba de independencia de la 2 Ley de la


Multiplicacin de Laplace para sucesos simultneos dependientes:

P(A)=P A/B Independencia


(Se lee: Si la P(A) es igual a su Probabilidad Condicional, es decir, la P(A sabiendo que se ha
dado B), se concluye que ambas categoras son independientes)
Aplicando ambos criterios a una tabla emprica, para averiguar si el Sexo es independiente o
no respecto del Estado Civil, tenemos:
TABLA 2
Sexo
Estado Civil

Hombre

Mujer

Total

Solteros

8.000

5.000

13.000

Casados

10.000

12.000

22.000

1.000

4.000

5.000

21.000

40.000

Viudos
Total

19.000

Sierra Bravo (1991: 365)

PA/B

P(A)

AYUDA SPSS - CHI CUADRADO-NOTAS METODOLGICA

7/19

b) La proporcin entre la distribucin condicional comparada con la distribucin marginal,


del ejemplo, da:
f (viudo)/f (total) f (viudo y mujer)/f (mujer)
5.000/40.000 4.000/21.000

0,125 0,191 No independencia


La desigualdad nos confirma que el hecho de ser mujer No es independiente del Estado Civil que
se posee. Se pueden comparar las proporciones de cada una de las celdas y se obtendr la misma
conclusin para cada par de categoras. Por lo que podemos generalizar las conclusiones para el
conjunto del cuadro bivariado: el Sexo No es independiente del Estado Civil.
b) Si P(A) es la Probabilidad Simple de que una persona sea Viudo, es decir, la Probabilidad de
ser Viudo, es igual a la cantidad de Viudos divido el Total de personas, es decir:
P (Viudo) = 5.000/40.000= 0,125
Y P (B) la Probabilidad Simple de que una persona sea Mujer, es igual:
P (Mujer)= 21.000/40.000= 0,525
Pero, P(A/B) es la Probabilidad Condicional de Ser Viudo sabiendo que es Mujer, es decir, la
Probabilidad de ser Viudo condicionado a que sea Mujer, es igual a:
P (Viudo/Mujer)= 4.000/21.000= 0,191
Comparando los resultados, comprobamos que ambas probabilidades son distintas:
P (Viudo) P (Viudo/Mujer)

0,125 0,191 No independencia


Obsrvese que analticamente, la expresin
P (Viudo/Mujer)= f (viudo y mujer)/f (mujer),
con lo cual se demuestra que ambos criterios (a) y (b) de Prueba de Independencia son equivalente.
c) Un tercer modo alternativo de anlisis emprico de un cuadro bivariado es convertir las
frecuencias absolutas en frecuencias relativas, es decir en porcentajes, y calcular la Diferencia
Porcentual (d%). Para ello debemos tener en cuenta la Regla de Hans Zeisel 1: Porcentuar en el
1

Galtung, Johan (1966): Teora y mtodos de la investigacin social, 2 ed., Buenos Aires, Eudeba, Tomo
II, 1969, p. 234: La regla es muy simple: sacar porcentajes tomando siempre como base los valores de lo
que se considera variable independiente en el modelo subyacente.

AYUDA SPSS - CHI CUADRADO-NOTAS METODOLGICA

8/19

sentido de la variable independiente, -tomando como base el marginal de esta ltima- y comparar
los porcentajes en sentido opuesto. Tambin debemos observar la forma de la distribucin
condicional relativa (distribucin diagonal o rinconal), e identificar las celdas verificadoras
(circuladas en rojo en el ejemplo) y las celdas falsificadoras de la hiptesis que subyace al cuadro.
En nuestro ejemplo:
TABLA 3
Sexo (%)
Estado Civil

Hombre

Mujer

d%

Solteros

42,1

23,8

32,5

18,3

Casados

55,6

57,1

55,0

-1,5

5,3

19,1

12,5

-13,8

100,0

: 0

Viudos
Total

100,0

100,0

Obsrvese que los porcentajes resaltados en azul, coinciden con las proporciones y probabilidades
obtenidas mediante los criterios alternativos (a) y (b). La Diferencia porcentual, nos indica la
fuerza o intensidad relativa de la asociacin entre las variables, y no solamente es una Prueba
de Independencia. Si la d% = 0 indica independencia estadstica, o asociacin nula, y si la d% =
100, estara sealando mxima asociacin. En nuestro ejemplo, (d% = -13,8) indica leve
asociacin. Hubiese existido asociacin nula segn los subndices de la TABLA 1- si los
porcentajes hubiesen sido iguales:

p 00 p01

p viudo y hombre = p viudo y mujer


Y hubiese existido algn grado de asociacin si los porcentajes hubiesen sido:

p 00 p 01

p viudo y hombre p viudo y mujer

No obstante que, la diferencia porcentual como medida de asociacin, acta como medida de
influencia de una variable X sobre otra Y, debe ser interpretada mediante la prueba t de
diferencia de medias de proporciones para muestras independientes (Galtung, 1969, II: 241)
para medir la significacin estadstica del tamao de la diferencia, pues una d% = 10%, puede ser
tanto la diferencia entre 95-85% como entre 25-15%. Si bien en ambos casos la d% es igual al
10%. En el primer caso la diferencia del 10% en proporcin al porcentaje menor representa un
incremento porcentual (%) del 11,76%:

AYUDA SPSS - CHI CUADRADO-NOTAS METODOLGICA

9/19

95 85
% 100
11, 76%
85
Mientras que en el segundo caso la diferencia del 10% en proporcin al 15% representa un
incremento (%) del 66,67%. En este sentido, se puede opinar que es ms significativo este
segundo caso que el primero.

25 15
% 100
66, 67%
15
d) Un cuarto modo es, justamente, la prueba t de diferencias de proporciones de
dos muestras independientes, que permite verificar diferencias entre proporciones
o porcentajes (d%) de dos muestra (grandes) independientes. Los componentes del
modelo y los pasos para el clculo del estadstico de prueba, son:
Modelo estadstico: Distribucin de diferencias de proporciones muestrales,
con media igual a la Media de la distribucin diferencias de proporciones
muestrales y con Desvo Standard igual al Error Estndar de las diferencias
de proporciones muestrales. En smbolos:

D 0

p1 q1 p2 q2

n1
n2

= ESD

Hiptesis estadsticas: La hiptesis nula plantea la igualdad de las


proporciones en las dos muestras, o lo que es lo mismo, que su diferencia es igual
a 0. Mientras que la hiptesis alternativa, la hiptesis del investigador, plantea
que las proporciones muestrales son distintas, es decir, que sus diferencias son
distintas de 0, divergiendo del mero azar. Simblicamente:

H 0 p1 p2 D 0
H1 p1 p2 0; o D 0
Estadstico de prueba:
Caso I: t de Student para diferencias de proporciones muestrales
independientes (muestras grandes).

AYUDA SPSS - CHI CUADRADO-NOTAS METODOLGICA

t p p
1

10/19

p1 p2
d%

p1 q1 p2 q2 D

n1
n2

Estadstico de prueba:
Caso II: t de Student diferencias de medias de muestras independientes
(muestras grandes).

t X1 X 2

X 2 D
2
1

s
n1

s2
n2

DX X
1

Clculo del estadstico de prueba: Si aplicamos la prueba t para el caso II, al


Fichero Ventas-Beneficios-1994-95 X 83 empresas2 para poner a prueba la
hiptesis nula de la no existencia de diferencia entre las medias de Beneficios
antes de impuestos en l995 (bai95) entre empresas del sector servicios e
industriales. Para ello, debemos dar los siguientes pasos:
i. Recodificar la variable Sector (sector) asignando los viejos cdigos del sector de
actividad de la variable sector a la nueva variable dicotomizada sectorb,
categorizada en Sector Servicios (1) y Sector Industrial (2). Dato que la prueba t
compara dos medias en base a una variable de agrupacin dicotmica.
ii. Luego se abre la cuadro de dilogo: Comparar medias>Prueba T para
muestras independientes, del men Analizar.
iii. En dicho cuadro seleccionamos la variables bai95 y la pasamos a la ventana
Contrastar variables (Test Variable), en Variables de agrupacin,
seleccionamos la nueva variable que recodifica los sectores: sectorb.

/h
2

Visauta Vinacua, Bienvenido (1997): Anlisis estadstico con SPSS para Windows (6.1), Madrid,
McGraw-Hill, 1997, captulo 4: Test de hiptesis: Comparacin de medias, pp. 111-114.

11/19

AYUDA SPSS - CHI CUADRADO-NOTAS METODOLGICA

iv. Luego se definen los grupos: Usar valores especificados O Punto de corte.
Oprimir Continuar para volver a la ventana original o primaria. Y luego Aceptar.

SPSS ejecuta el comando T-Test y arroja dos tablas con los resultados que se
observan en el Visor de SPSS:

TABLA 4
Estadsticos de grupo

Sector-ServicioIndustria
Beneficios antes de
impuestos (1995)

Media

Desviacin tp.

Error tp. de la media

Sector Servicios

39

23.068,74

50.154,834

8.031,201

Sector Industrial

36

10.774,83

32.247,476

5.374,579

TABLA 5
Prueba de muestras independientes

Prueba de
Levene para la
igualdad de
varianzas

F
Beneficios
antes de
impuestos
(1995)

Sig.

Prueba T para la igualdad de medias

Sig.(
bilate
ral)

gl

Diferencia
de medias

Error tp.
de la
diferencia

95% Intervalo de confianza


para la diferencia

Inferior
Se han
asumido
varianzas
iguales
No se han
asumido
varianzas
iguales

2,356

,129

Superior

1,251

73

,215

12.293,91

9.827,639

7.292,546

31.880,367

1,272

65,413

,208

12.293,91

9.663,658

7.003,436

31.591,256

AYUDA SPSS - CHI CUADRADO-NOTAS METODOLGICA

12/19

vi. Luego para visualizar los resultados reemplazamos en la frmula del


estadstico t los datos obtenidos en el output y confirmamos el t-value:

t X1 X 2

t X1 X 2

X 2 D
2
1

s
n1

s2
n2

DX X
1

12.293,91
1, 251
9.827,639

vii. Por ltimo, tomamos la decisin estadstica con relacin a la hiptesis nula.
Dado que aplicando la Regla de Decisin de Fisher, tenemos que:

Si P-Value < P
Pero:

Si 0,215 > 0,05

H0 y H1
H0 y H1

y concluimos que no hay diferencias en los Beneficios antes de impuestos en


1995, en las 83 empresas entre los Sectores Servicios e Industria.
d) Por ultimo, una quinta forma de probar la hiptesis de independencia es
mediante el estadstico Chi Cuadrado.
En la tabla 6: Destino de sobrevivientes al hundimiento del TITANIC by
Sexo, ponemos a prueba la hiptesis nula de que no hay diferencias entre los
hombres y mujeres que perecieron. En cambio el investigador sostendr que en
los datos se puede poner a prueba la hiptesis de que en el siniestro del TITANIC
se evidenci una vez ms la aplicacin del principio marinero Primero las mujeres
y los nios y segundo los hombres. Por lo que esperaramos hallar en la celda
verificadora (rayado oblicuo en rojo) mujeres/nios y sobrevieron una
proporcin (p) mayor que en la celda hombre y sobrevivieron. Observemos qu
decisin nos indica tomar Chi Cuadrado respecto de la hiptesis nula.

H 0 phombres y sobrevivieron pmujeres y sobrevivieron d % 0


H1 phombres y sobrevivieron pmujeres y sobrevivieron d % 0

13/19

AYUDA SPSS - CHI CUADRADO-NOTAS METODOLGICA


TABLA 6

Tabla de contingencia: Destino en el hundimiento del TITANIC segn el Sexo del pasajero
Sexo del pasajero
Hombres
Recuento

Destino en el
hundimiento

Se salvaron

163

800

82,2%

32,0%

62,3%

154,5

-154,5

Residuos
tipificados

7,0

-8,7

Residuos
corregidos

18,2

-18,2

Recuento

138

347

485

% de Sexo de
pasajero

17,8%

68,0%

37,7%

Residuo

-154,5

154,5

-9,0

11,1

-18,2

18,2

775

510

1285

100,0%

100,0%

100,0%

Residuo

Residuos
tipificados
Residuos
corregidos
Total

Total

637

% de Sexo de
pasajero
Perecieron

MujeresNios

Recuento
% de Sexo de
pasajero

d%

+50,2%

-50,2%

Adaptado y reelaborado de Sanchez Carrin (1999: 331-333) (S.S. Titanic, White Star Line, 14
de abril de 1912)[RJR]

14/19

AYUDA SPSS - CHI CUADRADO-NOTAS METODOLGICA


TABLA 7

Pruebas de chi-cuadrado

Valor

Sig. asinttica
(bilateral)

gl

P-value
Chi-cuadrado de Pearson

330,307(b)

,000

Correccin por continuidad


de Yates (a)

328,172

,000

Razn de verosimilitud

338,182

,000

Sig. exacta
(bilateral)

Estadstico exacto de
Fisher

,000

Asociacin lineal por lineal


N de casos vlidos

Sig. exacta
(unilateral)

330,050

,000

,000

1285

a Calculado slo para una tabla de 2x2.


b 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es
192,49.

TABLA 8

Medidas simtricas

Nominal por nominal

Valor

Sig.
aproximada

Phi

,507

,000

V de Cramer

,507

,000

Coeficiente de Contingencia

,452

,000

N de casos vlidos

1285

a Asumiendo la hiptesis alternativa.


b Empleando el error tpico asinttico basado en la hiptesis nula.

Las conclusiones que se pueden obtener a partir de los resultados de las distintas
medias, pruebas y coeficientes, son:
La diferencia porcentual (d% = 82,2-32,0=50,2%) acta como medida de la
influencia que tuvo el sexo en la suerte corrida por los pasajeros.
Se confirma una distribucin diagonal de las frecuencias condicionales relativas,
efectivamente, la celda verificadora esperada segn el principio marinero, confirma
que el porcentaje de mujeres/nios que sobrevivieron es 3,8 veces ms (68,0/17,8)
que los hombres que se salvaron. Siendo importante esta magnitud de la diferencia
porcentual.
Los Residuos tipificados corregidos ( 18,2) se ubican a 9,2 Desvos Standard
respecto del valor crtico 1,96 esperado por azar (18,2/1,96= 9,2), con un intervalo
de confianza de .95. Un tal desvo no puede ser atribuido al azar sino que cabe
esperar que para producirse una tal diferencia es probable (95 veces de cada 100)

AYUDA SPSS - CHI CUADRADO-NOTAS METODOLGICA

15/19

que haya operado una decisin y una voluntad en el alto mando del S.S. TITANIC, de
hacer cumplir el principio marinero de salvar a las mujeres y nios primero.
El valor del Chi cuadrado calculado o emprico (Chi-square value) es de una magnitud
muy grande (330,307) y acusa una Significacin asinttica bilateral de .000. Esta
cifra es una probabilidad y significa = P-Value. Cuando esta probabilidad es inferior a
0,05, (P: Nivel de Significacin = 5%) se suele rechazar la hiptesis de independencia
Ho de no relacin entre las variables segn la Regla de decisin de Fisher-, para
aceptar la hiptesis alternativa H1, que indica que la relacin entre las variables existe
y es estadsticamente significativa y no se debe al azar. Se puede concluir que el
capitn del S. S. Titanic hizo honor a la armada britnica aplicando con firmeza el
principio marinero que dice: Primero las mujeres y los nios, y luego los hombres,
permitiendo que sobrevivan ms mujeres que hombres, ms all del azar, que es lo
sostenido por la hiptesis del investigador. En smbolos:

Resumen del modelo


Chi square value: 330, 337
Chi Cuadrado-Correccin por continuidad de Yates: 328,172
P : 0,05 (Nivel de significacin)
P-value: 0,000 (Significacin asinttica bilateral)
Grados de Libertad: 1 [df: (c-1)*(f-1)]
Chi Cuadrado de Tabla: 3,841 (Ver Tabla de Chi Cuadrado para 1 gl y P:
0,05)
Regla de decisin de Fisher:

Si P-Value < P H0 y H1
Si 0,000 < 0,05 H0 y H1
Regla de decisin de Pearson:

Si X 2 calculado > X 2 tabla H 0 H 1

Si 300,337 > 3,841 H 0 H1

AYUDA SPSS - CHI CUADRADO-NOTAS METODOLGICA

16/19

Distribucin de la Curva de Chi-Cuadrado:

P 0, 05
Rechazo H 0

Aceptacion H0

P-value= 0,000

Zona de Riesgo

X 2 teo rico X 2 1;0 , 0 5 3 ,8 4 1

X 2 calculado Chi square value 300,337

[Elaboracin Propia. RJR]


Finalmente, la magnitud de los coeficientes de asociacin indican,
efectivamente, una relacin entre ambas variables del orden de 0,452 y 0,507.
Expresando una mediana fuerza de asociacin teniendo en cuenta que estos
coeficientes varan entre 0 y 1.

CALCULADORA CHI-CUADRADO3
CORRECCION DE CONTINUIDAD DE YATES

SUM

637

163

800

II

138

347

485

SUM

775

510

1285

Chi-square value (X):

328.172423

Difference (p<0.05)?

yes

Difference (p<0.01)?

yes

[RJR]

Calculadora Chi Cuadrado-Correccin por continuidad de Yates. (En lnea): Disponible:


http://members.tripod.com/~gineco/CHISQUAR.HTM [Consulta: 11 de octubre de 2004]

AYUDA SPSS - CHI CUADRADO-NOTAS METODOLGICAS

17/19

Table: Chi-Square Probabilities


The areas given across the top are the areas to the right of the critical value. To look up an area on the left, subtract it from one, and then look it up (ie: 0.05 on the left is 0.95
on the right)

AYUDA SPSS - CHI CUADRADO-NOTAS METODOLGICAS

df

0.995

0.99

0.975

0.95

0.90

0.10

0.05

18/19

0.025

0.01

0.005

---

---

0.001

0.004

0.016

2.706

3.841

5.024

6.635

7.879

0.010

0.020

0.051

0.103

0.211

4.605

5.991

7.378

9.210

10.597

0.072

0.115

0.216

0.352

0.584

6.251

7.815

9.348

11.345

12.838

0.207

0.297

0.484

0.711

1.064

7.779

9.488

11.143

13.277

14.860

0.412

0.554

0.831

1.145

1.610

9.236

11.070

12.833

15.086

16.750

0.676

0.872

1.237

1.635

2.204

10.645

12.592

14.449

16.812

18.548

0.989

1.239

1.690

2.167

2.833

12.017

14.067

16.013

18.475

20.278

1.344

1.646

2.180

2.733

3.490

13.362

15.507

17.535

20.090

21.955

1.735

2.088

2.700

3.325

4.168

14.684

16.919

19.023

21.666

23.589

10

2.156

2.558

3.247

3.940

4.865

15.987

18.307

20.483

23.209

25.188

11

2.603

3.053

3.816

4.575

5.578

17.275

19.675

21.920

24.725

26.757

12

3.074

3.571

4.404

5.226

6.304

18.549

21.026

23.337

26.217

28.300

13

3.565

4.107

5.009

5.892

7.042

19.812

22.362

24.736

27.688

29.819

14

4.075

4.660

5.629

6.571

7.790

21.064

23.685

26.119

29.141

31.319

15

4.601

5.229

6.262

7.261

8.547

22.307

24.996

27.488

30.578

32.801

16

5.142

5.812

6.908

7.962

9.312

23.542

26.296

28.845

32.000

34.267

17

5.697

6.408

7.564

8.672

10.085

24.769

27.587

30.191

33.409

35.718

18

6.265

7.015

8.231

9.390

10.865

25.989

28.869

31.526

34.805

37.156

19

6.844

7.633

8.907

10.117

11.651

27.204

30.144

32.852

36.191

38.582

20

7.434

8.260

9.591

10.851

12.443

28.412

31.410

34.170

37.566

39.997

21

8.034

8.897

10.283

11.591

13.240

29.615

32.671

35.479

38.932

41.401

22

8.643

9.542

10.982

12.338

14.041

30.813

33.924

36.781

40.289

42.796

23

9.260

10.196

11.689

13.091

14.848

32.007

35.172

38.076

41.638

44.181

24

9.886

10.856

12.401

13.848

15.659

33.196

36.415

39.364

42.980

45.559

25

10.520

11.524

13.120

14.611

16.473

34.382

37.652

40.646

44.314

46.928

26

11.160

12.198

13.844

15.379

17.292

35.563

38.885

41.923

45.642

48.290

AYUDA SPSS - CHI CUADRADO-NOTAS METODOLGICAS

19/19

27

11.808

12.879

14.573

16.151

18.114

36.741

40.113

43.195

46.963

49.645

28

12.461

13.565

15.308

16.928

18.939

37.916

41.337

44.461

48.278

50.993

29

13.121

14.256

16.047

17.708

19.768

39.087

42.557

45.722

49.588

52.336

30

13.787

14.953

16.791

18.493

20.599

40.256

43.773

46.979

50.892

53.672

40

20.707

22.164

24.433

26.509

29.051

51.805

55.758

59.342

63.691

66.766

50

27.991

29.707

32.357

34.764

37.689

63.167

67.505

71.420

76.154

79.490

60

35.534

37.485

40.482

43.188

46.459

74.397

79.082

83.298

88.379

91.952

70

43.275

45.442

48.758

51.739

55.329

85.527

90.531

95.023

100.425

104.215

80

51.172

53.540

57.153

60.391

64.278

96.578

101.879

106.629

112.329

116.321

124.116

128.299

90

59.196

61.754

65.647

69.126

73.291

107.565

113.145

118.136

100

67.328

70.065

74.222

77.929

82.358

118.498

124.342

129.5

También podría gustarte