Está en la página 1de 32

PRUEBA DE SIGNIFICANCIA

CHI CUADRADO

Qu es la Chi Cuadrada?
Es una prueba estadstica para evaluar hiptesis acerca de la
relacin entre dos variables categricas
Se simboliza por 2
Hiptesis a probar : Correlacinales
( H0 : no hay asociacin y H1 hay asociacin)
Variables involucradas: Dos, esta prueba no considera
relaciones causales
Nivel de medicin de las variables: Nominal u ordinal

Otras caractersticas
Es una distribucin asimtrica
Slo toma valores positivos y es asinttica con respecto al
eje de las x positivas ( 0 < 2 < +)
Est caracterizada por un nico parmetro n llamado
grados de libertad adoptando formas distintas segn el
valor de n
El rea comprendida entre la curva y el eje de las x es 1
100%

Aplicaciones
Entre las aplicaciones ms frecuentes de
distribucin en el rea de salud, podemos sealar:

esta

1.

La prueba de asociacin, la cual permite al investigador


determinar si existe asociacin entre dos variables en
escala de medicin nominal u ordinal. Tambin aparece
en la literatura con el nombre de tablas de
contingencia

2.

La prueba de bondad de ajuste

PROCEDIMIENTO
Se calcula a travs de una tabla de contingencia o
tabulacin cruzada.
Es una tabla de dos dimensiones y cada dimensin
contienen una variable
Cada variable se subdivide en dos o ms categoras.
Ejemplo: tabla 2x2 => cada dgito indica una variable y el
valor de este indica el nmero de categoras de la variable

Ejemplo de una Tabla de Contingencia


Dos variables : voto y sexo
Cada variable con dos categoras

VOTO

CANDIDATO A

MASCULINO

SEXO
FEMENINO

CANDIDATO B

Ejemplo Tabla 2x3

Identificaci
n politica

Norte

Sur

Partido 1

180

100

Partido 2

190

280

Partido 3

170

120

Zona Distrito electoral

En esencia la prueba de Chi Cuadrado es .......

es una prueba que parte del supuesto de no relacin entre


las variables

una comparacin entre la tabla de frecuencias


observadas y la denominada tabla de frecuencias
esperadas

La lgica es Si no hay relacin entre las variables debe


tenerse una tabla como la de frecuencias esperadas, si la hay
la tabla que obtengamos como resultado de nuestra
investigacin debe ser muy diferente respecto de la tabla de
frecuencias esperadas

Paso a paso....................
1.

En la tabla de contingencia se anotan las frecuencias


observadas en la muestra de la investigacin.

2.

Se calculan las frecuencias esperadas para cada celda

fe = (total marginal de rengln)*(total marginal de columna)


N
donde N= nmero total de frecuencias observadas

Paso a paso....................
3.

Se aplica la siguiente frmula de Chi Cuadrada:

2 = (O E) / E
donde O = frecuencia observada en cada celda
E = frecuencia esperada en cada celda
Es decir:
Se calcula la diferencia entre la frecuencia observada y la
esperada, esta diferencia se eleva al cuadrado y se divide entre
la frecuencia esperada. Finalmente, se suman estos resultados y
la sumatoria es el valor de la 2 obtenida

Otra forma de calcular Chi Cuadrado es.............

Procedimiento para calcular la Chi Cuadrada

Celda

OE

( O E )

( O E ) / E

Zona Norte / P 1

180

145,4

34,6

1.197,16

8,23

Zona Norte / P 2

190

244,4

-54,4

2.959,36

12,11

Zona Norte / P3

170

150,6

19,4

376,36

2,50

Zona Sur / P 1

100

134,6

-34,6

1.197,16

8,89

Zona Sur / P 2

280

226,0

54,0

2.916,00

12,90

Zona Sur/ P 3

120

139,4

-19,4

376,33

2,7

2 = 47,33

Paso a paso.................
4.

Clculo del Ji cuadrada crtico: el cual se obtiene de una


tabla especfica, en donde se busca la interseccin entre
los grados de libertad y el nivel de significacin
gl = ( r-1)*(c-1)
donde r = n de renglones de la tabla de contingencia
c = n de columnas
Ejemplo => gl = ( 3 1 ) * ( 2 1 ) = 2

Con un nivel de confianza de 0,05 0,01 y con los


grados de libertad vamos a la tabla y obtenemos el valor
2

Paso a paso....................
5.

Regin de rechazo R: est constituida por todos los valores del


Ji cuadrado iguales o mayores que el Ji Cuadrado crtico
Si nuestro valor calculado de 2 es igual o superior al de la
tabla, decimos que las variables estn relacionadas ( 2 fue
significativa
En nuestro ejemplo => 2 tabla es 5,991
2 calculado es 47,33
El valor calculado por nosotros es muy superior al de la tabla :
2 es significativa, es decir estn relacionadas .

Observaciones
Mientras mayor sea la diferencia entre los valores
observados y los esperados, mayor ser el valor de 2 y
aumentar por tanto la probabilidad de rechazar la
hiptesis de nulidad
No se puede usar la prueba de 2 cuando el valor esperado
en alguna celda es menor que 5, en ese caso debe usarse la
probabilidad exacta de Fisher
La suma de las frecuencias observadas debe coincidir con
la suma de las frecuencias esperadas.

TABLAS DE CONTINGENCIAS
OTRO USO

Qu otra utilizacin tienen las tablas


de contingencia?

Son tiles para describir conjuntamente a dos o ms


variables.
Esto se hace convirtiendo las frecuencias observadas en
frecuencias relativas o porcentajes

Qu otra utilizacin tienen las tablas


de contingencia?
En una tabulacin cruzada puede haber tres tipos de porcentajes
respecto a cada celda:
Porcentaje en relacin al total de frecuencias observadas (N)
Porcentaje en relacin al total marginal de la columna
Porcentaje en relacin al total marginal del rengln
Veamos un ejemplo:
sexo
Preferencia
por el
conductor

Masc

Fem

25

25

40

60

Frecuencias observadas
25

En relacin a N
En relacin a a + b
En relacin a a + c

25,00%

38,46%

a + c = 50

50,00%

b+d

a + b = 65

c+d

N=100

Tabla N 1.- Tabla de contingencia para describir


conjuntamente dos variables
Sexo
Masculino

A
Preferencia
por el
conductor

Femenino

25
25,0%
38,5%
50,0%

25
25,0%
71,4%
,50,0%

40
40,0%
61,5%
80,0%

10
10,0%
28,6%
20,0%

65

35

50

50

Comentario final
Una cuarta parte de la
muestra est constituida por
hombres que prefieren al
conductor A, el 10 % son
mujeres que prefieren al
conductor B. Ms del 60%
de los hombres pprefieren a
B, etc..

EL TEST EXACTO DE FISHER

El test exacto de Fisher permite analizar si dos variables


dicotmicas estn asociadas cuando la muestra a estudiar es
demasiado pequea.

El test exacto de Fisher se basa en evaluar la probabilidad


asociada a cada una de las tablas 2 x 2 que se pueden formar
manteniendo los mismos totales de filas y columnas que los
de la tabla observada.

Cada una de estas probabilidades se obtiene bajo la


hiptesis nula de independencia de las dos variables que se
estn considerando.

La probabilidad exacta de observar un conjunto concreto


de frecuencias a, b, c y d en una tabla 2 x 2 cuando se
asume independencia y los totales de filas y columnas se
consideran fijos viene dada por la distribucin
hipergeomtrica:

a b ! c d ! a c ! b d !
p
n!a!b!c!d!

Esta frmula se obtiene calculando todas las posibles


formas en las que podemos disponer n sujetos en una
tabla 2 x 2 de modo que los totales de filas y columnas
sean siempre los mismos, (a+b), (c+d), (a+c) y (b+d).

La probabilidad anterior deber calcularse para todas las


tablas de contingencia que puedan formarse con los
mismos totales marginales que la tabla observada.
Posteriormente, estas probabilidades se usan para calcular
valor de la p asociado al test exacto de Fisher.

Este valor de p indicar la probabilidad de obtener una


diferencia entre los grupos mayor o igual a la observada,
bajo la hiptesis nula de independencia.

Si esta probabilidad es pequea (p<0.05) se deber


rechazar la hiptesis de partida y deberemos asumir que las
dos variables no son independientes, sino que estn
asociadas. En caso contrario, se dir que no existe
evidencia estadstica de asociacin entre ambas variables.

Supongamos que el suceso investigado es, si una enfermedad es ms


frecuente en el grupo de expuestos que en el de los no expuestos a un
posible factor causal .tendremos la siguiente tabla

Grupo

Si

No

Expuesto

A+ B

No expuesto C

C+D

Total

A+C

B+D

Total

El test exacto de Fisher


Ejemplo:
Supngase que un grupo de 16
personas se reuni a comer en un
restaurante. Diez comieron pastel
de mariscos y 6 comieron carne. Al
da siguiente, 11 de los comensales
amanecieron
enfermos
de
gastroenteritis
La tabla adjunta muestra las
frecuencia de enfermos en los que
comieron mariscos y en los que
comieron carne.
Lo que se quiere averiguar, es si la
asociacin entre el tipo de comida y
enfermar,
es
estadsticamente
significativa

Enfermos
Comida

Si

No

Total

Mariscos
Carne

9
2

1
4

10
6

Total

11

16

Procedimiento
La Ho = frecuencia de enfermos entre los que comieron mariscos es la
misma que la de los que enfermaron despus de comer carne
11/16 =0,6875, la frecuencia de enfermos en el grupo total.
Las probabilidades se pueden obtener en forma aproximada de la Tabla
de Valores Crticos de D o C en la prueba de Fisher *,
Se busca la seccin de la tabla en que los totales del margen derecho
son A + B ( 10) y C + D = 6.
Buscamos en la columna B o (A) si aparece 1, que es el valor de B en
nuestro ejemplo. Dado que no se encuentra, se debe utilizar el valor de
A= 9

Procedimiento
Dado que tuvimos que buscar la fila del valor A = 9, lo que
corresponde es buscar el valor de C en la tabla , que corresponde
al valor 2.
Valor observado es mayor o igual que el valor crtico indica
asociacin => 2 2 para 5% de significancia. => se declara
significativa la asociacin
Si es valor observado es menor que el crtico , entonces no existe
asociacin y se acepta la Ho
Un valor 2 es suficiente para declarar significativa la asociacin
entre el consumo de alimentos y la enfermedad a nivel de 5% pero
no a nivel 2,5% o 1%

COEFICIENTES
DE
C O R R E LAC I O N

Qu son los coeficientes de correlacin e


independencia para tabulaciones cruzadas?
Son coeficientes que tambin sirven para evaluar si las
variables incluidas en la tabla de contingencia o
tabulacin cruzada estn correlacionadas

Algunos de estos coeficientes se pueden observar en la


siguiente tabla resumen:

Coeficiente

Para tablas
de
contingencia

Nivel de
medicin
de las
variables

Interpretacin

Phi ()

2x2

Nominal

Vara de 0 a +1, donde 0 implica


ausencia de correlacin entre las
variables
y
+1
significa
correlacin de manera perfecta

Coef. de
Pearson

Cualquier
tamao

Nominal

Su valor mnimo es 0 ( ausencia de


correlacin). Su valor mximo
depende del tamao de la tabla de
contingencia = > 2x2 ( 0 y 0,707)
3x3 ( 0 y 0,816)

V de Cramer

Mayores de
2x2

Nominal

Vara de 0 a +1 ; donde 0 es nula


correlacin y +1 es perfecta
correlacin.

Lambda (b)

Cualquier
tamao

Nominal

Vara de 0 a +1 ; +1 significa que


puede predecirse sin error a la
variable dependiente definida en la
tabla, sobre la base de la
independiente

Coeficiente

Gamma ( r)

Tau-b de
Kendall
(Tau-b)

D. De Somers

Para tablas
de
contingencia

Nivel de
medicin
de las
variables

Interpretacin

Cualquier
tamao

Ordinal

Vara de 1 a +1 , donde 1 es una


relacin negativa perfecta y +1 una
relacin positiva perfecta)

Ordinal

Vara de 1 a +1

Cualquier
tamao, pero
ms
apropiado
para tablas
con
igual
nmero de
renglones y
columnas

Cualquier
tamao

Ordinal

Vara de 1 a +1

También podría gustarte