Está en la página 1de 7

Captulo 2

Anlisis de datos cualitativos


DEFINICIN DE VARIABLES CUALITATIVAS
Son aquellas variables cuyos valores son un conjunto de cualidades no numricas a las que se llama categoras o modalidades.
CLASIFICACIN DE VARIABLES CUALITATIVAS

Escala nominal: No se puede definir un orden natural entre sus categoras. (Ejemplo: la raza, el color del pelo, o la religin)

Escala ordinal: Se pueden establecer relaciones de orden entre las categoras. (Ejemplo: el rango militar, la clase social o el nivel de estudios)

Por intervalos: Pueden tratarse como ordinales y se pueden calcular distancias numricas entre dos niveles. (Ejemplo: El nmero de aos de educacin recibidos (0, 1, 2, ...) es una variable cuantitativa que puede ser
agrupada por intervalos)

17

18

Anlisis de datos cualitativos

TABLAS DE CONTINGENCIA
Una tabla de contingencia es una tabla bidimensional en la que las variables
objeto de estudio no son cuantitativas.
Ejemplo. Tabla de contingencia para estudiar la asociacin entre color y
fragancia de las flores azaleas:
Color de la flor
Fragancia Blanca Rosa Naranja
S
12
60
58
No
50
10
10

INDEPENDENCIA DE VARIABLES CUALITATIVAS


Contrastamos

H0 :

A y B son independientes

H1 :

A y B no son independientes

Estadstico de contraste
2exp

p X
q
X
(nij tij )2
i=1 j=1

tij

tij

ni nj
, y que bajo la hiptesis nula sigue una distribucin 2(p1)(q1)
N

p y q : Nmero de filas y columnas, respectivamente, de la tabla

ni. : Total de las frecuencias observadas de la isima fila (modalidad i


del carcter A)

n.j : Total de las frecuencias observadas de la jsima columna (modalidad


j el carcter B)

N : Nmero de individuos observados

Anlisis de datos cualitativos

19

ASOCIACIN DE VARIABLES CUALITATIVAS

Estudiamos algunas de las medidas de asociacin ms empleadas en la


prctica.

MEDIDAS DE ASOCIACIN

Chi-cuadrado
Medida que compara los valores (nij ) observados en la tabla con los que
tericamente se obtendran (tij ) bajo la hiptesis nula

2exp

p X
q
X
(nij tij )2
i=1 j=1

tij

Toma valores:
F

Entre 0 y N para tablas de contingencia 2 2 y

Entre 0 y N mn{p 1, q 1} en tablas p q, con p, q 2.

Un valor igual a 0 indica independencia de A y B.

20

Anlisis de datos cualitativos

MEDIDAS EN ESCALA NOMINAL


En escala nominal podemos considerar las siguientes medidas de asociacin:
1) Coeficiente
2) Coeficiente de contingencia o C de Pearson (C)
3) Coeficiented
4) Coeficiente V de Cramer (V)
5) Coeficiente Lambda ()

En tablas de contingencia 2 2 el coeficiente y el coeficiente V de


Cramer toman valores entre 0 y 1:

Un valor 0 implica independencia de los atributos.

Un valor 1 denota asociacin perfecta.

Valores cercanos a 1 indican un grado de asociacin fuerte mientras que


valores prximos a 0 implican un grado de asociacin dbil.

El Coeficiente de contingencia
o C de Pearson toma en tablas 22 valores
2
comprendidos entre 0 y
, siendo:
2

2
F El valor
denota asociacin perfecta.
2
F Un valor 0 indica independencia.

Anlisis de datos cualitativos

21

Los valores del coeficiente lambda estn comprendidos entre 0 y 1 para


tablas p q, con p, q 2:
Valores prximos a 0 implican baja asociacin

Valores prximos a 1 denotan fuerte asociacin.

Sin embargo un valor = 0 no implica independencia de los atributos.

Tabla 2 2 para medidas en escala nominal


Asociacin
Medida
Valores
Independencia
perfecta
Coeficiente
0 1
0
1
Coeficiente V de Cramer
0 V 1
0

1
2
2
Coeficiente de contingencia 0 C
0
2
2
C de Pearson
Coeficiente Lambda
0 1

Los valores de estas medidas no dependen del nmero de filas ni de columnas de la tabla, por lo que permiten la comparacin entre tablas.

Tabla p q con p, q > 2 para medidas en escala nominal


Medida
Valores
Indepenpendencia Asociacin perfecta
Coeficiente
0A
0
A
Coef. V de Cramer
0 V 1
0
1
Coef. de contingencia
C de Pearson
0 C B
0
B
Coeficiente Lambda
0 1

1
donde:
p
A=
mn{p 1, q 1}
s
mn{p 1, q 1}
B=
mn{p 1, q 1} + 1

Los valores de y de C dependen de p y q, por lo que no permiten


realizar comparaciones entre tablas.

22

Anlisis de datos cualitativos

MEDIDAS EN ESCALA ORDINAL


Para variables en escala ordinal, puede considerarse adems del
grado de asociacin la direccin de sta.

Se dice que dos variables estn relacionadas positivamente si a valores altos


(bajos) de una de ellas le corresponden valores altos (bajos) en la otra.

Se dice que estn relacionadas negativamente si a valores altos (bajos) de


una de ellas le corresponden valores bajos (altos) en la otra.

Si A y B son medidas a escala ordinal pueden aplicarse las medidas de


asociacin vlidas para escala nominal.

Adems en escala ordinal pueden considerarse:

1) Coeficiente Gamma de Goodman y Kruskal ()


2) Coeficiente d de Somers (d)
3) Coeficiente TauB de Kendall (TauB)
4) Coeficiente TauC de Kendall (TauC)

1 , d, TauB , TauC 1
EN GENERAL, PARA ESTAS MEDIDAS SE TIENE:

Cuanto ms prximos estn los valores de estas medidas a 0 ms dbil ser


la asociacin entre las variables.

Cuanto ms cercanos a 1 (o a 1 ) sean los valores de todas estas medidas


mayor ser la asociacin positiva (negativa) entre las variables.

Anlisis de datos cualitativos

23

Tabla p q con p, q > 2 para medidas en escala ordinal


Medida
Valores
Indepen- Asociacin Asociacin
dencia
perfecta
perfecta
positiva
negativa
d de Somers
1 d 1
0
1
1
TauB (Kendall) 1 TauB 1
0
1
1
TauC (Kendall)
0 TauC 1
0
1
1

En tablas no cuadradas la medida TauB de Kendall no alcanza los


lmites.

Si las variables son independientes entonces = 0 , sin embargo el recproco no es cierto.

Adems || = 1 no implica asociacin perfecta.

Bibliografa utilizada:
F Abad Montes, F. y Vargas Jimnez, M. (2002). Anlisis de datos para las Ciencias
Sociales. Ed.: Proyecto Sur.
F Aguilera del Pino, A. M. (2001). Tablas de contingencia bidimensionales. Ed.: La
Muralla, S.A.
F Milton, Susan (2001). Estadstica para Biologa y Ciencias de la Salud. Ed.: Mc
Graw-Hill.
Temporalizacin: Una hora

También podría gustarte