Está en la página 1de 7

Captulo 2 Anlisis de datos cualitativos

DEFINICIN DE VARIABLES CUALITATIVAS Son aquellas variables cuyos valores son un conjunto de cualidades no numricas a las que se llama categoras o modalidades. CLASIFICACIN DE VARIABLES CUALITATIVAS

Escala nominal: No se puede denir un orden natural entre sus categoras. (Ejemplo: la raza, el color del pelo, o la religin) Escala ordinal: Se pueden establecer relaciones de orden entre las categoras. (Ejemplo: el rango militar, la clase social o el nivel de estudios)

Por intervalos: Pueden tratarse como ordinales y se pueden calcular distancias numricas entre dos niveles. (Ejemplo: El nmero de aos de educacin recibidos (0, 1, 2, ...) es una variable cuantitativa que puede ser agrupada por intervalos)

17

18

Anlisis de datos cualitativos

TABLAS DE CONTINGENCIA
Una tabla de contingencia es una tabla bidimensional en la que las variables objeto de estudio no son cuantitativas. Ejemplo. Tabla de contingencia para estudiar la asociacin entre color y fragancia de las ores azaleas: Color de la or Fragancia Blanca Rosa Naranja S 12 60 58 No 50 10 10

INDEPENDENCIA DE VARIABLES CUALITATIVAS


Contrastamos

H0 : H1 :

A y B son independientes A y B no son independientes

Estadstico de contraste 2 exp


tij

p q X X (nij tij )2 i=1 j=1

tij

ni nj , y que bajo la hiptesis nula sigue una distribucin 2 (p1)(q1) N

p y q : Nmero de las y columnas, respectivamente, de la tabla ni. : Total de las frecuencias observadas de la isima la (modalidad i del carcter A) n.j : Total de las frecuencias observadas de la jsima columna (modalidad j el carcter B) N : Nmero de individuos observados

Anlisis de datos cualitativos

19

ASOCIACIN DE VARIABLES CUALITATIVAS

Estudiamos algunas de las medidas de asociacin ms empleadas en la prctica.

MEDIDAS DE ASOCIACIN

Chi-cuadrado Medida que compara los valores (nij ) observados en la tabla con los que tericamente se obtendran (tij ) bajo la hiptesis nula

2 exp

p q X X (nij tij )2 i=1 j=1

tij

Toma valores:
F

Entre 0 y N para tablas de contingencia 2 2 y Entre 0 y N mn{p 1, q 1} en tablas p q, con p, q 2. Un valor igual a 0 indica independencia de A y B.

20

Anlisis de datos cualitativos

MEDIDAS EN ESCALA NOMINAL


En escala nominal podemos considerar las siguientes medidas de asociacin: 1) Coeciente 2) Coeciente de contingencia o C de Pearson (C) 3) Coeciented 4) Coeciente V de Cramer (V) 5) Coeciente Lambda ()
F F F

En tablas de contingencia 2 2 el coeciente y el coeciente V de Cramer toman valores entre 0 y 1: Un valor 0 implica independencia de los atributos. Un valor 1 denota asociacin perfecta. Valores cercanos a 1 indican un grado de asociacin fuerte mientras que valores prximos a 0 implican un grado de asociacin dbil.

El Coeciente de contingencia o C de Pearson toma en tablas 22 valores 2 comprendidos entre 0 y , siendo: 2 2 F El valor denota asociacin perfecta. 2 F Un valor 0 indica independencia.

Anlisis de datos cualitativos

21

F F F

Los valores del coeciente lambda estn comprendidos entre 0 y 1 para tablas p q, con p, q 2: Valores prximos a 0 implican baja asociacin Valores prximos a 1 denotan fuerte asociacin. Sin embargo un valor = 0 no implica independencia de los atributos.

Tabla 2 2 para medidas en escala nominal Asociacin Medida Valores Independencia perfecta Coeciente 0 1 0 1 Coeciente V de Cramer 0 V 1 0 1 2 2 Coeciente de contingencia 0 C 0 2 2 C de Pearson Coeciente Lambda 0 1 1

Los valores de estas medidas no dependen del nmero de las ni de columnas de la tabla, por lo que permiten la comparacin entre tablas.

Tabla p q con p, q > 2 para medidas en escala nominal Medida Valores Indepenpendencia Asociacin perfecta Coeciente 0A 0 A Coef. V de Cramer 0 V 1 0 1 Coef. de contingencia C de Pearson 0 C B 0 B Coeciente Lambda 0 1 1 donde: p A= mn{p 1, q 1} s mn{p 1, q 1} B= mn{p 1, q 1} + 1

Los valores de y de C dependen de p y q, por lo que no permiten realizar comparaciones entre tablas.

22

Anlisis de datos cualitativos

MEDIDAS EN ESCALA ORDINAL


Para variables en escala ordinal, puede considerarse adems del grado de asociacin la direccin de sta.
F F

Se dice que dos variables estn relacionadas positivamente si a valores altos (bajos) de una de ellas le corresponden valores altos (bajos) en la otra. Se dice que estn relacionadas negativamente si a valores altos (bajos) de una de ellas le corresponden valores bajos (altos) en la otra. Si A y B son medidas a escala ordinal pueden aplicarse las medidas de asociacin vlidas para escala nominal. Adems en escala ordinal pueden considerarse:

1) Coeciente Gamma de Goodman y Kruskal () 2) Coeciente d de Somers (d) 3) Coeciente TauB de Kendall (TauB) 4) Coeciente TauC de Kendall (TauC)

1 , d, TauB , TauC 1 EN GENERAL, PARA ESTAS MEDIDAS SE TIENE:


Cuanto ms prximos estn los valores de estas medidas a 0 ms dbil ser la asociacin entre las variables. Cuanto ms cercanos a 1 (o a 1 ) sean los valores de todas estas medidas mayor ser la asociacin positiva (negativa) entre las variables.

Anlisis de datos cualitativos

23

Tabla p q con p, q > 2 para medidas en escala ordinal Medida Valores Indepen- Asociacin Asociacin dencia perfecta perfecta positiva negativa d de Somers 1 d 1 0 1 1 TauB (Kendall) 1 TauB 1 0 1 1 TauC (Kendall) 0 TauC 1 0 1 1

En tablas no cuadradas la medida TauB de Kendall no alcanza los lmites. Si las variables son independientes entonces = 0 , sin embargo el recproco no es cierto. Adems || = 1 no implica asociacin perfecta.

Bibliografa utilizada: F Abad Montes, F. y Vargas Jimnez, M. (2002). Anlisis de datos para las Ciencias Sociales. Ed.: Proyecto Sur. F Aguilera del Pino, A. M. (2001). Tablas de contingencia bidimensionales. Ed.: La Muralla, S.A. F Milton, Susan (2001). Estadstica para Biologa y Ciencias de la Salud. Ed.: Mc Graw-Hill. Temporalizacin: Una hora

También podría gustarte