Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. INTRODUCCIN
Este tema se centra en el estudio conjunto de dos variables.
- Tabla de datos
- Tabla de contingencia
- Diagrama de barras
- Tabla de diferencias entre frecuencias empricas y tericas
- Calculo de coeficiente X2
- Clculo del coeficiente de contingencia
Adems
2. CONCEPTOS PREVIOS
Asociacin y/o relacin entre dos variables: Dos variables estn relacionadas entre s
cuando ciertos valores de una de las variables se asocian con ciertos valores de la otra
variable.
Recordamos que la variable cualitativa era aquella que estaba medida en una escala
nominal o de clasificacin (tema 1). Adems pueden ser:
Cuando se dispone de los datos de dos variables cualitativas para todos los sujetos de una
muestra, se puede elaborar la Tabla de contingencia y su correspondiente diagrama de
barras (pgina 125). Los datos de esta tabla son las frecuencias empricas u observadas y
se representan por (ne)
Ahora tenemos que construir una nueva tabla con las frecuencias tericas (nt). Para ello
utilizaremos la frmula:
Totalfila _ x _ totalcolumna
Frecuencia terica = nt =
n
Anlisis de Datos
CAPITULO 4: ANALISIS CONJUNTO DE DOS VARIABLES
Una vez creada esta segunda tabla (pgina 126) tenemos que crear una tercera tabla que
muestra las diferencias entre la tabla 1 y la tabla 2. Es decir, la tabla de diferencias entre
las frecuencias empricas menos las frecuencias tericas. (pgina 127)
- Es importante quedarnos con el dato de que la suma de las filas y las columnas de
esta tercera tabla siempre es igual a 0, si sale otra cosa es que algo hemos hecho
mal.
Una vez que tenemos la tabla debemos interpretarla: La interpretacin que hace el libro se
basa en analizar los valores positivos (8) como fuente de informacin. (parece ser que los
valores negativos no nos aportan informacin) .As tenemos un 8 en S-V y en No-M. Por lo
tanto concluiremos que los varones tienen mayor tendencia a padecer estrs (S-V) y las
mujeres tiene menos tendencia a padecer estrs (No-M).
Y ahora
Calculamos un estadstico X2
(n e n t ) 2
Estadstico X2 = n
t
ne = frecuencia emprica
nt = frecuencia terica
Para calcular el estadstico no hace falta informacin nueva, ya que extraemos todos los
nmeros de las tablas anteriores.
Sin embargo este estadstico nos da poca informacin porque desconocemos su lmite
superior. Slo sabemos que si nos da valor 0 no hay relacin entre las dos variables. Sin
embargo si nos da un valor cualquiera como por ejemplo 10,78 (pgina 128) no sabemos
que interpretar ya que el lmite podra ser 20, 50 , 100 etc y lo desconocemos. Para
resolver este problema se calcula algo que s que sabemos sus lmites y es el ndice o
Coeficiente de Contingencia, C. (da valores entre 0 y 1)
X2
Coeficiente de contingencia = C =
X2 + n
Adems del Coeficiente de Contingencia tenemos tambin que calcular su mximo (para
posteriormente poder comparar uno con otro
)
k 1
Cmx =
k
k = Nmero de filas y nmero de columnas (en el ejemplo que vamos a ver a continuacin
K=2 porque tenemos mismo nmero de filas (2) que de columnas (2)
Anlisis de Datos
CAPITULO 4: ANALISIS CONJUNTO DE DOS VARIABLES
Tambin tenemos el ejemplo de tablas con distinto nmero de filas y columnas, por lo tanto
no podremos calcular el Cmx. Y la informacin la extraeremos directamente de C (ejemplo
pgina 129-130) En este ejemplo el procedimiento para calcular las tablas es el mismo que
el explicado en la primera parte, la nica diferencia es cuando llegamos a C ya que no
podemos calcular su Cmx.
Para concluir:
- Cuando utilicemos C para comparar la relacin entre dos variables cuyos datos
tenemos en dos tablas de contingencia diferentes, tenemos que vigilar que tienen el
mismo nmero de filas y de columnas. De lo contrario los valores de C no permiten
una comparacin vlida.
- Cuando existe un valor elevado de C, no podemos afirmar con rotundidad que una
de las variables es causa de la otra, ya que puede haber una tercera variable que
est relacionando a ambas.
Una vez realizado el diagrama y tan slo observndolo, podemos decir que existe una
relacin lineal en las variables X e Y. Es decir, a valores mayores de X correspondern
valores mayores de Y y viceversa.
Una vez llegados a este punto calculamos 2 ndices que nos permiten ponerle nmeros a
todo esto que llevamos analizado:
Anlisis de Datos
CAPITULO 4: ANALISIS CONJUNTO DE DOS VARIABLES
Covarianza = SXY =
X Y i i
XY
n
En el ejemplo de la pgina 134 observamos que la covarianza da 6,4 (signo positivo) por lo
tanto se cumple la relacin lineal directa que ya habamos observado en el diagrama de
dispersin.
SXY
rXY =
SX SY
Pgina 137 y 138: Ejemplos de diagramas de dispersin y nubes de puntos con sus
correspondientes explicaciones.
Caso A
Caso B
Caso C
Caso D
pero qu pasa cuando tenemos valores intermedios como por ejemplo 0,55?
En ese caso no podemos afirmar que ese valor indica correlacin alta o baja ya que
depender del tipo de datos que estemos analizando
- Ser baja si se trata de dos tests similares que estemos aplicando a los mismos
sujetos o si tenemos pocos sujetos
- Ser alta si se trata de tests bastante diferenciados o si tenemos muchos sujetos.
4. REGRESIN LINEAL
Cuando existe relacin lineal podemos utilizar la recta de regresin para efectuar
pronsticos de los valores de una variable a partir de otra variable.
Y = a + bX
Anlisis de Datos
CAPITULO 4: ANALISIS CONJUNTO DE DOS VARIABLES
Para hallar la recta tenemos que calcular a y b con las siguientes frmulas:
n (XY ) X Y
b=
n X 2 ( X ) 2
a = Y bX
La recta pasa por el punto X,Y . Las puntuaciones obtenidas mediante la recta de
regresin las denominaremos puntuaciones pronosticadas.