Documentos de Académico
Documentos de Profesional
Documentos de Cultura
BIVARIADA
La estadstica descriptiva bivariada aborda el estudio de los sucesos en los que
intervienen dos variables simultneamente.
1. DISTRIBUCIONES BIDIMENSIONALES
Cuando queremos describir conjuntamente dos variables estadsticas, el primer
paso ser (al igual que en el caso de la estadstica univariada), representar los
datos en una tabla de frecuencias. Ahora, a cada caso le corresponde no un valor
sino dos (uno para cada una de las variables). As, en el caso de que intentemos
relacionar el peso y la altura de las personas, a cada persona le asociamos un par
de valores (peso, altura).
Los pares de valores as formados constituyen la distribucin bidimensional. La
tabla de frecuencias consiste en una tabla de doble entrada en la que se recogen
tanto las frecuencias de cada una de las variables por separado como los pares de
puntuaciones que cada caso obtiene en ambas variables (frecuencia conjunta).
Las puntuaciones pueden aparecer sin agrupar o agrupadas en intervalos, no
teniendo por qu ser el nmero de intervalos de las dos variables iguales entre s,
as como la amplitud de los mismos.
Organizacin y representacin de los datos con ms de una variable
Los datos se organizan en tablas de contingencia
Para representar ,por ejemplo, dos variables cualitativas la variable Xi (con I
categoras) y la variable Yj (con J categoras) se construir una tabla de doble
entrada con I filas y J columnas. Dentro cada casilla de la tabla se encontrarn las
frecuencias conjuntas de las dos variables (n ij).
i =1
i =2
i =3
..
I
nj
j=1
n11
n21
n31
..
nI1
n1
j=2
n12
n22
n33
..
nI2
n2
..
..
..
..
..
..
J
n1J
n2J
n3J
..
nIJ
nJ
ni
n1
n2
n3
nI
N
Ejemplo
Gnero
Xi
Varn
Mujer
nj
Fumador
30
30
60
Tabaquismo Yj
No fumador
50
10
60
Exfumador
20
10
30
ni
100
50
150
Varn
Mujer
pj
Fumador
0,20
0,20
0,40
Tabaquismo Yj
No fumador
0,33
0,07
0,40
Exfumador
0,13
0,07
0,20
pi
0,66
0,34
1
Varn
Mujer
Tabaquismo Yj
Fumador
No fumador Exfumador
0,30=30/100 0,50=50/100 0,20=20/100
0,60=0,30/50 0,20=10/50 0,20=10/50
pi
1
1
Varn
Mujer
pj
Tabaquismo Yj
Fumador
No fumador
0,50=30/60 0,83=50/60
0,50=30/60 0,17=10/60
1
1
Exfumador
0,67=20/30
0,33=10/30
1
De los fumadores un 50% son hombres y un 50% son mujeres; de los no fumadores
el 83% son varones, y el 17% son mujeres; de los exfumadores el 67% son varones
y el 33% son mujeres.
2. REPRESENTACIN GRFICA
La representacin grfica conjunta de dos variables cualitativas puede verse en las
siguientes grficas.
Para dos variables cualitativas la representacin grfica podra ser un diagrama de
barras.
Nivel de
ansiedad
Bajo
Medio
Alto
Nota media
8
7
4
Nivel de
ansiedad
1-5
6-10
nj
1-3
1
7
8
Calificacin Final
4-6
7-9
4
2
0
0
4
2
ni
7
7
14
Propiedades:
Sxy es un valor que vara entre - y +
Si Sxy es positivo, entonces la correlacin es directa (a mayor valor de X, mayor
valor de Y) y, por tanto, la recta de regresin es ascendente.
Si Sxy es negativo, entonces la correlacin es inversa (a mayor valor de X, menor
valor de Y) y, por tanto, la recta de regresin es descendente.
Si Sxy es cero, entonces no hay correlacin entre X e Y.
Propiedades:
-1 rxy 1
Interpretacin:
Interpretacin grfica:
Si rxy = 1 los puntos (x,y) forman una lnea ascendente.
Si rxy = -1 los puntos (x,y) forman una lnea descendente.
Si rxy > 0 los puntos (x,y) forman una nube ascendente ms cercana a una
recta cuanto ms cercano sea este valor a 1.
Si rxy < 0 los puntos (x,y) forman una nube descendente ms cercana a una
recta cuanto ms cercano sea este valor a -1.
Si rxy = 0 la nube de puntos sigue una distribucin totalmente aleatoria
(circular).
- 1 rs +1
Si rs = +1, hay correlacin directa mxima.
Si rs = -1, hay correlacin inversa mxima.
Si rs = +1, la correlacin es nula.
Por lo tanto, cuando decimos que dos variables nominales X e Y estn relacionadas,
queremos decir que las proporciones de X (gnero: hombre, mujer) son diferentes
en cada categora de Y (ideologa poltica: izquierda, derecha). Si X e Y no estn
7
donde:
donde:
Una vez obtenida la recta, debemos medir la exactitud de ese ajuste o fiabilidad de
sus predicciones:
10
Por esto se llama ajuste por mnimos cuadrados, porque se considera que se
aproxima lo ms posible cuando la suma de los cuadrados de las diferencias entre
cada valor yi de la variable y el valor y que predice la recta buscada sea lo menor
posible.
Interpretacin
El coeficiente de determinacin multiplicado por cien representa el porcentaje
de la variabilidad de Y explicada por la recta de regresin, es decir por su
relacin con la variable X.
0 R2 1
Si R2 = 1 todos los residuos valen cero y el ajuste es perfecto
Si R2 = 0 el ajuste es inadecuado.
La fiabilidad de la prediccin ser mayor cuanto mayor sea la correlacin entre las
variables, R2 o rxy.
13