Está en la página 1de 5

Tema 3: Distribuciones bidimensionales: Relacin entre dos variables estadsticas

1.Relacin estadstica: Correlacin


En una distribucin bidimensional puede ocurrir que las dos variables guarden algn tipo de relacin entre si. El coeficiente de correlacin lineal mide el grado de intensidad de esta posible relacin entre las variables. Este coeficiente se aplica cuando la relacin que puede existir entre las varables es lineal (es decir, si representaramos en un gfico los pares de valores de las dos variables la nube de puntos se aproximara a una recta).

2.Diagramas de dispersin: Distribuciones o nube de puntos.


Un diagrama de dispersin es un tipo de diagrama matemtico que utiliza las coordenadas cartesianas para mostrar los valores de dos variables para un conjunto de datos. Los datos se muestran como un conjunto de puntos, cada uno con el valor de una variable que determina la posicin en el eje horizontal y el valor de la otra variable determinado por la posicin en el eje vertical.

3.Distribuciones marginales y condicionales


3.1) Distribuciones marginales Al analizar una distribucin bidimensional, uno puede centrar su estudio en el comportamiento de una de las variables, con independencia de como se comporta la otra. Estaramos as en el anlisis de una distribucin marginal. De cada distribucin bidimensional se pueden deducir dos distribuciones marginales: una correspondiente a la variable x, y otra correspondiente a la variable y. Distribuciones marginales de x

Distribucin marginal de y

3.2) Distribuciones condicionales Sean X e Y dos variables, con p y q modalidades respectivamente, llamaremos distribucin condicionada de Y a que X tome la modalidad xi al conjunto de valores que toma Y siendo el valor tomado por X= xi y lo notaremos Y | X = xi

4.Parmetros estadsticos bidimensionales.


4.1 Media y desviacin tpica marginales Son la media y la desviacin tpica de las dos variables de una distribucin bidimensional, es decir, x e y. 4.2. Covarianza La covarianza de una variable bidimensional es la media aritmtica de los productos de las desviaciones de cada una de las variables respecto a sus medias respectivas. La covarianza se representa por sxy o xy.

La covarianza indica el sentido de la correlacin entre las variables Si xy > 0 la correlacin es directa. Si xy < 0 la correlacin es inversa. La covarianza presenta como inconveniente, el hecho de que su valor depende de la escala elegida para los ejes. Es decir, la covarianza variar si expresamos la altura en metros o en centmetros. Tambin variar si el dinero lo expresamos en euros o en dlares. 4.3. Coeficiente de correlacin lineal El coeficiente de correlacin lineal mide el grado de intensidad de esta posible relacin entre las variables. Este coeficiente se aplica cuando la relacin que puede existir entre las varables es lineal (es decir, si representaramos en un gfico los pares de valores de las dos variables la nube de puntos se aproximara a una recta).

5. Rectas de regresin
La recta de regresin es la que mejor se ajusta a la nube de puntos. La recta de regresin pasa por el punto llamado centro de gravedad.

Recta de regresin de Y sobre X


La recta de regresin de Y sobre X se utiliza para estimar los valores de la Y a partir de los de la X. La pendiente de la recta es el cociente entre la covarianza y la varianza de la variable X.

Recta de regresin de X sobre Y


La recta de regresin de X sobre Y se utiliza para estimar los valores de la X a partir de los de la Y. La pendiente de la recta es el cociente entre la covarianza y la varianza de la variable Y.

Si la correlacin es nula, r = 0, las rectas de regresin son perpendiculares entre s, y sus eucaciones son: y= x=

Ejemplo Las notas de 12 alumnos de una clase en Matemticas y Fsica son las siguientes: Matemticas 2 3 4 4 5 6 6 6 7 4 7 6 8 7 10 9 10 10 Fsica 1 3 2 4 4 4 Hallar las rectas de regresin y representarlas. xi 2 3 4 4 5 yi 1 3 2 4 4 xi yi 2 9 8 16 20 xi2 4 9 16 16 25 yi2 1 9 4 16 16

6 6 7 7 8

4 6 4 6 7

24 36 28 42 56 90

36 36 49 49 64 100 100 504

16 36 16 36 49 81 100 380

10 9

10 10 100 72 60 431

1 Hallamos las medias aritmticas

2 Calculamos la covarianza

3 Calculamos las varianzas

4Recta de regresin de Y sobre X.

4Recta de regresin de X sobre Y.