Está en la página 1de 8

Probabilidades y Estadísticas Descriptivas e Inferencial

Análisis de datos bivariados

*Distribuciones bidimensionales
Relación funcional: Dos variables x e y están relacionadas funcionalmente cuando
conocida la primera se puede saber con exactitud el valor de la segunda.
Ejemplo: Si se deja caer una piedra, existe una fórmula que nos permite calcular
exactamente, la altura a la que se encuentra en función del tiempo transcurrido.
Relación estadística: Dos variables x e y están relacionadas estadísticamente cuando
conocida la primera se puede estimar aproximadamente el valor de la segunda.
Ejemplos: Ingresos y gastos de una familia. Producción y ventas de una fábrica. Gastos en
publicidad y beneficios de una empresa.
Variable estadística bidimensional: Una variable bidimensional es una variable en la que
cada individuo está definido por un par de caracteres, (X, Y). Estos dos caracteres son a su
vez variables estadísticas en las que sí existe relación entre ellas, una de las dos variables
es la variable independiente y la otra variable dependiente.

Tipos de variables
Variable Independiente (X): La variable independiente es aquella propiedad, cualidad o
característica de una realidad, evento o fenómeno, que tiene la capacidad de influir o
afectar a otras variables. Puede ser manipulada por el investigador o analista estadístico
para variar o modificar el comportamiento de la variable que depende de esta.
Variable Dependiente (Y): La variable dependiente es aquella propiedad, cualidad o
característica de una realidad, evento o fenómeno que es investigada su comportamiento
y que es influenciada o afectada por otras variables. Se dice que “Y” depende de “X”.

Distribuciones bidimensionales: Son aquellas en las que a cada individuo le


corresponden los valores de dos variables, las representamos por el par (xi, yi). Si
representamos cada par de valores como las coordenadas de un punto, el conjunto de
todos ellos se llama nube de puntos o diagrama de dispersión.
Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo mejor posible,
llamada recta de regresión. Ejemplo: Las notas de 12 alumnos de una clase en
Matemáticas y Física son las siguientes:

1
Probabilidades y Estadísticas Descriptivas e Inferencial

Análisis de datos bivariados

Covarianza: La covarianza de una variable bidimensional es la media aritmética de los


productos de las desviaciones de cada una de las variables respecto a sus medias
respectivas.
La covarianza se representa por δxy o Cov(xy). Y su fórmula es la siguiente:
n
Σ f x y
δxy= i=1 i i i −X∗Y
N
La covarianza indica el sentido de la correlación entre las variables:
Si xy > 0 la correlación es directa.
Si xy < 0 la correlación es inversa.
Ejemplo: Hallar la covarianza de la distribución.

Después de tabular los datos hallamos las medias aritméticas:

Desviación típica: La desviación típica es la raíz cuadrada de la varianza. Es decir, la raíz


cuadrada de la media de los cuadrados de las puntuaciones de desviación. La desviación
típica se representa por δ.
La fórmula para la desviación típica de Xi es:


n 2
Σ (x ) f
δx= i=1 i i −X 2
N

La fórmula para la desviación típica de Yi es:

2
Probabilidades y Estadísticas Descriptivas e Inferencial

Análisis de datos bivariados


n 2
Σi=1 ( y i ) f i 2
δy= −Y
N

Correlación: La correlación trata de establecer la relación o dependencia que existe


entre las dos variables que intervienen en una distribución bidimensional. Es decir,
determinar si los cambios en una de las variables influyen en los cambios de la otra. En
caso de que suceda, diremos que las variables están correlacionadas o que hay correlación
entre ellas.

Tipos de correlación:
1. Correlación directa: La correlación directa se da cuando al aumentar una de las
variables la otra aumenta. La recta correspondiente a la nube de puntos de la
distribución es una recta creciente.

2. Correlación inversa: La correlación inversa se da cuando al aumentar una de las


variables la otra disminuye. La recta correspondiente a la nube de puntos de la
distribución es una recta decreciente.

3. Correlación nula: La correlación nula se da cuando no hay dependencia de ningún tipo


entre las variables. En este caso se dice que las variables son incorreladas y la nube de
puntos tiene una forma redondeada.

Grado de correlación:

3
Probabilidades y Estadísticas Descriptivas e Inferencial

Análisis de datos bivariados

El grado de correlación indica la proximidad que hay entre los puntos de la nube de
puntos. Se pueden dar tres tipos:
1. Correlación fuerte: La correlación será fuerte cuanto más cerca estén los puntos de la
recta.
2. Correlación débil: La correlación será débil cuanto más separados estén los puntos de
la recta.

Coeficiente de correlación lineal:


El coeficiente de correlación lineal es el cociente entre la covarianza y el producto de las
desviaciones típicas de ambas variables.
El coeficiente de correlación no varía al hacerlo la escala de medición. Es decir, si
expresamos la altura en metros o en centímetros el coeficiente de correlación no varía.
El coeficiente de correlación lineal se expresa mediante la letra r. y su fórmula es la
siguiente:
δxy
r=
δx∗δy

Valor Significado
-1 Correlación negativa grande y perfecta
-0,9 a -0,99 Correlación negativa muy alta
-0,7 a -0,89 Correlación negativa alta
-0,4 a -0,69 Correlación negativa moderada
-0,2 a -0,39 Correlación negativa baja
-0,01 a -0,19 Correlación negativa muy baja
0 Correlación nula
0,01 a 0,19 Correlación positiva muy baja
0,2 a 0,39 Correlación positiva baja
0,4 a 0,69 Correlación positiva moderada
0,7 a 0,89 Correlación positiva alta
0,9 a 0,99 Correlación positiva muy alta
1 Correlación positiva grande y perfecta

Recta de regresión de Y sobre X

Recta de regresión de X sobre Y

4
Probabilidades y Estadísticas Descriptivas e Inferencial

Análisis de datos bivariados

5
Probabilidades y Estadísticas Descriptivas e Inferencial

Análisis de datos bivariados

Ejercicios de correlación lineal

2 la información estadística obtenida de una muestra de tamaño 12 sobre la relación existente
entre la inversión realizada y el rendimiento obtenido en cientos de miles de euros para
explotaciones agrícolas, se muestra en el siguiente cuadro: Inversión (X), Rendimiento (Y)

Calcular:

1La recta de regresión del rendimiento respecto de la inversión.

2La previsión de inversión que se obtendrá con un rendimiento de 1 250 000 €.

3 El número de horas dedicadas al estudio de una asignatura y la calificación obtenida en el


examen correspondiente, de ocho personas es: Horas (X)Calificación (Y)

Se pide:

1Recta de regresión de Y sobre X.

2Calificación estimada para una persona que hubiese estudiado   horas.

6
Probabilidades y Estadísticas Descriptivas e Inferencial

Análisis de datos bivariados

4 En la tabla siguiente se indica la edad (en años) y la conducta agresiva (medida en una
escala de cero a 10) de 10 niños. Edad Conducta Agresiva

1Obtener la recta de regresión de la conducta agresiva en función de la edad.

2A partir de dicha recta, obtener el valor de la conducta agresiva que correspondería a un niño
de   años.

5Los valores de dos variables X e Y se distribuyen según la tabla siguiente:

Se pide:

1 Calcular la covarianza.

2Obtener e interpretar el coeficiente de correlación lineal.

3Ecuación de la recta de regresión de Y sobre X.

6 Las puntuaciones obtenidas por un grupo de alumnos en una batería de test que mide la
habilidad verbal (X) y el razonamiento abstracto (Y) son las siguientes:

7
Probabilidades y Estadísticas Descriptivas e Inferencial

Análisis de datos bivariados

Se pide:

1¿Existe correlación entre ambas variables?

2Según los datos de la tabla, si uno de estos alumnos obtiene una puntuación de    puntos en
razonamiento abstracto, ¿en cuánto se estimará su habilidad verbal?

8 En una empresa de transportes trabajan cuatro conductores. Los años de antigüedad de
permisos de conducir y el número de infracciones cometidas en el último año por cada uno
de ellos son los siguientes:

Calcular el coeficiente de correlación lineal e interpretarlo.

9 Una persona rellena semanalmente una quiniela y un boleto de lotería primitiva anotando
el número de aciertos que tiene. Durante las cuatro semanas del mes de febrero, los aciertos
fueron:

Obtener el coeficiente de correlación lineal e interpretarlo. ¿Ofrecerían confianza las previsiones


hechas con las rectas de regresión?
+¿-
Solución

También podría gustarte