Está en la página 1de 5

Matemáticas aplicadas a las ciecias sociales I

Parte I

Estadística bidimensional
1. Variable bidimensional

En éste capítulo estudiaremos las técnicas para:


Elegir cuál es la variable independiente (x) y cuál es la dependiente (y).
Resumir información mediante las tablas de frecuencia: Simples y de doble entrada.
Comprobar los cálculos de las tablas de frecuencia tanto con la calculadora como con el ordenador.
Representar datos mediante la correspondiente nube de puntos, nombrando los ejes e intuyendo el tipo
de regresión así como el denominado centro de gravedad (x̄, ȳ).
Calcular parámetros (medias, desviaciones, covarianza, coeciente de correlación,...) de las distribucio-
nes de dos variables X, Y.
Calcular la recta de regresión de y sobre x.
Utilizar dicha recta para realizar estimaciones, principal objetivo de este tema.

Dos variables X e Y están relacionadas estadísticamente cuando conocida la primera se puede estimar aproximadamente
el valor de la segunda. Por ejemplo:
ˆ La estatura y el peso de unos jugadores de un equipo de baloncesto.
ˆ Calicaciones en Física y Matemáticas de los alumnos de una clase.
ˆ Ingresos y gastos de una familia.
ˆ Producción y ventas de una fábrica.
ˆ Gastos en publicidad y benecios de una empresa.
Variable estadística bidimensional: Una variable bidimensional es una variable en la que cada individuo está
denido por un par de caracteres, (X, Y). Estos dos caracteres son a su vez variables estadísticas en las que sí existe
relación entre ellas, una de las dos variables es la variable independiente y la otra variable dependiente.
Distribuciones bidimensionales: Son aquellas en las que a cada individuo le corresponden los valores de dos variables,
las representamos por el par (xi , yi ).
Las tablas de frecuencia pueden darse de dos maneras:
ˆ Tablas simples o marginales: Recogen en las o columnas las frecuencias de los datos.
ˆ Tablas de doble entrada: Recoge en cada casilla la frecuencia correspondiente a cada la y cada columna de
los valores de cada variable.
ˆ Si representamos cada par de valores como las coordenadas de un punto, el conjunto de todos ellos se llama nube
de puntos o diagrama de dispersión. Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos
lo mejor posible, llamada recta de regresión.

1.1. Cálculo de parámetros de las variables marginales


Para realizar un estudio cuantitativo (con números) de una distribución bidimensional se utilizan las correspondiente
distribuciones marginales (estudio de las dos variables por separado), repasando por tanto los contenidos de la estadística
descriptiva. Para ello, la información de las tablas de frecuencias deben pasarse a las correspondientes tablas marginales.
Con ello, calculamos las medias y desviaciones marginales de X, Y respectivamente.
ˆ Media de la variable X: P
xi · fi
x= (1)
N

ˆ Media de la variable Y: P
yi · fi
y= (2)
N

ˆ Varianza de la variable X:
nherrodj@canariaseducacion.es
Matemáticas aplicadas a las ciecias sociales I

x2i · fi
P
σx2 = − x2 (3)
N

ˆ Varianza de la variable Y:

yi2 · fi
P
σy2 = − y2 (4)
N

1.2. La covarianza y el coeciente de correlación lineal


ˆ La covarianza de una variable bidimensional es la media aritmética de los productos de las desviaciones de cada
una de las variables respecto a sus medias respectivas. La covarianza se representa por σxy .
P
xi · yi · fi
σxy = −X ·Y (5)
N

La covarianza indica el sentido de la correlación entre las variables:


◦ Si σxy > 0 la correlación es positiva (o directa). En éste caso cuando la variable independiente aumenta, la
variable dependiente también aumenta.
◦ Si σxy < 0 la correlación es negativa (o inversa).En éste caso cuando la variable independiente aumenta, la
variable dependiente disminuye (hace lo contrario).
La covarianza presenta como inconveniente, el hecho de que su valor depende de la escala elegida para los ejes.
Es decir, la covarianza variará si expresamos el dinero en euros o en céntimos. Por tanto, para realizar un estudio
sin que importe la unidad en que se miden las variables, utilizaremos el coeciente de correlación:
ˆ El coeciente de correlación lineal es el cociente entre la covarianza y el producto de las desviaciones típicas
de ambas variables. Su fórmula es:
σxy
r= (6)
σx · σy

Las propiedades del coeciente de correlación son:


◦ El coeciente de correlación no varía al hacerlo la escala de medición. Es decir, si expresamos el dinero en
euros o en céntimo, el coeciente de correlación no varía.
◦ El signo del coeciente de correlación es el mismo que el de la covarianza. Si la covarianza es positiva, la
correlación es directa, si la covarianza es negativa, la correlación es inversa y si la covarianza es nula, no existe
correlación.
◦ El coeciente de correlación lineal es un número real comprendido entre =1 y 1, es decir: −1 ≤ r ≤ 1.
◦ Si el coeciente de correlación lineal toma valores cercanos a =1 la correlación es fuerte e inversa, y será tanto
más fuerte cuanto más se aproxime a −1.
◦ Si el coeciente de correlación lineal toma valores cercanos a 1 la correlación es fuerte y directa, y será tanto
más fuerte cuanto más se aproxime a 1.
◦ Si el coeciente de correlación lineal toma valores cercanos a 0, la correlación es débil.
◦ Si r = 1 ó r = −1, los puntos de la nube están sobre la recta creciente o decreciente. Entre ambas variables
hay dependencia funcional.
ˆ Si analizamos lo que ocurre grácamente, seguro que nos va a dejar más clara el coeciente de correlación y la
covarianza:

nherrodj@canariaseducacion.es
Matemáticas aplicadas a las ciecias sociales I

Se nota el alto grado de correlación lineal Se nota el altísimo grado de correlación lineal
negativa (porque se agrupan los datos a una positiva (porque se agrupan los datos a una recta
recta con pendiente negativa), por tanto la de pendiente positiva), por tanto la covarianza
covarianza debe ser negativa. El coeciente de debe ser positiva. El coeciente de correlación
correlación lineal toma valores cercanos a -1, por lineal toma valores cercanos a 1, la correlación es
tanto la correlación es fuerte e inversa, y será fuerte y directa, y será tanto más fuerte cuanto
tanto más fuerte cuanto más se aproxime a −1. más se aproxime a 1.

Se nota que los datos están muy dispersos por lo Se nota que los datos están bastante dispersos
que no existe prácticamente corelación y por por lo que la correlación es poca y negativa, por
tanto la covarianza debe ser un valor próximo a tanto la covarianza debe ser un valor negativo.
cero.
Se nota que los valores están muy dispersos (no se paroximan a una recta), no existe prácticamente
correlación y por tanto la covarianza y coeciente de correlación toma valores cercanos a 0, la
correlación es débil.

1.3. La recta de regresión lineal


La recta de regresión es la que mejor se ajusta a la nube de puntos. La recta de regresión pasa SIEMPRE por el
punto(x, y) llamado centro de gravedad.

ˆ La recta de regresión de Y sobre X se utiliza para estimar los valores de la Y a partir de los de la X.
σxy
y−y = · (x − x) (7)
σx2

ˆ Si la correlación es nula, r = 0, las rectas de regresión son perpendiculares entre sí.


ˆ A partir de estas rectas podemos calcular los valores de x conocidos los de y (o viceversa), es decir, realizar
predicciones para valores que no se encuentran en nuestra tabla de valores. La abilidad que podemos conceder a
los cálculos obtenidos viene dada por el valor numérico del coeciente de correlación:
◦ Si r está muy cerca de 0, no tiene sentido realizar ningún tipo de estimaciones.
◦ Si r es próximo a 1 o 1, las estimaciones realizadas estarán cerca de los valores reales.
◦ Si r = 1 ó r = −1 , las estimaciones realizadas coincidirán con los valores reales.

nherrodj@canariaseducacion.es
Matemáticas aplicadas a las ciecias sociales I
2. Ficha de problemas

1. El número de horas de estudio de una materia y la calicación obtenida en un examen de 8 personas es:

x: Horas de estudio 20 16 34 23 27 32 18 22
y: Calicación obtenida 6.5 6 8.5 7 9 9.5 5 8

a) Dibuja la nube de puntos.


b) Calcula el coeciente de correlación lineal e interprétalo.
c) Calcula la recta de regresión y representa.
d) Estima la nota que obtendría una persona que estudiase 28 horas.

2. Encuestadas 50 personas sobre el número de horas que duermen y el número de horas que ven la televisión, se obtuvieron
los siguientes datos:

Nº horas dormidas 6 7 8 9 10
Nº de horas de TV 4 3 3 2 1
Frecuencias 3 16 20 10 1

a ) Calcula el coeciente de correlación lineal e interprétalo.


b ) Si una persona duerme 8,5 horas, ¾Cuántas se debe esperar que vez TV?, ¾es able la estimación?

3. -Se ha medido el peso (X) y la estatura en centímetros (Y) de los alumnos de una clase. Su peso medio ha sido de 56
kg con una desviación típica de 2.5 kg. La ecuación de la recta de regresión que relaciona la estatura y el peso es:

y = 1,8 · x + 62
a) La pendiente de esa recta es positiva, ¾qué signica esto?
b) ¾Cuál sería el centro de gravedad? Señálalo sobre la gráca correspondiente.
c) ¾Cuál es la estatura media de esos alumnos?
d) ¾Qué estatura puede estimarse en un alumno que pesa 64 kg?
e) ¾Y si pesara 44 kg?

4. Una compañía discográca ha recopilado la siguiente información sobre el número de conciertos dados durante el
verano por 15 grupos musicales y las ventas de discos de estos grupos(expresadas en miles de discos):

y = Discos \ x = Conciertos [10, 30) [30, 40) [40, 80)


[1, 5) 3 - -
[5, 10) 1 4 1
[10, 20) - 1 5

a ) Realiza la correspondiente tabla de frecuencias.


b ) Representa dichos datos mediante su correspondiente nube de puntos.
c ) ¾Cómo es el grado de dependencia del número de conciertos dados por el grupo y el número de discos vendidos?
Para ello calcula el coeciente de correlación.
d ) Obtener la recta de regresión que explica la dependencia anterior.
e ) Si un grupo musical ha realizado 33 conciertos, ¾cuántos discos venderá?

5. --En dos estudios realizados sobre los datos de una variable bidimensional, las rectas de regresión fueron las siguientes:
a ) Primer estudio:

Recta de regresión de Y sobre X: 8x − 3y − 61 = 0 Recta de regresión de X sobre Y: x − y + 18 = 0

b ) Segundo estudio:

Recta de regresión de Y sobre X: 8x − 5y + 20 = 0 Recta de regresión de X sobre Y: 5x − 2y − 10 = 0

Si conocemos que x = 23 ,y = 41 , y r = 0,8, comprueba cuál de los estudios es válido.


6. -Nico arma que si una nube de puntos se aproxima a una recta, el coeciente de correlación siempre vale 1 o -1.
Como Tere no está de cuerdo, Nico prueba con los puntos de la recta cuya ecuación es y = −5x + 20 y Tere hace lo
mismo con los puntos de y = 2x − x2 . ¾Quién tiene razón?, ¾por qué?
7. Representa , sin hallar su ecuación, la recta de regresión correspondiente a las nubes de puntos siguientes:
nherrodj@canariaseducacion.es
Matemáticas aplicadas a las ciecias sociales I

8. Para cada una de las variables bidimensionales siguientes, se ha hecho un estudio para investigar la correlación existente
entre los datos recogidos. Los coecientes de correlación obtenidos han sido:

σ1 = 0,9 σ2 = 0,83 σ3 = 1 σ4 = 0,6 σ5 = 0

Asigna a cada par de variables el correspondiente coeciente.

a ) Horas diarias que ve la televisión un alumno y asig- d ) Nota nal de matemáticas y nota nal de lengua de
naturas aprobadas en una evaluación. 1º bachillerato.
b ) Peso de un recién nacido y color de sus ojos.
c ) Número de partidos ganados y número de canastas e ) Espacio recorrido por un coche en un tiempo deter-
conseguidas por un equipo de baloncesto. minado y velocidad del mismo en dicho tiempo.

9. Tenemos dos variables aleatorias bidimensionales representadas por estas nubes de puntos:

a ) Elige los coecientes de correlación de ambas y razónalo.

-0.92 0.95 0.6 -0.65

b ) Ahora decide cuáles son las ecuaciones de las dos rectas de regresión correspondientes. Justica tu respuesta.

y = 3x + 0, 2 y = 1,3x − 0,9 y = −0,6x + 10 y = −2x − 12,6

10. Práctica a ordenador. La distribución bidimensional que se obtiene al estudiar la estatura y el peso de 10 personas
es:

Peso ( kg) 70 65 85 60 70 75 90 80 60 70
Estatura (cm) 175 160 180 155 165 180 185 175 160 170

a ) Analiza que variable es la independiente y la dependiente.


b ) Realiza la correspondiente tabla de doble entrada o tabla conjunta.
c ) Representa dichos datos en un diagrama de dispersión (o nube de puntos).
d ) Calcula la distribución marginal de X así como su media y desviación.
e ) Calcula la distribución marginal de Y así como su media y desviación.
f ) Calcula la covarianza. el coeciente de correlación e interpreta el resultado.
g ) Calcula la recta de regresión de Y sobre X. Representa dicha recta sobre la nube de puntos.
h ) Estima la estatura para una persona cuyo peso sea de 87 kilos. Señala sobre la recta de regresión.

nherrodj@canariaseducacion.es

También podría gustarte