Está en la página 1de 12

Tema 11

Estadística bidimensional

GUÍA DIDÁCTICA

• Orientaciones didácticas

• Solucionario

• Recursos Didácticos
– Navegamos por Tiching
– Bibliografía

11-1
1. DISTRIBUCIONES UNIDIMENSIONALES / ... / 3. TIPOS DE DIAGRAMAS DE DISPERSIÓN… 179
a
182
Orientaciones didácticas
● En la primera parte de la unidad estudiaremos las distribuciones Bibliografía
unidimensionales y los principales parámetros de centralización y ● DAVID S. MOORE. Estadística
dispersión: la media, el rango, la varianza y la desviación típica. aplicada básica. Antoni Bosch,
A continuación se prestará atención a las distribuciones bidimensionales, 2005.
aprenderemos a representarlas por medio de una tabla simple, tablas de
Este libro incluye teoría y
doble entrada y diagramas de dispersión. Atendiendo a estos últimos,
multitud de ejemplos y ejerci-
clasificaremos la relación de las dos variables de la distribución
cios sobre todo el contenido es-
bidimensional desde un punto de vista cualitativo.
tudiado a lo largo de esta uni-
Además definiremos los conceptos de centro de gravedad y distribuciones dad.
marginales y condicionadas.
● SANTIAGO FERNÁNDEZ FER-
NÁNDEZ, ALEJANDRO CÓRDO-
Navegamos por Tiching BA LAGO, JOSÉ MARÍA. CORDE-
● http://www.tiching.com/740953. Estadística bidimensional. En esta página RO SÁNCHEZ. Estadística des-
web se resumen los principales métodos de estudio de las variables criptiva. ESIC editorial, 2002.
bidimensionales, desde las nubes de puntos y las tablas de doble entrada
hasta la correlación y las rectas de regresión.
● http://www.tiching.com/740955. Diagrama de dispersión. Esta página web
incluye una escena que permite representar el diagrama de dispersión de
una variable bidimensional introducida.
● http://www.tiching.com/740959. Estadística con Excel. En este vídeo de
cinco minutos de duración se muestra cómo calcular con Excel los distintos
parámetros estadísticos de las variables bidimensionales, así como
generar rectas de regresión.

4. CORRELACIÓN LINEAL/ ... / 6. UTILIZACIÓN DE LA CALCULADORA 183


a
187

Orientaciones didácticas
● En la segunda parte de la unidad caracterizaremos la correlación entre las Bibliografía
dos variables de una distribución bidimensional desde un punto de vista
cuantitativo, mediante la covarianza y el coeficiente de correlación lineal.
● JOSÉ TOMÁS PÉREZ ROMERO.
Estadística. Editorial MAD,
Trabajaremos a continuación las rectas de regresión y sus aplicaciones, 2004.
como la interpolación y la extrapolación, en el caso de variables que no
presenten una relación funcional lineal. ● ROBERT R. JOHNSON, PATRICIA
KUBY. Estadística elemental.
Por último veremos unas nociones sobre el manejo de la calculadora en
Cengage Learning, 2008.
línea Wiris a la hora de realizar este tipo de cálculos.
Libro muy práctico de estadís-
Navegamos por Tiching tica, que presenta gran cantidad
de ejercicios y casos de estudio
● http://www.tiching.com/740965. Correlación y regresión. En este vídeo de
en situaciones reales. Incluye
diez minutos de duración se estudia la dependencia funcional entre dos
instrucciones de uso de la
variables, analizando la correlación y la regresión.
calculadora científica enfoca-
● http://www.tiching.com/740976. Rectas de regresión. Esta web analiza la das a la realización de estos
relación entre dos variables cuantitativamente mediante la recta de cálculos.
regresión.

11-2
Soluciones de las actividades

Página 179 Página 182

1. Media x = 5,93 . 4. La representación de la nube de puntos de la tabla


junto con la recta que más se aproxima a ellos es:
Varianza s 2 = 4,66 .
Desviación típica s = 2,16 .

Página 180

2. El diagrama de dispersión de la distribución es:

Existe una dependencia lineal positiva fuerte.

Página 184

5. Denotamos por x el tiempo (min) y por y el número de


errores. La solución del ejercicio es:
Página 181
Medias: x = 21,9 minutos, y = 2,2 errores.
3. La tabla de doble entrada obtenida mediante interva-
los de horas semanales de estudio es: Desviación típica:
Y\X [3,6) [6,9) [9,12) [12,15] ny s x = 6,833 minutos,
4 2 0 0 0 2 s y = 1,66 errores.
5 2 0 1 0 3
6 1 3 0 0 4 Covarianza: s xy = −5,48 .
7 1 3 0 0 4
Coeficiente de correlación lineal r = −0,482 .
8 0 1 1 0 2
9 0 0 1 1 2 Las variables tienen una correlación lineal negativa
débil.
10 0 1 0 0 1
nx 6 8 3 1 18
Página 186
Calculamos las medias de las distribuciones margi-
nales, usando las marcas de clase de los intervalos, y
6. Las soluciones del ejercicio son:
obtenemos el centro de gravedad de (22/3, 119/18).
La nube de puntos solicitada es: s xy 57,327
a) r = = = 0,945 .
sx ⋅ s y 2,25 ⋅ 26,95

Correlación lineal positiva fuerte.


b) La recta de regresión de Y sobre X es:
s xy
y−y= ( x − x) →
s x2

57,327
y − 198,86 = ( x − 29,29) →
2,25 2
→ y = 11,32x − 132,70 .

11-3
La recta de regresión de X sobre Y es: Obtenemos la recta de regresión:
s xy y = 0,2898 x + 60,032,
x−x= ( y − y) →
s 2y donde x representa la edad e y la frecuencia cardíaca
en reposo. Calculamos y(52):
57,327
x − 29,29 = ( y − 198,86) → y = 0,2898 · 52 + 60,032 =75,1016.
26,95 2
Un paciente de 52 años tendrá una frecuencia cardíaca
→ x = 0,079 y + 13,58 . en reposo de unos 75 latidos por minuto.
c) y = 11,32 ⋅ 30 − 132,70 = 206,9 .
Se venderán unas 207 latas. Página 190

P1. Las fórmulas solicitadas son:


Página 187
k

x i ⋅ ni
7. Introducimos en un mismo bloque: Media: x =
i =1
.
L = {punto(1,5), punto(2,4), punto(3,2), punto(4,1)} n
La media es la posición central más utilizada de la
correlación(L)
distribución de valores de una cierta variable x.
Obtenemos una correlación de -0,98995. Podemos k
deducir que hay una correlación lineal negativa muy
fuerte. 2
x i =1
i
2
⋅ ni
2
Varianza: s = −x
n
8. Introducimos en un mismo bloque:
La varianza es una medida vinculada a la dispersión
L = {punto(6, 4), punto(8, 5.5), punto(10, 8), de los valores. Con ella obtenemos un indicador de
punto(12, 10)} la dispersión de la variable estadística respecto a su
media.
correlación(L)
recta_de_regresión(L) Desviación típica: s = s 2
Obtenemos una correlación de 0,99586 y la recta de La desviación típica tiene un funcionamiento similar
regresión de y sobre x: y = 1,025x − 2,35 . al de la varianza pero utilizando la unidad de la
variable estadística.
9. Introducimos en un mismo bloque: P2. Una variable bidimensional es una variable en la que
L = {punto(20, 67), punto(25, 65), punto(40, 73), cada individuo está definido por un par de variables
punto(60, 75), punto(70,81)} estadísticas (X, Y).
r=recta_de_regresión(L) Las distribuciones marginales son las frecuencias
absolutas de los valores de las variables estadísticas
dibujar(L) X e Y para cada valor.
dibujar(r, {color = rojo}) La distribución condicionada de una variable
estadística X para y = yi. es el conjunto de valores de
Obtenemos un gráfico similar al siguiente:
X que se dan conjuntamente con el valor yi de la
variable estadística Y.

P3. Los ejemplos solicitados son:


a) Dependencia funcional:

Notemos que para observar la recta y la nube de


puntos deberemos movernos dentro del cuadro de
dibujo dado que, por defecto, estaremos centrados en
(0, 0) y con un zoom muy pequeño.
11-4
b) Correlación lineal positiva fuerte: El coeficiente de correlación lineal, a diferencia de
la covarianza, es un número adimensional y su valor
está comprendido entre -1 y 1. Este hecho nos permite
comprender de forma más sencilla la relación entre las
variables estadísticas.

P6. La ecuación de la recta de regresión de Y sobre X


es:
s xy
y−y= 2
(x − x ) .
sx
La ecuación de la recta de regresión de X sobre Y
es:
s xy
c) Correlación lineal negativa débil: x−x= 2
(y − y ) .
sy
Para hallar las rectas de regresión se utiliza el criterio
de mínimos cuadrados, que busca que la suma de los
cuadrados de las distancias de los puntos de la nube a
la recta sea mínima.

P7. Las rectas de regresión nos permiten estimar qué


valor es el esperado para una variable sabiendo un
valor de la otra. Dado un valor x de la variable X
podemos estimar el valor esperado de Y evaluando
en la recta de regresión de Y sobre X, y viceversa.

10. Los resultados son:


d) Independencia:
k

x
i =1
i ⋅ ni
a) Media: x = = 5,56 .
n
k

2
x
i =1
i
2
⋅ ni
2
Varianza: s = − x = 4,97
n

Desviación típica: s = s 2 = 2,29


b) (x − s, x + s ) → 64% .

(x − 2s, x + 2s ) → 96% .
P4. La ecuación de la covarianza es: (x − 3s, x + 3s ) → 100% .

n
x ⋅ yi
i =1 i 11. Los resultados del ejercicio son:
s xy = − x⋅ y
n
a) Las marcas de clase para cada intervalo son:
La covarianza tiene dos inconvenientes. Por un lado
depende de las unidades en que se miden las Peso (Kg) [50,60] (60,70] (70,80] (80,90]
variables, existiendo una dificultad a la hora de Marcas de clase 55 65 75 85
razonar si la correlación es fuerte o débil. Por otro
lado, los puntos más alejados del centro de gravedad b) Media: x = 68 kg.
influyen excesivamente en el valor de la covarianza,
perturbando el valor de la covarianza como un buen c) Varianza: s 2 = 94,33 kg 2
indicador de la correlación.
Desviación típica: s = s 2 = 9,71 kg.
P5. La fórmula del coeficiente de correlación lineal es la
siguiente: 12. Las soluciones del ejercicio son:
s xy a) Los intervalos en los cuales se han agrupado los
r= .
sx ⋅ s y estudiantes de bachillerato son:

11-5
Altura (cm) Marcas de clase nº. de alumnos 14. a) La tabla de doble entrada correspondiente es:
[153,5, 162,5] 158 1 X\Y [1,2] (2,3] (3,4] nx
(162,5, 171,5] 167 6 [1, 3] 5 2 0 7
(171,5, 180,5] 176 6 (3, 5] 1 3 1 5
(180,5, 189,5] 185 5 (5, 7] 0 0 3 3
(189,5, 198,5] 194 1 ny 6 5 4 15
b) Usamos las marcas de clase para calcular los datos
7 ⋅ 2 + 5 ⋅ 4 + 3 ⋅ 6 52
solicitados: b) x = = .
15 15
158 ⋅ 1 + 167 ⋅ 6 + ... + 194 ⋅ 1
Media: x = ≈ 175,53 . 6 ⋅ 1,5 + 5 ⋅ 2,5 + 4 ⋅ 3,5 35,5
19 y= =
15 15
Varianza: 2
7 ⋅ 2 2 + 5 ⋅ 4 2 + 3 ⋅ 6 2  52 
2 2
158 ⋅ 1 + 167 ⋅ 6 + ... + 194 ⋅ 1 2 sx = −   ≈ 1,54
s2 = − 175,53 2 ≈ 15  15 
19
≈ 79,48. 6 ⋅ 1,5 2 + 5 ⋅ 2,5 2 + 4 ⋅ 3,5 2  35,5 
2
sy = −  ≈
Desviación típica: s = s 2 ≈ 8,92 . 15  15 
≈ 0,81.
13. La solución de las actividades es:
 52 35,5 
a) El diagrama de dispersión de las notas de inglés y
c) El centro de gravedad es  , .
 15 15 
filosofía es:
15. a) El diagrama de dispersión correspondiente es:

b) La tabla de doble entrada obtenida mediante


intervalos en ambas variables es:
b) La tabla de doble entrada obtenida es:
Filosofía\Inglés [3,5] (5,7] (7,9] ny
Y\X [3,5] (5,7] (7,9] ny
[3, 5] 2 1 0 3
(5, 7] 1 1 0 2 [2,5, 4,5] 2 0 0 2
(7, 9] 0 2 1 3 (4,5, 6,5] 1 2 0 3
(6,5, 8,5] 0 1 2 3
nx 3 4 1 8
nx 3 3 2 8
c) Calculamos la media y la desviación típica de las
distribuciones marginales usando las marcas de 4⋅3 + 6⋅3 + 8⋅ 2
c) x = = 5,75 ;
clase de los intervalos: 8
4 ⋅ 3 + 6 ⋅ 4 + 8 ⋅1 3,5 ⋅ 2 + 5,5 ⋅ 3 + 7,5 ⋅ 3
x= = 5,5 ; y= = 5,75 .
8 8
4⋅3+ 6⋅2 + 8⋅3
y= =6; 42 ⋅ 3 + 62 ⋅ 3 + 82 ⋅ 2
8 sx = − 5,75 2 = 1,56 ;
8
42 ⋅ 3 + 62 ⋅ 4 + 82
sx = − 5,5 2 = 1,75 ≈ 1,32 ;
8 3,5 2 ⋅ 2 + 5,5 2 ⋅ 3 + 7,5 2 ⋅ 3
sy = − 5,75 2 = 1,56 .
8
42 ⋅ 3 + 62 ⋅ 2 + 82 ⋅ 3
sy = − 6 2 = 3 ≈ 1,73 . d) El centro de gravedad de la distribución bidimen-
8 sional de la tabla es (5,75, 5,75).

11-6
Página 191 18. Las respuestas son:
a) Verdadero.
16. Los resultados del ejercicio son:
b) Falso, la covarianza ha de tener el mismo signo
a) e) que el coeficiente de correlación lineal.
c) Verdadero.

19. Las respuestas del ejercicio son:


a) El centro de gravedad de la distribución bidimen-
sional es (17,71, 5,71).
2
“dependencia lineal “dependencia funcional b) Varianzas: s x = 92,20 , s y 2 = 5,63 .
positiva fuerte” negativa”
Desviación típica:
b) f)
s x = 9,60 ejercicios, s y = 2,37 correctos.


n
x ⋅ yi
i =1 i
c) s xy = − x ⋅ y = 22,06 .
n
s xy
d) r = = 0,97 .
“dependencia cuadrática” “dependencia lineal sx ⋅ s y
positiva fuerte”
Existe una correlación lineal positiva fuerte entre
c) g) ambas variables.

20. Las respuestas del ejercicio son:


a) La gráfica I tiene un coeficiente correlación lineal
mayor puesto que la nube de puntos se ajustaría
mejor a una recta.
b) En ambas gráficas los coeficientes de correlación
“independencia” “dependencia lineal lineal tienen signo positivo puesto que cuando una
negativa débil” variable crece la otra también tiende a crecer.
d) h)
21. Las respuestas del ejercicio son:
a) El diagrama de dispersión bidimensional obtenido
de la tabla es:

“dependencia lineal “dependencia lineal


negativa fuerte” positiva débil”

17. Dibujamos el diagrama de dispersión y la recta que se


ajuste a los puntos de la nube:

b) No, no se observa ninguna correlación entre ambas


variables.
σ xy
c) r = = 0,088 .
σ x ⋅σ y

d) Tenemos un coeficiente de correlación lineal


próximo a cero y por lo tanto podemos afirmar que
no existe ninguna correlación lineal entre ambas
Hay una dependencia lineal negativa fuerte. variables.

11-7
22. Las respuestas del ejercicio son: e) y = 1,046 ⋅ 9 − 1,106 = 8,308 .

a) Media x = 31,50 miles de €, y = 29,67 miles de €. Podemos esperar que tenga un 8,3.

Desviación típica: f) x = 0,467 ⋅ 7 + 4,153 = 7,422 .

s x = 8,69 miles de €, s y = 6,67 miles de €. Podemos esperar que tenga un 7,4.

24. Las soluciones del ejercicio son:



n
x ⋅ yi
i =1 i a) Dado que vemos que se nos dan la varianza de la
Covarianza: s xy = − x ⋅ y = 46,17 .
n altura en cm, usaremos los cm como unidades para
la recta de regresión:
b) Media x = 61,17 miles de €.
s xy
Desviación típica: s = 14,58 miles de €. y− y= 2
(x − x ) → y − 174 = 252 (x − 67)
sx 4
c) Existe una correlación lineal positiva entre los
ingresos de hombres y mujeres. Aunque esta y = 1,56 ⋅ x + 69,31 .
correlación no es una correlación fuerte se observa
una tendencia lineal entre ambas. b) y = 1,56 ⋅ 72 + 69,31 = 181,63 ≈ 1,82 m.
c) Para saber como de fiable es la predicción utiliza-
Página 192 mos el coeficiente de correlación:

23. Las soluciones del ejercicio son: s xy 25


r= = = 0,89 .
sx ⋅ sy 4⋅7
a) El diagrama de dispersión es:
Tenemos un coeficiente de correlación lineal
elevado e interpolamos para un valor relativamente
cercano a la media, por lo que podemos afirmar
que la predicción es razonablemente fiable.

25. Las soluciones del ejercicio son:


a) Medias:
k

x ⋅n
i =1
i i
61 112
x= = = 3,05 ; y = = 5,6 .
n 20 20
Desviación típica:
b) Media x = 7,11 , y = 6,33
k
2
Varianzas: s x = 1,88 , s y 2 = 4,22 . x
i =1
i
2
⋅ ni
2 215
sx = −x = − 3,05 2 = 1,2 .
Desviaciones típicas: n 20
s x = 1,37 , s y = 2,05 . 776
sy = − 5,6 2 = 2,73 .
s xy 20
c) r = = 0,699 .
sx ⋅ sy b) La siguiente fórmula nos permite calcular la cova-
rianza si tenemos una tabla de doble entrada:
Existe una correlación lineal positiva entre las dos n
variables, pero no es una correlación extremadamen-
te fuerte. x ⋅ y
i , j =1
i j ⋅ nij
342
σ xy = − x⋅ y = − 17,08 = 0,02
d) Recta de regresión de la prueba oral sobre la escrita: n 20
y = 1,046 ⋅ x − 1,106 . 0,02
c) Coeficiente de correlación: r = ≈ 0,006 .
Recta de regresión de la prueba escrita sobre la oral: 1,2 ⋅ 2,73
x = 0,467 ⋅ y + 4,153 . Estas dos variables estadísticas no tienen una
correlación lineal entre ellas.
El punto de intersección es el centro de gravedad
de la distribución: d) y – 5,6 = 0,014 (x – 3,05).
 y = 1,046 ⋅ x − 1,106 e) Como no hay correlación entre ambas variables,
 → x = 7,11 e y = 6,33 . no es adecuado usar la recta de regresión para
 x = 0,467 ⋅ y + 4,153 estimar una sobre la otra.

11-8
26. Las soluciones del ejercicio son: Página 193
s xy 3,43
a) r = = = 0,938 . 30. Las soluciones del ejercicio son:
sx ⋅ s y 2,42 ⋅ 1,51
a) Para resolver el ejercicio usaremos los coeficientes
b) Usamos la recta de regresión de vehículos sobre de regresión que nos proporcionan las rectas:
accidentes:
s xy s xy
3,43 = −1,25 ; = −0,65 .
x − 10,14 = (y − 6) → para y = 8 → x = 13,14 sx 2 sy
2
1,512
El jueves podemos suponer que circulaban 13.140 Usando que el coeficiente de regresión lineal es
vehículos. r = sxy/(sx · sy) y que ha de ser negativo puesto que
los coeficientes de regresión lo son, tenemos:
c) Al ser un coeficiente de correlación lineal elevado
y una estimación interpolada próxima al centro de s xy s xy
gravedad, podemos afirmar que es una predicción r=− 2
⋅ → r = − (− 0,65)(− 1,25) →
suficientemente fiable. sx sy2

r = −0,90 .
27. Las soluciones del ejercicio son:
a) Usamos la recta de regresión del abono sobre las b) El centro de gravedad es la intersección de las dos
frutas: rectas de regresión:

0,697  y = −1,25 ⋅ x + 14,55


x − 2,63 = (4 − 5,91) → x = 1,92 kg.  → x = 3,8 e y = 9,8 .
1,365 2 x = −0,65 ⋅ y + 10,17
b) Usamos la recta de regresión de las frutas sobre el Por lo tanto el centro de gravedad será (3,8, 9,8).
abono:
31. Las soluciones del ejercicio son:
0,697
y − 5,91 = (2,3 − 2,63) → y ≈ 5 toneladas. a) La nube de puntos obtenida de inversión sobre
0,514 2
beneficios es:
28. Primero calculamos la covarianza:
s xy
r= → s xy = 0,7 ⋅ 7,5 ⋅ 5 = 26,25 .
sx ⋅ s y

A continuación utilizamos la recta de regresión de la


altura de los hijos sobre la de los padres para obtener las
estimaciones solicitadas. Usamos los cm como unidad de
cálculo puesto que es la unidad usada en las desviaciones
típicas.
26,25
x − 170 = (180 − 168) → x ≈ 183 cm;
52
b) Primero calculamos medias y desviaciones típicas:
26,25
x − 170 = (160 − 168) → x ≈ 162 cm. x = 5,33; y = 4,42; sx = 1,65; sy = 1,26
52

n
x ⋅ yi
29. Antes de responder las preguntas calculamos los i =1 i
s xy = − x ⋅ y = 1,61 .
parámetros estadísticos de las distribuciones n
marginales y la covarianza. Obtenemos:
s xy
x = 2,54; y = 2,79; sx = 1,28; sy = 1,39; sxy = 0,01. r= = 0,778 .
sx ⋅ sy
s xy 0,01 c) Empleamos la recta de regresión del beneficio sobre
a) r = = = 0,006 .
sx ⋅ sy 1,28 ⋅ 1,39 la inversión:
1,61
Al ser una correlación próxima a cero podemos decir x − 5,33 = (4,5 − 4,42) → x = 5,411 .
que no existe correlación lineal entre las variables. 1,26 2
0,01
b) x − 2,54 = (3,5 − 2,79) → x = 2,544 horas. Habrá obtenido un beneficio de unos 5411 €.
1,39 2
d) El coeficiente de correlación lineal sería el mismo ya
c) Al haber obtenido un coeficiente de correlación que es un indicador adimensional y la relación entre
tan próximo a cero esta estimación no sería fiable. ambas variables no varía.
11-9
32. Las soluciones del ejercicio son: b) La media es:
k
a) Para resolver el ejercicio usaremos los coeficientes
de regresión que nos proporcionan las rectas de  y ⋅n
i =1
i i
2,5 ⋅ 3 +  + 5,5 ⋅ 2
forma similar a los ejercicios anteriores. Para y= = = 3,85 m.
obtenerlos tenemos que aislar la variable x en la n 20
recta de X sobre Y (y la variable y en la recta de Y c) Tenemos sx = 0,527 y sy = 0,853. Podemos calcu-
sobre X). Obtenemos: lar la covarianza usando la tabla con la siguiente
1 5 fórmula:
y = 2x – 7; x= y− . n
3 3
Por lo tanto tenemos los coeficientes de regresión:
x
i , j =1
i ⋅ y j ⋅ nij
s xy = − x ⋅ y = −0,0725 .
s xy s xy n
1
2
= 2; 2
= . La recta de regresión de Y sobre X es:
sx sy 3
s xy
Usando que el coeficiente de regresión lineal es y−y= (x − x ) →
r = sxy/(sx · sy) y que ha de ser positivo puesto que sx2
los coeficientes de regresión lo son, tenemos:
−0,0725
s xy s xy
y − 3,85 = (x − 3,6) → y = −0,26 x + 4,79 .
1 0,527 2
r= 2
⋅ 2
→ r = 2⋅ = 0,816 .
sx sy 3
s xy − 0,0725
d) r = = = −0,16 .
b) Las medias de X y de Y se corresponden a con las sx ⋅ s y 0,527 ⋅ 0,853
coordenadas del centro de gravedad, que es el
Por el valor obtenido sabemos que las dos variables
punto de intersección de las dos rectas:
tienen una correlación lineal negativa débil. Por lo
 y = 2⋅ x − 7 tanto, los estudiantes que corren más rápido (corren
 la distancia en menos tiempo) tienden a saltar más
 x = 1 ⋅ y − 5 → x = −12 e y = −31 .
 3 3 largo, si bien no podríamos estimar una variable a
partir de la otra usando las rectas de regresión.
c) Primero calculamos la covarianza usando el
coeficiente de regresión de la recta de X sobre Y.
Evaluación de estándares
s xy 1 1
= → s xy = ⋅ 3 = 1 ;
sy
2
3 3 1. Dependencia funcional: la dependencia entre las dos
variables puede ser descrita mediante una función
Ahora podemos calcular la desviación típica lineal (r=1) o (r=-1).
usando el coeficiente de correlación:
s xy s xy 1
r= → sx = = = 0,707 .
sx ⋅ sy r ⋅ sy 0,816 ⋅ 3

33. Obtenemos la tabla de doble entrada:

Y\X [2,5, 3] (3, 3,5] (3,5, 4] (4, 4,5] ny


[2, 3] 0 3 0 0 3
(3, 4] 0 3 1 5 9
(4, 5] 1 2 1 2 6 Dependencia lineal positiva fuerte: Existe una
relación creciente fuerte entre ambas variables.
(5, 6] 1 1 0 0 2
nx 2 9 2 7 20

Usaremos las marcas de clase de la tabla de doble


entrada para calcular los datos estadísticos solicitados:
a) La media es:
k

x ⋅n
i =1
i i
2,75 ⋅ 2 +  + 4,25 ⋅ 7
x= = = 3,6 min.
n 20

11-10
Dependencia lineal positiva débil: Existe una leve b) Si hay correlación lineal negativa fuerte entre las
relación creciente entre ambas variables. variables, el coeficiente de correlación lineal es
próximo a -1.
c) Si no hay correlación lineal entre las variables, el
coeficiente de correlación lineal es prácticamente 0.
d) Si hay correlación lineal débil entre las variables, el
coeficiente de correlación lineal es próximo a 0.

3. La covarianza es:
s xy
r= → s xy = 0,93 ⋅ 47,76 ⋅ 1,79 = 8,60 .
sx ⋅ sy

Dependencia lineal negativa fuerte: Existe una Los coeficientes de regresión son:
relación inversamente proporcional fuerte entre ambas s xy 8,60 s xy 8,60
variables. 2
= = 0,18 ; 2 = = 4,80 .
sx 47,76 sy 1,79

4. Los resultados del ejercicio son:


a) El diagrama de dispersión de la distribución bidimen-
sional es:

Dependencia lineal negativa débil: Existe una leve


relación inversamente proporcional entre ambas
variables.

b) Medias: x = 5,125 ; y = 5 .

Desviaciones típicas: s x = 2,93 ; s y = 2,45 .

c) s xy = 7 .

s xy 7
d) r = = = 0,97 .
sx ⋅ s y 2,93 ⋅ 2,45

Independencia: No existe ninguna relación entre Hay una dependencia lineal positiva fuerte.
ambas variables.
5. Las soluciones del ejercicio son:
a) Puesto que las medias vienen dadas por las coorde-
nadas del centro de gravedad, las rectas de regresión
son:
s xy 2,61
x−x = 2
( y − y ) → x − 5,45 = ( y − 5,6) →
sy 1,76 2

→ x = 0,843y + 0,7315 .

s xy 2,61
y− y= 2
(x − x ) → y − 5,6 = (x − 5,45) →
sx 1,612
2. Las frases completas son:
→ y = 1,007 x + 0,112 .
a) Si hay dependencia funcional lineal positiva entre las
variables, el coeficiente de correlación lineal es 1. b) y = 1,007 ⋅ 7 + 0,112 = 7,161 .

11-11
DIRECCIONES DE INTERNET

TICHING WEBS

www.tiching.com/740953 http://estadistica.ematematicas.net/bidimensional/index.php?tipo=tabla&utm

http://descartes.cnice.mec.es/materiales_didacticos/bidimensional_lbarrios/ediagrama
www.tiching.com/740955
_dispersion_est.htm

www.tiching.com/740959 https://www.youtube.com/watch?v=CyC07ybt2qA

www.tiching.com/740965 https://www.youtube.com/watch?v=s3yVkj1YIVk

www.tiching.com/740976 http://www.fisterra.com/mbe/investiga/regre_lineal_simple/regre_lineal_simple.asp

11-12

También podría gustarte