Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística bidimensional
GUÍA DIDÁCTICA
• Orientaciones didácticas
• Solucionario
• Recursos Didácticos
– Navegamos por Tiching
– Bibliografía
11-1
1. DISTRIBUCIONES UNIDIMENSIONALES / ... / 3. TIPOS DE DIAGRAMAS DE DISPERSIÓN… 179
a
182
Orientaciones didácticas
● En la primera parte de la unidad estudiaremos las distribuciones Bibliografía
unidimensionales y los principales parámetros de centralización y ● DAVID S. MOORE. Estadística
dispersión: la media, el rango, la varianza y la desviación típica. aplicada básica. Antoni Bosch,
A continuación se prestará atención a las distribuciones bidimensionales, 2005.
aprenderemos a representarlas por medio de una tabla simple, tablas de
Este libro incluye teoría y
doble entrada y diagramas de dispersión. Atendiendo a estos últimos,
multitud de ejemplos y ejerci-
clasificaremos la relación de las dos variables de la distribución
cios sobre todo el contenido es-
bidimensional desde un punto de vista cualitativo.
tudiado a lo largo de esta uni-
Además definiremos los conceptos de centro de gravedad y distribuciones dad.
marginales y condicionadas.
● SANTIAGO FERNÁNDEZ FER-
NÁNDEZ, ALEJANDRO CÓRDO-
Navegamos por Tiching BA LAGO, JOSÉ MARÍA. CORDE-
● http://www.tiching.com/740953. Estadística bidimensional. En esta página RO SÁNCHEZ. Estadística des-
web se resumen los principales métodos de estudio de las variables criptiva. ESIC editorial, 2002.
bidimensionales, desde las nubes de puntos y las tablas de doble entrada
hasta la correlación y las rectas de regresión.
● http://www.tiching.com/740955. Diagrama de dispersión. Esta página web
incluye una escena que permite representar el diagrama de dispersión de
una variable bidimensional introducida.
● http://www.tiching.com/740959. Estadística con Excel. En este vídeo de
cinco minutos de duración se muestra cómo calcular con Excel los distintos
parámetros estadísticos de las variables bidimensionales, así como
generar rectas de regresión.
Orientaciones didácticas
● En la segunda parte de la unidad caracterizaremos la correlación entre las Bibliografía
dos variables de una distribución bidimensional desde un punto de vista
cuantitativo, mediante la covarianza y el coeficiente de correlación lineal.
● JOSÉ TOMÁS PÉREZ ROMERO.
Estadística. Editorial MAD,
Trabajaremos a continuación las rectas de regresión y sus aplicaciones, 2004.
como la interpolación y la extrapolación, en el caso de variables que no
presenten una relación funcional lineal. ● ROBERT R. JOHNSON, PATRICIA
KUBY. Estadística elemental.
Por último veremos unas nociones sobre el manejo de la calculadora en
Cengage Learning, 2008.
línea Wiris a la hora de realizar este tipo de cálculos.
Libro muy práctico de estadís-
Navegamos por Tiching tica, que presenta gran cantidad
de ejercicios y casos de estudio
● http://www.tiching.com/740965. Correlación y regresión. En este vídeo de
en situaciones reales. Incluye
diez minutos de duración se estudia la dependencia funcional entre dos
instrucciones de uso de la
variables, analizando la correlación y la regresión.
calculadora científica enfoca-
● http://www.tiching.com/740976. Rectas de regresión. Esta web analiza la das a la realización de estos
relación entre dos variables cuantitativamente mediante la recta de cálculos.
regresión.
11-2
Soluciones de las actividades
Página 180
Página 184
57,327
y − 198,86 = ( x − 29,29) →
2,25 2
→ y = 11,32x − 132,70 .
11-3
La recta de regresión de X sobre Y es: Obtenemos la recta de regresión:
s xy y = 0,2898 x + 60,032,
x−x= ( y − y) →
s 2y donde x representa la edad e y la frecuencia cardíaca
en reposo. Calculamos y(52):
57,327
x − 29,29 = ( y − 198,86) → y = 0,2898 · 52 + 60,032 =75,1016.
26,95 2
Un paciente de 52 años tendrá una frecuencia cardíaca
→ x = 0,079 y + 13,58 . en reposo de unos 75 latidos por minuto.
c) y = 11,32 ⋅ 30 − 132,70 = 206,9 .
Se venderán unas 207 latas. Página 190
x i ⋅ ni
7. Introducimos en un mismo bloque: Media: x =
i =1
.
L = {punto(1,5), punto(2,4), punto(3,2), punto(4,1)} n
La media es la posición central más utilizada de la
correlación(L)
distribución de valores de una cierta variable x.
Obtenemos una correlación de -0,98995. Podemos k
deducir que hay una correlación lineal negativa muy
fuerte. 2
x i =1
i
2
⋅ ni
2
Varianza: s = −x
n
8. Introducimos en un mismo bloque:
La varianza es una medida vinculada a la dispersión
L = {punto(6, 4), punto(8, 5.5), punto(10, 8), de los valores. Con ella obtenemos un indicador de
punto(12, 10)} la dispersión de la variable estadística respecto a su
media.
correlación(L)
recta_de_regresión(L) Desviación típica: s = s 2
Obtenemos una correlación de 0,99586 y la recta de La desviación típica tiene un funcionamiento similar
regresión de y sobre x: y = 1,025x − 2,35 . al de la varianza pero utilizando la unidad de la
variable estadística.
9. Introducimos en un mismo bloque: P2. Una variable bidimensional es una variable en la que
L = {punto(20, 67), punto(25, 65), punto(40, 73), cada individuo está definido por un par de variables
punto(60, 75), punto(70,81)} estadísticas (X, Y).
r=recta_de_regresión(L) Las distribuciones marginales son las frecuencias
absolutas de los valores de las variables estadísticas
dibujar(L) X e Y para cada valor.
dibujar(r, {color = rojo}) La distribución condicionada de una variable
estadística X para y = yi. es el conjunto de valores de
Obtenemos un gráfico similar al siguiente:
X que se dan conjuntamente con el valor yi de la
variable estadística Y.
x
i =1
i ⋅ ni
a) Media: x = = 5,56 .
n
k
2
x
i =1
i
2
⋅ ni
2
Varianza: s = − x = 4,97
n
(x − 2s, x + 2s ) → 96% .
P4. La ecuación de la covarianza es: (x − 3s, x + 3s ) → 100% .
n
x ⋅ yi
i =1 i 11. Los resultados del ejercicio son:
s xy = − x⋅ y
n
a) Las marcas de clase para cada intervalo son:
La covarianza tiene dos inconvenientes. Por un lado
depende de las unidades en que se miden las Peso (Kg) [50,60] (60,70] (70,80] (80,90]
variables, existiendo una dificultad a la hora de Marcas de clase 55 65 75 85
razonar si la correlación es fuerte o débil. Por otro
lado, los puntos más alejados del centro de gravedad b) Media: x = 68 kg.
influyen excesivamente en el valor de la covarianza,
perturbando el valor de la covarianza como un buen c) Varianza: s 2 = 94,33 kg 2
indicador de la correlación.
Desviación típica: s = s 2 = 9,71 kg.
P5. La fórmula del coeficiente de correlación lineal es la
siguiente: 12. Las soluciones del ejercicio son:
s xy a) Los intervalos en los cuales se han agrupado los
r= .
sx ⋅ s y estudiantes de bachillerato son:
11-5
Altura (cm) Marcas de clase nº. de alumnos 14. a) La tabla de doble entrada correspondiente es:
[153,5, 162,5] 158 1 X\Y [1,2] (2,3] (3,4] nx
(162,5, 171,5] 167 6 [1, 3] 5 2 0 7
(171,5, 180,5] 176 6 (3, 5] 1 3 1 5
(180,5, 189,5] 185 5 (5, 7] 0 0 3 3
(189,5, 198,5] 194 1 ny 6 5 4 15
b) Usamos las marcas de clase para calcular los datos
7 ⋅ 2 + 5 ⋅ 4 + 3 ⋅ 6 52
solicitados: b) x = = .
15 15
158 ⋅ 1 + 167 ⋅ 6 + ... + 194 ⋅ 1
Media: x = ≈ 175,53 . 6 ⋅ 1,5 + 5 ⋅ 2,5 + 4 ⋅ 3,5 35,5
19 y= =
15 15
Varianza: 2
7 ⋅ 2 2 + 5 ⋅ 4 2 + 3 ⋅ 6 2 52
2 2
158 ⋅ 1 + 167 ⋅ 6 + ... + 194 ⋅ 1 2 sx = − ≈ 1,54
s2 = − 175,53 2 ≈ 15 15
19
≈ 79,48. 6 ⋅ 1,5 2 + 5 ⋅ 2,5 2 + 4 ⋅ 3,5 2 35,5
2
sy = − ≈
Desviación típica: s = s 2 ≈ 8,92 . 15 15
≈ 0,81.
13. La solución de las actividades es:
52 35,5
a) El diagrama de dispersión de las notas de inglés y
c) El centro de gravedad es , .
15 15
filosofía es:
15. a) El diagrama de dispersión correspondiente es:
11-6
Página 191 18. Las respuestas son:
a) Verdadero.
16. Los resultados del ejercicio son:
b) Falso, la covarianza ha de tener el mismo signo
a) e) que el coeficiente de correlación lineal.
c) Verdadero.
n
x ⋅ yi
i =1 i
c) s xy = − x ⋅ y = 22,06 .
n
s xy
d) r = = 0,97 .
“dependencia cuadrática” “dependencia lineal sx ⋅ s y
positiva fuerte”
Existe una correlación lineal positiva fuerte entre
c) g) ambas variables.
11-7
22. Las respuestas del ejercicio son: e) y = 1,046 ⋅ 9 − 1,106 = 8,308 .
a) Media x = 31,50 miles de €, y = 29,67 miles de €. Podemos esperar que tenga un 8,3.
x ⋅n
i =1
i i
61 112
x= = = 3,05 ; y = = 5,6 .
n 20 20
Desviación típica:
b) Media x = 7,11 , y = 6,33
k
2
Varianzas: s x = 1,88 , s y 2 = 4,22 . x
i =1
i
2
⋅ ni
2 215
sx = −x = − 3,05 2 = 1,2 .
Desviaciones típicas: n 20
s x = 1,37 , s y = 2,05 . 776
sy = − 5,6 2 = 2,73 .
s xy 20
c) r = = 0,699 .
sx ⋅ sy b) La siguiente fórmula nos permite calcular la cova-
rianza si tenemos una tabla de doble entrada:
Existe una correlación lineal positiva entre las dos n
variables, pero no es una correlación extremadamen-
te fuerte. x ⋅ y
i , j =1
i j ⋅ nij
342
σ xy = − x⋅ y = − 17,08 = 0,02
d) Recta de regresión de la prueba oral sobre la escrita: n 20
y = 1,046 ⋅ x − 1,106 . 0,02
c) Coeficiente de correlación: r = ≈ 0,006 .
Recta de regresión de la prueba escrita sobre la oral: 1,2 ⋅ 2,73
x = 0,467 ⋅ y + 4,153 . Estas dos variables estadísticas no tienen una
correlación lineal entre ellas.
El punto de intersección es el centro de gravedad
de la distribución: d) y – 5,6 = 0,014 (x – 3,05).
y = 1,046 ⋅ x − 1,106 e) Como no hay correlación entre ambas variables,
→ x = 7,11 e y = 6,33 . no es adecuado usar la recta de regresión para
x = 0,467 ⋅ y + 4,153 estimar una sobre la otra.
11-8
26. Las soluciones del ejercicio son: Página 193
s xy 3,43
a) r = = = 0,938 . 30. Las soluciones del ejercicio son:
sx ⋅ s y 2,42 ⋅ 1,51
a) Para resolver el ejercicio usaremos los coeficientes
b) Usamos la recta de regresión de vehículos sobre de regresión que nos proporcionan las rectas:
accidentes:
s xy s xy
3,43 = −1,25 ; = −0,65 .
x − 10,14 = (y − 6) → para y = 8 → x = 13,14 sx 2 sy
2
1,512
El jueves podemos suponer que circulaban 13.140 Usando que el coeficiente de regresión lineal es
vehículos. r = sxy/(sx · sy) y que ha de ser negativo puesto que
los coeficientes de regresión lo son, tenemos:
c) Al ser un coeficiente de correlación lineal elevado
y una estimación interpolada próxima al centro de s xy s xy
gravedad, podemos afirmar que es una predicción r=− 2
⋅ → r = − (− 0,65)(− 1,25) →
suficientemente fiable. sx sy2
r = −0,90 .
27. Las soluciones del ejercicio son:
a) Usamos la recta de regresión del abono sobre las b) El centro de gravedad es la intersección de las dos
frutas: rectas de regresión:
x ⋅n
i =1
i i
2,75 ⋅ 2 + + 4,25 ⋅ 7
x= = = 3,6 min.
n 20
11-10
Dependencia lineal positiva débil: Existe una leve b) Si hay correlación lineal negativa fuerte entre las
relación creciente entre ambas variables. variables, el coeficiente de correlación lineal es
próximo a -1.
c) Si no hay correlación lineal entre las variables, el
coeficiente de correlación lineal es prácticamente 0.
d) Si hay correlación lineal débil entre las variables, el
coeficiente de correlación lineal es próximo a 0.
3. La covarianza es:
s xy
r= → s xy = 0,93 ⋅ 47,76 ⋅ 1,79 = 8,60 .
sx ⋅ sy
Dependencia lineal negativa fuerte: Existe una Los coeficientes de regresión son:
relación inversamente proporcional fuerte entre ambas s xy 8,60 s xy 8,60
variables. 2
= = 0,18 ; 2 = = 4,80 .
sx 47,76 sy 1,79
b) Medias: x = 5,125 ; y = 5 .
c) s xy = 7 .
s xy 7
d) r = = = 0,97 .
sx ⋅ s y 2,93 ⋅ 2,45
Independencia: No existe ninguna relación entre Hay una dependencia lineal positiva fuerte.
ambas variables.
5. Las soluciones del ejercicio son:
a) Puesto que las medias vienen dadas por las coorde-
nadas del centro de gravedad, las rectas de regresión
son:
s xy 2,61
x−x = 2
( y − y ) → x − 5,45 = ( y − 5,6) →
sy 1,76 2
→ x = 0,843y + 0,7315 .
s xy 2,61
y− y= 2
(x − x ) → y − 5,6 = (x − 5,45) →
sx 1,612
2. Las frases completas son:
→ y = 1,007 x + 0,112 .
a) Si hay dependencia funcional lineal positiva entre las
variables, el coeficiente de correlación lineal es 1. b) y = 1,007 ⋅ 7 + 0,112 = 7,161 .
11-11
DIRECCIONES DE INTERNET
TICHING WEBS
www.tiching.com/740953 http://estadistica.ematematicas.net/bidimensional/index.php?tipo=tabla&utm
http://descartes.cnice.mec.es/materiales_didacticos/bidimensional_lbarrios/ediagrama
www.tiching.com/740955
_dispersion_est.htm
www.tiching.com/740959 https://www.youtube.com/watch?v=CyC07ybt2qA
www.tiching.com/740965 https://www.youtube.com/watch?v=s3yVkj1YIVk
www.tiching.com/740976 http://www.fisterra.com/mbe/investiga/regre_lineal_simple/regre_lineal_simple.asp
11-12