Está en la página 1de 11

REGRESIÓN LINEAL

20-1-2022
– CORRELACIÓN
MARIO DÍAZ F.DEZ

MATEMÁTICAS 1º BACHILLERATO
IES MAESTRO MATÍAS BRAVO
REGRESIÓN LINEAL – CORRELACIÓN

ÍNDICE
REGRESIÓN LINEAL Y CORRELACIÓN...........................................................................2
SELECCIÓN DE HOTELES....................................................................................................2
NUBE DE PUNTOS...................................................................................................................4
MEDIA ARITMÉTICA.............................................................................................................4
VARIANZA Y DESVIACIÓN TÍPICA...................................................................................6
COVARIANZA..........................................................................................................................6
COEFICIENTE DE CORRELACIÓN LINEAL....................................................................8
RECTA DE REGRESIÓN........................................................................................................8
PRECIO PARA DISTINTAS DISTANCIAS...........................................................................9
BIBLIOGRAFÍA......................................................................................................................10

Página 1 de 11
REGRESIÓN LINEAL – CORRELACIÓN

REGRESIÓN LINEAL Y
CORRELACIÓN
La regresión lineal es una técnica de modelado estadístico que se emplea para
describir una variable de respuesta continua como una función de una o varias
variables predictoras. Puede ayudar a comprender y predecir el comportamiento de
sistemas complejos o a analizar datos experimentales, financieros y biológicos.

Las técnicas de regresión lineal permiten crear un modelo lineal. Este modelo describe
la relación entre una variable dependiente y como una función de una o varias
variables independientes Xi.

La correlación indica la fuerza y la dirección de una relación lineal y proporcionalidad


entre dos variables estadísticas.

SELECCIÓN DE HOTELES
Para elegir los 50 hoteles he utilizado el comparador de hoteles “Tripadvisor”. He
buscado hoteles que ofrezcan una habitación individual del 13 al 15 de abril cerca del
centro de París. Los hoteles debían estar a 3 kilómetros de distancia del centro de
Parías como máximo y tener 3 o 4 estrellas.

Esta es la tabla que he realizado en Excel de los 50 hoteles:

Nombre del hotel Distancia Precio


(km) (€)
Hotel La Villa Saint-Germain 1,2 276
Hôtel Résidence Henri 4 0,5 253
Hotel La Lanterne 0,5 232
Le Lapin Blanc 0,7 192
Hotel Left Bank Saint Germain 0,8 191
Hotel du Jeu de Paume 0,5 242
Hotel Parc St. Severin - Espirit de France 0,4 246
Le Relais des Halles 1,1 240
Millesime Hotel 1,1 261
Hotel Saint Paul Rive Gauche 0,8 284
Hotel des Grandes Ecoles 0,9 226
Hotel Residende Des Arts 0,5 218
K+K Hotel Cayre 1,8 228
Le Relais du Louvre 1 193
Hotel Pas de Calais 1,4 228

Página 2 de 11
REGRESIÓN LINEAL – CORRELACIÓN

Hotel Dauphine Saint Germain 0,8 189


Hotel le Petit Paris 1 207
Hotel de Seine 1 179
L'Empire Paris 1 253
Hotel du College de France 0,4 178
Hotel Saint-Marc 2,2 291
Hôtel Madison 1,1 251
Hotel Europe Saint Severin 0,4 293
Hotel le Notre Dame 0,2 260
Hotel de Fleurie 0,9 140
La Chambre du Marais 1,4 273
Lenox Montparnasse 2 147
Victoria Palace Hotel 2 272
Hotel du Danube Saint Germain 1,4 206
Hotel du Levant 0,4 135
Hotel Luxemburgo Parc 1,2 259
Hôtel de l'Abbaye Saint-Germain 1,4 311
Hotel Saint Christophe 1,1 127
Le Mathurin Hotel & Spa Paris 2,9 223
Hòtel Jardin Le Bréa 1,8 166
Hôtel Le Littre 2,1 235
Les Bulles de Paris 0,5 162
Hotel La Perle 1,2 203
Relais Hotel du Vieux Paris 0,5 253
Hotel Oratio 0,5 185
Hôtel Bourgogne & Montana 2,4 237
Hotel Caron 1 201
Hotel Royal Saint-Honore 2 217
Hotel Charles V 0,9 241
Les Tournelles 1,2 223
Hôtel Henriette 1,9 171
Au Manoir Saint Germain Des Pres 1,3 233
Legend Hotel by Elegancia 2 192
Hôtel de JoBo 0,9 268
Hotel Design Sorbonne 0,8 158

Página 3 de 11
REGRESIÓN LINEAL – CORRELACIÓN

NUBE DE PUNTOS
Una nube de puntos es un gráfico que se obtiene al representar, en unos ejes de
coordenadas, los N pares de datos que toma la variable bidimensional. Es usada
en estadística para mostrar la posible relación entre dos variables.

He realizado una nube de puntos en Excel de estos 50 hoteles, siendo la distancia al


centro de París en kilómetros la variable X, y el precio en euros la variable Y.

Hoteles cerca del centro de París


350

300

250

200
Precio (€)

150

100

50

0
0 0.5 1 1.5 2 2.5 3 3.5

Distancia (km)

Página 4 de 11
REGRESIÓN LINEAL – CORRELACIÓN

MEDIA ARITMÉTICA
La media aritmética es el cociente de la suma de todos los datos multiplicados por su
frecuencia entre el número total de datos. Se la utiliza para calcular un valor
representativo de los valores que se están promediando. Su fórmula es:

He calculado la media de X (distancia en km) y la de Y (precio en euros) con la función


“PROMEDIO” en Excel.

Media X (km): 1,14


Media Y (€): 220,98

VARIANZA Y DESVIACIÓN TÍPICA


Tanto la varianza como la desviación típica son medidas de dispersión que permiten
conocer el grado de agrupamiento de los datos en torno a las medidas de
centralización.

La varianza se utiliza para representar a la variabilidad de un conjunto de datos


respecto de la media aritmética de los mismos. Su fórmula es la siguiente:

La desviación típica es la raíz cuadrada positiva de la varianza. Su fórmula es la


siguiente:

Página 5 de 11
REGRESIÓN LINEAL – CORRELACIÓN

He calculado la varianza y deviación típica de X (distancia en km) y la de Y (precio en


euros) con la función “VARP” para la varianza y “DESVESTP” para la desviación típica
en Excel.

Varianza X (km): 0,3676

Desviación típica X 0,60630025


(km): 6

Varianza Y (€): 1912,3396

Desviación típica Y 43,7303052


(€): 8

COVARIANZA
La covarianza es el valor a través del cual se refleja en qué cuantía dos variables
cualesquiera varían de forma conjunta respecto de sus medias aritméticas. Así, esta
medida nos permite conocer cómo se comportan las variables en cuestión respecto de
otras variables. Su fórmula es:

He calculado la covarianza de X (distancia en km) e Y (precio en euros) con la función


“COVARIANCE.P” en Excel.

Covarianza: 1,3888

COEFICIENTE DE CORRELACIÓN
LINEAL
El coeficiente de correlación lineal es un tipo de medida de regresión que se emplea
para conocer el grado de variación entre dos variables determinadas. Permite
cuantificar la dependencia entre dos variables y establecer una correlación lineal entre
ellas. Su fórmula es:

Página 6 de 11
REGRESIÓN LINEAL – CORRELACIÓN

Página 7 de 11
REGRESIÓN LINEAL – CORRELACIÓN

He calculado el coeficiente de correlación lineal con la función “COEF.DE.CORREL”


en Excel.

Coeficiente de correlación lineal: 0,052380477

RECTA DE REGRESIÓN
Una recta de regresión es un modelo lineal que relaciona una variable de salida Y
con otra variable X. Nos permite, conocidos los valores de una de las variables,
estimar de manera aproximada los valores esperados de la otra variable.

He realizado la recta de regresión en Excel de estos 50 hoteles, siendo la distancia al


centro de París en kilómetros la variable X, y el precio en euros la variable Y.

Hoteles cerca del centro de París


350

300

250

f(x) = 3.77801958650707 x + 216.673057671382


200 R² = 0.00274371434955445
Precio (€)

150

100

50

0
0 0.5 1 1.5 2 2.5 3 3.5

Distancia (km)

Página 8 de 11
REGRESIÓN LINEAL – CORRELACIÓN

PRECIO PARA DISTINTAS


DISTANCIAS
Fijándonos en la recta de regresión, podemos apreciar una ligera varianza del precio
del hotel con respecto a su distancia al centro. Cuanto más alejado del centro de la
ciudad de encuentra el hotel, más caro es. Lo cual va en contra de los esperado, ya
que teóricamente cuanto más cerca del centro esté el hotel, más caro debería ser. El
precio de un hotel a 250 metros del centro podría ser de 210 euros, y el de uno a 4,5
kilómetros podría ser de 250 euros. Pero me es imposible estimar los precios de forma
exacta.

Estas estimaciones no son fiables ya que de estos precios dependen muchos otros
factores que habría que tener en cuenta, como el tipo de barrio en el que se encuentra
cada hotel, ya pueda ser más o menos conflictivo; la cercanía a transporte público; los
lugares famosos que puedo tener cerca, ya sean más o menos turísticos; o el número
de estrellas de cada uno.

Página 9 de 11
REGRESIÓN LINEAL – CORRELACIÓN

BIBLIOGRAFÍA
https://la.mathworks.com/discovery/linear-regression.html

https://economipedia.com/definiciones/media-aritmetica.html

https://www.sdelsol.com/glosario/varianza/

https://www.sdelsol.com/glosario/desviacion-tipica/

https://www.superprof.es/apuntes/escolar/matematicas/estadistica/descriptiva/
desviacion-tipica.html

https://psicologiaymente.com/cultura/desviacion-tipica

https://es.wikipedia.org/wiki/Desviaci%C3%B3n_t%C3%ADpica

https://www.sdelsol.com/glosario/covarianza/

https://www.sdelsol.com/glosario/coeficiente-de-correlacion-lineal/

https://www.economiasimple.net/glosario/coeficiente-de-correlacion-lineal

https://conceptosclaros.com/recta-regresion/#:~:text=Una%20recta%20de%20regresi
%C3%B3n%20es,Y%20tiene%20que%20ser%20cuantitativa.

https://www.superprof.es/apuntes/escolar/matematicas/estadistica/disbidimension/
recta-de-regresion.html

https://ekuatio.com/recta-de-regresion-formula-y-como-se-calcula-ejercicios-resueltos/

Página 10 de
11

También podría gustarte