Está en la página 1de 10

Introducción

Muy a menudo se encuentra en la práctica que existe una relación


entre dos (o más) variables. Por ejemplo: los pesos de los hombres
adultos dependen en cierto modo de sus alturas; las longitudes de las
circunferencias y las áreas de los círculos dependen del radio, y la
presión de una masa de gas depende de su temperatura y de su
volumen.

El análisis de regresión y correlación múltiple se perfila como


herramienta en el campo de la estadística que permite modelar la
relación que se origina entre una variable dependiente (Y) y un conjunto
de variables independientes (X1, X2,X3….).

Por una parte, el análisis de regresión demuestra cómo emplear


las variables independientes para determinar una ecuación que describa
y estime a la variable dependiente; y en segundo término, un análisis de
correlación va a permitir cuantificar el grado de asociación lineal entre
las variables mencionadas.

A continuación se resuelve un caso práctico donde se realiza un


análisis de regresión y correlación lineal múltiple que permita modelar y
estimar el número de pasajeros diarios de cierta línea de transporte con
el número de unidades diarias y la línea principal usada; con el objetivo
de demostrar las ventajas de ésta herramienta estadística.

Planteamiento del Problema

Para el caso múltiple se plantea lo siguiente:

Se requiere el análisis de números de pasajeros vs unidades diarias en


las tres líneas principales. Para el caso se tomaron los registros en las
tres primeras semanas de lunes a viernes del mes de octubre de 2013.
Donde;

Y=pasajeros diarios de las tres líneas principales

X1= número de unidades diarias referido a las líneas

X2= línea principal usada

y x1 x2
29700 11 1
32400 12 1
35100 13 1
35100 13 1
35100 13 1
29700 11 1
32400 12 1
35100 13 1
37830 13 1
37830 13 1
32010 11 1
34920 12 1
29100 10 1
29100 10 1
32010 11 1
30420 13 2
28080 12 2
28080 12 2
30420 13 2
28080 12 2
30420 13 2
28080 12 2
28080 12 2
42120 12 2
42120 12 2
35100 10 2
42120 12 2
38610 11 2
38610 11 2
38610 11 2
9360 8 3
9360 8 3
8190 7 3
8190 7 3
8190 7 3
9360 8 3
9360 8 3
8190 7 3
9360 8 3
9360 8 3
7020 6 3
8190 7 3
8190 7 3
8190 7 3
8190 7 3
SPSS (Statistical Product and Service Solutions)

Variables introducidas/eliminadas
Variables Variables
Modelo introducidas eliminadas Método
1 X2, X1a . Introduci
r
a. Todas las variables solicitadas
introducidas.

Resumen del modelo


Model
o R R cuadrado R cuadrado corregida Error típ. de la estimación
1 ,915a ,838 ,830 5143,441
a. Variables predictoras: (Constante), X2, X1

ANOVAb

Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 5,732E9 2 2,866E9 108,335 ,000a

Residual 1,111E9 42 2,645E7

Total 6,843E9 44

a. Variables predictoras: (Constante), X2, X1

b. Variable dependiente: Y

Coeficientesa
Coeficientes no Coeficientes Intervalo de confianza
estandarizados tipificados de 95,0% para B
Límite Límite
Modelo B Error típ. Beta t Sig. inferior superior
ANOVAb

Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 5,732E9 2 2,866E9 108,335 ,000a

Residual 1,111E9 42 2,645E7

Total 6,843E9 44

a. Variables predictoras: (Constante), X2, X1

1(Constante) -6427,967 8589,728 -,748 ,458 - 10906,805


23762,739
X1 3776,729 560,602 ,705 6,737 ,000 2645,388 4908,071
X2 -3729,414 1580,034 -,247 -2,360 ,023 -6918,052 -540,776
a. Variable dependiente: Y
Conclusiones
En el cuadro “Resumen del Modelo” podemos encontrar un
coeficiente de correlación que indica una intensidad muy importante en
el grado en que se relacionan las variables conocidas (número de
unidades diarias y línea principal usada) con la variable que se intenta
predecir (número de pasajeros diarios).

También obtenemos un coeficiente de determinación corregida de


0,83 que señala la proporción de variación del número de pasajeros
diarios que se ve explicada por la recta de regresión, o lo que es lo
mismo, las variables independientes: número de unidades diarias y línea
principal usada. Dicho del mismo modo, la ecuación de estimación
describe realmente la relación entre las variables.

En el cuadro ANOVA la prueba F de Fisher-Snedecor comprueba la


veracidad poblacional de los coeficientes de regresión. En este caso la
prueba arroja rechazo de la hipótesis nula y la aceptación de la hipótesis
alternativa, que implica utilidad de al menos una de las variables
independientes en el modelo de regresión que intenta predecir en
número de pasajeros diarios.

En el cuadro de los coeficientes; se hayan los valores de la


ordenada Y; constante para cualquier línea recta dada cuyo valor
representa un número de pasajeros diarios de -6427,967 cuando el
valor del número de unidades diarias y la línea principal usada es 0.

Así mismo se consiguen las pendientes que indican un cambio en


el número de pasajeros diarios de 3776,729 con un cambio de una
unidad en el número diario de unidades usadas, además, un cambio del
número de pasajeros diarios de -3729,414 con un cambio de una unidad
en la línea principal usada.
De acuerdo con los resultados de la prueba t, las dos variables son
realmente útiles dentro del modelo de regresión y la fórmula
matemática que relaciona la variable desconocida con las variables
conocidas en el análisis de regresión es:

Y^ =−6427,967+3776,729∗X 1−3729,414∗X 2

También podría gustarte