Está en la página 1de 14

INGENIERÍA EN GESTIÓN EMPRESARIAL

TRABAJO: No. 1 Investigación Conceptual

TEMA No. 1 Regresión lineal

NOMBRE DEL MAESTRO: Ramón Agustín Bocos Patrón

NOMBRE DEL ALUMNO: Diaz Acosta Carlos Nicolas

MATERIA: Estadísticas Inferencial II

GRUPO: MG 5

FECHA: 28/Septiembre/2018
INTRODUCCIÓN
En la industria con mucha frecuencia es necesario resolver problemas que
implican conjuntos de variables, cuando se sabe que existe alguna relación
inherente entre ellas. A partir de lo anterior, es necesario establecer modelos que
expliquen dicha relación.

Cuando, simultáneamente, contemplamos dos variables continuas, aunque por


extensión se pueden emplear para variables discretas cuantitativas, surgen
preguntas y problemas específicos. Esencialmente, se emplearán estadísticos
descriptivos y técnicas de estimación para contestar esas preguntas, y técnicas de
contraste de hipótesis específicos para resolver dichos problemas. La mayoría de
estos métodos están encuadrados en las técnicas regresión y correlación

En forma más especifica el análisis de correlación y regresión comprende el


análisis de los datos muestrales para saber qué es y cómo se relacionan entre si
dos o más variables en una población. El análisis de correlación produce un
número que resume el grado de la fuerza de relación entre dos variables; y el
análisis de regresión da lugar a una ecuación matemática que describe dicha
relación.

La técnica de regresión lineal simple está indicada cuando se pretende explicar


una variable respuesta cuantitativa en función de una variable explicativa
cuantitativa también llamada variable independiente, variable regresora o variable
predictora. Por ejemplo, se podría intentar explicar el peso en función de la altura.
El modelo intentaría aproximar la variable respuesta mediante una función lineal
de la variable explicativa.

A partir de la presente investigación, se pretende mostrar la aplicación práctica de


la regresión y correlación lineal simple y múltiple en la industria. Ya que la
aplicación de las técnicas estadísticas contribuyen a la optimización de los
procesos.
COMPETENCIAS ESPECÍFICAS A DESARROLLAR

Aplica, desarrolla y analiza las técnicas de regresión lineal simple para hacer
predicciones de sucesos futuros en el ramo empresarial.
17.75 Un estadístico que trabaja para un fabricante estadunidense de automóviles
desearía desarrollar un modelo estadístico para predecir el tiempo de entrega (la
cantidad de días transcurridos entre el pedido de un automóvil y la entrega real
del mismo) de los pedidos de automóviles nuevos. El estadístico piensa que existe
una relación lineal entre el número de opciones pedidas y el tiempo de entrega. Se
seleccionó una muestra aleatoria de 16 automóviles y se obtuvieron los resultados
que se presentan a continuación:

Relación del tiempo de entrega con las opciones ordenadas (problema


17.75).

Automóvil Numero de opciones Tiempo de entrega Y


pedidas, X (en días)
1 3 25
2 4 32
3 4 26
4 7 38
5 7 34
6 8 41
7 9 39
8 11 46
9 12 44
10 12 51
11 14 53
12 16 58
13 17 61
14 20 64
15 23 66
16 25 70

DIAGRAMA DE DISPERSIÓN
Gráfico X-Y - Tiempo de entrega Y (en días) vs. Numero de opciones pedidas,
X

Variable X: Numero de opciones pedidas, X

Variable Y: Tiempo de entrega Y (en días)

16 valores

El StatAdvisor
Este procedimiento genera un diagrama de dispersión para Tiempo de entrega Y
(en días) versus Numero de opciones pedidas, X. Para ajustar una curva a estos
datos, seleccione Relacionar - Un Factor - Regresión Simple del menú principal.

Gráfico de Tiempo de entrega Y (en días) v s Numero de opciones pedidas, X

75
Tiempo de entrega Y (en días)

65

55

45

35

25
0 5 10 15 20 25
Numero de opciones pedidas, X

En el diagrama de dispersión del Tiempo de entrega y Numero de opciones


pedidas, de los automóviles nosotros podemos predecir que si hay una relación
entre las dos variables.

MÉTODOS DE MÍNIMOS CUADRADOS


Regresión Simple - Tiempo de entrega Y (en días) vs. Numero de opciones
pedidas, X
Variable dependiente: Tiempo de entrega Y (en días)
Variable independiente: Numero de opciones pedidas, X
Lineal: Y = a + b*X

Coeficientes
Mínimos Cuadrados Estándar Estadístico
Parámetro Estimado Error T Valor-P
Intercepto 21.9254 1.59084 13.7823 0.0000
Pendiente 2.06871 0.116411 17.7707 0.0000

Interpretaciones:
La pendiente 𝑏1 fue calculada como + 2.06871. Esto significa que para cada
incremento de una unidad en X se estima que el valor de Y aumenta en un
promedio de 0.116411 unidades.
AJUSTE E INTERPRETACIÓN DE LA RECTA
Gráfico del Modelo Ajustado
Tiempo de entrega Y (en días) = 21.9254 + 2.06871*Numero de opciones pedidas, X

75
Tiempo de entrega Y (en días)

65

55

45

35

25
0 5 10 15 20 25
Numero de opciones pedidas, X

Interpretación:

Error estándar del est. = 3.04456


Interpretación:

ENFOQUE DEL ANDEVA P/LA PRUEBA DE SIGNIFICACIÓN DE LA


REGRESIÓN.
Análisis de Varianza
Fuente Suma de Gl Cuadrado Razón-F Valor-P
Cuadrados Medio
Modelo 2927.23 1 2927.23 315.80 0.0000
Residuo 129.77 14 9.26932
Total (Corr.) 3057.0 15

Interpretaciones:
Puesto que el valor-P en la tabla ANOVA es menor que 0.05, existe una relación
estadísticamente significativa entre Tiempo de entrega Y (en días) y Numero de
opciones pedidas, X con un nivel de confianza del 95.0%.
I. DE C. PARA 𝜷𝟏 , 𝜷𝟎 (PENDIENTE Y ORDENADA DEL MODELO)
Gráfico del Modelo Ajustado
Tiempo de entrega Y (en días) = 21.9254 + 2.06871*Numero de opciones pedidas, X

75
Tiempo de entrega Y (en días)

65

55

45

35

25
0 5 10 15 20 25
Numero de opciones pedidas, X
Interpretación:

I. DE C. PARA LA MEDIA 𝝁𝒚,𝒙


Valores Predichos
95.00%
Predicciones Límite Predicción
X Y Inferior Superior
3.0 28.1316 21.0355 35.2277

I. DE C. DE PREDICCIÓN PARA UNA OBSERVACIÓN FUTURA 𝒀𝒊


Valores Predichos
95.00%
Predicciones Límite Confianza
X Y Inferior Superior
3.0 28.1316 25.3541 30.909

El StatAdvisor
Esta tabla muestra los valores predichos para Tiempo de entrega Y (en días)
usando el modelo ajustado. Además de las mejores predicciones, la tabla
muestra:

(1) intervalos de previsión del 95.0% para las nuevas observaciones


(2) intervalos de confianza del 95.0% para la media de varias observaciones
Los intervalos de predicción y de confianza corresponden a las cotas internas y
externas en la gráfica del modelo ajustado.

ANÁLISIS RESIDUAL
Gráfico de Residuos
Tiempo de entrega Y (en días) = 21.9254 + 2.06871*Numero de opciones pedidas, X

1
residuo

-1

-3

-5
0 5 10 15 20 25
Numero de opciones pedidas, X
Interpretaciones:

EL COEFICIENTE DE DETERMINACIÓN
R-cuadrado (ajustado para g.l.) = 95.4518 porciento

EL ANÁLISIS DE CORRELACIÓN
Coeficiente de Correlación = 0.978545
17.77 Al dueño de una gran cadena de expendios de helados de gustaría estudiar
el efecto de la temperatura ambiente sobre las ventas de sus productos durante la
temporada de verano. Se seleccionó una muestra aleatoria de 21 días y se
obtuvieron los resultados que se presentan a continuación:

Relación de ventas con temperatura (problema 17.77).

Día Temperatura alta diaria Venta por tienda (en


(°F) $(000)
1 63 1.52
2 70 1.68
3 73 1.80
4 75 2.05
5 80 2.36
6 82 2.25
7 85 2.68
8 88 2.90
9 90 3.14
10 91 3.06
11 92 3.24
12 75 1.92
13 98 3.40
14 100 3.28
15 92 3.17
16 87 2.83
17 84 2.58
18 88 2.86
19 80 2.26
20 82 2.14
21 76 1.98

Gráfico X-Y - Venta por tienda (en $(000) vs. Temperatura alta diaria (°F)
Variable X: Temperatura alta diaria (°F)
Variable Y: Venta por tienda (en $(000)

21 valores

El StatAdvisor
Este procedimiento genera un diagrama de dispersión para Venta por tienda (en
$(000) versus Temperatura alta diaria (°F). Para ajustar una curva a estos datos,
seleccione Relacionar - Un Factor - Regresión Simple del menú principal.
Gráfico de Venta por tienda (en $(000) v s Temperatura a lta diaria (°F)

3.5
Venta por tienda (en $(000)

3.1

2.7

2.3

1.9

1.5
63 73 83 93 103
Temperatura alta diaria (°F)

MÉTODOS DE MÍNIMOS CUADRADOS


Regresión Simple - Venta por tienda (en $(000) vs. Temperatura alta diaria
(°F)
Variable dependiente: Venta por tienda (en $(000)
Variable independiente: Temperatura alta diaria (°F)
Lineal: Y = a + b*X

Coeficientes
Mínimos Estándar Estadístico
Cuadrados
Parámetro Estimado Error T Valor-P
Intercepto -2.53499 0.295223 -8.58667 0.0000
Pendiente 0.060728 0.00351995 17.2525 0.0000

AJUSTE E INTERPRETACIÓN DE LA RECTA


Gráfico del Modelo Ajustado
Venta por tienda (en $(000) = -2.53499 + 0.060728*Temperatura alta diaria (°F)

3.5
Venta por tienda (en $(000)

3.1

2.7

2.3

1.9

1.5
63 73 83 93 103
Temperatura alta diaria (°F)

Error estándar del est. = 0.146108


ENFOQUE DEL ANDEVA P/LA PRUEBA DE SIGNIFICACIÓN DE LA
REGRESIÓN.
Análisis de Varianza
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
Modelo 6.35406 1 6.35406 297.65 0.0000
Residuo 0.405601 19 0.0213474
Total 6.75966 20
(Corr.)

I. DE C. PARA 𝜷𝟏 , 𝜷𝟎 (PENDIENTE Y ORDENADA DEL MODELO)


Gráfico del Modelo Ajustado
Venta por tienda (en $(000) = -2.53499 + 0.060728*Temperatura alta diaria (°F)

3.5
Venta por tienda (en $(000)

3.1

2.7

2.3

1.9

1.5
63 73 83 93 103
Temperatura alta diaria (°F)

I. DE C. PARA LA MEDIA 𝝁𝒚,𝒙


Valores Predichos
95.00%
Predicciones Límite Predicción
X Y Inferior Superior
63.0 1.29088 0.943721 1.63803

El StatAdvisor
Esta tabla muestra los valores predichos para Venta por tienda (en $(000) usando
el modelo ajustado.
I. DE C. DE PREDICCIÓN PARA UNA OBSERVACIÓN FUTURA 𝒀𝒊
Valores Predichos
95.00%
Predicciones Límite Confianza
X Y Inferior Superior
63.0 1.29088 1.12656 1.45519

El StatAdvisor
Esta tabla muestra los valores predichos para Venta por tienda (en $(000) usando
el modelo ajustado.

ANÁLISIS RESIDUAL
Residuos Atípicos
Predicciones Residuos
Fila X Y Y Residuos Studentizados
1 63.0 1.52 1.29088 0.229123 2.00
14 100.0 3.28 3.53781 -0.257813 -2.17
20 82.0 2.14 2.44471 -0.304709 -2.39

El StatAdvisor
La tabla de residuos atípicos enlista todas las observaciones que tienen residuos
Estudentizados mayores a 2, en valor absoluto. Los residuos Estudentizados
miden cuántas desviaciones estándar se desvía cada valor observado de Venta
por tienda (en $(000) del modelo ajustado, utilizando todos los datos excepto esa
observación. En este caso, hay 3 residuos Estudentizados mayores que 2, pero
ninguno mayor que 3.

Gráfico de Residuos
Venta por tienda (en $(000) = -2.53499 + 0.060728*Temperatura alta diaria (°F)

0.4

0.2
residuo

-0.2

-0.4
63 73 83 93 103
Temperatura alta diaria (°F)
EL COEFICIENTE DE DETERMINACIÓN
R-cuadrado (ajustado para g.l.) = 93.6839 porciento

EL ANÁLISIS DE CORRELACIÓN
Coeficiente de Correlación = 0.969534

BIBLIOGRAFÍA
Est. Básica en Admón. - Berenson, Levine 6ª ed.

Regresión Simple (pdf).

WEDGRAFIA
Regresion y correlacion con Statgraphics | | UPV

https://youtu.be/7WMYoMnpYSg
Regresión Lineal en Statgraphics

https://youtu.be/QjBJif4vyVA

REGRESION LINEAL (statgraphics)

https://youtu.be/D659OLiWOHw

También podría gustarte