Está en la página 1de 12

ESTADISTICA INDUSTRIAL ANÁLISIS DE REGRESIÓN SIMPLE

LABORATORIO

06 Ing. William León Velásquez wjleonv@yahoo.com SEM 2020-1

ANÁLISIS DE REGRESIÓN SIMPLE


El análisis de regresión estudia de la relación entre dos grupos
de datos desarrollando una ecuación matemática que la describe.
La ecuación nos permitirá predecir el valor de la variable
dependiente Y basándonos en el valor de la variable
independiente X. La técnica usada para desarrollar la ecuación
para la línea de tendencia y hacer esta predicción es llamada
análisis de regresión. El siguiente ejemplo nos ayudará a
visualizar mejor que es la regresión.

PROBLEMAS DESARROLLADO

Un fabricante desea obtener una medida de calidad de un producto, pero el


procedimiento para obtener la medida es costoso. Existe un método indirecto, el cual
utiliza una puntuación del producto diferente (Puntuación 1) en lugar de la medida de
calidad real (Puntuación 2). Este método es menos costoso, pero también menos
preciso.

Realice un análisis de correlación para analizar la relación de las dos variables mediante
un diagrama de dispersión y el coeficiente de correlación

Utilizar la regresión para ver si la Puntuación 1 explica una cantidad significativa de


varianza en la Puntuación 2 y para determinar si la Puntuación 1 es un sustituto
aceptable para la Puntuación 2.

1 Ingrese los datos que se muestra a continuación:

Punt 01 4.1 2.2 2.7 6 8.5 4.1 9 8 7.5


Punt 02 2.1 1.5 1.7 2.5 3 2.1 3.2 2.8 2.5

Variable dependiente: Puntuación 2


Variable independiente: Puntuación 1

2. Se muestra el grafico de dispersión de puntos

Pag: 1/12
ESTADISTICA INDUSTRIAL ANÁLISIS DE REGRESIÓN SIMPLE
LABORATORIO

06 Ing. William León Velásquez wjleonv@yahoo.com SEM 2020-1

Una vez cargado la variable presionar el botón aceptar

De diagrama de Punt 01 – Punt 2 la serie de puntos presenta una tendencia


"ascendente” es decir existen entre las dos variables una "dependencia directa".
Además se muestra una fuerte correlación lineal positiva

Pag: 2/12
ESTADISTICA INDUSTRIAL ANÁLISIS DE REGRESIÓN SIMPLE
LABORATORIO

06 Ing. William León Velásquez wjleonv@yahoo.com SEM 2020-1

Calculo del Coeficiente de correlación

Correlaciones: Punt 01, Punt 2

Correlación de Pearson de Punt 01 y


Punt 2 = 0.978

Valor P = 0.000

El R nos indica que existe una fuerte correlación lineal positiva

por tanto, las predicciones que se realicen a partir de la recta de regresión serán fiables

Ho: Rho=0

Ha: Rho≠ 0

Coeficiente de correlación es diferente de 0

Como el valor de p es o.ooo y menor que 0.05 se rechaza la Ho

Se puede afirmar con un nivel de significancia del 5% que

Coeficiente de correlación es diferente de 0

Por lo tanto existe correlación a nivel poblacional

Pag: 3/12
ESTADISTICA INDUSTRIAL ANÁLISIS DE REGRESIÓN SIMPLE
LABORATORIO

06 Ing. William León Velásquez wjleonv@yahoo.com SEM 2020-1

2 Elija (Estadísticos)

> Regresión

> Regresión.

3 En Respuesta,
(dependiente), ingrese
Puntuación2.

4 En Predictores,
(independiente), ingrese
Puntuación1.

5 Haga clic en Aceptar.

Análisis de regresión: P02 vs. P01


Análisis de Varianza
Fuente GL SC Ajust. MC Ajust. Valor F Valor p
Regresión 1 2.54191 2.54191 156.56 0.000
P01 1 2.54191 2.54191 156.56 0.000
Error 7 0.11365 0.01624
Falta de ajuste 6 0.11365 0.01894 * *
Error puro 1 0.00000 0.00000
Total 8 2.65556
Resumen del modelo
R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
0.127419 95.72% 95.11% 93.17%

Coeficientes
EE del
Término Coef coef. Valor T Valor p FIV
Constante 1.118 0.109 10.23 0.000
P01 0.2177 0.0174 12.51 0.000 1.00

Ecuación de regresión
P02 = 1.118 + 0.2177 P01

Pag: 4/12
ESTADISTICA INDUSTRIAL ANÁLISIS DE REGRESIÓN SIMPLE
LABORATORIO

06 Ing. William León Velásquez wjleonv@yahoo.com SEM 2020-1

Ajustes y diagnósticos para observaciones pocos comunes


Resid
Obs P02 Ajuste Resid est.
9 2.5000 2.7502 -0.2502 -2.15 R
Residuo grande R

Interpretación de los resultados


Por opción predeterminada, Minitab muestra los resultados en la ventana Sesión.
VALIDACION DEL MODELO
Análisis de la Varianza
Ho: β1 =0 la correlación es 0
Ha: β1 ≠ 0 la correlación es diferente de 0

Rechazar Ho si el valor de p <= α

El valor p en la tabla Análisis de varianza (0.000), Se rechaza la hipótesis nula, indica


que la relación entre la Puntuación 1 y la Puntuación 2 es estadísticamente
significativa en un nivel a de 0.05.

Esto también lo muestra el valor p del coeficiente estimado de la Puntuación 1, el cual


es 0.000.

El valor de R2 muestra que la Puntuación 1 explica el 95.7% de la varianza en la


Puntuación 2, lo que indica que el modelo se ajusta a los datos extremadamente bien.

La Observación 9 se identifica como una observación inusual porque su residuo


estandarizado es menor que -2. Esto podría indicar que esta observación es un valor
atípico..

Debido a que el modelo es significativo y explica una gran parte de la varianza en la


Puntuación 2, el fabricante decide utilizar la Puntuación 1 en lugar de la Puntuación 2
como una medida de calidad para el producto.

Pag: 5/12
ESTADISTICA INDUSTRIAL ANÁLISIS DE REGRESIÓN SIMPLE
LABORATORIO

06 Ing. William León Velásquez wjleonv@yahoo.com SEM 2020-1

GRAFICOS DE LOS RESIDUALES

Para analizar los residuales gráficamente repita los pasos anteriores y en la ventana
de dialogo Regresión hacer clic en Gráficos

Para visualizar los gráficos en un solo cuadro, active el botón Cuatro en uno

Pag: 6/12
ESTADISTICA INDUSTRIAL ANÁLISIS DE REGRESIÓN SIMPLE
LABORATORIO

06 Ing. William León Velásquez wjleonv@yahoo.com SEM 2020-1

Gráfica de probabilidad normal de residuos: Los puntos de esta gráfica deben generalmente formar
una línea recta si los residuos se están normalmente
distribuidos. Si los puntos en la gráfica salen de una
línea recta, el supuesto de normalidad puede ser
inválido. Si sus datos tienen menos de 50
observaciones, la gráfica podría mostrar una curvatura
en las colas, aun si los residuos están normalmente
distribuidos. A medida que el número de observaciones
disminuye, la gráfica de probabilidad podría mostrar
una variación sustancial no linealidad, aun si los
residuos están normalmente distribuidos. Utilice la
gráfica de probabilidad y las pruebas de bondad de
ajuste, tales como el estadístico de Anderson-Darling,
para evaluar si los residuos están normalmente distribuidos.

Residuos versus ajustes: Esta gráfica debe


mostrar un patrón de residuos aleatorio en
ambos lados de 0. Si uno de los puntos se
encuentra lejos de la mayoría de los puntos,
podría tratarse de un valor atípico. Además, no
debería haber ningún patrón reconocible en la
gráfica de residuos. Lo siguiente podría
indicar un error que no es aleatorio:
 Una serie de puntos crecientes o
decrecientes
 La predominancia de residuos positivos o una predominancia de residuos negativos
 Patrones, tales como residuos crecientes, con ajustes crecientes

Histograma de residuos: Una herramienta exploratoria que muestra las características


generales de los datos, incluyendo:

- Valores típicos, dispersión o variación y


forma

- Valores inusuales en los datos

La presencia de largas colas en la gráfica podría


indicar sesgo en los datos. Si una o dos barras
están lejos de las demás, esos puntos pueden
ser valores atípicos. Debido a que el aspecto del
histograma cambia según el número de
intervalos utilizados para agrupar los datos,
utilice la gráfica de probabilidad normal y las pruebas de bondad de ajuste para evaluar la
normalidad de los residuos.

Residuos versus orden: Esta es una gráfica de


todos los residuos en el orden en el que se
colectaron los datos y puede utilizarse para hallar
errores no aleatorios, especialmente de efectos
relacionados con el tiempo. Una correlación
positiva es indicada por un conglomerado de
residuos con el mismo signo. Una correlación
negativa es indicada por los cambios rápidos en los
signos de residuos consecutivos.

Pag: 7/12
ESTADISTICA INDUSTRIAL ANÁLISIS DE REGRESIÓN SIMPLE
LABORATORIO

06 Ing. William León Velásquez wjleonv@yahoo.com SEM 2020-1

ESTIMAR VALORES

Intervalos de predicción para nuevas observaciones: Escriba valores predictores numéricos o ingrese
las columnas o constantes en las que se almacenan. El número de predictores debe ser igual que el
número de predictores en el modelo.

Nivel de confianza: Escriba el nivel de confianza deseado (por ejemplo, escriba 90 para 90%). El valor
predeterminado es 95%

Por ejemplo, si se ingresa 6

El resultado adicional será:.

Predicción para P02


Ecuación de regresión
P02 = 1.118 + 0.2177 P01
Configuración
Valor de
Variable configuración
P01 6
Predicción
Ajuste EE de ajuste IC de 95% IP de 95%
2.42373 0.0426313 (2.32292; 2.52454) (2.10602; 2.74144)

Intervalo de predicción: Representa un rango en el que probablemente una nueva


observación individual se incluya en la configuración especificada dada de los
predictores.

Pag: 8/12
ESTADISTICA INDUSTRIAL ANÁLISIS DE REGRESIÓN SIMPLE
LABORATORIO

06 Ing. William León Velásquez wjleonv@yahoo.com SEM 2020-1

Intervalo de confianza de la predicción: Representa un rango en el que


probablemente la respuesta media se incluya en la configuración especificada dada de
los predictores.

El intervalo de predicción siempre es más ancho que el intervalo de confianza


correspondiente debido a la incertidumbre agregada incluida en la predicción de una
respuesta versus la respuesta media.

GRAFICA DE LA LINEA AJUSTADA

Desde la ventana de dialogo Grafica de la línea ajustada seleccionar las variables

Presione el botón opciones: Active las casillas para visualizar el intervalo de confianza
y el de predicción

Pag: 9/12
ESTADISTICA INDUSTRIAL ANÁLISIS DE REGRESIÓN SIMPLE
LABORATORIO

06 Ing. William León Velásquez wjleonv@yahoo.com SEM 2020-1

Pag: 10/12
ESTADISTICA INDUSTRIAL ANÁLISIS DE REGRESIÓN SIMPLE
LABORATORIO

06 Ing. William León Velásquez wjleonv@yahoo.com SEM 2020-1

PROBLEMAS PROPUESTOS

1. Un proyecto de investigación fue emprendido para determinar si hay una relación


entre los años de servicio y el rating de eficiencia de los empleados.

El objetivo del estudio es predecir el rating


de eficiencia de un empleado basado en los
años de servicio. Los resultados de una
muestra de empleados son:

empleado años de rating de


servicio eficiencia
Cristina 1 6
Jessica 20 5
Lizbeth 6 3
Judith 8 5
Claudia 2 2
Paola 1 2
María 15 4
Myrna 8 3
a. Realizar un análisis de correlación
b. Obtenga la ecuación de regresión
c. Verifique si es válida para la población
d. Calcule y luego muestre el intervalo de confianza y de predicción al 95%, para
el valor de Y, cuando X = 7.

2. El departamento de producción de una compañía manufacturera quiere


explorar la relación entre el número de
personas que realizan un ensamble y
el número de unidades producidas.
Como experimento se asignaron a
diferentes números de trabajadores a
realizar el ensamble durante un
periodo de una hora, los resultados de
las unidades producidas por hora
fueron los siguientes:

número de unidades producidas


ensambladores en una hora
2 15
4 25
1 10
5 40
3 30

a. Realizar un análisis de correlación


b. Obtenga la ecuación de regresión
c. Verifique si es válida para la población
d. Para 6 ensambladores cuantas unidades por hora se producirá Calcule y luego
muestre el intervalo de confianza y de predicción al 95%,

Pag: 11/12
ESTADISTICA INDUSTRIAL ANÁLISIS DE REGRESIÓN SIMPLE
LABORATORIO

06 Ing. William León Velásquez wjleonv@yahoo.com SEM 2020-1

3. ¿Se desea saber cuál será el gasto familiar por semana en comida, si se tiene
como información el tamaño de la familia?
De una muestra de 10 familias en una gran ciudad se obtuvo los siguientes datos
que se muestra a continuación indicando el tamaño de la familia y sus gastos en
comida a la semana.

tamaño de la familia gastos en comida


($)
3 99
6 104
5 151
6 129
6 142
3 111
4 74
4 91
5 119
3 91

a. Realizar un análisis de correlación


b. Obtenga la ecuación de regresión
c. Verifique si es válida para la población
d. Calcule y luego muestre el intervalo de confianza y de predicción al 95%, para
el valor de Y, cuando X = 7.

4. En base a la siguiente muestra de 12 casas en una ciudad importante, Determine la


relación entre el tamaño de la casa (en cientos de pies cuadrados), y su precio (en
miles de dólares).

Tamaño de la casa Precio de la casa


(cientos de pies ( miles de dólares )
cuadrados)
14 100
13 110
12 105
11 120
14 80
10 105
13 110
8 85
12 105
9 75
11 70
11 95

a. Realizar un análisis de correlación


b. Obtenga la ecuación de regresión
c. Verifique si es válida para la población
d. Calcule y luego muestre el intervalo de confianza y de predicción al 95%, para
el valor de Y, cuando X = 15.

Pag: 12/12

También podría gustarte