Prácticai Regresion Simple

++++
REGRESIÓN
Práctica No. I LINEAL
SIMPLE
Aplicar, desarrollar y analizar las técnicas de
regresión lineal simple para hacer predicciones de
sucesos futuros en el ramo empresarial..
MANUAL DE PRÁCTICAS ESTADÍSTICA II
Práctica No. I
REGRESIÓN LINEAL SIMPLE
Objetivo:
Aplicar, desarrollar y analizar las técnicas de regresión lineal simple para hacer
predicciones de sucesos futuros en el ramo empresarial.
Introducción:
La regresión es una técnica estadística que se utiliza para resolver problemas comunes
en el ramo empresarial, la cual consiste en un método matemático que modela la
relación lineal entre dos variables, una llamada variable dependiente, la cual suponemos
se ve afectada por los cambios producidos por una variable independiente, y un término
aleatorio (comúnmente llamado error).
A menudo, se intenta determinar la relación que existe entre un par de variables, por
ejemplo: ¿Existe una relación entre el promedio obtenido por un alumno a nivel
preparatoria y el promedio obtenido a nivel profesional? , ¿Las ventas se ven afectadas
por los gastos de publicidad? etc.
En muchas situaciones, los valores de las variables no se determinan simultáneamente
en el tiempo; más bien, se ajusta una de las variables a un determinado valor, y éste por
su parte, afecta el valor de la segunda variable. Por ejemplo, el presupuesto dedicado a
mercadotecnia se suele decidir antes de que estén determinadas las cifras de ventas, y la
cantidad de catalizador empleado en un experimento se suele establecer antes de que se
pueda determinar el resultado del mismo. La variable cuyo valor se determina con
anterioridad recibe el nombre de variable de entrada, variable predictora o variable
independiente, mientras que a la otra se le conoce como variable de salida, variable
respuesta o dependiente.
Las observaciones las clasificamos en dos tipos de datos, x, y donde x es la variable
independiente y y la variable dependiente.
Instituto Tecnológico de Querétaro

Regresión Lineal Simple
M.C. G. Patricia Yscapa Morán
1
El tipo de relación más sencilla entre este par de variables es la relación que se establece
mediante una línea recta, o relación lineal, en la forma:
y= β 0 +β 1 x
Sin embargo, este modelo supone que (una vez que los parámetros
β 0 y β 1 estén
determinados) es posible predecir exactamente la respuesta a cualquier valor de la
variable de entrada. En la práctica, tal precisión casi nunca es alcanzable, de modo que
lo máximo que se puede esperar es que la anterior ecuación sea válida sujeta a un error
aleatorio.
Consideremos un par de variables, una de las cuales será denominada variable de
entrada y la otra, variable de respuesta. Supongamos que para un valor dado, x, de la
variable de entrada, la variable de respuesta, Y, se puede expresar en la forma:
y= β 0 +β 1 x +e i
Los elementos
β 0 y β 1 son parámetros. Se asume que la variable e, denominada
error aleatorio, es una variable aleatoria con media 0.
La relación entre la variable de respuesta, y, y la variable de entrada, x, especificadas
ambas en la anterior ecuación (nótese que es una ecuación de primer orden), se
denomina regresión lineal simple.
Los parámetros
β 0 y β 1 serán, por lo general, desconocidos y se deberán estimar
a partir de los datos muestrales.
De ahí que el modelo que encontremos quede definido como:
^y = β^ 0 + β^ 1 x
^ β^ 1 es la pendiente de la recta o lo que hace
En donde β 0 es la ordenada al origen y
cambiar x a y.
En primer lugar para determinar si existe una relación lineal entre x e y, podemos
hacerlo gráficamente para ello es necesario graficar la pareja de datos en un plano
cartesiano, relacionando la pareja (x,y).
El diagrama de dispersión es la representación mediante el eje cartesiano de estos datos.
En donde de forma visual podremos observar si hay alguna relación entre el par de
variables y de que tipo es.

2
Correlación fuerte positiva Correlación fuerte negativa Correlación débil positiva

( y aumenta claramente ( y disminuye claramente ( y aumenta algo cuando
cuando aumenta x) cuando aumenta x) aumenta x
Correlación débil positiva Correlación compleja ( y Correlación nula (no hay

( y disminuye algo cuando parece relacionarse con x relación entre x y y)
aumenta x) pero no de un modo lineal) Los puntos en el diagrama
no tienen un patrón u orden
aparente.
Fig. 1.1 Tipos de correlación.
El Diagrama de Dispersión se puede utilizar para estudiar:
 Relaciones causa-efecto. Este es el caso más común en su utilización para la

mejora de la calidad. Se utiliza el diagrama a partir de la medición del efecto
observado y de su posible causa. Comprobar la relación entre el número de
errores y la hora en que se cometen.
 Relaciones entre dos efectos. Sirve para contrastar la teoría de que ambos
provienen de una causa común desconocida o difícil de medir. Analizar la

3
relación entre el número de quejas que llegan y el aumento o disminución de las

ventas, suponiendo que los dos dependen del nivel de satisfacción del cliente.
 Posibilidad de utilizar un efecto como sustituto de otro. Se puede utilizar para
controlar efectos difíciles o costosos de medir, a través de otros con medición
más simple. Estudiar la relación existente entre reducción de costos y
satisfacción del cliente para utilizar el parámetro de más fácil medición en la
evaluación de las actividades de planificación.
Una vez realizada la nube de dispersión se puede observar si el modelo corresponde

una ecuación de primer orden, es decir un modelo lineal. Los parámetros son los que
dan forma gráfica al modelo.
Hay tres posibles formas para la línea recta descrita por el modelo de regresión
lineal simple y son:
^y = β^ 0 + β^ 1 x ^y = β^ 0 − β^ 1 x ^y = β^ 0
β 1 >0 β 1 <0
β 1=0
Fig. 1.2 Tendencias del modelo lineal.

El valor de β 1 representa la magnitud en que la variable x influye sobre el
comportamiento de la variable y.
Mientras mayor sea el valor absoluto de β 1 , se tiene mayor influencia de x sobre

y.
 Cuando β 1 >0, implica que a medida que aumenta x, aumenta y de ahí que la
pendiente sea positiva.

4
 Cuando β 1 <0, implica que a medida que aumenta x , disminuye y, de ahí que
la pendiente sea positiva
 Cuando β 1 =0, implica que a medida que aumenta x, y permanece constante,

de ahí que el cambio de y por x sea nulo, es decir 0.
Ejemplo 1.1:
Se pidió a los alumnos de un curso de estadística II llenaran un formulario con los
siguientes datos.
Prom. Calificac Tiempo Calific.

Prom. Edad Estatura Número
del ión que Calific. Estadísti
Estatura Peso de promedi promedi de Cálculo
Género Edad Semestr Cálculo dedicas Probabil ca
(en cm) (en Kg) bachille o de tus o de tus herman integral
e diferenc a hacer idad Inferen.
rato papás papás os
Anterior ial ejercicio lI
Tabla 1.1 Variables encuestadas.
Una vez obtenidos intuitivamente propusieron una relación entre la calificación
obtenida en la asignatura de Probabilidad (variable predictora x) y la obtenida en
Estadística I (variable respuesta y )
Se sugirió realizar un diagrama de dispersión para realizar el análisis gráfico (diagrama

de dispersión) que pudiera sugerir una relación entre ambas variables
Calificación Calificación Calificación Calificación

obtenida en obtenida en obtenida en obtenida en
Probabilidad Estadística I Probabilidad Estadística I
72 82 83 83
85 87 86 83
85 90 82 91
84 80 84 88
80 84 83 87
86 83 93 92
95 87 80 85
80 81 75 80
73 80 88 90
74 75 78 81
84 87 70 70
90 90 82 78
90 88 85 78
70 75 86 87
84 86 93 95
5
74 85 71 78
96 95 80 81
96 95 100 95
96 95 77 75
80 78 84 86
70 74 80 78
87 90 83 84
85 76 90 86
75 77 90 92
Tabla 1.2 Valores de variables independiente y variable dependiente.
Uticemos MINITAB para construir el diagrama de dispersión
Gráfica de dispersión de Calif Estad y vs. Calif Prob x
95
90
Calif Estad y
85
80
75
70
70 75 80 85 90 95 100
Calif Prob x
Fig. 1.3 Gráfica de dispersión.
Interpretando el diagrama podemos suponer que existe una relación entre la calificación
obtenida en la asignatura Probabilidad y la calificación de la asignatura Estadística I de
tal forma que a mayor precio calificación en la asignatura Probabilidad la calificación
de la asignatura Estadística I aumenta, es decir la relación es fuerte positiva, y el modelo
lineal es el apropiado para esta colección de datos.
Estimación de los parámetros de regresión
Si pretendemos estimar los valores de

y i correspondientes a los valores de entrada
xi i=1.....n para estimar los parámetros β 0 y β 1 del modelo de regresión
lineal simple
y= β 0 +β 1 x +e i primero debemos determinar los estimadores de β 0

6
^ β^ 1 fueran los
y β 1 , utilizando los valores muestrales entonces: si β 0 y
estimadores respectivos de
β 0 y β 1 , el estimador de la respuesta correspondiente a
la entrada
x i sería ^y = β^ 0 + β^ 1 x .
A la diferencia entre la respuesta observada y su valor estimado lo conocemos como el
error que se deriva de usar los estimadores β^ 0 y β^ 1 para predecir la respuesta al
valor de entrada
xi .
Donde:
e i≡ y i −( { β^ ¿ ¿ 0 + β^ 1 x )= y i− y^ i
¿
Para elegir como estimadores de α y β debemos encontrar a aquellos valores α
¿
y β que hagan que estos errores sean pequeños.
n
Se elegirán aquellos valores de β^ 0 y β^ 1 que minimicen el valor de ∑i e i2 , la

suma de los cuadrados de los errores.
Los estimadores de
β 0 y β 1 resultantes de este procedimiento reciben el nombre
de estimadores de mínimos cuadrados.
n n
2
∑ e i2=∑ ( y i− β^ 0 + β^ 1 )
i =1 i =1
Se puede demostrar que los estimadores de mínimos cuadrados de

β 0 y β 1 que se
¿ ¿
denotarán por α y β , vienen dados por:
Fórmulas Conceptuales
n ¿ ¿
¿
∑ xy −n x y
i=1
β 1= n ¿
∑ x i2−n x 2
i=1
¿ ¿ ¿ ¿
β 0 = y −β 1 x
Donde

7
n n
¿
∑ xi ¿
∑Yi
i=1 i=1
x= y=
n y n
Sea:
n n
¿
S xy =∑ (x i −x )( y i −̄¿ ȳ )=∑ xi y i −
∑x∑ y ¿
i= i=1 n
n
n n ( ∑ x i )2
¿
i=1
S xx =∑ ( x i −x )2 =∑ xi2−
i= i=1 n
n
( ∑ y i )2
∑x∑ y n
¯ ȳ )2=∑ y i2−
n
i=1
∑ xy − n
S yy =∑ ( y i −¿
n
¿
i=1 i=1
Fórmulas simplificadas
Por tanto
¿ S xY
β 1=
S xx
¿ ¿ ¿ ¿
β 0 = y −β 1 x
La ecuación de regresión obtenida es:
Calific. Estadistica = 26.5 + 0.694 Calific. Probabilidad
Interpretación β 0
^
Interpretación β^ 1
De acuerdo a los datos obtenidos la ^
Debido a que β 1 b tiene un valor
ordenada al origen corta al eje Y en el
positivo, la pendiente de la recta es
punto (0, 26.5).
positiva. Por cada punto que aumenta la
calificación de probabilidad , la
calificación de estadística aumenta en
0.694
^ ^
Tabla 1.3 Interpretación para β 0 y β 1
Significancia de la regresión

8
Para realizar la significancia del modelo recurrimos al Análisis de Varianza (ANOVA)

el cual parte la variabilidad total en dos componentes uno debido al modelo y otro
debido al error
Gráfica de dispersión de Calificación obt vs. Calificación obt
95 yi ŷ
Variabilidad
Calificación obtenida en Estads
Debida al
90 Variabilidad eroralalalerro
Total rVariabilidad
Debida al
85 modelo
͞y
80
75
70
70 75 80 85 90 95 100
Calificación obtenida en Probab
Fig. 1.4 Descomposición de la variabilidad.
Variabilidad total = Variabilidad del modelo + Variabilidad del error

SSTotales =SS Modelo + SS Error
n n n
¯ ȳ ) =∑ ( y i −̄¿ ȳ ) + ∑ ( y i −̄¿ y i )2 ¿ ¿ ¿
∑ ( yi −¿ 2 2
i =1 i=1 i=1
Resumiendo la información en la siguiente tabla:
ANOVA
Fórmulas conceptuales
Fuente df SS MS F
n SS Modelo MS Modelo
Regresión k
∑ ( yi−¿¯ ȳ )2 ¿ k MS Error
i=1
n SSerror
Error n-k-1
residual ∑ ( yi−¿¯ yi )2 ¿ n−k −1
i=1

9
n
Total n-1
∑ ( yi−¿¯ ȳ )2 ¿
i=1
Tabla 1.4 Fórmulas conceptuales para la tabla ANOVA.
La primera columna contiene las fuentes de variación

Regresión, Error residual, Total
La segunda columna corresponde a los grados de libertad

Modelo k = número de variables predictoras
Error n-k-1 = número total de observaciones menos número de variables regresoras
menos 1
Total n-1 = número total de observaciones menos1
La tercera columna contiene las sumas de cuadrados de las desviaciones
La cuarta columna el componente de varianza para el modelo y el error.
La quinta columna el valor de F
El análisis de varianza anterior postula las siguientes hipótesis:

H o ; β 1 =0
H o ; β 1 ≠0
La hipótesis nula supone que ; β 1=0 , como β 1 es la razón de cambio esto sugiere
que no hay cambio alguno de la variable respuesta debido a la variable predictora.
La hipótesis nula será rechazada si la variabilidad del modelo es mayor a la variabilidad
del error, si esto ocurre, x (variable predictora) le es significativa a y (variable
respuesta) pues lo hace variar cuando ella varia.
H o ; β 1 =0
H o ; β 1 ≠0
ANOVA
Simplificada
Fuente df SS MS F
n
Regresión k ∑ x∑ y SS Modelo MS Modelo
β^ S xy = β^ ∑ x i y i−
i=1 n k MS Error
Error n-k-1 SS Totales −SS Modelo SSerror
residual n−k −1

10
n
Total n-1
n ( ∑ y i )2
i =1
∑ y 2i − n
i =1
Tabla 1.5 Fórmulas simplificada para la tabla ANOVA.
Para nuestro ejemplo

H o ; β 1 =0
H o ; β 1 ≠0
ANOVA
Fuente df SS MS F P
Regresión 1 1302.1 1302.1 95.63 0.000
Error
45 626.3 13.6
residual
Total 47 626.3
Tabla 1.6 ANOVA para el ejemplo. 1.1
Finalmente concluyamos e interpretemos
Conclusión Interpretación
Como Existe evidencia suficiente para
P vs α decir que la calificación obtenida
0.000 0.02 en probabilidad si predice la
Como P > α se rechaza
H 0 ; β 1=0 calificación que se obtiene en
estadística.
Tabla 1.7 Conclusión e Interpretación de ANOVA para el ejemplo. 1.1
Análisis de Correlación.
El análisis de correlación nos muestra a través del coeficiente de determinación r2 y el

coeficiente de correlación r que tan bien le queda el modelo propuesto a nuestros datos.
El coeficiente de determinación mide por un lado el porcentaje de la variabilidad
explicada por el modelo sabemos que:

SSTotales =SS Modelo + SS Error
entonces
SS Modelo
r2 =
SSTotales
En nuestro ejemplo sabemos que:
1928.479167 626.3363934 1302.090677
SS TOTALES SSERROR SSMODELO

11
Tabla 1.8 Suma de cuadrados para el ejemplo. 1.1

SS Modelo 1302. 1
r2 = = =0 .675
De ahí que: SSTotales 1928 . 47916
2
r =0.675 El 67.5% de la variabilidad total se ve explicada por el
r2=67.5% modelo
Tabla 1.9 Interpretación del coeficiente de determinación para el ejemplo. 1.1
El coeficiente de correlación es simplemente la raíz cuadrada del coeficiente de

determinación
SS Modelo
r= √ r 2 =
1302. 1
√ SSTotales
Conclusión
r
=
√ 1928 . 47916
=√0 . 675=.822
Interpretación
r = 0.822
El 82.2% de las variables (x,y) están relacionadas
r =82.2%
Tabla 1.10 Interpretación del coeficiente de correlación para el ejemplo. 1.1
¿Pero cuál es el valor aceptable para r2?

Resulta arriesgado dar una respuesta única a esta pregunta, el contexto donde se utilice
el modelo y finalmente el criterio del analista decidirá cual valor es el apropiado. No es
lo mismo que el modelo se use en la industria farmacéutica o de aviación que en el
análisis de una empresa de comportamiento humano. En el primer caso quizá se
requieran valores de r2 por arriba del 99% y en el segundo caso un r2 del 70% sería
suficiente.
Finalmente el criterio del analista tiene la sensibilidad para conocer cuando un valor de
r2 es adecuado de acuerdo a la situación a la que se esté enfrentando.
Correlación con el programa:
Tema1 Regresión lineal simple y correlación.
1.1 Modelo de regresión simple.

12
1.3 Determinación de la ecuación de regresión.

1.8 Aplicaciones.
Material y equipo:
 Computadora
 Excel
Metodología:
Resolvamos el problema planteado utilizando Excel, encontrando la ecuación de

regresión con las fórmulas conceptuales y las fórmulas simplificadas y posteriormente,
la Adecuación del Modelo con las fórmulas conceptuales y las simplificadas.
1. Abre un libro Excel y llámalo Práctica Regresión Simple, captura la tabla del
ejemplo en una hoja que llames Regresión.
Fig. 1.5 Preparación de la Hoja de Trabajo.

13
2. Prepara la hoja de cálculo insertando las siguientes columnas:

Calif Prob Calif Estad
xy x2
x y
3. Obtén el promedio de las variables x y y
Fig. 1.6 Insertar función PROMEDIO.
Posiciónate al final de la(s) columnas que contienen la(s) variable(s) y escribe el signo
=, presiona fx selecciona la categoría Estadísticas y selecciona la función PROMEDIO
Fig. 1.7 Argumentos de la función PROMEDIO
haz click en Aceptar aparece el sig. Cuadro de diálogo.
Selecciona desde la columna A2 hasta la A49 Aceptar, aparecerá el PROMEDIO de la

variable x; realiza lo mismo con la variable y

14
Fig. 1.8 Resultados de la función PROMEDIO.

4. Utilizando las fórmulas conceptuales necesitamos obtener la suma de:
xy X2
Fig. 1.9 Resultados de la suma de columnas x, y, xy, x2.

Fórmulas Conceptuales
n ¿ ¿
¿
∑ xy −n x y 338287−48(84 . 229 )( 83. 208 )
i=1
β 1= n
= =0 . 694214
¿
2 335036−48(83 . 208)2
∑ x i2−n x
i=1
¿ ¿ ¿ ¿
β 0 = y −β 1 x =84 .229−0 .694214 (83 .208 )=26 . 464778
Posiciónate en la celda D67 y escribe β1 = ((C50-(48*A50*B50)))/(D50-

(48*(A50*A50)))
Posiciónate en la celda D71 y escribe β2 =B50-(O38*A50)

15
Fig. 1.10 Resultados de β1 y β2.

5. Para obtener la recta ajustada con las formulas simplificadas.
6. Calcula el valor de y2 posiciónate en la celda E2 y escribe =B2*B2, desliza el
cursor hasta la celda E49.
7. En la celda E50 y realiza la suma de la columna E50=SUMA(E2:E49)
¿ S xY 1875 .70833
β 1= = =0 . 694214
S xx 2701. 91667
¿ ¿ ¿ ¿
β 0= y −β 1 x =84 . 22916−0 .694214∗83 .20833=26. 46
Posiciónate en la celda O62 y escribe Sxy=C50-((A52*B52))/48
Fig. 1.11 Cálculo SXY.
Posiciónate en la celda O67 y escribe Sxx =D50-(A52*A52)/48

16
Fig. 1.12 Cálculo SXX
Posiciónate en la celda O71 y escribe Syy =E50-(B52*B52)/48
Fig. 1.13 Cálculo SYY

Quedando la Ecuación de regresión
¿ S xY 1875 .70833
β 1= = =0 . 694214
S xx 2701. 91667
¿ ¿ ¿ ¿
β 0= y −β 1 x =84 . 22916−0 .694214∗83 .20833=26. 46
^y i=26. 464 +. 6942 x
Interpretación β 0
^
Interpretación β^ 1
De acuerdo a los datos obtenidos la ^
Debido a que β 1 b tiene un valor
ordenada al origen corta al eje Y en el
positivo, la pendiente de la recta es
punto (0, 26.5).
positiva. Por cada punto que aumenta la
calificación de probabilidad , la
calificación de estadística aumenta en
0.694

17
Tabla 1.11 Interpretación β0 y β1 para el ejemplo. 1.1
8. Inserta en la hoja de trabajo las siguientes columnas:
Calculemos el valor de las celdas de la siguiente forma:

yajustada Celda F2=26.464+(0.6942*A2)
Fig. 1.14 Cálculo yajustada
Selecciona la celda y aparecerá un signo más deslízalo hacia abajo y aparecerán los
valores ajustados para cada valor de x.
9. Para encontrar la celda . Posiciónate en la celda G2=(B2-$B$50)* (B2-

$B$50), el signo de pesos
10. es para dejar fija la casilla B50 que es donde se encuentra ȳ .
Fig. 1.15 Cálculo (y-ymedia)22 y su SUMA
Realice la misma operación que en la celda F para encontrar todos los valores y al final
obtén la suma. En la celda G50 =SUMA (G2:G49)
 2
11. Para encontrar la celda ( y i  y i ) En la celda H2 escriba =(B2-F2)*(B2-F2)

18
Fig. 1.16 Cálculo (y-yajustada)2 y su SUMA
Realice la misma operación que en la celda G para encontrar todos los valores y al
final obtén la suma H50= SUMA (H2:H49)
12. Para encontrar la celda Posiciónate en la celda I2= (F2-$B$50)*(F2-$B$50)
el signo de pesos es para dejar fija la casilla $B$50 que es donde se encuentra ȳ .
Fig. 1.17 Cálculo (yajustada- ymedia)2 y su SUMA

Realice la misma operación que en la celda F para encontrar todos los valores y al final
obtén la suma. I50= SUMA(I2:I49).
13. Llena la tabla Anova con las Sumas encontradas
H o ; β 1 =0
H o ; β 1 ≠0
ANOVA
Fórmulas conceptuales
Véase ecuaciones 1.12, 1.13, 1.14
Fuente df SS MS F
1302. 090677 1302. 0906
Regresión 1 1302.090677 =1302. 09677 =95 . 629
1 13 .6160
Error 626 .3363
48-2= 46 626.3363934 =13 . 6160
residual 46
Total 48-1 =47 1928.47916
Tabla 1.12 ANOVA para el ejemplo. 1.1obtenida con fórmulas conceptuales
.

19
Gráfica de distribución
F, df1=1, df2=46
0.7
0.6
0.5
Densidad
0.4
0.3
0.2
0.1
0.04
0.0
0 4.467
X
Fig. 1.18 Gráfico valor de P
Como Existe evidencia suficiente para decir que
F α=.04, 1, 46 vs F α= , 1, 46 la calificación obtenida en probabilidad si
4.467 < 95.629 predice la calificación que se obtiene en
Se rechaza H0 estadística.
Tabla 1.13 Conclusión e interpretación para ANOVA en el ejemplo. 1.1
.
14. Para encontrar SS TOTALES, debemos incluir en nuestra hoja de trabajo la columna E
con los valores de
2
yi
En la celda E2 escriba=B2*B2
Fig. 1.19 Cálculo y2
Realice la misma operación que en la celda H para encontrar todos los valores y al final
obtén la suma. E50= SUMA(E2:E49).
15. Obtén la SS TOTALES posiciónate en la celda O71 =E50-((B52*B52)/48)

20
Fig. 1.20 Cálculo SS TOTALES

16. Obtén la SS Modelo posiciónate en la celda O75=D67*O62
Fig. 1.20 Cálculo SS Modelo
17. Finalmente llena la tabla ANOVA con los valores encontrados.
H o ; β 1 =0
H o ; β 1 ≠0
ANOVA
Simplificada
Véase ecuaciones 1.15, 1.16, 1.17

Fuente df SS MS F P
Regresión 1 1302.142955 1302.143 95.619 8.26E-13
Error 4
SS Totales –SS modelo=1928.479167-1302.142955
13.6160
residual =626.336212
6
4
Total 1928.479167
7
Tabla 1.14 ANOVA obtenida con fórmulas simplificadas en el ejemplo. 1.1

21
Gráfica de distribución
F, df1=1, df2=46
1.4
1.2
1.0
Densidad
0.8
0.6
0.4
0.2
8.2578E-13
0.0
0 f= 95.619
.
Fig. 1.21 Cálculo P para ANOVA.
Enfrentemos Existe evidencia suficiente para decir que la
P vs α calificación obtenida en probabilidad si
8.26E-13 < 0.05 predice la calificación que se obtiene en
Se rechaza H0 estadística.
Tabla 1.15 Conclusión e interpretación para ANOVA en el ejemplo. 1.1
.
18. Para encontrar el valor de r 2 posiciónate en la celda I65 =I50/G50
Fig. 1.22 Cálculo coeficiente de determinación.
2
r =0.675 El 67.5% de la variabilidad total se ve explicada por el
2
r =67.5% modelo
Tabla 1.16 Conclusión e interpretación para coeficiente de determinación en el
ejemplo. 1.1
19. Para encontrar el valor de r posiciónate en la celda I69=IM.RAIZ2(I65)

22
Fig. 1.23 Cálculo coeficiente de correlación.

r = 0.822
El 82.2% de las variables (x,y) están relacionadas
r =82.2%
Tabla 1.17 Conclusión e interpretación para coeficiente de correlación en el ejemplo.
1.1
Sugerencias didácticas:
1. Realizar visitas industriales con el objetivo de consultar casos reales de

aplicación de los conceptos de regresión lineal simple en las empresas.

23
2. Obtener información de la vida real para diseñar, y llevan a cabo la aplicación de

regresión lineal simple.
3. Realizar los ejemplos propuestos del libro en Excel y entregar un reporte escrito
según rúbrica.
4. Leer artículos referentes a la aplicación de regresión lineal simple.
5. Al final de la práctica y entrega del reporte que el alumno se autoevalúe
preguntándose algunos aspectos
Aspectos Si No Algo que Aportar Acciones
Soy capaz de
expresar de forma
ordenada y
comprensible todos
los conceptos
anteriores.
Soy capaz de analizar
un modelo de
regresión lineal
simple.
Soy capaz de utilizar
el Excel
Soy capaz de trabajar
sin interferir con los
demás.
Soy capaz de dar una
opinión de mi
desempeño
honestamente
Reporte del alumno:

Recopila información que permita la regresión lineal simple.
Reporte de los alumnos (según rúbrica en Anexo )
Competencia a 1. Aprender la metodología y los conceptos de la regresión

evaluar:
lineal simple.
2. Encontrar la ecuación de regresión lineal simple.
3. Llevar a cabo el análisis mediante Excell.
4. Analizar los resultados obtenidos haciendo inferencias para el

proceso relacionarlos para poder concluir y proporcionar en

24
forma adecuada recomendaciones.
5. Redactar un informe final.
6. Aplicar los conceptos de la regresión lineal simple.
Tipo de evaluación: Formativa

Criterios de evaluación:
 Realizar el reporte con los lineamientos marcados en rúbrica.
 Participar en la práctica.
 Manejo del software.
 Cumplir con fecha de entrega
Bibliografía:
1. Levin,Rubin,Balderas, Del Valle, Gómez Estadística para Administración y Economía

9ª Edición Editorial Pearson, Prentice Hall
2. Lind, Marchal, Wathen Estadística aplicada a los negocios y la economía 13 a Edición
Editorial Mc Graw Hill.
3. Walpole. Probabilidad y estadística. Editorial: Prentice-Hall
4. William Mendenhall, D. Wackerly, L. Scheaffer. 2 a Edición Estadística matemática con
aplicaciones. Grupo Editorial Iberoamericana.

25

Prácticai Regresion Simple

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Prácticai Regresion Simple

Cargado por

Copyright:

Formatos disponibles

++++

REGRESIÓN LINEAL SIMPLE

Instituto Tecnológico de Querétaro

Instituto Tecnológico de Querétaro

Correlación fuerte positiva Correlación fuerte negativa Correlación débil positiva

Correlación débil positiva Correlación compleja ( y Correlación nula (no hay

El Diagrama de Dispersión se puede utilizar para estudiar:

 Relaciones causa-efecto. Este es el caso más común en su utilización para la

Instituto Tecnológico de Querétaro

relación entre el número de quejas que llegan y el aumento o disminución de las

Una vez realizada la nube de dispersión se puede observar si el modelo corresponde

Fig. 1.2 Tendencias del modelo lineal.

Mientras mayor sea el valor absoluto de β 1 , se tiene mayor influencia de x sobre

Instituto Tecnológico de Querétaro

 Cuando β 1 =0, implica que a medida que aumenta x, y permanece constante,

Prom. Calificac Tiempo Calific.

Se sugirió realizar un diagrama de dispersión para realizar el análisis gráfico (diagrama

Calificación Calificación Calificación Calificación

Gráfica de dispersión de Calif Estad y vs. Calif Prob x

Fig. 1.3 Gráfica de dispersión.

Estimación de los parámetros de regresión

Si pretendemos estimar los valores de

xi i=1.....n para estimar los parámetros β 0 y β 1 del modelo de regresión

Instituto Tecnológico de Querétaro

error que se deriva de usar los estimadores β^ 0 y β^ 1 para predecir la respuesta al

Se elegirán aquellos valores de β^ 0 y β^ 1 que minimicen el valor de ∑i e i2 , la

Se puede demostrar que los estimadores de mínimos cuadrados de

Instituto Tecnológico de Querétaro

La ecuación de regresión obtenida es:

Calific. Estadistica = 26.5 + 0.694 Calific. Probabilidad

Instituto Tecnológico de Querétaro

Para realizar la significancia del modelo recurrimos al Análisis de Varianza (ANOVA)

Gráfica de dispersión de Calificación obt vs. Calificación obt

Fig. 1.4 Descomposición de la variabilidad.

Variabilidad total = Variabilidad del modelo + Variabilidad del error

Instituto Tecnológico de Querétaro

La primera columna contiene las fuentes de variación

La segunda columna corresponde a los grados de libertad

El análisis de varianza anterior postula las siguientes hipótesis:

Instituto Tecnológico de Querétaro

Para nuestro ejemplo

El análisis de correlación nos muestra a través del coeficiente de determinación r2 y el

explicada por el modelo sabemos que:

En nuestro ejemplo sabemos que:

1928.479167 626.3363934 1302.090677

SS TOTALES SSERROR SSMODELO

Tabla 1.8 Suma de cuadrados para el ejemplo. 1.1

El coeficiente de correlación es simplemente la raíz cuadrada del coeficiente de

¿Pero cuál es el valor aceptable para r2?

Correlación con el programa:

Tema1 Regresión lineal simple y correlación.

1.1 Modelo de regresión simple.

Instituto Tecnológico de Querétaro

1.3 Determinación de la ecuación de regresión.

Resolvamos el problema planteado utilizando Excel, encontrando la ecuación de

Fig. 1.5 Preparación de la Hoja de Trabajo.

Instituto Tecnológico de Querétaro

2. Prepara la hoja de cálculo insertando las siguientes columnas:

Fig. 1.6 Insertar función PROMEDIO.

haz click en Aceptar aparece el sig. Cuadro de diálogo.

Selecciona desde la columna A2 hasta la A49 Aceptar, aparecerá el PROMEDIO de la

Instituto Tecnológico de Querétaro

Posiciónate en la celda D67 y escribe β1 = ((C50-(48A50B50)))/(D50-