Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADISTICA INFERENCIAL I
GRUPO:31B
ACTIVIDAD: INVESTIGACION TEORICA
UNIDAD : V
HORA: 16:00-17:00
Los modelos de regresión lineal son relativamente sencillos y proporcionan una
fórmula matemática fácil de interpretar que puede generar predicciones. La
regresión lineal puede aplicarse a varias áreas de la empresa y de los estudios
académicos.
Uno de los aspectos más relevantes de la Estadística es el análisis de la relación o
dependencia entre variables. Frecuentemente resulta de interés conocer el efecto
que una o varias variables pueden causar sobre otra, e incluso predecir en mayor
o menor grado valores en una variable a partir de otra. Por ejemplo, supongamos
que la altura de los padres influyen significativamente en la de los hijos.
Podríamos estar interesados en estimar la altura media de los hijos cuyos padres
presentan una determinada estatura.
Los métodos de regresión estudian la construcción de modelos para explicar o
representar la dependencia entre una variable respuesta o dependiente (Y ) y la(s)
variable(s) explicativa(s) o dependiente(s), X . En este Tema abordaremos el
modelo de regresión lineal, que tiene lugar cuando la dependencia es de tipo
lineal, y daremos respuesta a dos cuestiones básicas:
• ¿Es significativo el efecto que una variable X causa sobre otra Y ? ¿Es
significativa la dependencia lineal entre esas dos variables?.
• De ser así, utilizaremos el modelo de regresión lineal simple para explicar y
predecir la variable dependiente (Y ) a partir de valores observados en la
independiente (X).
Este modelo se considera un predictor x y una variable dependiente o
respuesta Y. Imagina que la verdadera relación entre Y y x es una línea recta y
que la observación Y en cada nivel x es una variable aleatoria.
E(Y/x) = 0 + β1 x
EJEMPLO.
Suponga que los gastos de publicidad semanales se usan para determinar el efecto
de la publicidad sobre las ventas. La relación entre el ingreso por ventas (𝑦) y el
gasto en publicidad (𝑥) se expresa como el modelo estadístico:
𝑦 = 𝛽0 + 𝛽1 𝑥 + 𝜀 = 0 + 20𝑥 + 𝜀
Observe que la componente del modelo 20𝑥 indica que si se gasta $1 en publicidad,
el ingreso por ventas será igual a $20. Sin embargo, al error aleatorio en el modelo
indica que el ingreso por ventas no se relaciona de manera precisa con el gasto de
publicidad. Es decir, la componente de error aleatorio (𝜀) indica que el ingreso por
ventas puede depender de otras variables distintas al gasto de publicidad.
𝑛 𝑛
Entonces:
𝑠 4.9
= = 1.64 (𝑒𝑟𝑟𝑜𝑟 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 𝑑𝑒𝑙 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑟𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛 𝑙𝑖𝑛𝑒𝑎𝑙)
√𝑆𝐶𝑋𝑋 √8.88
̂1 −𝛽
𝛽 ̂10
𝑖𝑖𝑖) El estadístico de prueba 𝑡𝑐 = ( )√𝑆𝐶𝑋𝑋
𝑠
Regla de decisión
Recordemos que (n - 2)= 8 – 2 = 6 grados de libertad.
0.001 1−0.001
Rechazar 𝐻0 si 𝐶𝐶: 𝑡𝑐 < 𝑡𝑡𝑎𝑏𝑙𝑎𝑠 ( ) = −3.707 𝑜 𝑡𝑐 > 𝑡𝑡𝑎𝑏𝑙𝑎𝑠 ( ) = 3.707
2,6 2,6
Por último, 7.96 = 𝑡𝑐 > 3.707, se rechaza la hipótesis nula 𝐻0 : 𝛽1 = 0. Por lo tanto,
se concluye que la recta de regresión poblacional no tiene pendiente 0, así que al
1% de significancia se puede decir que existe una relación lineal 𝑥 y 𝑦 en la
población.
La calidad del ajuste de una regresión lineal simple, permite verificar la calidad con
la que el modelo planteado permite hacer estimaciones. Se necesita conocer qué
tanta variabilidad en Y fue explicada por el modelo, si se cumplen los supuestos
de normalidad en los residuos y si la variación no tiene ningún patrón fuera de lo
usual.
La presentación de varios criterios para evaluar la calidad del modelo tiene el
propósito de destacar que los buenos modelos se construyen a medida que
cumplen más criterios de calidad de ajustes. El no cumplimiento de alguno de los
criterios, no hará necesariamente inviable el modelo desde el punto de vista
práctico. Entre los criterios que utilizamos para la evaluación de la calidad del
ajuste, se encuentran:
EJEMPLO
En estadística inferencial, específicamente en inferencia predictiva, un intervalo de
predicción es una estimación de un intervalo de valores en el que se producirá una
observación futura con determinada probabilidad, dado lo que ya se ha observado.
Los intervalos de predicción se utilizan a menudo en análisis de la regresión.
Entonces tomaremos como estimaciones de β0 y β1 , que notamos por β0 y β1, aquellos valores que
hagan mínima la suma de los errores al cuadrado, que viene dada por:
ˆ ˆ
β0 = −y − β1−x
Siendo:
ˆ ˆ ˆ
A la recta resultante Y = β0 + β1X se le llama recta de regresión lineal de Y sobre X.
Un último parámetro a estimar en el modelo es la varianza de los errores (σ2). A su estimador
se le denomina varianza residual y viene dada por:
ˆ P n
^ 2 SSE i =1 e2i SS yy − β 1 SS xy
sR = = =
n−2 n−2 n−2
Ejemplo : Referentes a la cantidad de compresion (Y ) de un material aislante a diferentes
niveles de presión (X), vamos a determinar la recta de regresión.
SSxy = 7,SSxx = 10
luego
ˆ ˆ
β0 = −y − β1−x = −0.1
La recta de regresión de Y sobre X es por tanto:
ˆY = −0.1 + 0.7X