Investigacion Teorica U5

INSTITUTO TECNOLOGICO DE OAXACA
ESTADISTICA INFERENCIAL I
NOMBRE: ANTONIO DE JESUS BAUTISTA

PEREZ
CATEDRATICO: ING. SERGIO ISIDRO LOPEZ
PEREZ
GRUPO:31B
ACTIVIDAD: INVESTIGACION TEORICA
UNIDAD : V
HORA: 16:00-17:00
Los modelos de regresión lineal son relativamente sencillos y proporcionan una
fórmula matemática fácil de interpretar que puede generar predicciones. La
regresión lineal puede aplicarse a varias áreas de la empresa y de los estudios
académicos.
Uno de los aspectos más relevantes de la Estadística es el análisis de la relación o
dependencia entre variables. Frecuentemente resulta de interés conocer el efecto
que una o varias variables pueden causar sobre otra, e incluso predecir en mayor
o menor grado valores en una variable a partir de otra. Por ejemplo, supongamos
que la altura de los padres influyen significativamente en la de los hijos.
Podríamos estar interesados en estimar la altura media de los hijos cuyos padres
presentan una determinada estatura.
Los métodos de regresión estudian la construcción de modelos para explicar o
representar la dependencia entre una variable respuesta o dependiente (Y ) y la(s)
variable(s) explicativa(s) o dependiente(s), X . En este Tema abordaremos el
modelo de regresión lineal, que tiene lugar cuando la dependencia es de tipo
lineal, y daremos respuesta a dos cuestiones básicas:
• ¿Es significativo el efecto que una variable X causa sobre otra Y ? ¿Es
significativa la dependencia lineal entre esas dos variables?.
• De ser así, utilizaremos el modelo de regresión lineal simple para explicar y
predecir la variable dependiente (Y ) a partir de valores observados en la
independiente (X).
Este modelo se considera un predictor x y una variable dependiente o
respuesta Y. Imagina que la verdadera relación entre Y y x es una línea recta y
que la observación Y en cada nivel x es una variable aleatoria.
El modelo de regresión lineal simple se caracteriza por predecir la variable

dependiente a través de la siguiente ecuación:
E(Y/x) = 0 + β1 x
Donde la ordenada al origen β0 y la pendiente β1 son coeficientes desconocidos

de la regresión.
Algunos consejos que puedes tomar en cuenta al utilizar el modelo de regresión

lineal simple son:
 Debes tener cuidado al seleccionar las variables con las que se construyen las
ecuaciones de regresión y determinar la forma del modelo.
 Las relaciones de regresión sólo son válidas para los valores del regresor que
están dentro del rango de los datos originales.
Esta forma de análisis estima los coeficientes de la ecuación lineal, involucrando

una o a más variables independientes que mejor predicen el valor de la variable
dependiente. La regresión lineal se ajusta a una línea recta o a una superficie que
minimiza las discrepancias entre los valores de salida previstos y reales. Hay
calculadoras de regresión lineal simple que utilizan el método de “mínimos
cuadrados” para determinar la línea que mejor se ajusta para un conjunto de datos
pareados. A continuación, se calcula el valor de X (variable dependiente) con
respecto a Y (variable independiente).
EJEMPLO.
Suponga que los gastos de publicidad semanales se usan para determinar el efecto
de la publicidad sobre las ventas. La relación entre el ingreso por ventas (𝑦) y el
gasto en publicidad (𝑥) se expresa como el modelo estadístico:
𝑦 = 𝛽0 + 𝛽1 𝑥 + 𝜀 = 0 + 20𝑥 + 𝜀
Observe que la componente del modelo 20𝑥 indica que si se gasta $1 en publicidad,
el ingreso por ventas será igual a $20. Sin embargo, al error aleatorio en el modelo
indica que el ingreso por ventas no se relaciona de manera precisa con el gasto de
publicidad. Es decir, la componente de error aleatorio (𝜀) indica que el ingreso por
ventas puede depender de otras variables distintas al gasto de publicidad.
a) Realice el contraste de hipótesis 𝐻0 : 𝛽1 = 0 contra 𝐻0 : 𝛽1 ≠ 0, con 𝛼 = 0.01
- Antes de comenzar resolver el problema debemos de tomar en cuenta la siguiente

tabla:
𝑛 𝑛
𝑆𝐶𝑋𝑋 = ∑(𝑥𝑖 − 𝑥̅ )2 = 8.88, ∑ 𝑒𝑖2 = 144 𝑦 𝑠 = 4.9

𝑖=1 𝑖=1
Entonces:
𝑠 4.9
= = 1.64 (𝑒𝑟𝑟𝑜𝑟 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 𝑑𝑒𝑙 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑟𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛 𝑙𝑖𝑛𝑒𝑎𝑙)
√𝑆𝐶𝑋𝑋 √8.88
Ahora, seguiremos los pasos de la metodología:
𝑖) El contraste de hipótesis 𝐻0 : 𝛽1 = 0 contra 𝐻0 : 𝛽1 ≠ 0
𝑖𝑖) Fijar el nivel de significancia 𝛼 = 0.01
̂1 −𝛽
𝛽 ̂10
𝑖𝑖𝑖) El estadístico de prueba 𝑡𝑐 = ( )√𝑆𝐶𝑋𝑋
𝑠
Regla de decisión
Recordemos que (n - 2)= 8 – 2 = 6 grados de libertad.
0.001 1−0.001
Rechazar 𝐻0 si 𝐶𝐶: 𝑡𝑐 < 𝑡𝑡𝑎𝑏𝑙𝑎𝑠 ( ) = −3.707 𝑜 𝑡𝑐 > 𝑡𝑡𝑎𝑏𝑙𝑎𝑠 ( ) = 3.707
2,6 2,6
𝑖𝑣) Aplicar la regla de decisión.
Si se recuerda la ecuación de regresión 𝑦̂ = 82.269 + 13.056𝑥 donde 𝛽̂1 = 13.056;

luego, el valor del estadístico 𝑡 calculado es:
𝛽̂1 − 𝛽̂10 13.056 − 0

𝑡𝑐 = ( ) √𝑆𝐶𝑋𝑋 = = 7.96
𝑠 1.64
Por último, 7.96 = 𝑡𝑐 > 3.707, se rechaza la hipótesis nula 𝐻0 : 𝛽1 = 0. Por lo tanto,
se concluye que la recta de regresión poblacional no tiene pendiente 0, así que al
1% de significancia se puede decir que existe una relación lineal 𝑥 y 𝑦 en la
población.
La calidad del ajuste de una regresión lineal simple, permite verificar la calidad con
la que el modelo planteado permite hacer estimaciones. Se necesita conocer qué
tanta variabilidad en Y fue explicada por el modelo, si se cumplen los supuestos
de normalidad en los residuos y si la variación no tiene ningún patrón fuera de lo
usual.
La presentación de varios criterios para evaluar la calidad del modelo tiene el
propósito de destacar que los buenos modelos se construyen a medida que
cumplen más criterios de calidad de ajustes. El no cumplimiento de alguno de los
criterios, no hará necesariamente inviable el modelo desde el punto de vista
práctico. Entre los criterios que utilizamos para la evaluación de la calidad del
ajuste, se encuentran:
EJEMPLO
En estadística inferencial, específicamente en inferencia predictiva, un intervalo de
predicción es una estimación de un intervalo de valores en el que se producirá una
observación futura con determinada probabilidad, dado lo que ya se ha observado.
Los intervalos de predicción se utilizan a menudo en análisis de la regresión.
Para estimar la línea de regresión poblacional a partir de la nube de puntos se utiliza

el método de los mínimos cuadrados ordinarios (MCO), que considera como recta
que mejor se ajusta a la que minimiza la suma de los cuadrados de los residuos.
Si la recta de mejor ajuste es los errores o residuos se definen
como: y los estimadores por MCO de la ordenada en el origen, , y de

la pendiente, , son:
Para evaluar la bondad del ajuste se calcula el coeficiente de determinación R 2 y,

para medir la dispersión de los puntos alrededor de la recta estimada, el error típico
de la estimación Su. Estas medidas se definen como:
Partimos de una muestra de valores de X e Y medidos sobre n individuos:

(x1,y1),(x2,y2),...,(xn,yn),
ˆ
y queremos estimar valores en Y según el modelo Y = β0 + β1X, donde β0 y β1 son por el momento
desconocidos. Debemos encontrar entonces de entre todas las rectas la que mejor se ajuste a los
datos observados, es decir, buscamos aquellos valores de β0 y β1 que hagan mínimos los errores de
estimación. Para un valor xi, el modelo estima un valor en Y igual a yi = β0 + β1xi y el valor
observado en Y es igual a yi, con lo cual el error de estimación en ese caso vendría dado por
ˆ
Entonces tomaremos como estimaciones de β0 y β1 , que notamos por β0 y β1, aquellos valores que
hagan mínima la suma de los errores al cuadrado, que viene dada por:
De ahí que al método de estimación se le llame método de mínimos cuadrados. La solución se

obtiene por el mecanismo habitual, derivando SSE con respecto a β0 y β1 e igualando a 0. Los
estimadores resultan:
ˆ ˆ
β0 = −y − β1−x
Siendo:
ˆ ˆ ˆ
A la recta resultante Y = β0 + β1X se le llama recta de regresión lineal de Y sobre X.
Un último parámetro a estimar en el modelo es la varianza de los errores (σ2). A su estimador
se le denomina varianza residual y viene dada por:
ˆ P n
^ 2 SSE i =1 e2i SS yy − β 1 SS xy
sR = = =
n−2 n−2 n−2
Ejemplo : Referentes a la cantidad de compresion (Y ) de un material aislante a diferentes
niveles de presión (X), vamos a determinar la recta de regresión.
SSxy = 7,SSxx = 10
luego
ˆ ˆ
β0 = −y − β1−x = −0.1
La recta de regresión de Y sobre X es por tanto:
ˆY = −0.1 + 0.7X

Investigacion Teorica U5

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Investigacion Teorica U5

Cargado por

Copyright:

Formatos disponibles

INSTITUTO TECNOLOGICO DE OAXACA

NOMBRE: ANTONIO DE JESUS BAUTISTA

El modelo de regresión lineal simple se caracteriza por predecir la variable

Donde la ordenada al origen β0 y la pendiente β1 son coeficientes desconocidos

Algunos consejos que puedes tomar en cuenta al utilizar el modelo de regresión

Esta forma de análisis estima los coeficientes de la ecuación lineal, involucrando

a) Realice el contraste de hipótesis 𝐻0 : 𝛽1 = 0 contra 𝐻0 : 𝛽1 ≠ 0, con 𝛼 = 0.01

- Antes de comenzar resolver el problema debemos de tomar en cuenta la siguiente

𝑆𝐶𝑋𝑋 = ∑(𝑥𝑖 − 𝑥̅ )2 = 8.88, ∑ 𝑒𝑖2 = 144 𝑦 𝑠 = 4.9

Ahora, seguiremos los pasos de la metodología:

𝑖) El contraste de hipótesis 𝐻0 : 𝛽1 = 0 contra 𝐻0 : 𝛽1 ≠ 0

𝑖𝑖) Fijar el nivel de significancia 𝛼 = 0.01

𝑖𝑣) Aplicar la regla de decisión.

Si se recuerda la ecuación de regresión 𝑦̂ = 82.269 + 13.056𝑥 donde 𝛽̂1 = 13.056;

𝛽̂1 − 𝛽̂10 13.056 − 0

Para estimar la línea de regresión poblacional a partir de la nube de puntos se utiliza

Si la recta de mejor ajuste es los errores o residuos se definen

como: y los estimadores por MCO de la ordenada en el origen, , y de

Para evaluar la bondad del ajuste se calcula el coeficiente de determinación R 2 y,

Partimos de una muestra de valores de X e Y medidos sobre n individuos:

De ahí que al método de estimación se le llame método de mínimos cuadrados. La solución se

También podría gustarte