Está en la página 1de 6

5.

REGRESION LINEAL SIMPLE:


La regresión lineal simple se basa en estudiar los cambios en una variable, no
aleatoria, afectan a una variable aleatoria, en el caso de existir una relación
funcional entre ambas variables que puede ser establecida por una expresión
lineal, es decir, su representación gráfica es una línea recta. Es decir, se está en
presencia de una regresión lineal simple cuando una variable independiente ejerce
influencia sobre otra variable dependiente.
La regresión lineal simple es un método estadístico que nos permite resumir y
estudiar las relaciones entre dos variables continuas (cuantitativas):
 Una variable, denominada x, se considera como la variable predictora,
explicativa o independiente
 La otra variable denominada y, se considera como la variable de respuesta,
resultado o dependiente
Debido a que los otros términos se usan con menos frecuencia hoy en día,
usaremos los términos "predictor" y "respuesta" para referirnos a las variables
encontradas en este curso. La regresión lineal simple obtiene su adjetivo "simple"
porque se refiere al estudio de una sola variable predictiva.

Ejemplo 1
Este conjunto de datos proporciona masas promedio para las mujeres en función
de su estatura en una muestra de mujeres estadounidenses de 30 a 39 años de
edad. Aunque el artículo de OLS argumenta que sería más apropiado ejecutar una
regresión cuadrática para estos datos, aquí se aplica el modelo de regresión lineal
simple.
Hay n=15 puntos en este conjunto de datos. Los cálculos manuales se iniciarían
encontrando las cinco sumas siguientes:

Estas cantidades se utilizarían para calcular las estimaciones de los coeficientes


de regresión y sus errores estándar.
Este ejemplo también demuestra que los cálculos sofisticados no superarán el uso
de datos mal preparados. Las alturas fueron dadas originalmente en pulgadas, y
han sido convertidas al centímetro más cercano. Puesto que la conversión ha
introducido un error de redondeo, no se trata de una conversión exacta. Las
pulgadas originales pueden ser recuperadas por (x/0.0254) y luego reconvertidas
a métricas sin redondear: si esto se hace, los resultados se convierten en:

Por lo tanto, una variación aparentemente pequeña en los datos tiene un efecto
real.
Diagrama de dispersión
Un diagrama de dispersión es una ilustración gráfica que se usa en el análisis de
regresión. Consta de una dispersión de puntos tal que cada punto representa un
valor de la variable independiente (medido a lo largo del eje horizontal), y un valor
asociado de la variable dependiente (medido a lo largo del eje vertical). El
diagrama de dispersión permite analizar si existe algún tipo de relación entre dos
variables.
El diagrama de dispersión, también llamado nube de puntos, brinda dos tipos de
información, visualmente se pueden determinar los patrones que indican como las
variables están relacionadas (lineal o mediante una curva) y por otro lado si existe
una relación entre ellas visualizando la clase de línea o ecuación de estimación
que describe a dicha relación.
A continuación, se ilustran algunas relaciones en los diagramas de dispersión:

El error estándar de estimación mide la variabilidad o dispersión de los valores


observados alrededor de la línea de regresión y se representa como Se, de la
misma manera en la imagen podemos observar la formula.
Cuanto mayor sea el error estándar de la estimación, más grande será la
dispersión (o esparcimiento) de puntos alrededor de la línea de regresión. Por el
contrario, si Se=0, se espera que la ecuación de estimación sea un estimador
"perfecto" de la variable dependiente, en este caso todos los puntos caerían
directamente sobre la línea de regresión y no habría puntos dispersos, como se
muestra en la siguiente figura:
5.1 PRUEBA DE HIPÓTESIS EN LA REGRESIÓN LINEAL SIMPLE.

Queremos una prueba de nivel a para las hipótesis


Ho: B1 = B1* versus H1: ß1 ≠ B1*
ß1* es algún valor propuesto por el investigador
La prueba para Ho: B1 = 0 se conoce como test de independencia o de no
asociación
ya que nos dice si las variables están asociadas o no. (La prueba t que hace
STATA considera ß1* = 0)
La prueba se basa en el estadístico y rechaza Ho cuando el valor del estadístico
observado en la muestra da grande y positivo o grande y negativo, es decir, el p-
valor da menor que el nivel ∝

También podría gustarte