Está en la página 1de 18

1.

Regresión Lineal simple

El análisis de regresión se usa con el propósito de predicción. La meta del análisis


de regresión es desarrollar un modelo estadístico que se pueda usar para predecir
los valores de una variable dependiente o de respuesta basados en los valores de
al menos una variable independiente o explicativa.

Para establecer una relación cuantitativa entre y es necesario disponer de cierta


información muestral. Esta información consiste de un conjunto de pares de
observaciones de y , donde cada uno de estos pares pertenece a una unidad
elemental particular de la muestra.

Se refiere a encontrar la línea recta que mejor se ajuste a los datos. El mejor
ajuste puede definirse de varias maneras. Quizá la más sencilla sea encontrar la
línea recta para la cual las diferencias entre los valores reales y los valores
pronosticados a partir de la recta ajustada de regresión sean tan pequeñas como
sea posible. Sin embargo, como estas diferencias son positivas para algunas
observaciones y negativas para otras, en términos matemáticos se minimiza la
suma de los cuadrados de las diferencias.

El modelo propuesto es lineal (es decir existe relación entre la variable explicativa
y la variable explicada, y esta relación es lineal). Es decir se asume que:

Var respuesta = (bo) + variable explicativa (b1) + e


y = bo + xb 1 + e

Siendo:
b0: el término independiente (constante)
b1: el coeficiente de regresión de la variable explicativa (pendiente)
e: es una variable aleatoria que se llama error residual

1.1.1. Prueba de hipótesis en la regresión lineal simple


El estadístico de prueba es:
1.1.2. Calidad del ajuste en regresión lineal simple

En la sección anterior estudiamos pruebas de hipótesis para verificar que hay una
relación significativa entre X y Y ; sin embargo, no hemos visto si tal relación
permite hacer estimaciones con una precisión aceptable. Por ejemplo, es de
interés saber qué tanta de la variabilidad presente en Y fue explicada por el
modelo, además si se cumplen los supuestos de los residuos.

Coeficiente de determinación 𝑅 2 . Un primer criterio para evaluar la calidad del


ajuste es observar la forma en que el modelo se ajustó a los datos. En el caso de
la regresión lineal simple esto se distingue al observar si los puntos tienden a
ajustarse razonablemente bien a la línea recta (véase la figura 1.3). Pero otro
criterio más cuantitativo es el que proporciona el coeficiente de determinación, el
cual está definido por:
lo cual habla de una correlación lineal positiva fuerte.

Error estándar de estimación. 𝜎.: Una medición sobre la calidad del ajuste de un
modelo lo da el error estándar de estimación, que es una estimación de la
desviación estándar del error . En el caso de la regresión lineal simple, está dado
por:

Análisis gráfico de residuos: Como complemento a lo que se ha discutido hasta


aquí, un análisis adecuado de los residuos proporciona información adicional
sobre la calidad del ajuste del modelo de regresión y de esa manera es posible
verificar si el modelo es adecuado.

Las gráficas que suelen hacerse para completar el diagnóstico del modelo
consisten en:

a) graficar los residuos en papel de probabilidad normal

b) graficar los residuos contra los predichos.

1.1.3. Estimación y predicción por intervalo en regresión lineal simple

Una de las aplicaciones más importantes en un análisis de regresión es hacer


estimaciones de la respuesta media para un valor dado de X. En el caso particular
de la regresión lineal simple, sabemos que un estimador puntual de la respuesta
media lo da la recta de regresión:
1.1.4. Uso de software estadístico

- Excel En la hoja de cálculo de Excel se incluye la regresión lineal simple y


múltiple; para ello, es necesario realizar la siguiente secuencia de opciones:

Generalmente Excel no trae instalado la herramienta de análisis de datos esta


debe instalarse con la siguiente secuencia:

1.- En la hoja de cálculo de Excel (pantalla principal) hacer clic con el puntero en el
símbolo del sistema localizado en el extremo superior izquierdo

2.- De la ventana desplegada hacer clic en opciones de Excel (parte inferior)

3.- De la ventana desplegada hacer clic en complementos

4.- De la ventana desplegada hacer clic en ir

5.- De esta ventana activar la casilla de herramientas para análisis (palomearla) y


dar clic en aceptar. De esta manera hemos activado la opción de análisis de datos.

Para capturar la tabla de datos para el análisis de regresión lineal simple o


múltiple, primeramente capturamos los datos en la hoja de cálculo, posteriormente

activamos

En la ventana de captura se solicitará el rango de celdas donde se encuentran los


datos para la variable dependiente Rango Y de entrada y para la(s) variable(s)
regresora(s) Rango X de entrada
- En Minitab

La secuencia de captura para la regresión lineal simple o múltiple en la hoja de


cálculo una vez capturada las columnas de datos seleccionamos Estadísticas
luego Regresión seguida de Regresión nuevamente de la ventana desplegada
en respuesta indicamos la variable de respuesta, en este caso es resistencia y
en predictor indicamos porcentaje de fibra activando también cualquiera de las
opciones posibles, terminando en aceptar.

Ejemplo:

1.- Suponga que el gerente de una cadena de servicios de entrega de paquetería


desea desarrollar un modelo para predecir las ventas semanales (en miles de
dólares) para las tiendas individuales basado en el número de clientes que
realizan compras. Se seleccionó una muestra aleatoria entre todas las tiendas de
la cadena con los siguientes resultados.
Regresión lineal múltiple

En muchas situaciones prácticas existen varias variables independientes que se


cree que influyen o están relacionadas con una variable de respuesta Y , y por lo
tanto será necesario tomar en cuenta si se quiere predecir o entender mejor el
comportamiento de Y.

La regresión lineal permite trabajar con una variable a nivel de intervalo o razón.
De la misma manera, es posible analizar la relación entre dos o más variables a
través de ecuaciones.
EJEMPLO

La siguiente tabla muestra los pesos Y a la libra más cercana, las estaturas X1 a la pulgada más
cercana y las edades X2 al año más cercano de 12 muchachos.
Pruebas de hipótesis en regresión lineal múltiple
Intervalos de confianza y predicción en regresión múltiple

En los modelos de regresión múltiple con frecuencia es conveniente construir estimaciones de


intervalos de confianza para los coeficientes de regresión . Por ejemplo, a partir de la tabla 1.6 es
claro que un estimador por intervalos de cada coeficiente en lo individual está dado por:

Uso de un software estadístico

Para capturar la tabla de datos para el análisis de regresión lineal múltiple, primeramente
capturamos los datos en la hoja de cálculo, posteriormente activamos Datos seguido de Análisis de
datos y seleccionamos Regresión, y aceptar
Utilizando Minitab En Minitab la secuencia de captura para la regresión lineal simple o múltiple en
la hoja de cálculo una vez capturada las columnas de datos seleccionamos Estadísticas luego
Regresión seguida de Regresión nuevamente

Regresión no lineal
Para encontrar los valores de a, b y c que hacen mínima la expresión anterior, deberemos igualar
las derivadas parciales de D con respecto a dichos parámetros a cero y resolver el sistema
resultante. Las ecuaciones que forman dicho sistema se conocen como ecuaciones normales de
Gauss (igual que en el caso de la regresión lineal simple)

También podría gustarte