Está en la página 1de 5

Estadística Inferencial I M.E.A. Jesús Miguel Chávez C.

UNIDAD V – ANÁLISIS DE REGRESIÓN LINEAL SIMPLE (ARLS)

Definición: El concepto se definirá con base en los términos que lo componen de la siguiente forma:
 Análisis: Hace referencia al ajuste de un modelo de regresión a un conjunto de datos, mediante le técnica
de estimación de mínimos cuadrados.
 Regresión: Se refiere a la estimación (o predicción) de la media de una variable respuesta ( y ) con base en
la construcción de una ecuación matemática.
 Lineal: dicha ecuación matemática es de primer grado donde cada uno de los términos se encuentran
de forma aditiva.
 Simple: Estimar la variable respuesta con base en el conocimiento de una sola variable explicatoria.

Objetivo del ARLS: predecir el valor promedio de una variable basándonos en el conocimiento del valor de otra variable.

Supuestos del Modelo de RLS


 Población de valores: para cada valor de x existe una población de
valores de y.
 Normalidad: se presenta normalidad en el conjunto de datos (ésta se
evalúa mediante una prueba de normalidad sobre los residuales).
 Linealidad: al existir normalidad, es posible reflejar la relación entre
la variable respuesta y la variable explicatoria mediante una línea
recta.

 Homocedasticidad y Homogeneidad de varianzas: solamente


existe una única varianza (la varianza del error, que es igual a la
varianza de y: )
 Independencia: un valor cualquiera del término del error es
estadísticamente independiente de cualquier otro valor del error.
 Sumatoria del Error Igual a Cero: En cualquier combinación dada
de valores de x_1,x_2,…,x_k, la media de la población de los valores
potenciales del término de error es igual a cero.

Modelo algebraico de Regresión Lineal Simple

Procedimiento para llevar a cabo un Análisis de Regresión Lineal Simple

1) Determinación de dependencia entre variables. 6) Evaluación de los Parámetros de regresión.


2) Diagrama de dispersión de puntos. a) Prueba de significancia para los
3) Estadísticos de relación (covarianza y análisis de parámetros de regresión.
correlación). b) Interpretación de los parámetros de
4) Determinación del modelo de regresión lineal regresión.
simple mediante la técnica de mínimos cuadrados. c) Intervalos de confianza para parámetros
5) Evaluación del modelo mediante la tabla de de regresión.
análisis de varianza (ANOVA) 7) Evaluación del modelo: Prueba de Normalidad
a) Prueba de significancia del modelo. sobre los residuales.
b) Varianza del Modelo ( 8) Estimaciones y/o predicciones.
c) Coeficiente de determinación ajustado (R2)

Ejemplo a desarrollar en clase

Un estudio sobre la cantidad de lluvia y la de contaminación del aire eliminada produjo los siguientes datos:

Cantidad de lluvia diaria (0.01 cm) 4.3 4.5 5.9 5.6 6.1 5.2 3.8 2.1 7.5
Partículas en el ambiente (μg/m3) 126 121 116 118 114 118 132 141 108

Llevando a cabo cada uno de los pasos mencionados en clase:


a) Calcule la ecuación de la recta de regresión para predecir las partículas en el ambiente con base en la cantidad de
precipitación diaria.
b) Estime la cantidad de partículas eliminadas si la precipitación diaria es x = 4.8 unidades.
Estadística M.E.A. Jesús Miguel
Inferencial I Chávez C.

RESULTADOS DE MINITAB PARA EL EJEMPLO EN CLASE

Covariances: Partículas en el ambiente, Cantidad de lluvia

Partículas en el Cantidad de lluvia


Partículas en el 100.52778
Cantidad de lluvia -15.22500 2.40750

Correlations: Partículas en el ambiente, Cantidad de lluvia

Pearson correlation of Partículas en el ambiente and


Cantidad de lluvia = -0.979

P-Value = 0.000

Regression Analysis: Partículas en el ambiente versus Cantidad de


lluvia

The regression equation is


Partículas en el ambiente = 153 - 6.32 Cantidad de
lluvia

Predictor Coef SE Coef T P


Constant 153.175 2.615 58.58 0.000
Cantidad de lluvia -6.3240 0.5019 -12.60 0.000

S = 2.20261 R-Sq = 95.8% R-Sq(adj) = 95.2%

Analysis of Variance

Source DF SS MS F P
Regression 1 770.26 770.26 158.77 0.000
Residual Error 7 33.96 4.85
Total 8 804.22

NOTAS ADICIONALES
Estadística Inferencial I M.E.A. Jesús Miguel Chávez C.

DESARROLLO DEL EJEMPLO

1) Determinación de dependencia entre variables.


 Es necesario determinar cómo es la relación de dependencia, es decir, cuál variable es la
respuesta y cuál variable es la explicatoria

Variable Dependiente (y) Variable Independiente (x)

2) Diagrama de dispersión de puntos.

Es necesario llevar a cabo un diagrama de dispersión de puntos donde


se deberá de observar los siguientes aspectos:
a) ¿Existe relación lineal? (se determina observando si la nube
de puntos tiende a generar una línea recta, ya sea de forma
ascendente o descendente).
b) ¿Tipo de relación? (si la nube de puntos presenta un
comportamiento ascendente se determina como una relación
directa o positiva; si la nube de puntos tiene un
comportamiento descendente, se dice que es una relación
inversa o negativa).
c) ¿Magnitud de la relación? (la fuerza o magnitud de la
relación se determina observando la cercanía de los puntos a la
línea recta, entre más cercanos estén a la línea recta, más
fuerte será la relación, entre más se separen la relación se
debilita. Suelen emplearse los siguientes adjetivos: Perfecta,
Fuerte, Moderada, Débil)
d) ¿Existencia de observaciones atípicas (“outliers”)? (son
puntos dentro del diagrama que rompen con el comportamiento
de los demás puntos, es decir, no siguen el comportamiento de
los demás puntos)

3) Estadísticos de relación (covarianza y análisis de correlación).


 Con objeto de evaluar la relación entre las dos variables es necesario calcular dos estadísticos de relación:

Covarianza Coef. De Correlación de Pearson =


Indica el tipo de relación, si se trata de una relación directa o inversa. Indica el tipo de relación, si se trata de una relación directa o inversa.
Además, permite evaluar la fuerza o magnitud de la relación.

Covarianza Coef. De Correlación de Pearson =

PRUEBA DE SIGNIFICANCIA DEOBRE EL COEFICIENTE DE REGRESIÓN


Hipótesis Estadísticas Valor de P Decisión y Conclusión

Intervalo de Confianza
Estadística Inferencial I M.E.A. Jesús Miguel Chávez C.

4) Determinación del modelo de regresión lineal simple mediante la técnica de mínimos


cuadrados.
 Mediante Minitab se obtendrá el modelo de regresión.

Ecuación de Regresión

5) Evaluación del modelo mediante la tabla de análisis de varianza (ANOVA)


 Prueba de significancia del modelo.
 Varianza del Modelo (
 Coeficiente de determinación ajustado (R2)

Fuente de Variación g.l. SC CM F P


Regresión

Error

Total

Resultados del Análisis de Varianza

6) Evaluación de los Parámetros de regresión.

Criterio

a) Prueba de
significancia para los
parámetros de
regresión.

b) Interpreta
ción de los
parámetros de
regresión.

c) Intervalos de
confianza
para
parámetro
s de
regresión.

También podría gustarte