Está en la página 1de 26

ESTADISTICA II

UNIDAD 3 Análisis de regresión, correlación lineal


simple y múltiple.
M.C. PASCUAL HERNANDEZ BAUTISTA
3.1 REGRESIÓN LINEAL Y CORRELACIÓN
3.1.1 Método de mínimos cuadrados y la línea
3.1.2 Coeficientes de correlación, de determinación y el
del error estándar de la estimación
3.1.3 Intervalos de confianza y de predicción
3.1.4 Análisis de varianza para la regresión
3.1.5 Análisis de residuales

3.2 REGRESIÓN Y CORRELACIÓN MÚLTIPLE


3.2.1 Análisis de regresión múltiple y el método de los
mínimos cuadrados
3.2.2 El coeficiente de determinación Múltiple y el error
CONTENIDO estándar múltiple de estimación
3.2.3 Análisis de varianza para la regresión Múltiple
3.2.4 Análisis de residuales

3.3 APLICACIONES
3.1
REGRESIÓN LINEAL Y
CORRELACIÓN
CONTENIDO 3.1.1 Método de mínimos cuadrados y la línea
3.1.2 Coeficientes de correlación, de determinación y
el del error estándar de la estimación
3.1.3 Intervalos de confianza y de predicción
3.1.4 Análisis de varianza para la regresión
3.1.5 Análisis de residuales
REGRESIÓN LINEAL Y CORRELACIÓN
Características

En estos modelos se busca encontrar la función Los métodos de regresión se emplean


matemática que relaciona una o varias variables generalmente para analizar datos de
dependientes con otras independientes. Se aplica experimentos no planeados, por ejemplo

1 cuando una o varias de las variables a formar el


modelo representan variables aleatorias continuas. 2 aquellos que surgen de
controlados o de datos históricos.
fenómenos no

La relación entre las variables del modelo es a lo El experimentador debe evaluar varios modelos
que se llama modelo de regresión.
hasta poder encontrar aquel que mejor se ajuste

3
En algunos casos el experimentador conoce la a los datos. Se aconseja comenzar con modelos
forma de la función de regresión que desea
ajustar a los datos de una muestra del proceso,
pero en la mayoría de los casos no.
4 sencillo y aumentar la complejidad en la medida
de lo necesario.
3.1.1 Método de mínimos cuadrados y la línea
Concepto y ecuación
Hipotesis 3.1.1 Método de mínimos cuadrados y la línea

Y= β0 + β1Xi + εi
Ejemplo 3.1.1 Método de mínimos cuadrados y la línea
Ejemplo: en un laboratorio se quiere investigar la forma en que se relaciona la
cantidad de fibra (madera) en la pulpa con la resistencia del producto (papel). Los
datos obtenidos en un estudio experimental se muestran en la tabla 11.1
Porcentaje de fibra Resistencia 30,183
4 134
6 145
8 142
10 149
12 144
14 160
16 156
18 157 4,134
20 168
22 166
24 167
26 171
28 174
30 183

7
Ejemplo
Porcentaje de fibra Resistencia
(xi) (yi) xi2 yi2 xiyi
4 134 16 17 956 536
6 145 36 21 025 870
8 142 64 20 164 1 136
10 149 100 22 201 1 490
12 144 144 20 736 1 728
14 160 196 25 600 2 240
16 156 256 24 336 2 496
18 157 324 24 649 2 826
20 168 400 28 224 3 360
22 166 484 27 556 3 652
24 167 576 27 889 4 008
26 171 676 29 241 4 446
28 174 784 30 276 4 872
30 183 900 33 489 5 490
Σxi= 238 Σyi= 2 216 Σxi = 4 956 Σyi = 353 342 Σxiyi= 39 150
2 2

= 17 = 158.286
Ejemplo

Y= β0 + β1Xi + εi
Ejemplo
Porcentaje de fibra Resistencia
(xi) (yi)
4 134 137.1668 -3.1668
6 145 140.4152 4.5848
8 142 143.6636 -1.6636
10 149 146.912 2.088
12 144 150.1604 -6.1604
14 160 153.4088 6.5912
16 156 156.6572 -0.6572
18 157 159.9056 -2.9056
20 168 163.154 4.846
22 166 166.4024 -0.4024
24 167 169.6508 -2.6508
26 171 172.8992 -1.8992
28 174 176.1476 -2.1476
30 183 179.396 3.604
Ejemplo

11
Ejemplo

12
13
EL COEFICIENTE DE CORRELACION
El coeficiente de correlación r, mide la intensidad de la relación lineal entre dos variables X y
Y. Si se tiene n pares de datos de la forma (xi, yi), entonces este coeficiente se obtiene de la
siguiente manera:

Se puede ver que -1 ≤ r ≥ 1; si r es próximo a -1, entonces tendremos una relación lineal
negativamente fuerte, y r es próximo a cero, entonces diremos que no hay correlación lineal, y
finalmente si r es próximo a 1, entonces tendremos una relación lineal positiva fuerte.

14
Ejemplo
R2 Mide la proporción de la variabilidad en los datos (Y) que es explicada por el modelo de
regresión.

Es claro que 0 ≤ R2 ≥ 1. En generala R2 se interpreta como la proporción de la variabilidad


en los datos (Y) que es explicada por modelo.

15
EL COEFICIENTE DE DETERMINACION AJUSTADO
Ejemplo

Cuando hay muchos términos en un modelo, el estadístico R2aj se


prefiere en lugar de R2, puesto que este ultimo es engañoso al
incrementarse en forma artificial con cada termino que se agrega al
modelo, aunque sea un término que contribuya en nada a la
explicación de la respuesta. En cambio, el R2aj incluso baja de valor
cuando el termino que se agrega no aporta en nada. Se cumple que 0
< R2aj ≤ R2 ≤ 1. En general, para fines de predicción se recomienda un
coeficiente de determinación ajustado de al menos 0.7

16
Ejemplo
Estima la desviación estándar del error e indica la magnitud de estimación de
un modelo

17
MEDIA DEL ERROR ABSOLUTO
Es la media del valor absoluto de los residuales, y sirve para ver cuanto falla
en promedio el modelo al hacer la estimación de la variable de respuesta.

18
EL COEFICIENTE DE DETERMINACION AJUSTADO

EL COEFICIENTE DE CORRELACION

ERROR ESTANDAR

19
EJERCICIO

20
3.2 REGRESIÓN Y
CORRELACIÓN MÚLTIPLE

3.2.1 Análisis de regresión múltiple y el método de


los mínimos cuadrados
3.2.2 El coeficiente de determinación Múltiple y el
CONTENTS error estándar múltiple de estimación
3.2.3 Análisis de varianza para la regresión
Múltiple
3.2.4 Análisis de residuales
3.2.1 ANÁLISIS DE REGRESIÓN MÚLTIPLE Y EL MÉTODO DE
LOS MÍNIMOS CUADRADOS

22
3.2.1 ANÁLISIS DE REGRESIÓN MÚLTIPLE Y EL MÉTODO DE
LOS MÍNIMOS CUADRADOS

=85.188

23
3.2.1 ANÁLISIS DE REGRESIÓN MÚLTIPLE Y EL MÉTODO DE
LOS MÍNIMOS CUADRADOS

24
3.2.2 EL COEFICIENTE DE DETERMINACIÓN MÚLTIPLE Y EL
ERROR ESTÁNDAR MÚLTIPLE DE ESTIMACIÓN

25
THANK YOU

M.C. PASCUAL HERNÁNDEZ BAUTISTA

También podría gustarte