Está en la página 1de 40

Modelo de Administración

y Gestión de Riesgo I

MIGUEL ANTONIO SÁNDIGO GARCÍA


MASG@BANGUAT.GOB.GT
Línea de Regresión

Es un modelo matemático usado para aproximar la


relación de dependencia entre una variable
dependiente Y y variables independientes X.
Ecuación para una recta

Y = a + bX

Y= Variable Dependiente
a = Intersección en Y
b = Pendiente de la línea
X = Variable Independiente
Ecuación de estimación para una recta
Ecuación de estimación para una recta
Métodos de mínimos cuadrados

Su objetivo es buscar la línea de estimación que


minimice la suma de los cuadrados de los errores

Ŷ = a + bX

Donde:
Ŷ representa los valores individuales de los puntos
estimados
Métodos de mínimos cuadrados
Métodos de mínimos cuadrados
Métodos de mínimos cuadrados
Métodos de mínimos cuadrados
Métodos de mínimos cuadrados
Métodos de mínimos cuadrados
Métodos de mínimos cuadrados
Métodos de mínimos cuadrados
Ejemplo
Ejemplo resuelto
Error estándar de la estimación

Mide la variabilidad o dispersión de los valores


observados alrededor de la línea de regresión

Diferencia entre la desviación estándar y el error


estándar de la estimación?
Error estándar de la estimación
Ejemplo: camiones y años de reparación

ERROR ESTANDAR DE LA ESTIMACIÓN

Ŷ = 3.75 + 0.75x

X Y Ŷ (y - Ŷ ) (y - Ŷ )2
5 7 3.75+(0.75)(5) 7-7.5 = -0.5 0.25
3 7 3.75+(0.75)(3) 7-6.0= 1.0 1
3 6 3.75+(0.75)(3) 6-6.0= 0 0
1 4 3.75+(0.75)(1) 4-4.5=-0.5 0.25 suma de los
cuadrados de los
1.5 errores

Se =
Se =
Se = 0.866
Uso de un método abreviado para calcular el error
estándar de la estimación
Ejemplo: camiones y años de reparación

USO DE UN MÉTODO ABREVIADO DEL ERROR ESTANDAR DE LA ESTIMACIÓN

camiones años (x) gtos reparación xy x2 y2

1 5 7 35 25 49

2 3 7 21 9 49

3 3 6 18 9 36

4 1 4 4 1 16

12 24 78 44 150

se =

se =

se = 0.866
Interpretación del error estándar de la
estimación
Cuánto mayor sea el Se, más grande será la dispersión de
puntos alrededor de la línea de regresión.
Si Se = O, esperamos que la ecuación de estimación sea un
estimador “perfecto” de la variable dependiente.
Suponiendo que los puntos observados estén normalmente
distribuidos alrededor de la línea de regresión cabe esperar:
68% dentro de +/- 1 Se
95% dentro de +/- 2 Se
99.7 % dentro de +/- 3Se
El error estándar de la estimación se mide a lo largo del eje
Y, y no perpendicularmente a la línea de regresión.
Interpretación del error estándar de la
estimación

Y = a+bx
Y = a +bx +/- 1Se
Y = a + bx +/- 2 Se
Y = a + bx +/- 3 Se
Intervalos aproximados de predicción

Una manera de concebir el error estándar de la


estimación consiste en considerarlo como la
herramienta estadística que podemos utilizar para
hacer una formulación de probabilidad acerca del
intervalo alrededor de un valor estimado de Ŷ.
A estos intervalos alrededor de la Ŷ los llamamos
Intervalos aproximados de predicción.
Los estadísticos aplican intervalos de predicción
basándose en la distribución normal (68% para 1Se,
95.5% para 2 Se y 99.7% para 3 Se), exclusivamente
de muestras grandes. Ejemplo……..
ANÁLISIS DE CORRELACIÓN

Es la herramienta estadística de que nos valemos


para describir el grado de relación que hay entre dos
variables.
Se usa junto con el análisis de regresión para medir
la eficacia con que la línea de regresión explica la
variación de la variable dependiente, Y.
También se usa para medir el grado de asociación
que existe entre dos variables.
Los estadísticos han inventado 2 medidas para
describir la correlación.
Coeficiente de determinación

Es la manera primaria de medir el grado, o fuerza, de


la relación que existe entre dos variables, X y Y.
Dicho coeficiente se obtiene de la relación entre dos
tipos de variación:
 La línea de regresión ajustada: variación de los
valores de Y alrededor de la línea de regresión
(Y-Ŷ)2
 Su propia media: variación de los valores de Y
alrededor de su media
(Y-Y)2
Fórmula del coeficiente muestral de
determinación
Uno menos la razón entre esas 2 variaciones es el
coeficiente muestral de determinación, que se
representa con r2

r2 = 1 – (Y - Ŷ)2
( Y – Y)2
Interpretación intuitiva de r2

Ŷ = 4x
= 0 0/ 672 Ŷ = 4(1) = 4

Puntos Valor de X Valor de Y


Primero 1 4
Segundo 2 8
Tercero 3 12
Cuarto 4 16
Quinto 5 20
Sexto 6 24
Séptimo 7 28
Octavo 8 32
144

Media de Y = 144/8
Media de Y = 18
Ejemplo de r2

Dado que la línea de regresión pasa por el origen,


sabemos que la intersección en Y es cero; y como Y
aumenta en 4 cada vez que X aumenta en 1, la
pendiente ha de ser igual a 4. Así pues, la línea de
regresión será:
Ŷ = 4x
Entonces: (Y-Ŷ)2 = (O)2 = 0
Puesto que todos los valores de Y se encuentran en la
línea de regresión, la diferencia entre Y y Ŷ es cero en
todos los casos.
Ejemplo de r2

Variación de los valores de Y alrededor de su media


2
( 4 - 18 ) = 196
2
( 8 - 18 ) = 100
2
( 12 - 18 ) = 36
2
( 16 - 18 ) = 4
2
( 20 - 18 ) = 4
2
( 24 - 18 ) = 36
2
( 28 - 18 ) = 100
2
( 32 - 18 ) = 196
suma = 672
Ejemplo de r2

Aplicando la fórmula a estos valores, podemos


calcular el coeficiente muestral de determinación.

r2 = 1 – 0
672
= 1 coeficiente muestral de determinación cuando
hay una correlación perfecta.
Interpretación intuitiva de r2

El valor de r2 = + 1, siempre que la línea de regresión


sea un estimador perfecto.
Un segundo valor extremo en el cual las variables X y
Y pueden relacionarse es aquel en que los puntos
pueden encontrarse a igual distancia en ambos lados
de una línea horizontal de regresión.
Ejemplo…..
El valor de r2 = O cuando no hay correlación
Un r2 mide exclusivamente la fuerza de una relación
lineal entre dos variables.
Interpretación intuitiva de r2

En resumen:
R2 se encontrará entre los extremos de 1 y O.
Un r2 cercano a 1 indica una fuerte correlación entre X y Y
Un r2 cercano a cero significa que esas dos variables tienen
poca correlación
Ejemplo:
Si tuviéramos muchos puntos X y Y que cayeran sobre la
circunferencia de un círculo pero en lugares aleatoriamente
dispersos, es evidente que habría una relación entre ellos,
pero si calculáramos r2, éste resultaría estar cercano a cero,
ya que los puntos no tienen una relación lineal entre sí.
Otra forma de calcular r2

r 2 = a Y + b XY – n Y2
Y2 – n Y2

Donde:
R2 = coeficiente muestral de determinación
a = intersección en Y
b = pendiente de la línea de estimación del mejor ajuste
n = número de puntos de datos
X = valores de la variable independiente
Y = valores de la variable dependiente
Y = media de los valores observados de la variable de pendiente.
Coeficiente de correlación
Coeficiente de correlación

Si existe una relación inversa, es decir, si Y


disminuye al aumentar X, entonces r caerá entre cero
y -1. De manera análoga, si hay una relación directa,
r será un valor dentro del intervalo de cero a 1.
Interpretación de r2 y r

r2 = 0.81 y r = 0.9

r2 nos dice que el 81% de la variación de Y es explicado


por la línea de regresión.

“r” no es otra cosa que la raíz cuadrada de r2, y no


podemos interpretar directamente su significado pero
si nos ayuda a conocer la relación entre las dos
variables. En este caso la relación es directa y la
pendiente es positiva, por lo tanto, el signo r es
positivo.
REGRESIÓN MULTIPLE

Es cuando utilizamos más de una variable


independiente para estimar la variable dependiente,
y de este modo, procurar mejorar la precisión de la
estimación.
Una ventaja de esta regresión es que nos permite
utilizar una mayor parte de la información de que
disponemos para estimar la variable dependiente
Fórmula de Regresión Múltiple

Ŷ = a + b1x1 + b2x2

Podemos visualizar la ecuación simple como una línea en


una gráfica, en forma similar podemos representar una
ecuación de regresión múltiple de dos variables como un
plano.
El problema consiste en decidir cuál de los planos posibles
que podríamos trazar será el de mejor ajuste. Para hacer
esto aplicamos el criterio de mínimos cuadrados y
encontraremos así el plano que minimice la suma de los
cuadrados de los errores; esto es, las distancias entre los
puntos alrededor del plano y los puntos correspondientes
sobre él.

También podría gustarte