Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Regresión Robusta
INTEGRANTES
• BENITO SANTILLÁN ANDRÉ BENITO
• CAMPOS PALPA GERALDO ELOY
• HUAYLLA ARIAS ANGEL RONALD
• PAUCAR FUENTES KEVIN DENIZ
Metodología
1 Introducción Estimadores M 4
Un breve resumen sobre el Definiciones y fórmulas de
tema expuesto. 1 6 estimadores
Funciones
2 Observaciones
2 Robustas 5
Algunas acotaciones en 5 Mención de las funciones
cuenta a tomar. mas utilizadas hoy en día
Ejemplo
3 Clasificación 3 4 Aplicativo 6
Mención de valores Un ejercicio de base para
atípicos de la regresión entender este tema
Introdución
Sabemos que cuando las observaciones 𝑦 en el
modelo de regresión lineal están normalmente
distribuidas, el método de mínimos cuadrados es un
buen procedimiento de estimación de parámetros,
porque produce un estimador del vector 𝛽 de
parámetros que tiene buenas propiedades
estadísticas. Sin embargo, hay muchos casos en los
que hay evidencias de que la distribución de la
variable de respuesta (𝑦) tiene una distribución no
normal o hay valores atípicos que afectan al modelo
de regresión.
¿Porque se utiliza este tipo de regresión ?
1. las observaciones y en el modelo de regresión lineal esta normalmente distribuida
Cuando
A
Observaciones
• Si se tienen en cuenta todas las observaciones, el modelo de regresión que resulta
es y = 1,3444 + 1,0239x, y R2 = 0.544, no obstante, si se ajusta el modelo de
regresión lineal con todas las observaciones excepto A, se obtiene y = 0,1109 +
1,5351x, para el cual R2 = 0.8885.
• Es claro que el punto A tuvo un efecto radical sobre el modelo de regresión, y
sobre el valor obtenido de R2.
• Una forma de manejar esta situación es eliminar la observación A, así se obtiene una
recta que pasa muy bien por el resto de los datos, más agradable desde un punto de
vista estadístico, sin embargo, lo que se está haciendo ahora es descartar
observaciones tan solo porque es agradable desde un punto de vista de modelado
estadístico, y por lo general esa práctica no es buena.
• Un procedimiento de regresión robusta es aquel que amortigua el efecto de las
observaciones que serían muy influyentes si se usaran los mínimos cuadrados, lo que
nos indica que un procedimiento robusto tiende a dejar grandes los residuales
asociados con valores atípicos, facilitando así la identificación de puntos influyentes.
• Además de la insensibilidad a los valores atípicos, un procedimiento de estimación
robusta debería producir, en esencia, los mismos resultados que los mínimos
cuadrados cuando la distribución básica es normal, y cuando no hay valores atípicos.
Otro objetivo deseable de la regresión robusta es que los procedimientos de
estimación y los de referencia sean relativamente fáciles de llevar a cabo.
• Los métodos de regresión robusta son técnicas que en potencia se pueden usar
cuando hay valores atípicos. Hay varias clases de valores atípicos que se presentan
en el contexto de modelos de regresión
Una clasificación frecuente es la siguiente
01 Valor atípico de regresión. 02 Valor atípico residual.
Es un punto que tiene un residual
Punto que se desvía de la regresión estandarizado o estudentizado grande,
lineal que se determina con las n – 1 cuando se usa en la muestra de n
observaciones restantes. observaciones con que se ajusta un
modelo
Donde los errores son variables aleatorias independientes que tienen la distribución
doble exponencial:
Gráfica Exponencial
Para estimar se usará el método de máxima verosimilitud. Esta función es:
en la forma: …(IV)
TABLA DE FUNCIONES DE CRITERIO ROBUSTO
Donde: … (V), en notación matricial para la
ecuación (IV) será de la siguiente forma: … (Ecuaciones normales)
Donde: es una matriz diagonal de n x n de "pesos" con elementos diagonales
Se sabe que la última ecuación matricial representa las ecuaciones normales por mínimos cuadrados y el
estimador por etapa es:
En el siguiente paso se recalculan los factores de ponderación o pesos con la ecuación (V), pero con en
lugar de . Por lo general solo se requieren unas pocas iteraciones para alcanzar la convergencia. El
procedimiento de mínimos cuadrados iterativamente reponderados se podría implementar con un
programa computacional estándar de mínimos cuadrados ponderados.
Funciones de Criterio Robusto
Los procedimientos de
regresión robusta se
pueden clasificar de
acuerdo con el
comportamiento de su
función . Esta función
controla el factor de
ponderación que se
asigna a cada residual y
(además de una
constante de
E0.3 proporcionalidad), a
veces se llama función
W de influencia.
Por ejemplo: La función para mínimos cuadrados no es acotada, por lo que los
mínimos cuadrados tienden a ser no robustos cuando se usan con datos procedentes de
una distribución con colas gruesas. La función t de Huber tiene una función monótona
y no pondera residuales grandes con tanta intensidad como los mínimos cuadrados.
La¡; tres últimas funciones de influencia en realidad redescienden a medida que el
residual se hace más grande.
Es importante conocer algo acerca de la estructura de los errores en los estimados ~
de la regresión robusta final. Es importante determinar la matriz de covarianza de si
se deben establecer intervalos de confianza, o si se van a hacer otras inferencias,
Huber demostró que, asintóticamente, tiene una distribución aproximadamente
normal, y su matriz de covarianza es:
Funciones robustas de influencia
Estas se clasifican en 5 funciones
Función Lineal
En su forma más simple, intenta minimizar la suma de cuadrados
de las diferencias en las ordenadas (llamadas residuos) entre los
puntos generados por la función elegida y los correspondientes
valores en los datos.
Función t de Huber
Función Compuesta
Tiene la propiedad de ser menos
sensible a los valores atípicos que
la suma de los cuadrados
residuales.
Función E de Ramsay
Función Concava
Podemos ver que esta función es más
"picuda" en el centro que la normal, y las
colas van a cero cuando IεiI tiende a
infinito.
Función onda de Andrews
Función no Lineal
Notamos que esta función es creciente
hasta /2 y luego decrece
hasta llegar a y de
manera contraria cuando es menor a 0.
Función 17A de Hampel
Función Compuesta
Notamos que esta función es creciente y
luego es constante en un cierto intervalo (a,b)
y luego descrece hasta c y de manera
contraria cuando son menores a 0.
Por lo anterior, una aproximación razonable para la matriz de covarianza de es;
También, el programa de cómputo para mínimos cuadrados ponderados obtiene
un estimado de la matriz de covarianza.
Apesar de que en Welsch y en Hill se presentan otras sugerencias,
no hay acuerdo generalizado acerca de cuál aproximación a la
matriz de covarianza de es la mejor, tanto Welsch como Hill hacen
notar que esos estimados de matriz de covarianza funcionan mal
con matrices X que tienen puntos atípicos.
También el deterioramiento (multicolinealidad) distorsiona los
estimados de regresión robusta, sin embargo, hay indicaciones de
que en muchos casos se pueden hacer inferencias aproximadas
acerca de mediante procedimientos parecidos a los de la teoría
normal acostumbrada.
Ejemplo Aplicativo
Enunciado
● Un embotellador de bebidas gaseosas analiza las rutas de
servicio de las máquinas expendedoras en su sistema de
distribución. Le interesa predecir el tiempo necesario para
que el representante de ruta atienda las máquinas
expendedoras en una tienda. Esta actividad de servicio
consiste en abastecer la máquina con productos
embotellados, y algo de mantenimiento o limpieza. Y se ha
sugerido que las dos variables más importantes que
afectan el tiempo de entrega
Observacion Y(Tiempo de entrega) X1(Cantidad de Cajas) X2 (Distancia)
1 16,68 7 560
2 11,5 3 220
3 12,03 3 340
4 14,88 4 80
5 13,75 6 150
6 18,11 7 330
7 8 2 110
8 17,83 7 210
9 79,24 30 1460
10 21,5 5 605
Datos
11 40,33 16 688
12 21 10 215
13 13,5 4 255
14 19,75 6 462
15 24 9 448
16 29 10 776
17 15,35 6 200
18 19 7 132
19 9,5 3 36
20 35,1 17 770
21 17,9 10 140
22 52,32 26 810
23 18,75 9 450
24 19,83 8 635
25 10,75 4 150
Procedimiento
𝑦=2.3412+1.6159𝑥1+0.0144𝑥2
𝑅2=0.961𝑦 𝜎=3.201
Graficas
Procedimiento
By Mercury By Venus
Where Are Our Research Centers?
Venus
Venus has a beautiful
name but it’s hot
Mars
Despite being red, Mars
is a cold place
“This is a quote, words full of wisdom that
someone important said and can make the
reader get inspired.”
—Someone Famous
Factors to Consider
Venus Jupiter
Venus is the second It’s the biggest planet in
planet from the Sun the Solar System
Mars Saturn
Despite being red, Mars Saturn is a gas giant
is a cold place and has several rings
150,000
Big numbers catch your audience’s attention
Clinical Trial
Preclinical Results
40% 25%
Young healthy people
20 - 80 Participants Saturn Neptune
It’s a gas giant and has It’s the farthest planet
several rings from the Sun
Phase 2
Despite being red, Mars is
actually a cold place
Phase 3
Saturn is a gas giant and has Follow the link in the graph to modify its data and then paste
several rings the new one here. For more info, click here
Results
Outcome
Treatment Test 1 Test 2 Test 3
Group 1 315 285 600
Mars Tachycardia
Despite being red, Mars Mercury is the closest planet
is a cold place to the Sun
333,000.000
earths is the Sun’s mass
386,000 km
is the distance between Earth and the Moon
Success Rate
75% 25%
Patients Cured
Without Side Effects
Number
Neptune is far away Venus has a very
from Earth beautiful name
Conclusions
Mercury is the closest planet to the
Sun and the smallest one in the
Solar System. This planet's name
has nothing to do with the liquid
metal
Meet The Team
youremail@freepik.com
+91 620 421 838
yourcompany.com
Vectors:
● Company card in abstract painted style
Photos:
● Cheerful male doctor with tablet and pen
● Senior woman with medical problems
● Confident young doctor
● Smiling doctor looking at camera
● Nurse checking pulse on female patient's wrist
● High angle of covid recovery center female doctor checking elder patient's blood press
ure
● Man with back pains
Instructions for use
In order to use this template, you must credit Slidesgo by keeping the Thanks slide.
For more information about editing slides, please read our FAQs or visit Slidesgo School:
https://slidesgo.com/faqs and https://slidesgo.com/slidesgo-school
Instructions for use (premium users)
In order to use this template, you must be a Premium user on Slidesgo.
For more information about editing slides, please read our FAQs or visit Slidesgo School:
https://slidesgo.com/faqs and https://slidesgo.com/slidesgo-school
Fonts & colors used
This presentation has been made using the following fonts:
Abril Fatface
(https://fonts.google.com/specimen/Abril+Fatface)
PHASE 1
Task 1
Task 2
PHASE 2
Task 1
Task 2
PHASE
1
Task 1
Task 2
Medical Infographics
...and our sets of editable icons
You can resize these icons without losing quality.
You can change the stroke and fill color; just select the icon and click on the paint bucket/pen.
In Google Slides, you can also use Flaticon’s extension, allowing you to customize and add even more icons.
Educational Icons Medical Icons
Business Icons Teamwork Icons
Help & Support Icons Avatar Icons
Creative Process Icons Performing Arts Icons
Nature Icons
SEO & Marketing Icons