Está en la página 1de 77

Aplicación del Análisis de

Regresión Robusta
INTEGRANTES
• BENITO SANTILLÁN ANDRÉ BENITO
• CAMPOS PALPA GERALDO ELOY
• HUAYLLA ARIAS ANGEL RONALD
• PAUCAR FUENTES KEVIN DENIZ
Metodología
1 Introducción Estimadores M 4
Un breve resumen sobre el Definiciones y fórmulas de
tema expuesto. 1 6 estimadores
Funciones
2 Observaciones
2 Robustas 5
Algunas acotaciones en 5 Mención de las funciones
cuenta a tomar. mas utilizadas hoy en día

Ejemplo
3 Clasificación 3 4 Aplicativo 6
Mención de valores Un ejercicio de base para
atípicos de la regresión entender este tema
Introdución
Sabemos que cuando las observaciones 𝑦 en el
modelo de regresión lineal están normalmente
distribuidas, el método de mínimos cuadrados es un
buen procedimiento de estimación de parámetros,
porque produce un estimador del vector 𝛽 de
parámetros que tiene buenas propiedades
estadísticas. Sin embargo, hay muchos casos en los
que hay evidencias de que la distribución de la
variable de respuesta (𝑦) tiene una distribución no
normal o hay valores atípicos que afectan al modelo
de regresión.
¿Porque se utiliza este tipo de regresión ?
1.   las observaciones y en el modelo de regresión lineal esta normalmente distribuida
Cuando

El método de mínimos cuadrados es un buen procedimiento de estimación de parámetros,


porque produce un estimador del vector β de parámetros que tiene buenas propiedades
estadísticas, sin embargo, hay muchos casos en los que la distribución de la variable
respuesta tiene una distribución no normal y/o hay valores atípicos que afectan al modelo de
regresión. Un caso de mucho interés práctico es aquél en el que las observaciones tienen
una distribución que tiene colas más largas o gruesas que la distribución normal. Esas
distribuciones tienden a generar valores atípicos, que pueden tener una gran influencia
sobre el método de los mínimos cuadrados, al desplazar demasiado la ecuación de regresión
en su dirección.
Ilustración
Por ejemplo, en la siguiente figura El punto identificado con A en esa figura está en el
extremo derecho del espacio de x, pero su valor de respuesta queda cerca del promedio
de las otras 9 respuestas.

A
Observaciones
• Si se tienen en cuenta todas las observaciones, el modelo de regresión que resulta
es y = 1,3444 + 1,0239x, y R2 = 0.544, no obstante, si se ajusta el modelo de
regresión lineal con todas las observaciones excepto A, se obtiene y = 0,1109 +
1,5351x, para el cual R2 = 0.8885.
• Es claro que el punto A tuvo un efecto radical sobre el modelo de regresión, y
sobre el valor obtenido de R2.
• Una forma de manejar esta situación es eliminar la observación A, así se obtiene una
recta que pasa muy bien por el resto de los datos, más agradable desde un punto de
vista estadístico, sin embargo, lo que se está haciendo ahora es descartar
observaciones tan solo porque es agradable desde un punto de vista de modelado
estadístico, y por lo general esa práctica no es buena.
• Un procedimiento de regresión robusta es aquel que amortigua el efecto de las
observaciones que serían muy influyentes si se usaran los mínimos cuadrados, lo que
nos indica que un procedimiento robusto tiende a dejar grandes los residuales
asociados con valores atípicos, facilitando así la identificación de puntos influyentes.
• Además de la insensibilidad a los valores atípicos, un procedimiento de estimación
robusta debería producir, en esencia, los mismos resultados que los mínimos
cuadrados cuando la distribución básica es normal, y cuando no hay valores atípicos.
Otro objetivo deseable de la regresión robusta es que los procedimientos de
estimación y los de referencia sean relativamente fáciles de llevar a cabo.
• Los métodos de regresión robusta son técnicas que en potencia se pueden usar
cuando hay valores atípicos. Hay varias clases de valores atípicos que se presentan
en el contexto de modelos de regresión
Una clasificación frecuente es la siguiente
01 Valor atípico de regresión. 02 Valor atípico residual.
Es un punto que tiene un residual
Punto que se desvía de la regresión estandarizado o estudentizado grande,
lineal que se determina con las n – 1 cuando se usa en la muestra de n
observaciones restantes. observaciones con que se ajusta un
modelo

03 Valor atípico en el espacio X


Es una observación remota en
04 Valor atípico en el espacio Y
Es una observación con coordenada Y
una o más coordenadas X. inusual. El efecto de esta observación en
el modelo de regresión depende de X

05 Valores atípicos en los espacios X y Y.


Es una observación que es atípica en sus
coordenadas X y Y al mismo tiempo.
Observemos la siguiente imagen
Para seguir demostrando por qué puede ser bueno usar una alternativa de los
mínimos cuadrados cuando las observaciones no tienen distribución normal,
considérese el modelo de regresión lineal simple:
 

Donde los errores son variables aleatorias independientes que tienen la distribución
doble exponencial:
Gráfica Exponencial
 Para estimar se usará el método de máxima verosimilitud. Esta función es:

Por consiguiente, al maximizar la función de verosimilitud se minimiza , la suma de los errores


absolutos. Recuérdese que el método de máxima verosimilitud aplicado al modelo de regresión,
con errores de distribución normal, conduce al criterio de los mínimos cuadrados, así, la
hipótesis de una distribución de error con colas más gruesas que las de la normal implica que el
método de los mínimos cuadrados ya no es una técnica óptima de estimación. Nótese que el
criterio del error absoluto ponderaría los valores atípicos con mucho menos severidad que los
mínimos cuadrados. La minimización de la suma de errores absolutos se llama con frecuencia
problema de regresión L1-norm (mínimos cuadrados es el problema de regresión L2-norm).
Estimadores M
(estimador de máxima verosimilitud)
 
El problema de regresión L1-norm es un caso especial de la regresión Lp-norm, en el
que los parámetros del modelo se escogen para minimizar , donde . Cuando 1 < p < 2,
se puede formular y resolver el modelo con técnicas de programación no lineal. Esto
surge de forma natural a partir del método de máxima verosimilitud, con errores
doblemente exponenciales. En general, se define una clase de estimadores robustos
que minimizan una función p de los residuales, por ejemplo:
 

Donde: x¡' representa el i-ésimo renglón de X.


Un estimador de este tipo se llama estimador M, donde M quiere decir máxima
verosimilitud, esto quiere decir que, la función se relaciona con la función de
verosimilitud para una elección adecuada de la distribución del error.
 Por ejemplo: Si se usa el método de mínimos cuadrados (que implica que
la distribución de errores es normal), entonces la función de densidad.

El estimador M no necesariamente es invariante de escala [es decir, si se


multiplicaran los errores Yi - x¡'f3 por una constante, la nueva solución de
la ecuación (I) podría variar, para ello se realizará una ecuación invariante
de escala para este estimador y esto se formula de la siguiente forma:

Donde: s es un estimado robusto de escala.


 Una elección muy frecuente de s es la mediana de la desviación absoluta
s= -
La constante de ajuste 0.6745 hace que s sea aproximadamente un
estimador insesgado de si n es grande y la distribución de errores es
normal.
Para minimizar la ecuación , se igualan a cero las primeras derivadas
parciales de con respecto a (j = 0, 1, ... , k), y se obtiene una condición
necesaria para un mínimo.
 
 De este modo se obtiene el sistema de = k + 1 ecuaciones:

Donde: y es la i-ésima observación del j-ésimo regresor, y = 1,


En general, la función es no lineal, y se debe resolver la ecuación (III) por
métodos iterativos. Si bien se podrían emplear varias técnicas no lineales de
optimización, lo que más se usa son los mínimos cuadrados reponderados
iterativamente.
 Para aplicar los mínimos cuadrados reponderados iterativamente se
supone un estimado inicial y que s es un estimado de escala. A
continuación, se realizarán las = k + 1 ecuaciones (III).

 
en la forma: …(IV)
TABLA DE FUNCIONES DE CRITERIO ROBUSTO
 Donde: … (V), en notación matricial para la
ecuación (IV) será de la siguiente forma: … (Ecuaciones normales)
 
Donde: es una matriz diagonal de n x n de "pesos" con elementos diagonales
Se sabe que la última ecuación matricial representa las ecuaciones normales por mínimos cuadrados y el
estimador por etapa es:

En el siguiente paso se recalculan los factores de ponderación o pesos con la ecuación (V), pero con en
lugar de . Por lo general solo se requieren unas pocas iteraciones para alcanzar la convergencia. El
procedimiento de mínimos cuadrados iterativamente reponderados se podría implementar con un
programa computacional estándar de mínimos cuadrados ponderados.
Funciones de Criterio Robusto

 Los procedimientos de
regresión robusta se
pueden clasificar de
acuerdo con el
comportamiento de su
función . Esta función
controla el factor de
ponderación que se
asigna a cada residual y
(además de una
constante de
E0.3 proporcionalidad), a
veces se llama función
W de influencia.
 Por ejemplo: La función para mínimos cuadrados no es acotada, por lo que los
mínimos cuadrados tienden a ser no robustos cuando se usan con datos procedentes de
una distribución con colas gruesas. La función t de Huber tiene una función monótona
y no pondera residuales grandes con tanta intensidad como los mínimos cuadrados.
La¡; tres últimas funciones de influencia en realidad redescienden a medida que el
residual se hace más grande.
 Es importante conocer algo acerca de la estructura de los errores en los estimados ~
de la regresión robusta final. Es importante determinar la matriz de covarianza de si
se deben establecer intervalos de confianza, o si se van a hacer otras inferencias,
Huber demostró que, asintóticamente, tiene una distribución aproximadamente
normal, y su matriz de covarianza es:
Funciones robustas de influencia
Estas se clasifican en 5 funciones

Mínimos Funciones Función E de


 
Cuadrados t de Huber Ramsay

Función de onda Función 17A


de Andrews de Hampel
Mínimos Cuadrados

Función Lineal
En su forma más simple, intenta minimizar la suma de cuadrados
de las diferencias en las ordenadas (llamadas residuos) entre los
puntos generados por la función elegida y los correspondientes
valores en los datos.
Función t de Huber

Función Compuesta
Tiene la propiedad de ser menos
sensible a los valores atípicos que
la suma de los cuadrados
residuales. 
Función E  de Ramsay

Función Concava
Podemos ver que esta función es más
"picuda" en el centro que la normal, y las
colas van a cero cuando IεiI tiende a
infinito.
Función onda de Andrews

Función no Lineal
Notamos que esta función es creciente
hasta /2 y luego decrece
  hasta llegar a y de
manera contraria cuando es menor a 0.
Función 17A de Hampel

Función Compuesta
Notamos que esta función es creciente y
luego es constante en un cierto intervalo (a,b)
y luego descrece hasta c y de manera
contraria cuando son menores a 0.
 Por lo anterior, una aproximación razonable para la matriz de covarianza de es;
 

 
También, el programa de cómputo para mínimos cuadrados ponderados obtiene
un estimado de la matriz de covarianza.
 
 Apesar de que en Welsch y en Hill se presentan otras sugerencias,
no hay acuerdo generalizado acerca de cuál aproximación a la
matriz de covarianza de es la mejor, tanto Welsch como Hill hacen
notar que esos estimados de matriz de covarianza funcionan mal
con matrices X que tienen puntos atípicos.
 
También el deterioramiento (multicolinealidad) distorsiona los
estimados de regresión robusta, sin embargo, hay indicaciones de
que en muchos casos se pueden hacer inferencias aproximadas
acerca de mediante procedimientos parecidos a los de la teoría
normal acostumbrada.
Ejemplo Aplicativo
Enunciado
● Un embotellador de bebidas gaseosas analiza las rutas de
servicio de las máquinas expendedoras en su sistema de
distribución. Le interesa predecir el tiempo necesario para
que el representante de ruta atienda las máquinas
expendedoras en una tienda. Esta actividad de servicio
consiste en abastecer la máquina con productos
embotellados, y algo de mantenimiento o limpieza. Y se ha
sugerido que las dos variables más importantes que
afectan el tiempo de entrega
Observacion Y(Tiempo de entrega) X1(Cantidad de Cajas) X2 (Distancia)

1 16,68 7 560
2 11,5 3 220
3 12,03 3 340
4 14,88 4 80
5 13,75 6 150
6 18,11 7 330
7 8 2 110
8 17,83 7 210
9 79,24 30 1460
10 21,5 5 605

Datos
11 40,33 16 688
12 21 10 215
13 13,5 4 255
14 19,75 6 462
15 24 9 448
16 29 10 776
17 15,35 6 200
18 19 7 132
19 9,5 3 36
20 35,1 17 770
21 17,9 10 140
22 52,32 26 810
23 18,75 9 450
24 19,83 8 635
25 10,75 4 150
Procedimiento

● Primero realizaremos el método de los Mínimos Cuadrados


Ordinarios, para poder obtener los coeficientes de regresión iniciales y
los residuos.
● Obtenemos los coeficientes de regresión para poder armar nuestro
modelo, el cual sería:

𝑦=2.3412+1.6159𝑥1+0.0144𝑥2
𝑅2=0.961𝑦 𝜎=3.201
Graficas
Procedimiento

● Los estadísticos de resumen del modelo no revelan algo


desacostumbrado en este ajuste, sin embargo, una gráfica de
probabilidad normal de los residuales indicó que es dudosa la
suposición de normalidad, y que es posible que los errores
pertenezcan a una distribución con colas gruesas. Al profundizar el
análisis se vio que hay cuatro observaciones relativamente influyentes,
los puntos 1,4,9 y20.
Research and Publications

“Mercury is the closest planet to “Venus has a beautiful name


the Sun and the smallest one in and is the second planet from
the Solar System” the Sun”

By Mercury By Venus
Where Are Our Research Centers?

Venus
Venus has a beautiful
name but it’s hot

Mars
Despite being red, Mars
is a cold place
“This is a quote, words full of wisdom that
someone important said and can make the
reader get inspired.”
—Someone Famous
Factors to Consider

Venus Jupiter
Venus is the second It’s the biggest planet in
planet from the Sun the Solar System

Mars Saturn
Despite being red, Mars Saturn is a gas giant
is a cold place and has several rings
150,000
Big numbers catch your audience’s attention
Clinical Trial

Preclinical Phase 1 Phase 2 Phase 3


Lab Studies Human Safety Expanded Safety Efficacy & Safety
Trial Timeline

Jupiter is a really big Neptune is far away


planet from Earth

Preclinical Results

Research Experimentation Conclusions


Mercury is a really Venus is the second Mars is actually a very
small planet planet from the Sun cold place
Phase 1
Sample Side Effects

40% 25%
Young healthy people
20 - 80 Participants Saturn Neptune
It’s a gas giant and has It’s the farthest planet
several rings from the Sun

Goal 6 Months Results


Saturn is a gas giant Mercury is a really Despite being red, Mars is actually a cold
with rings small planet place. It’s full of iron oxide dust
Trend
Phase 1
Venus is the second planet
from the Sun

Phase 2
Despite being red, Mars is
actually a cold place

Phase 3
Saturn is a gas giant and has Follow the link in the graph to modify its data and then paste
several rings the new one here. For more info, click here
Results

Outcome
Treatment Test 1 Test 2 Test 3
Group 1 315 285 600

Group 2 210 390 600

Group 3 240 165 580


Results Analysis
Venus Nausea
Venus is the second Jupiter is the biggest planet
planet from the Sun of them all

Mars Tachycardia
Despite being red, Mars Mercury is the closest planet
is a cold place to the Sun

Saturn Muscle Pain


Saturn is a gas giant and The Sun is the star at the
has several rings center of the Solar System
9h 55m 23s
is Jupiter's rotation period

333,000.000
earths is the Sun’s mass

386,000 km
is the distance between Earth and the Moon
Success Rate

75% 25%
Patients Cured
Without Side Effects
Number
Neptune is far away Venus has a very
from Earth beautiful name
Conclusions
Mercury is the closest planet to the
Sun and the smallest one in the
Solar System. This planet's name
has nothing to do with the liquid
metal
Meet The Team

Jenna Doe Timmy Jimmy Susan Bones


You can talk a bit about this You can talk a bit about this You can talk a bit about this
person here person here person here
Follow Us!
You can replace the image on the
screen with your own work. Just
delete this one, add yours and
center it properly
Thanks!
Do you have any questions?

youremail@freepik.com
+91 620 421 838
yourcompany.com

Please keep this slide for attribution

CREDITS: This presentation template was created by Slidesgo, including


icons by Flaticon, infographics & images by Freepik
Alternative Resources
Resources
Did you like the resources on this template? Get them for free at our other websites:

Vectors:
● Company card in abstract painted style

Photos:
● Cheerful male doctor with tablet and pen
● Senior woman with medical problems
● Confident young doctor
● Smiling doctor looking at camera
● Nurse checking pulse on female patient's wrist
● High angle of covid recovery center female doctor checking elder patient's blood press
ure
● Man with back pains
Instructions for use
In order to use this template, you must credit Slidesgo by keeping the Thanks slide.

You are allowed to:


- Modify this template.
- Use it for both personal and commercial projects.

You are not allowed to:


- Sublicense, sell or rent any of Slidesgo Content (or a modified version of Slidesgo Content).
- Distribute Slidesgo Content unless it has been expressly authorized by Slidesgo.
- Include Slidesgo Content in an online or offline database or file.
- Offer Slidesgo templates (or modified versions of Slidesgo templates) for download.
- Acquire the copyright of Slidesgo Content.

For more information about editing slides, please read our FAQs or visit Slidesgo School:
https://slidesgo.com/faqs and https://slidesgo.com/slidesgo-school
Instructions for use (premium users)
In order to use this template, you must be a Premium user on Slidesgo.

You are allowed to:


● Modify this template.
● Use it for both personal and commercial purposes.
● Hide or delete the “Thanks” slide and the mention to Slidesgo in the credits.
● Share this template in an editable format with people who are not part of your team.

You are not allowed to:


● Sublicense, sell or rent this Slidesgo Template (or a modified version of this Slidesgo Template).
● Distribute this Slidesgo Template (or a modified version of this Slidesgo Template) or include it in a database or in
any other product or service that offers downloadable images, icons or presentations that may be subject to
distribution or resale.
● Use any of the elements that are part of this Slidesgo Template in an isolated and separated way from this
Template.
● Register any of the elements that are part of this template as a trademark or logo, or register it as a work in an
intellectual property registry or similar.

For more information about editing slides, please read our FAQs or visit Slidesgo School:
https://slidesgo.com/faqs and https://slidesgo.com/slidesgo-school
Fonts & colors used
This presentation has been made using the following fonts:

Abril Fatface
(https://fonts.google.com/specimen/Abril+Fatface)

Red Hat Text


(https://fonts.google.com/specimen/Red+Hat+Text)

#e5e0dcff #eaccbbff #976e6fff #95b4a1ff #c87743ff #ffe9deff #5e564bff


Storyset
Create your Story with our illustrated concepts. Choose the style you like the most, edit its colors, pick
the background and layers you want to show and bring them to life with the animator panel! It will boost
your presentation. Check out How it Works.

Pana Amico Bro Rafiki Cuate


Use our editable graphic resources...
You can easily resize these resources without losing quality. To change the color, just ungroup the resource
and click on the object you want to change. Then, click on the paint bucket and select the color you want.
Group the resource again when you’re done. You can also look for more infographics on Slidesgo.
JANUARY FEBRUARY MARCH APRIL MAY JUNE

PHASE 1

Task 1

Task 2

PHASE 2

Task 1

Task 2

JANUARY FEBRUARY MARCH APRIL

PHASE
1

Task 1

Task 2
Medical Infographics
...and our sets of editable icons
You can resize these icons without losing quality.
You can change the stroke and fill color; just select the icon and click on the paint bucket/pen.
In Google Slides, you can also use Flaticon’s extension, allowing you to customize and add even more icons.
Educational Icons Medical Icons
Business Icons Teamwork Icons
Help & Support Icons Avatar Icons
Creative Process Icons Performing Arts Icons
Nature Icons
SEO & Marketing Icons

También podría gustarte