Está en la página 1de 25

ESTADÍSTICA

INFERENCIAL II
TecNM-Istmo
TEMA: REGRESIÓN LINEAL MÚLTIPLE Y
CORRELACIÓN
• El Análisis de Regresión Lineal Múltiple nos permite establecer la relación que se produce
entre una variable dependiente Y (resultado) y un conjunto de variables independientes
(explicativa) (X1, X2, ...XK). El análisis de regresión lineal múltiple, a diferencia del simple, se
aproxima más a situaciones de análisis real puesto que los fenómenos, hechos y procesos
sociales, por definición, son complejos y,en consecuencia, deben ser explicados en la medida
de lo posible por la serie de variables que, directa e indirectamente, participan en su
concreción.

TecNM-Istmo
• Los modelo de regresión múltiple estudian:
• la relación entre una variable de interés Y (variable respuesta o dependiente)
• Y un conjunto de variables explicativas o independientes X1, X2, ...,Xp
• En el modelo de regresión lineal múltiple se supone que la función de regresión que relaciona
la variable dependiente con las variables independientes es lineal, es decir:
• Y = β0 + β1X1 + β2X2 + · · · + βpXp + ε

TecNM-Istmo
A PARTIR DE LOS ANÁLISIS DE
REGRESIÓN LINEAL MÚLTIPLE PODEMOS:
• identificar que variables independientes (causas) explican una variable dependiente (resultado)
• comparar y comprobar modelos causales
• predecir valores de una variable, es decir, a partir de unas características predecir de forma
aproximada un comportamiento o estado

TecNM-Istmo
EJEMPLOS:
• planteamos un modelo de regresión que explique la densidad de escarabajo en
función del tamaño de la arena…humedad…. Oleaje.
Se pretenden estimar los gastos en alimentación de una familia en base a la
información que proporcionan las variables 'ingresos mensuales y 'número de
miembros de la familia’.
• Estudio para conocer cuáles son los factores que explican la justificación del aborto
– saber cuáles son los factores que explican la justificación del aborto justificación del
aborto(1 es nunca lo justificaría y 10 siempre lo justificarían) –dependiente-
– Importancia de Dios en la vida: se preguntó en una escala de 1 a 10, donde 1 es nada
importante y 10 es muy importante –independiente-
– Nivel educativo: se preguntó cuál es el último nivel educativo alcanzado donde 1 es sin
estudios primarios completos, 2 es primarios completos, 3 es secundarios completos y
4 es universitarios completos.-independiente-
– Nivel de ingresos: se preguntó sobre cuánto gana al mes en una escala del 1 al 10 con
diversos rangos salariales –independiente-

TecNM-Istmo
EJEMPLOS:

• Estudio para estimar el salario de un jugador de la NBA con relación a minutos jugados, las
asistencias, los rebotes, y los puntosanotados
• Estudio para predecir la estatura de la hija considerando la estatura de la Madre y el Padre
• Predicción del tamaño de la familia a partir de la basura desechada
– Jardín
– Plástico, vidrio, metal y otros
– Alimentos

TecNM-Istmo
RECOMENDACIONES PARA ELEGIR LA
MEJOR ECUACIÓN DE REGRESIÓN
❖ Al tratar de determinar la mejor ecuación
de regresión múltiple, no necesariamente se
deben de incluir todas las variables de
predicción disponibles. La determinación de
la mejora ecuación de regresión múltiple
requiere de una buena dosis de juicio, y no
existe un procedimiento exacto y
automático que se pueda utilizar para
encontrar la mejor ecuación de regresión
múltiple. Sin embargo tomaremos como los
tres principales componentes la ecuación de
regresión múltiple, 𝑅 2 ajustada y el valorP

TecNM-Istmo
LINEAMIENTOS PARA DETERMINAR LA
MEJOR ECUACIÓN DE REGRESIÓN
MÚLTIPLE
• Utilice el sentido común y consideraciones prácticas para incluir o excluir variables. Por ejemplo, al
tratar de determinar una buena ecuación de regresión múltiple para predecir la estatura de una hija,
se debe de excluir la estatura del médico de su nacimiento, ya que esa estatura es completamente
irrelevante
• Considere el valor P Seleccione una ecuación que tenga significancia general, tal como lo determina
el valor P indicando en los resultados del programa de computo
• Considera con ecuaciones con valores altos de 𝑅2ajustado y trate de incluir solo una cuantas
variables.Trate de incluir relativamente pocas variables independientes (x)
– Para eliminar las variables independientes (x) que no tienen mucho efecto sobre la variable de respuesta
(y), sería útil Calcular el coeficiente de correlación lineal r para cada una de las variables de consideración.

TecNM-Istmo
CONCEPTOS

• Valores P Es una medida de significancia general de la ecuación de regresión múltiple. El valor de


P de 0.000 (redondeado a tres decimales) de los resultados de minitab es pequeño, lo que indica
que la ecuación de regresión múltiple tiene una buena significancia general y es útil para realizar
predicciones. Al igual que la 𝑅2 ajustada, este valor P es una buena medida de qué tan bien se
ajusta la ecuación a los datos muestrales. El valor 0.000 resulta de una prueba de hipótesis nula de
que 𝐵1 = 𝐵2 = 0 . El rechazo implica de que alguno de las 𝐵1 y 𝐵2 no es 0, lo que indica que esta
ecuación de regresión es eficaz
• 𝑅2 ajustada. Denota el coeficiente de determinación considerando el número de variables y
tamaño de la muestra, que es una medida de lo bien que se ajusta la ecuación de regresión
múltiple a los datos muestrales. Un ajuste perfecto daría como resultado 𝑅2 ajustado= 1 y un
ajuste , muy bueno daría valores cercanos a uno, un ajuste deficiente daría como resultado
valores cercanos a 0. La comparación de diferentes ecuaciones de regresión múltiple, se logra
mejor con el coeficiente ajustado de determinación (coeficiente de determinación ajustado),
para el número de variables y el tamaño de la muestra.

TecNM-Istmo
EJEMPLO
• Estaturas de Madres, Padres e hijas. Se desea encontrar una ecuación de regresión
múltiple donde la variable de respuesta (y) es la estatura de la hija y las variables
independientes (x) son las estaturas de la madre y el padre.
• Obteniendo el resultado de:
• Estatura de hija = 7.5 + 0.707 madre + 0.164 padre
• Utilizando la notación tendríamos
• 𝑌෠ = 7.5 + 0.707𝑥1 + 0.164𝑥2
• Donde 𝑦ො es la estatura predicha de una hija, 𝑥1es la estatura de la madre y 𝑥2es la estatura
del padre
• Si una ecuación de regresión múltiple se ajusta bien (valor P = 0.00 y 𝑅2 ajustada = valores
cercanos a uno), los datos muestrales se pueden emplear para hacer predicciones. Por
ejemplo: Si determinamos la ecuación de regresión múltiple y la estatura de la madre 63
pulgadas y el padre de 69 pulgadas, podemos predecir la estatura de la hija de ambos
sustituyendo esos valores en la ecuación de regresión, para obtener una estatura predicha de
63.4 pulgadas
TecNM-Istmo
EJEMPLOS

TecNM-Istmo
EJEMPLOS
La variable respuesta (y) es el precio de venta de una casa (dólares) y las
variables de predicción (x) PL (precio de lista), AH (área habitable en
metros cuadrados ),T tamaño del terreno en metros cuadrados )

TecNM-Istmo
CONTRASTE DE HIPÓTESIS: EL TEST
DE LA T
• Para realizar un contraste de hipótesis necesitamos:
• 1) Hipótesis nula: hipótesis que queremos contrastar.

– H₀ :βі = 0
• Ej: el numero de años de antigüedad no tiene efecto sobre el salario por hora, una vez controlado
por la educación y la experiencia.
• 2) Hipótesis alternativa: situación alternativa a la H0. Puede ser una alternativa bilateral o unilateral.

– H₁: βі ≠0
• Ej: los años de antigüedad contribuyen a la productividad y de ahí al salario.

TecNM-Istmo
REGLAS DE RECHAZO:
RECHAZAMOS𝐻 0

• Contraste bilateral (H1 :β1 ≠ 0): si |t βbj| > c.

• Contraste unilateral (H1 :β1 > 0): si tβbj> c.

• Contraste unilateral (H1 :β1 < 0): si tβbj< −c.

• Si H0 se rechaza en favor de H1 al α %, Xj es estadísticamente significativa (o estadísticamente


distinto de cero) al α % de significación.
• Si no rechazamos H0 al α %, Xj es estadísticamente no-significativa al α % de significación.

TecNM-Istmo
VALORES P Y LA PRUEBA DE
HIPÓTESIS
• Los valores P se obtienen automáticamente con un programa de cómputo cuando se realizan
las pruebas de bondad de ajuste.
• Recuerde que se rechaza la hipótesis nula cuando el valor de p es bajo

• Ejemplo: En la pantalla de resultados de minitab indica que el valor de p es 0.048 como este
valor es menor al nivel de significancia de 0.05, rechazamos la hipótesis nula, lo que quiere
decir que se acepta la hipótesis alternativa y consideramos que si es significativa.

TecNM-Istmo
EJEMPLO PRACTICO

• En un Hospital se lleva a cabo un estudio de la relación que existe entre la satisfacción del
paciente (y), su edad (𝑥 1 , en años), la gravedad de su enfermedad (𝑥 2 , un índice) y el nivel
de ansiedad (𝑥 3 , un índice). El investigador que ralizó el estudio seleccionó a 23 pacientes
de forma aleatoria y reunió los datos mostrados en la tabla.

TecNM-Istmo
TecNM-Istmo
TecNM-Istmo
Ecuación de regresión

Tabla de coeficientes

Valor p

Coeficientes β Estadístico t
Error
TecNM-Istmo
típico
S=error típico ,desviación ,error estándar= variabilidad de los valores de y
observados en la muestra alrededor línea de regresión.
• R.cuad=coeficiente de determinación = refleja la bondad del ajuste de un
modelo a la variable que pretender explicar.

TecNM-Istmo
• Conclusión:
• Para β₁=0.2032 si fuera posible modificar la variable independiente x1 y mantener constantes los
valores de las variables x2 y x3 entonces por cada año de edad del paciente, su satisfacción variaría en
manera proporcional en 0.2032 unidades en promedio , al igual manera al disminuir la edad la
satisfacción disminuiría en 0.2032 en promedio.
• Para β2=-0.2840, si fuera posible modificar la variable independiente x2 (índice de gravedad de la
enfermedad), y mantener constantemente la edad e índice de ansiedad, entonces por cada unidad de
variación en el índice de la gravedad de la enfermedad del paciente, su satisfacción variaría
inversamente proporcional en 0.2840 unidades. Por su parte, al aumentar el índice de la gravedad de la
enfermedad en una unidad, la satisfacción disminuiría en 0.2840 unidades en promedio; de la misma
forma, al disminuir el índice de gravedad de la enfermedad la satisfacción aumenta en 0.2840 unidades
en promedio.
• Para β3=13.5739, si fuera posible modificar la variable independiente x3 (índice de ansiedad) y
mantener contantemente la edad y el índice de gravedad del paciente, entonces por cada unidad de
variación en el índice de ansiedad del paciente, su satisfacción variaría de manera proporcional en
13.5739 unidades. Por su parte, al aumentar el índice de ansiedad en una unidad, la satisfacción
aumentará en 13.5739 unidades en promedio; de igual manera, al reducir el índice de ansiedad, las
satisfacción se reduciría en 13.5739 unidades en promedio.
TecNM-Istmo
Prueba t a 5% de significancia para los contrastes de hipótesis
H₀ :βі=0 H₁:βі≠0

• Conclusión:
• La columna de probabilidad los valores p es para decidir si se rechaza o no las hipótesis:
• Se obtuvo p1 =0.134> 0.05 = α,se concluye que no hay evidencia para rechazar la hipótesis
H0:βі =0
• Se obtuvo p2 =0.1263> 0.05 = α,se concluye que no hay evidencia para rechazar la hipótesis
H0:βі =0
•Se obtuvo p3 =0.0004<0.05 = α,se concluye que rechaza la hipótesis H0: β і = 0
(es decir se acepta la hipótesis alternativa H1: βі ≠ 0 )

TecNM-Istmo
CONCLUSIÓN:

• Se tiene que las variables independientes x1 y x2 a 5% de significancia no influyen en la


satisfacción de los pacientes, no así para x3.

TecNM-Istmo
EN EXCEL

TecNM-Istmo
EN EXCEL

TecNM-Istmo

También podría gustarte