Está en la página 1de 23

ESTADÍSTICA INFERENCIAL II

Regresión Lineal Simple


Con frecuencia, científicos e ingenieros reúnen datos con el
propósito de determinar la naturaleza de la relación entre dos
cantidades. Por ejemplo, un ingeniero químico puede realizar
varias veces un proceso químico para estudiar la relación entre
la concentración de cierto catalizador y la producción del
REGRESIÓN LINEAL proceso. Cada vez que realiza éste, registra la concentración x y
la producción y. Por consiguiente, el experimento genera datos
bivariados; un conjunto de pares ordenados (x1, y1), . . . , (xn,
yn). En muchos casos, al graficar los pares ordenados que se
generan en un experimento científico se encontrarán,
aproximadamente, a lo largo de una línea recta. En estos casos,
los datos son útiles para calcular la ecuación de una recta.
Los métodos de correlación y la regresión
REGRESIÓN Y lineal simple se utilizan para: analizar datos
CORRELACIÓN bivariados con la finalidad de determinar si un
ajuste lineal es adecuado, calcular la ecuación
de la recta si es adecuado, y usar esta ecuación
con el fin de hacer inferencias respecto de la
relación entre ambas cantidades
TIPOS DE RELACIONES

Los análisis de regresión y de


correlación se basan en la
relación, o asociación, entre dos
(o más) variables. La variable (o
variables) conocida(s) se llaman
variable(s) independiente(s); la
que tratamos de predecir es la
variable dependiente.
DIAGRAMAS DE DISPERSIÓN

 El primer paso para determinar si existe una relación entre dos variables es
examinar la gráfica de los datos observados (o conocidos).

 Un diagrama de dispersión nos puede dar dos tipos de información. Visualmente,


podemos identificar patrones que indiquen que las variables están relacionadas.
Si esto sucede, podemos ver qué tipo de línea, o ecuación de estimación,
describe esta relación.
COEFICIENTE DE CORRELACIÓN

Es una medida numérica que índica qué tan fuerte es la relación


lineal entre dos variables.
r= Coeficiente de correlación
Mientras más cercano éste de 1 ó -1,es más fuerte la relación lineal. Si
r es un valor positivo, la relación lineal es positiva, es decir a medida
que aumenta la variable independiente X aumenta también la
variable dependiente Y
Si r es un valor negativo, la relación lineal es negativa, a medida que
aumenta la variable independiente X, disminuye la variable
dependiente Y.
Si r=0, esto no significa que las
dos variables sean
Es una medida de asociación
independientes. Lo que
lineal o dependencia lineal
significa es que no existe
solamente; su uso en la
relación lineal entre ellas,
descripción de relaciones no
pero puede haber otro tipo
lineales no tiene significado.
de asociación: cuadrática,
exponencial, logarítmica.

EL COEFICIENTE DE CORRELACIÓN MIDE SÓLO LA


ASOCIACIÓN LINEAL
La relación entre la altura de un objeto en caída libre con una velocidad positiva
inicial y el tiempo de caída libre es cuadrático. La correlación es igual a 0.
DATOS ATÍPICOS

La correlación es 0.26. Debido a los datos atípicos el


coeficiente de correlación es engañoso.
El solo hecho de que dos variables estén correlacionadas entre
sí no permite suponer que el cambio en una tenderá a ocasionar
un cambio en la otra. Antes de que se concluya que las dos
variables tienen una relación causal se debe descartar la
posibilidad de confusión.

Relación Espuria (factor de confusión)

Error al diseñar el experimento (variables escondida)

LA CORRELACIÓN NO ES
CAUSALIDAD
¿CÓMO OBTENER LA ECUACIÓN DE LA LÍNEA RECTA QUE MEJOR SE AJUSTA A LOS DATOS?

Aquí es cuando entra el


análisis de regresión. Con  En regresión lineal simple,
los datos de la muestra se generalmente, se estiman
pretende obtener una
los parámetros del modelo
ecuación del tipo:
bo y b1 que minimizan el
cuadrado medio del error
(la suma de cuadrados de
los residuales).

En realidad sabemos
que está estimación va
a tener un error, que se
representa con:
MODELO LINEAL
¿CÓMO INTERPRETAR LOS COEFICIENTES EN REGRESIÓN LINEAL?

 𝑏0 no siempre se puede explicar porque un valor de X=0 puede no ser factible.

 El valor de 𝑏1 , indica lo que en promedio cambia Y por un cambio de una unidad en X.

Cabe aclarar, que la variable dependiente en regresión lineal es cuantitativa y por lo


general también la variable independiente es cuantitativa, en algunas ocasiones es
cualitativa ordinal (dato de una cualidad en donde las posibles respuestas llevan un
orden y se pueden representar por números).
EJEMPLO:

 Y= ventas en miles de galones


 X= Precio de la leche en dólares
 b1=-14.54. Indica que en promedio las ventas aumentan 14.54 cuando el
precio de la leche disminuye 1 dólar
 En general, b1, índica cuanto cambia Y en promedio por un cambio en
una unidad en X.
Fórmulas para el cálculo de la línea de regresión y el coeficiente de correlación
MÉTODO DE MÍNIMOS CUADRADOS
σ 𝑥𝑖 2
2
𝑆𝑆𝑥𝑥 = ෍ 𝑥𝑖 −
𝑛

σ 2
𝑦 𝑖
𝑆𝑆𝑦𝑦 = ෍ 𝑦𝑖2 −
𝑛
σ 𝑥𝑖 σ 𝑦𝑖
𝑆𝑆𝑥𝑦 = ෍ 𝑥𝑖 𝑦𝑖 −
𝑛
𝑆𝑆𝑥𝑦
𝑏1 = 𝑏0 = 𝑦ത − 𝑏1 𝑥ҧ
𝑆𝑆𝑥𝑥

𝑦ො𝑖 = 𝑏0 + 𝑏1 𝑥𝑖

𝑆𝑆𝑥𝑦
𝑟=
𝑆𝑆𝑥𝑥 𝑆𝑆𝑦𝑦
COEFICIENTE DE DETERMINACIÓN O R2

El coeficiente de determinación mide el porcentaje de variabilidad en Y que


puede explicarse a través del conocimiento de la variable independiente X.
Toma valores entre 0 y 1, mientras más cercano este de 1 es mejor el ajuste
del modelo de regresión. Se calcula de la siguiente manera:

El coeficiente de determinación es el cuadrado del coeficiente de


correlación lineal.
ERROR ESTÁNDAR DE ESTIMACIÓN

El error estándar de estimación mide la dispersión de los datos con respecto a la línea
de regresión.

También podría gustarte