REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

Términos y conceptos

Suposiciones
Análisis de correlación

Análisis de regresión de mínimos cuadrados

Diagrama de dispersión
Diagrama de dispersión Coeficiente de correlación r Línea de regresión de muestra Prueba de Ho: P=0

Utilice alternativa a la regresión de mínimos cuadrados

Datos recolectados en orden secuencial

Diagnóstico de regresión

muestrales. COEFICIENTES DE REGRESIÓN: Son parámetros a estimar a partir de los datos VALOR MEDIO O ESPERADO: Constante de gravedad que nos señala los valores donde se sitúa los valores de máxima probabilidad de la variable aleatoria. . afectan a una aleatoria. Ei = Error del modelo ei= Se denomina residuo y describe el error en el ajuste del modelo en el iésimo punto de los datos. y si existe una relación se establece en una expresión lineal. ECUACIÓN DE REGRESIÓN: Relación que se ajusta a un conjunto de datos experimentales.REGRESIÓN LINEAL SIMPLE: Estudia cómo los cambios de una variable no aleatoria.

DIAGRAMA DE DISPERSION: es una representación en un sistema de coordenadas cartesianas de los datos numéricos observados. HIPOTESIS NULA: se utiliza para designar cualquier hipótesis formulada para ver si puede ser rechazada . COEFICIENTE DE CORRELACIÓN :permite predecir si entre dos variables existe o no una relación o dependencia matemática.CONCEPTOS CORRELACION:se basa en el grado de relación que poseen dos variables numéricas entre si.

ei= Es el residuo.Se predice una variable dependiente en función de una variable independiente simple.  Su media se relaciona linealmente con x mediante:  n parejas de (xi.y .  Y|x es la variable aleatoria Y que corresponde a un valor fijo x. describe el error en el ajuste: ei= yi . y cada Yi se describe con el modelo de regresión lineal simple: Hay tres tipos de errores:  Ei: error del modelo  εi = Valor de una variable aleatoria y α tal que μ = 0.yi) donde deseamos determinar la línea que mejor se ajuste con: y = a + Bx Todas las medias caen en una línea recta.

t α/2 Se √ n / Sxx  Pendiente de la línea de regresión es β es el cambio promedio de las y correspondiente a un incremento unitario en x.t α/2 Se √ ( 1/n + (n(xo-x)2)/ Sxx .t α/2 Se √ (Sxx + (nx)2) / nSxx b +. Límites de confianza para los coeficientes de regresión: a +.  Límites de confianza para α + βxo: (a+bxo) +.

. entre más datos.Es la línea que se utiliza para distinguir entre le valor estimado o predicho. es la línea que se ajusta mejor a los datos que obtenidos de la muestra tomada. más exactas serán las suposiciones.

.

 Método de calcular la ecuación de la línea que mejor ajusta un conjuntos dado de datos apareados. . se hace la suma: Σ ei Si Σei=0 . que da valores de a y b ( estimaciones). (ei).  Debemos determinar a y b de forma que los errores sean lo más pequeño posible. elegiremos a y b tales que: Σ [yi – (a + bxi)]2  La ecuaciones lineales con las incógnitas a y b se denominan ecuaciones normales. minimizamos la suma de los cuadrados de los ei.

yi): Sxx= nΣxi2 – (Σxi)2 Syy= n Σyi2 – (Σyi)2 Sxy= n Σ xiyi – (Σ xi)(Σ yi) Estimacion de σ2 Se2= Sxx Syy – (Sxx)2 / n(n-2) Sxx  Estadísticos para inferencias acerca de α y β: t= [(a-α) / se] √ (nSxx / Sxx + (nx)2 .  Expresiones relacionadas con los valores muestrales (xi. Se emplea cuando la relación entre x y la media de y es lineal o bastante cercana a una línea recta.

los estimadores de mínimos cuadrados tienen la variancia más pequeña. Los estimadores de mínimos cuadrados son los más confiables por hallarse sujetos a variaciones aleatorias más pequeñas. .“Entre todos los estimados insesgados de α y β que son lineales en las yi.

CORRELACION .

CORRELACION • El concepto de relación o correlación se refiere al grado de variación conjunta existente entre dos o mas variables. . • Nos vamos a centrar en el estudio de un particular de relación llamada lineal y nos vamos a limitar a considerar dos variables únicamente (simple X y Y) .

. A esta clase de problemas se les llama problemas de análisis de correlación donde se supone que los datos puntuales (Xi.Y) ..Análisis de correlación • Si consideramos la relación entre las precipitaciones pluviales y la producción de cierta cosecha.. Yi) para i= 1. la relación entre la resistencia a la tensión y la dureza del aluminio o la conexión entre las impurezas del aire y la incidencia de cierta enfermedad.n son valores de un par de variables aleatorias cuya densidad conjunta esta dada por f(X..2.

Este coeficiente se aplica cuando la relación que puede existir entre las varables es lineal El coeficiente de correlación lineal se calcula aplicando la siguiente fórmula: r = Sxy / √ (Sxx *Syy) • • Es decir: Numerador: se denomina covarianza y se calcula de la siguiente manera: en cada par de valores (x.Coeficiente de correlación lineal • El coeficiente de correlación lineal mide el grado de intensidad de esta posible relación entre las variables. Denominador se calcula el produto de las varianzas de "x" y de "y". • • • • • . La correlación es tanto más fuerte cuanto más se aproxime a 1.y) se multiplica la "x" menos su media. la correlación lineal es positiva (si sube el valor de una variable sube el de la otra). y a este produto se le calcula la raíz cuadrada. por la "y" menos su media. Se suma el resultado obtenido de todos los pares de valores y este resultado se divide por el tamaño de la muestra. Los valores que puede tomar el coeficiente de correlación "r" son: -1 < r < 1 Si "r" > 0.

r. si se realiza un cambio de unidades. r = 1 ó r = -1. tiene las siguientes propiedades: • No tiene dimensiones: Es decir. | r | es próximo a 0. no depende de las unidades en las que se expresan los valores de las dos variables. . • Si la correlación es fuerte. • Si la correlación es débil.PROPIEDADES DEL COEFICIENTE DE CORRELACION El coeficiente de correlación. | r | es próximo a 1. •El valor de r está comprendido entre -1 y 1. Por tanto. el valor de r no varía. • Si la correlación es perfecta (puntos de la nube alineados). entonces | r | = 1. es decir.

hay una buena correlación positiva entre las variables según un modelo lineal y la recta de regresión que se determine tendrá pendiente positiva. No hay correlación r 0 Hay correlación no lineal Correlación lineal Correlación lineal positiva negativa r 0 r  1 (c) Rosario Ruiz Baños. será creciente. • Cuando r es cercano a +1. No se puede trazar una recta de regresión. • Cuando r es próximo a 0. • Cuando r es cercano a -1. Universidad de Granada (España) r  1 . La nube de puntos está muy dispersa o bien no forma una línea recta. Departamento de Biblioteconomía y Documentación. no hay correlación lineal entre las variables. r. hay una buena correlación negativa entre las variables según un modelo lineal y la recta de regresión que se determine tendrá pendiente negativa: es decreciente.Grado de Correlación • El coeficiente de correlación. presenta valores entre –1 y +1.

la otra (Yi) en la ordenada y los pares (Xi. Yi) se representan como una nube de puntos. Este es un grafico en el que una de las variables (Xi) se coloca en el eje de la abscisa.DIAGRAMA DE DISPERSIÓN La forma mas directa e intuitiva de formarnos una primera impresión sobre el tipo de relación existente entre dos variables esa través de un diagrama de dispersión. La forma de la nube de puntos nos informa sobre el tipo de relación existente entre las variables .

se seleccionó una muestra de 20 almacenes de entre todos los que conforman la cadena. .Suponga que al administrador de una cadena de almacenes departamentales le gustaría desarrollar un modelo para predecir las ventas semanales ( en miles de dólares) de cada tienda..Ejemplo.

DIAGRAMA DE DISPERSIÓN ventas semanales (míles de dolares) 15 10 Serie1 5 0 0 500 1000 1500 número de clientes .

cuando ocurre esto.Muestra una situación de que entre mayores son las puntuaciones en una variable. los puntos se sitúan en una línea recta ascendente y hablamos de una relación lineal positiva. Correlación lineal positiva r  1 . mayores son también . las puntuaciones en la otra.

Correlación lineal negativa r  1 . en este caso los puntos se sitúan en una línea recta descendente y hablamos de una relación lineal negativa.Representa una situación de que entre mayores sean las puntuaciones de una variable. menores son las puntuaciones en la otra.

Hay correlación no lineal r 0 No hay correlación r 0 . La nube de puntos está muy dispersa o bien no forma una línea recta. No se puede trazar una recta de regresión.Cuando r es próximo a 0. no hay correlación lineal entre las variables.

.La importancia del cálculo de regresiones lineales es importante porque nos permite predecir valores de respuesta a uno o más valores de la variable independiente. representa un intervalo que tiene una probabilidad igual a 1-α de contener no un parámetro sino un valor futuro yo de la variable aleatoria Yo. El intervalo de predicción calculado.

Ho p= 0 H1 p> 0 En el cálculo de la hipótesis se pueden cometer 2 tipos de errores: El rechazo de la hipótesis nula cuando es verdadera se llama error tipo I.Una hipótesis estadística es cualquier conjetura sobre una o varias características de interés de un modelo de probabilidad. Puede ser: paramétrica (simple o compuesta) y no paramétrica. La hipótesis que se contrasta se denomina hipótesis nula (H0). . Si se rechaza la hipótesis nula es porque se asume como correcta una hipótesis complementaria que se denomina hipótesis alternativa (H1). La aceptación de la hipótesis nula cuando es falsa se llama error tipo II.

Por ejemplo. En vista de que formulamos la hipótesis de que no hay diferencia en los costos de los dos métodos de irrigación. p=0 A menudo se requiere que formulemos la hipótesis opuesta a la que deseamos probar. si queremos demostrar que un método de irrigación es más costoso que otro. . formulamos la hipótesis de que los dos son igualmente costosos.HIPOTESIS NULA Ho. a esta hipótesis la llamaremos hipótesis nula y la denotaremos por Ho .

la hipótesis nula p=0. con el estadístico z= √ (n-3) * Z = √ (n-3)/2 * ln (1+r ) / (1-r) Donde: n= tamaño de la muestra Z= transformación Z de Fisher ½*ln (1+r ) / (1-r) r= coeficiente de correlación .En particular podemos probar la hipótesis nula de que no hay correlación. es decir.

Sign up to vote on this title
UsefulNot useful