P. 1
Regresion Lineal

Regresion Lineal

|Views: 23|Likes:

More info:

Published by: Alexandro Barradas Díaz on Feb 07, 2013
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PPT, PDF, TXT or read online from Scribd
See more
See less

01/15/2014

pdf

text

original

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

Términos y conceptos

Suposiciones
Análisis de correlación

Análisis de regresión de mínimos cuadrados

Diagrama de dispersión
Diagrama de dispersión Coeficiente de correlación r Línea de regresión de muestra Prueba de Ho: P=0

Utilice alternativa a la regresión de mínimos cuadrados

Datos recolectados en orden secuencial

Diagnóstico de regresión

Ei = Error del modelo ei= Se denomina residuo y describe el error en el ajuste del modelo en el iésimo punto de los datos. COEFICIENTES DE REGRESIÓN: Son parámetros a estimar a partir de los datos VALOR MEDIO O ESPERADO: Constante de gravedad que nos señala los valores donde se sitúa los valores de máxima probabilidad de la variable aleatoria.REGRESIÓN LINEAL SIMPLE: Estudia cómo los cambios de una variable no aleatoria. muestrales. y si existe una relación se establece en una expresión lineal. . afectan a una aleatoria. ECUACIÓN DE REGRESIÓN: Relación que se ajusta a un conjunto de datos experimentales.

COEFICIENTE DE CORRELACIÓN :permite predecir si entre dos variables existe o no una relación o dependencia matemática. DIAGRAMA DE DISPERSION: es una representación en un sistema de coordenadas cartesianas de los datos numéricos observados.CONCEPTOS CORRELACION:se basa en el grado de relación que poseen dos variables numéricas entre si. HIPOTESIS NULA: se utiliza para designar cualquier hipótesis formulada para ver si puede ser rechazada .

ei= Es el residuo.yi) donde deseamos determinar la línea que mejor se ajuste con: y = a + Bx Todas las medias caen en una línea recta.  Su media se relaciona linealmente con x mediante:  n parejas de (xi.y . y cada Yi se describe con el modelo de regresión lineal simple: Hay tres tipos de errores:  Ei: error del modelo  εi = Valor de una variable aleatoria y α tal que μ = 0.  Y|x es la variable aleatoria Y que corresponde a un valor fijo x.Se predice una variable dependiente en función de una variable independiente simple. describe el error en el ajuste: ei= yi .

 Límites de confianza para los coeficientes de regresión: a +.  Límites de confianza para α + βxo: (a+bxo) +.t α/2 Se √ n / Sxx  Pendiente de la línea de regresión es β es el cambio promedio de las y correspondiente a un incremento unitario en x.t α/2 Se √ (Sxx + (nx)2) / nSxx b +.t α/2 Se √ ( 1/n + (n(xo-x)2)/ Sxx .

más exactas serán las suposiciones.Es la línea que se utiliza para distinguir entre le valor estimado o predicho. . es la línea que se ajusta mejor a los datos que obtenidos de la muestra tomada. entre más datos.

.

 Debemos determinar a y b de forma que los errores sean lo más pequeño posible. (ei). minimizamos la suma de los cuadrados de los ei. se hace la suma: Σ ei Si Σei=0 . elegiremos a y b tales que: Σ [yi – (a + bxi)]2  La ecuaciones lineales con las incógnitas a y b se denominan ecuaciones normales. . que da valores de a y b ( estimaciones). Método de calcular la ecuación de la línea que mejor ajusta un conjuntos dado de datos apareados.

 Se emplea cuando la relación entre x y la media de y es lineal o bastante cercana a una línea recta.  Expresiones relacionadas con los valores muestrales (xi.yi): Sxx= nΣxi2 – (Σxi)2 Syy= n Σyi2 – (Σyi)2 Sxy= n Σ xiyi – (Σ xi)(Σ yi) Estimacion de σ2 Se2= Sxx Syy – (Sxx)2 / n(n-2) Sxx  Estadísticos para inferencias acerca de α y β: t= [(a-α) / se] √ (nSxx / Sxx + (nx)2 .

los estimadores de mínimos cuadrados tienen la variancia más pequeña.“Entre todos los estimados insesgados de α y β que son lineales en las yi. . Los estimadores de mínimos cuadrados son los más confiables por hallarse sujetos a variaciones aleatorias más pequeñas.

CORRELACION .

.CORRELACION • El concepto de relación o correlación se refiere al grado de variación conjunta existente entre dos o mas variables. • Nos vamos a centrar en el estudio de un particular de relación llamada lineal y nos vamos a limitar a considerar dos variables únicamente (simple X y Y) .

. A esta clase de problemas se les llama problemas de análisis de correlación donde se supone que los datos puntuales (Xi.n son valores de un par de variables aleatorias cuya densidad conjunta esta dada por f(X.. la relación entre la resistencia a la tensión y la dureza del aluminio o la conexión entre las impurezas del aire y la incidencia de cierta enfermedad.2..Análisis de correlación • Si consideramos la relación entre las precipitaciones pluviales y la producción de cierta cosecha. Yi) para i= 1.Y) ..

Denominador se calcula el produto de las varianzas de "x" y de "y". Se suma el resultado obtenido de todos los pares de valores y este resultado se divide por el tamaño de la muestra. la correlación lineal es positiva (si sube el valor de una variable sube el de la otra). Este coeficiente se aplica cuando la relación que puede existir entre las varables es lineal El coeficiente de correlación lineal se calcula aplicando la siguiente fórmula: r = Sxy / √ (Sxx *Syy) • • Es decir: Numerador: se denomina covarianza y se calcula de la siguiente manera: en cada par de valores (x. Los valores que puede tomar el coeficiente de correlación "r" son: -1 < r < 1 Si "r" > 0. por la "y" menos su media. La correlación es tanto más fuerte cuanto más se aproxime a 1.y) se multiplica la "x" menos su media.Coeficiente de correlación lineal • El coeficiente de correlación lineal mide el grado de intensidad de esta posible relación entre las variables. • • • • • . y a este produto se le calcula la raíz cuadrada.

•El valor de r está comprendido entre -1 y 1. no depende de las unidades en las que se expresan los valores de las dos variables. • Si la correlación es fuerte. • Si la correlación es perfecta (puntos de la nube alineados). r = 1 ó r = -1. es decir. | r | es próximo a 1. .PROPIEDADES DEL COEFICIENTE DE CORRELACION El coeficiente de correlación. Por tanto. • Si la correlación es débil. r. | r | es próximo a 0. si se realiza un cambio de unidades. el valor de r no varía. tiene las siguientes propiedades: • No tiene dimensiones: Es decir. entonces | r | = 1.

Departamento de Biblioteconomía y Documentación. No hay correlación r 0 Hay correlación no lineal Correlación lineal Correlación lineal positiva negativa r 0 r  1 (c) Rosario Ruiz Baños. • Cuando r es cercano a -1. presenta valores entre –1 y +1. La nube de puntos está muy dispersa o bien no forma una línea recta. será creciente. no hay correlación lineal entre las variables. Universidad de Granada (España) r  1 .Grado de Correlación • El coeficiente de correlación. r. hay una buena correlación negativa entre las variables según un modelo lineal y la recta de regresión que se determine tendrá pendiente negativa: es decreciente. hay una buena correlación positiva entre las variables según un modelo lineal y la recta de regresión que se determine tendrá pendiente positiva. • Cuando r es próximo a 0. • Cuando r es cercano a +1. No se puede trazar una recta de regresión.

Este es un grafico en el que una de las variables (Xi) se coloca en el eje de la abscisa. Yi) se representan como una nube de puntos. La forma de la nube de puntos nos informa sobre el tipo de relación existente entre las variables . la otra (Yi) en la ordenada y los pares (Xi.DIAGRAMA DE DISPERSIÓN La forma mas directa e intuitiva de formarnos una primera impresión sobre el tipo de relación existente entre dos variables esa través de un diagrama de dispersión.

. se seleccionó una muestra de 20 almacenes de entre todos los que conforman la cadena..Ejemplo.Suponga que al administrador de una cadena de almacenes departamentales le gustaría desarrollar un modelo para predecir las ventas semanales ( en miles de dólares) de cada tienda.

DIAGRAMA DE DISPERSIÓN ventas semanales (míles de dolares) 15 10 Serie1 5 0 0 500 1000 1500 número de clientes .

los puntos se sitúan en una línea recta ascendente y hablamos de una relación lineal positiva. las puntuaciones en la otra.Muestra una situación de que entre mayores son las puntuaciones en una variable. Correlación lineal positiva r  1 . cuando ocurre esto. mayores son también .

en este caso los puntos se sitúan en una línea recta descendente y hablamos de una relación lineal negativa. menores son las puntuaciones en la otra.Representa una situación de que entre mayores sean las puntuaciones de una variable. Correlación lineal negativa r  1 .

no hay correlación lineal entre las variables. La nube de puntos está muy dispersa o bien no forma una línea recta. No se puede trazar una recta de regresión.Cuando r es próximo a 0. Hay correlación no lineal r 0 No hay correlación r 0 .

El intervalo de predicción calculado.La importancia del cálculo de regresiones lineales es importante porque nos permite predecir valores de respuesta a uno o más valores de la variable independiente. representa un intervalo que tiene una probabilidad igual a 1-α de contener no un parámetro sino un valor futuro yo de la variable aleatoria Yo. .

La hipótesis que se contrasta se denomina hipótesis nula (H0). La aceptación de la hipótesis nula cuando es falsa se llama error tipo II. Si se rechaza la hipótesis nula es porque se asume como correcta una hipótesis complementaria que se denomina hipótesis alternativa (H1). .Una hipótesis estadística es cualquier conjetura sobre una o varias características de interés de un modelo de probabilidad. Ho p= 0 H1 p> 0 En el cálculo de la hipótesis se pueden cometer 2 tipos de errores: El rechazo de la hipótesis nula cuando es verdadera se llama error tipo I. Puede ser: paramétrica (simple o compuesta) y no paramétrica.

formulamos la hipótesis de que los dos son igualmente costosos. . si queremos demostrar que un método de irrigación es más costoso que otro. Por ejemplo.HIPOTESIS NULA Ho. a esta hipótesis la llamaremos hipótesis nula y la denotaremos por Ho . p=0 A menudo se requiere que formulemos la hipótesis opuesta a la que deseamos probar. En vista de que formulamos la hipótesis de que no hay diferencia en los costos de los dos métodos de irrigación.

es decir. con el estadístico z= √ (n-3) * Z = √ (n-3)/2 * ln (1+r ) / (1-r) Donde: n= tamaño de la muestra Z= transformación Z de Fisher ½*ln (1+r ) / (1-r) r= coeficiente de correlación .En particular podemos probar la hipótesis nula de que no hay correlación. la hipótesis nula p=0.

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->