a) Regresión Lineal En el estudio de la relación funcional entre dos variables poblacionales, una variable X, llamada independiente, explicativa o de predicción

y una variable Y, llamada dependiente o variable respuesta, presenta la siguiente notación: Y=a+bX+e

Donde: a es el valor de la ordenada donde la línea de regresión se intercepta con el eje Y. b es el coeficiente de regresión poblacional (pendiente de la línea recta) e es el error • • • Es la técnica matemático – estadística que analiza la dependencia entre dos o más variables. Observa si las variaciones de una característica provocan variaciones en la magnitud de otra característica. Es la función matemática que, para un valor dado de una variable, da el valor esperado de una característica, con la cual está ligada.

Ejemplos:  El precio de venta (VD; Y) depende del precio de costo de un artículo (VI; X).  El costo total (VD; Y) depende de la producción total (VD; X).  El tiempo de servicios (VD; Y) de un trabajador depende de su edad (VD; X).  El consumo familiar (VD; Y) está en función del ingreso familiar VD; X). Donde: VD; Y = variable dependiente, predictando, explicativa. VI; X = variable independiente; predictor, explicativa. Esta relación se expresa: Y = f(X), “Y depende de X”

Si existe un parámetro que se incrementa o disminuye de forma sistemática por el experimentador. Ejemplo: La relación entre el número de años(x) laborando para la empresa y el número de ventas logradas (y) por cada vendedor es la mostrada en la siguiente tabla. a) . se le denomina parámetro de control o variable independiente = eje de x y habitualmente se representa a lo largo del eje horizontal. cada uno con el valor de una variable que determina la posición en el eje horizontal y el valor de la otra variable determinado por la posición en el eje vertical. Se emplea cuando una variable está bajo el control del experimentador. La variable medida o dependiente = eje de y usualmente se representa a lo largo del eje vertical. cualquier variable se puede representar en cada eje y el diagrama de dispersión mostrará el grado de correlación (no causalidad) entre las dos variables. Los datos se muestran como un conjunto de puntos. Si no existe una variable dependiente.Diagramas de Dispersión Un diagrama de dispersión es un tipo de diagrama matemático que utiliza las coordenadas cartesianas para mostrar los valores de dos variables para un conjunto de datos.

. Para darse una idea visual del trabajo que se va a realizar conviene graficar los puntos de esta tabla . b) ¿Cuántos años. aproximadamente.¿Cuántas ventas pueden esperarse en un trabajador con 16 años de servicio?. es decir. se requieren para lograr 14 ventas? vendedor años x 3 4 4 5 3 6 6 7 7 8 9 9 10 10 Ventas y 2 3 4 4 2 4 5 5 6 6 6 7 7 8 Abel Manuel Luis Gloria Abel Eva Roque Ana Saúl Rebecca Daniel Flor Teresa Efraín Solución: Lo primero que debe encontrarse es la ecuación de regresión. la ecuación de la recta que con mayor fidelidad une a todos los puntos de la tabla anterior.

La 1ª columna encabezada con x.698 Y se utiliza la siguiente formula: Obsérvese que como el denominador es el mismo para m como para b. no se hizo ya ninguna sustitución y solamente se copió el valor de m obtenido antes para ponerlo en este denominador. la 2ª columna encabezada con y. La ecuación de la recta buscada es . la 3ª columna encabezada con xy y la 4ª columna encabezada con x2 de la siguiente manera: M=677/969 M=0.

430=0.430 Esta ecuación sirve para poder contestar las dos preguntas formuladas en el enunciado del problema: ¿Cuántas ventas pueden esperarse en un trabajador con 16 años de servicio? ¿Cuántos años.698x+0. de manera que sustituyendo en la ecuación de la recta. de manera que sustituyéndolo en la ecuación de la recta. se tiene como dato que y = 14. para la primera pregunta se tiene como dato que x =16.44 Significa que se requieren aproximadamente de diez y nueve a veinte años de servicio para alcanzar 14 ventas.698x X=13.Y= 0.698(16)+0. Para la segunda pregunta. aproximadamente. se requieren para lograr 14 ventas? Como en la ecuación anterior x representa los años laborando e y las ventas. se obtiene Y=mx+b 14= 0. o sea 14 ventas. 698x+ 0 .430 Y=11.698 X=19.57/0. se pueden esperar aproximadamente entre once y doce ventas de un trabajador con 16 años laborando. .430 14-0. se obtiene: Y=mx+b Y= 0.59 Es decir.

2. Para estimar los coeficientes b0 y b1. Σdi = Σei = Σ (Yi – Ŷi) = 0 3. P1 (X1. b1 = Coeficiente de regresión (pendiente. cuando la variable X toma un valor determinado. de influencia.Ŷ b0 = Coeficiente autónomo (cantidad media). Y = Variable dependiente (respuesta. en la expresión . Ŷ 1)    Ŷ Condiciones: d1 =   1. Y1) 1 Y2 XX 2  P1 (X1. El modelo de estimación matemática.Método de los mínimos cuadrados Si el diagrama de dispersión muestra que los puntos se disponen siguiendo el lugar geométrico de una recta: Yi = b0 + b1Xi Donde: X = Variable independiente (estímulo. entonces la ecuación de estimación estará definida por: Yi = b0 + b1Xi     . di = ei = (Yi – Ŷi) = dispersión o error. donde Ŷ es un Y estimado. que valor asume probablemente Y. efecto). esperado o calculado. proporción de cambio). causa). ∑ ∑ ∑ ̂ ∑ ̂ 4. permite predecir. criterio.

 X  XY  b0 =  XY = b  X+b  X n X 2 . X  XY = n  X . obteniendo Σ (Yi – b0 – b1 Xi)2.sustituimos Ŷi = b0 + b1Xi. X  Y X -recta (a X) Ajústesen una línea los valores x y y de las primeras dos columnas de la  siguiente tabla: Ejemplo: n Se pueden calcular las siguientes cantidades: . X  Y n  X . diferenciando parcialmente con respecto al intercepto b0 y a la pendiente b1 e igualando a cero se obtienen las ECUACIONES NORMALES:  Y = n b +b  X X 2  Y .( X) 2 2 b1   XY .( X) 2 2 2 2 2 b1  n  XY .( X) 2 0 1 2 0 1   De su solución se obtienen los parámetros b0 y b1 b0  X  Y .

.

( Y) 2 ] n  XY .2) Coeficiente de correlación El coeficiente de correlación (r) mide el grado de afinidad o asociación entre dos variables. Fórmula r= [n  X 2 . X  Y Ejemplo: Las notas de 12 alumnos de una clase en Matemáticas y Física son las siguientes: Matemáticas Física 2 1 3 3 4 2 4 4 5 4 6 4 6 6 7 4 7 6 8 7 10 9 10 10 Hallar el coeficiente de correlación de la distribución e interpretarlo.( X) 2 ] [n  Y 2 . xi 2 3 4 4 5 6 6 7 7 8 yi 1 3 2 4 4 4 6 4 6 7 xi ·yi 2 9 8 16 20 24 36 28 42 56 xi2 4 9 16 16 25 36 36 49 49 64 yi2 1 9 4 16 16 16 36 16 36 49 .

. Como coeficiente de correlación está muy próximo a 1 la correlación es muy fuerte.10 9 90 100 81 10 10 100 100 100 72 60 431 504 380 1º Hallamos las medias aritméticas. Al ser el coeficiente de correlación positivo. 4º Aplicamos la fórmula del coeficiente de correlación lineal. Los valores de dos variables X e Y se distribuyen según la tabla siguiente: Y/X 1 2 3 2 1 2 0 1 4 5 2 3 2 0 4 Determinar el coeficiente de correlación. la correlación es directa. 3º Calculamos las desviaciones típicas. 2º Calculamos la covarianza. Convertimos la tabla de doble entrada en tabla simple.

Como coeficiente de correlación está muy próximo a 0 la correlación es muy débil. .0 P (X Y= d Ŷ = b Y. la correlación es inversa. Ŷ - Y2) ) Ŷ2 +b 2 1 12 2 202 1 xi yi 0 0 0 2 2 2 4 4 1 2 3 1 2 3 1 2 fi 2 1 2 1 4 5 3 2 xi · fi xi2 · fi yi · fi yi2 · fi xi · yi · fi 0 0 0 2 8 10 12 8 0 0 0 4 16 20 48 32 120 2 2 6 1 8 15 3 4 41 2 4 18 1 16 45 3 8 97 0 0 0 2 16 30 12 16 76 20 40 Al ser el coeficiente de correlación negativo.

Sign up to vote on this title
UsefulNot useful

Master Your Semester with Scribd & The New York Times

Special offer: Get 4 months of Scribd and The New York Times for just $1.87 per week!

Master Your Semester with a Special Offer from Scribd & The New York Times