P. 1
Regresion Lineal

Regresion Lineal

|Views: 2.822|Likes:

More info:

Published by: Aniano Urtecho Aguilar on Jun 22, 2011
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOCX, PDF, TXT or read online from Scribd
See more
See less

03/03/2015

pdf

text

original

PRODUCCIÓN

PRONÓSTICOS

PRONÓSTICOS CAUSALES CON REGRESIÓN El objetivo es pronosticar una variable dependiente, por ejemplo las ventas, en función de una o más variables independientes, por ejemplo el precio. Este es un pronóstico causal, porque el valor de la variable dependiente está causado o al menos tiene una correlación alta con el valor de las(s) variable(s) independiente(s). Lo primero que debe hacerse es un análisis de correlación para medir la asociación entre las dos variables: 1. Elaborar un diagrama de dispersión para observar si existe una relación lineal entre las variables. En un sistema de coordenadas graficar la nube de puntos considerando X = variable independiente e Y = variable dependiente. Calcular el coeficiente de correlación para establecer la medida de la fuerza de la relación lineal entre las dos variables. Este coeficiente tiene las siguientes características: ➢ Varia de -1 hasta +1, ambos inclusive. ➢ Un valor cercano a 0 indica que hay poca asociación entre las variables. ➢ Un valor cercano a +1 indica una asociación directa o positiva entre las variables. ➢ Un valor cercano a -1 indica una asociación inversa o negativa entre las variables. 1. 2. Calcular el coeficiente de determinación para determinar la proporción de la variación total en la variable dependiente Y que se explica por la variación en la variable independiente X. Realizar una prueba de la importancia del coeficiente de correlación para determinar si la correlación se debe o no a la casualidad.

2.

Si el análisis de correlación concluye que existe una relación lineal fuerte entre las variables, se procede a elaborar una ecuación para expresar la relación lineal (recta) entre las variables con la finalidad de estimar el valor de la variable dependiente Y con base en un valor seleccionado de la variable independiente X. La técnica para desarrollar la ecuación y proporcionar los estimados se denomina análisis de regresión. La referida ecuación de la recta que relaciona las variables es una ecuación de regresión que se determina aplicando el método matemático denominado “principio de los mínimos cuadrados” que proporciona la recta del “mejor ajuste”. El método de los mínimos cuadrados determina una ecuación de regresión al minimizar la suma de las desviaciones cuadráticas entre los valores reales y los valores estimados de Y.

REGRESIÓN LINEAL SIMPLE

ANIANO URTECHO AGUILAR

1

la relación no es “perfecta” o exacta. (10. Concluimos que probablemente las ventas de computadoras dependen de la cantidad de llamadas que se hagan a los clientes. (30.PRODUCCIÓN PRONÓSTICOS Ejemplo: La siguiente información muestra las llamadas realizadas a clientes y computadoras vendidas por 10 vendedores. los vendedores que hicieron más llamadas a clientes vendieron más computadoras. Por ejemplo. (20. el vendedor 2 hizo 40 llamadas a clientes y logró una venta de 60 computadoras. (20.30).y) =(20.60).30). Es decir. En un sistema de coordenadas graficamos los diez puntos (x.50). Vendedores 1 2 3 4 5 6 7 8 9 10 Llamadas Computadoras a clientes vendidas 20 40 20 30 10 10 20 20 20 30 30 60 40 60 30 40 40 50 30 70 Se desea determinar si existe una relación lineal entre las variables y usar esta relación para fines de pronóstico de ventas. Paso 1: Determinar cuáles son las variables independiente y dependiente Al analizar los datos se observa cierta relación entre el número de llamadas a clientes y el número de computadoras vendidas.30).40). el vendedor 1 hizo 20 llamadas a clientes y vendió 30 computadoras. (40. (20.40). las variables son las siguientes: X = cantidad de llamadas a clientes (variable independiente) Y = cantidad de computadoras vendidas (variable dependiente) Paso 2: Elaboramos el diagrama de dispersión para establecer si la relación entre las variables es lineal o no lineal. Sin embargo.40). Por ejemplo el vendedor 10 hizo menos llamadas que el vendedor 2.60). (30. (10.70) ANIANO URTECHO AGUILAR 2 . En este sentido. (20. pero vendió más computadoras.

184210526)22010=18. cuyos parámetros “a” y “b” se determinan aplicando el modelo de regresión lineal simple mediante las siguientes fórmulas: b=nXY-XYnX2-X2 a=Y-bXn a = intersección de la recta con el eje X. se puede emplear el conocimiento de la variable independiente para pronosticar la variable dependiente mediante una línea recta Y = a + bX. significa que para cada incremento de una unidad en X. Paso 3: Recta de Regresión Una vez establecida una relación lineal. el valor de Y aumenta “b” unidades en promedio.94736842 ANIANO URTECHO AGUILAR 3 .184210526 a=Y-bXn=450-(1.PRODUCCIÓN PRONÓSTICOS La nube de puntos en el diagrama de dispersión nos muestra una relación lineal (lo cual se indica con la línea punteada por el centro de la nube) entre las ventas de computadoras (variable dependiente) y la cantidad de llamadas a clientes (variable independiente). b = pendiente de la recta. vamos a suspender por el momento el análisis de correlación para determinar la recta de regresión. representa el valor promedio de Y cuando X es igual a cero. Para determinar los parámetros a y b elaboramos la siguiente hoja de cálculo: Vended Llamada or s i Xi 1 20 2 40 3 20 4 30 5 10 6 10 7 20 8 20 9 20 10 30 ∑ 220 MEDIA 22 Ventas Yi 30 60 40 60 30 40 40 50 30 70 450 45 X2 400 1600 400 900 100 100 400 400 400 900 5600 XY 600 2400 800 1800 300 400 800 1000 600 2100 10800 b=nXY-XYnX2-X2=1010800-220450105600-2202=1. Considerando que los valores de los coeficientes de correlación y de determinación suelen obtenerse fácilmente con los valores de “a” y “b” de la recta de regresión.

Ejemplo. si se incrementa la cantidad de llamadas en 10. se espera que las ventas aumenten en 1. una correlación próxima a -1 significa una fuerte relación lineal inversa o negativa entre X e Y.PRODUCCIÓN PRONÓSTICOS Usando las siguientes funciones de Excel se puede calcular directamente los promedios de las variables X e Y así como los valores de los parámetros a y b: a b Media X Media Y     =INTERSECCION.94736842 = 19.84210526 = 12 Ahora.EJE(Y1:Yn. Su valor está comprendido entre -1 < r < +1. y una correlación cercana a cero quiere decir que existe una relación lineal débil entre X e Y.184210526) = 11.184210526X a = 18. siendo su signo igual al del parámetro “b”. respectivamente. RECTA DE REGRESIÓN: Yp = a + bX Yp = 18. esto es: 10(1. antes de realizar el pronóstico retomamos el análisis de correlación para determinar si realmente existe una fuerte asociación entre las variables y qué proporción de la variación de la variable dependiente se puede explicar por la variación en la variable independiente.X1:Xn) =PROMEDIO(X1:Xn) =PROMEDIO(Y1:Yn) Donde Y1:Yn y X1:Xn son los rangos de celdas que contienen los valores de las variables dependiente “Y” e independiente “X”.X1:Xn) =PENDIENTE(Y1:Yn. significa que por cada aumento de una llamada a clientes. Una correlación cercana a +1 indica una fuerte relación lineal positiva entre X e Y.94736842 + 1.184210526. COEFICIENTE DE CORRELACIÓN (r) Indica la correlación entre las variables dependiente e independiente.184210526 computadoras. el efecto en el número de computadoras vendidas es 10*b. indica la venta de copiadoras cuando no hay ninguna llamada a clientes o la porción de las ventas de computadoras que varía con respecto a factores diferentes a las llamadas a clientes. El coeficiente de correlación puede calcularse mediante cualquiera de las siguientes fórmulas: r=XY-nXYX2-nX2Y2-nY2 ó también: r=aY+bXY-nY2Y2-nY2 Donde: X = media de X = ∑X / n = 220 / 10 = 22 ANIANO URTECHO AGUILAR 4 . b = 1.

“b” es positivo. La población en este ejemplo sería toda la fuerza de ventas de la empresa. ¿más llamadas a clientes realmente generarán más ventas’ No.X1:Xn) r se calcula con la función: El valor de r = +0.DE. Sin embargo.PRODUCCIÓN PRONÓSTICOS Y = media de Y = ∑Y / n = 450 / 10 = 45 Para el ejemplo que venimos desarrollando. Sin embargo.CORREL(Y1:Yn. aquí no se ha demostrado la causa y el efecto.75901 = +0. La pregunta que nos planeamos ahora es: ¿puede haber una correlación cero en la población de la cual se seleccionó la muestra? En otras palabras ¿proviene el valor del coeficiente de correlación de una población de observaciones pareadas con correlación cero? Para responder tal pregunta realizaremos una prueba de hipótesis de la siguiente manera: Formulación de las hipótesis nula y alternativa: H0:ρ=0 (la correlación en la población es cero) H1:ρ≠0 (la correlación en la población es diferente de cero) ANIANO URTECHO AGUILAR 5 . sólo que hay una relación entre las dos variables.75901 r=aY+bXY-nY2Y2-nY2= 18. en consecuencia el coeficiente de correlación también es positivo y su valor según las fórmulas anteriores es el siguiente: r=XY-nXYX2-nX2Y2-nY2=10800-1022455600-1022222100-10452=0. r 2. PRUEBA DE LA IMPORTANCIA DEL COEFICIENTE DE CORRELACIÓN El coeficiente de correlación de +0. la muestra contiene solamente 10 vendedores.75901 Si se conoce el valor del coeficiente de determinación. entonces el coeficiente de correlación se obtiene extrayendo la raíz cuadrada.75901 indica una asociación fuerte entre el número de llamadas a clientes y el número de computadoras vendidas.75901 se debió a la casualidad. debido a que el número de llamadas a clientes se relaciona con el número de computadoras vendidas. Se podría motivar al personal de ventas para hacer llamadas adicionales. es decir: r=r2 En Excel el valor de =COEF.94736842450+1.76 es positivo lo cual nos indica que existe una relación directa entre la cantidad de llamadas a clientes y la ventas de computadoras. el valor del coeficiente de correlación está muy cercano a +1 indicando que la asociación entre las variables es fuerte. Asimismo. ¿Puede ser que en realidad la correlación en la población sea 0? Esto significaría que la correlación de +0.18421052610800-104522210010452=0.

31.54 3.31 0 +2.975 63.025 0. Además como se trata de una muestra pequeña utilizaremos el estadístico t de la distribución Student.7590110-21-0.57 2.995 t 0.025 0.82 6.96 4. El valor crítico de 2.29730276=3.26 Cálculo del valor de t: t=rn-21-r2.36 2. la regla de decisión en este caso indica que si el valor calculado de t se encuentra en el área entre +2. la prueba es de dos colas.99 t 0.30 3.03 3.92 5.36 3. no se rechaza la hipótesis nula. con n-2 grados de libertad t=0.25 31.95 -2.05 (95% de confianza) : 2.759012=3.31 Con un nivel de significancia de 0.75 3.05.82 12.PRODUCCIÓN PRONÓSTICOS Por la forma en que se ha formulado la hipótesis alternativa.45 2.60 4.31 se obtiene directamente de la tabla estadística de la distribución Student o mediante la siguiente función de Región de rechazo se rechaza H 0 no (hay correlación) (no hay correlación en la población) 0.30 ANIANO URTECHO AGUILAR 6 .50 3. Prueba t para el coeficiente de correlación: Nivel de significancia Valor crítico : 0.71 3.31 Tabla de distribución Student 99% 98% 95% gl 1 2 3 4 5 6 7 8 9 t 0.31 y -2.00 2.18 2.66 9.90 2.71 4.31 2.14 3.84 4.78 2.36 3.

58 = 58%. por tanto se rechaza la hipótesis nula al nivel de significación de 0. Podemos concluir que la cantidad de llamadas a clientes explican aproximadamente el 58% de la cantidad de computadoras vendidas.57610 En Excel el valor de r2 se calcula mediante la siguiente función: =COEFICIENTE. se puede usar esta relación para fines de pronóstico.57610 r2=aY+bXY-nY2Y2-nY2=18.X1:Xn) El valor de r2 = 0. Por tanto. Se calcula mediante cualquiera de las siguientes fórmulas: r2=XY-nXY2X2-nX2Y2-nY2 r2=aY+bXY-nY2Y2-nY2 Donde: Y = media de Y = ∑Y / n = 450 / 10 = 45 X = media de X = ∑X / n = 220 / 10 = 22 Para nuestro ejemplo ¿qué porcentaje de la variación en las ventas de computadoras se puede explicar por la variabilidad en las llamadas a clientes? r2=XY-nXY2X2-nX2Y2-nY2=10800-10224525600-1022222100-10452=0. El 42% no se puede explicar por la variabilidad en la cantidad de llamadas a clientes.05. Esto significa que la correlación en la. Desde un punto de vista práctico. COEFICIENTE DE DETERMINACIÓN (r2) Permite establecer qué porcentaje de la variabilidad de la variable dependiente se puede explicar por la variabilidad de la variable independiente. está fuera de la región de aceptación de la hipótesis nula. Esta porción en la variabilidad de las ventas se debe explicar mediante factores que aún no han sido identificados en este análisis de correlación (por ejemplo: publicidad).R2(Y1:Yn.18421052610800-1045222100-10452 r2=0.30 > valor crítico = 2.PRODUCCIÓN PRONÓSTICOS Decisión: El valor calculado de t = 3. esto indica que hay una correlación entre el número de llamadas a clientes y el número de computadoras vendidas en la población de vendedores de la empresa. significa que de la variabilidad en las ventas de computadoras: ➢ ➢ El 58% se puede explicar por la variabilidad en la cantidad de llamadas a clientes. PRONÓSTICO (Yp) ANIANO URTECHO AGUILAR 7 .57610 = 0.31. población no es cero. es decir.94736842450+1.

31579 42.47368 30.184210526X Considerando que existe una fuerte correlación positiva entre las variables.63158 54. En Excel el pronóstico se determina con la siguiente función: =PRONOSTICO(X.54017 0.92521 30.552632 = 49. de modo que hacer la estimación sería una extrapolación más allá de dicho rango. Y1:Yn. esto es: Yp = 18.78947 Yi -Yp -12. indica que tan preciso es el pronóstico de Y con base en X o. ERROR ESTANDAR DE LA ESTIMACION (Syx) Mide la cantidad estándar en la cual los valores reales Y difieren de los valores pronosticados Yp.184210526(25) = 48.X1:Xn) Donde X es el valor de la variable independiente para la cual se desea estimar el valor de la variable dependiente Y. para 25 llamadas a clientes esperaríamos una venta aproximada de 49 computadoras. es decir es una medida de la dispersión de los valores observados con respecto a la línea de regresión. Por ejemplo.31579 -2.PRODUCCIÓN PRONÓSTICOS Yp = 18. por el contrario.55679 39.52632 -0. utilizaremos la recta de regresión lineal para pronosticar las ventas de computadoras.78947 (Yi -Yp)2 159. Se requiere entonces reunir información de ventas para cantidades de llamadas a clientes que incluyan la cantidad de 100 y determinar una nueva recta de regresión.63158 66.63158 5. Si quisiéramos estimar las ventas para un representante de ventas que hace 100 llamadas a clientes ¿sería apropiado hacer la estimación con la recta de regresión establecida anteriormente? No. Entonces.Y1:Yn. X1:Xn son los rangos de celdas que contienen los valores Y y X respectivamente. porque la cantidad de llamadas a clientes tiene un rango de variación de 10 a 40. cantidad determinada reemplazando X = 25 en la ecuación de la recta y calculando el valor correspondiente de Y.94736842 + 1.62327 ANIANO URTECHO AGUILAR 8 .63158 -6.94736842 + 1. cuán inexacta podría ser la estimación.88920 6. Se calcula mediante cualquiera de las siguientes fórmulas: Syx=Y-Yp2n-2 o también: Syx=Y2-aY-bXYn-2 Hoja de cálculo para aplicar las fórmulas: i 1 2 3 4 5 Xi 20 40 20 30 10 Yi 30 60 40 60 30 X2 400 1600 400 900 100 Y2 900 3600 1600 3600 900 XY 600 2400 800 1800 300 Yp 42.

63158 15. denominado intervalo de confianza.2105310-2=9.55679 241.XY(Y1:Yn. El primero.90082 En Excel el valor de Syx se calcula mediante la siguiente función: =ERROR. se requiere efectuar un pronóstico estocástico o probabilístico dentro del siguiente intervalo: Yp± k*Sp Donde: Yp = valor estimado con la recta de regresión. ESTIMACIONES DE INTERVALO Se desea proporcionar estimaciones de intervalo de dos tipos.94736842450-1.63158 54.TIPICO.184210526(20) = 42. presenta el valor medio de Y para un valor dado de X.9 unidades en promedio.00000 84.83380 6.06648 784.21053 Los valores de Yp han sido obtenidos con la recta de regresión Yp = 18. cuando el tamaño de la muestra es mayor de 30 (n>30) y su valor se obtiene de la tabla de la Distribución Normal para un determinado nivel de ANIANO URTECHO AGUILAR 9 .90082 Syx=Y2-aY-bXYn-2=22100-18. sin embargo.63158.55. lo cual indica que las desviaciones positivas (por encima de la línea de regresión) se compensan con las desviaciones negativas (por debajo de la línea de regresión).94736842+1.29363 159.63158 42. Anteriormente calculamos que para X = 25 llamadas a clientes se esperaba una venta de Yp =49 computadoras.36842 -12.78947 42. Se observa en el cuadro anterior que la suma de las desviaciones es igual a cero.94736842+1. con respecto a la recta de regresión. El segundo tipo se conoce como intervalo de pronóstico e informa acerca del valor individual de Y para un valor particular de X.63158 7. por ejemplo para X = 20 el valor de Yp = 18.184210526(10800)n-2=9.52632 0. k = coeficiente de confianza k = z. la venta real rara vez coincidirá con esta estimación puntual o determinística.X1:Xn) Interpretación: Los valores observados de Y se encuentran dispersos en ± 9. En consecuencia.PRODUCCIÓN PRONÓSTICOS 6 7 8 9 10 Σ 10 20 20 20 30 220 40 40 50 30 70 450 100 400 400 400 900 5600 1600 1600 2500 900 4900 22100 400 800 1000 600 2100 10800 30.00000 9.21053 -2.184210526X. El error estándar de la estimación según las fórmulas anteriores es el siguiente: Syx=Y-Yp2n-2= 784. para nuestro ejemplo Yp = 48.63158 42.47368 450.92521 54.

311 Error estándar del pronóstico para un valor individual de Y Sp=Syx*1+1n+X-X2X2-nX2 ANIANO URTECHO AGUILAR 10 .6 31.31 El valor de “t” también puede obtenerse directamente de la tabla estadística de la Distribución Student. Los principales valore de “z” usados para fines de pronósticos son los siguientes: Nivel de Confianza Valor de z 90% 1.96 95.54 3.50 3. Se calcula mediante las siguientes fórmulas: Error estándar del pronóstico para la media Y Sp=Syx*1n+X-X2X2-nX2 Para nuestro ejemplo: Sp=Syx*1n+X-X2X2-nX2=9.73% 3 k = t. usaremos la tabla de la Distribución Student para determinar el valor de “t” con n – 2 = 10 – 2 = 8gl grados de libertad.99 t 5 t 0.00 2.05.PRODUCCIÓN PRONÓSTICOS confianza o probabilidad.8 6 2 12.84 4.31 2.18 4.25 3.03 3.36 3.58 99.36 3.45 2.71 9.99 t 0.5% 2 99% 2.30 5. cuando el tamaño de la muestra de datos es menor o igual a 30 (n ≤ 30) y su valor se obtiene de la tabla estadística de la Distribución Student cuando se conoce el nivel de confianza o probabilidad y los grados de libertad = n – 2. Entonces como n = 10 < 30.82 2.60 3.14 3.75 2.T.975 63.26 gl 1 2 3 4 5 6 7 8 9 Sp = Error estándar del pronóstico que mide la variabilidad de los valores de predicción Yp alrededor del valor promedio de Y o de un valor individual de Y para un valor dado de X.90082*110+25-2225600-10222=3.36 2.78 4. En EXCEL el valor de “t” puede obtenerse con la siguiente función: =DISTR.96 4. según se indica: 99% 98% 95% 0.64 95% 1.8) = 2.90 2.92 6. Para el ejemplo que venimos desarrollando vamos a considerar un nivel de confianza de 95%.71 3.57 2.INV(0.

31≤μyx≤48.55+2.55-2. se espera una venta de computadoras comprendida entre 24 y 73 unidades. 1 2 3 4 5 6 B C D DATOS Llamadas Computadora s vendidas Vendedores a clientes X2 X Y 1 20 30 400 2 40 60 1600 3 20 40 400 A E F G DEMANDA ESPERADA Promedio Yp 42. con un 95% de confianza. esto es: Yp±k*Syx*1+1n+X-X2X2-nX2 El intervalo de pronóstico del 95%.11 18.31.55±2. podemos usar una hoja de cálculo con funciones de Excel.63 94.63 ANIANO URTECHO AGUILAR 11 . Intervalo de pronóstico para un valor individual de “Y” Yp± k*Sp equivalente a: Yp-k*Sp≤μyx≤Yp+k*Sp.44≤μyx≤48. para un representante de ventas que realice 25 llamadas a clientes.55±2.63 Máxima Yp + tSp 66. con un 95% de confianza.55+2.63 38.63 66. de donde 24≤μyx≤73. PRONÓSTICO MEDIANTE HOJA DE CÁLCULO Si nuestro objetivo solamente es obtener el intervalo de pronóstico para valores individuales de “Y” con un determinado nivel de confianza.31*9. A continuación se presenta la hoja de cálculo con el intervalo de pronóstico de 95% de confianza para la muestra de los 10 vendedores.65 En forma de intervalo: 48.55±7.PRODUCCIÓN PRONÓSTICOS Para nuestro ejemplo: Sp=Syx*1+1n+X-X2X2-nX2=9.44.32 42.55±24.31*3.55-2.90082*1+110+25-2225600-10222=48.31*10.63 Mínima Yp .31*9. para todos los representantes de ventas que realicen 25 llamadas a clientes. es decir.52 66. se espera una venta entre 41 y 56 computadoras.44 Intervalo de confianza para la media de “Y” Yp± k*Sp equivalente a: Yp-k*Sp≤μyx≤Yp+k*Sp. para un representante de ventas que realiza 25 llamadas a clientes es: 48.tSp 18.90082*110+25-2225600-10222=48.90082*1+110+25-2225600-10222=10.31*10. de donde 41≤μyx≤56.31*3. esto es: Yp±k*Syx*1n+X-X2X2-nX2 Para nuestro ejemplo: 48. es decir.12 Expresándolo en intervalo: 48.

2))) 95% =ERROR.63 54.79 30.B4:B13) =CONTAR(F4:F13)-2 =SI(CONTAR(F4:F13)>30.3060041 900 100 100 400 400 400 900 5600 29.86 4.63 4.5 +C16/2).63 42.79 42.DISTR.32 Nivel confianza = Syx = Grados libertad = t= Para obtener los resultados mostrados.63 79.DISTR.C18)) F5:F13 E5:E13 G5:G13 D5:D13 Cópiese a EJERCICIOS 1.PRODUCCIÓN PRONÓSTICOS 7 8 9 10 11 12 13 14 15 16 17 18 19 4 5 6 7 8 9 10 30 10 10 20 20 20 30 60 30 40 40 50 30 70 95% 9. La empresa Paraíso SAC analiza la relación entre el consumo de energía (en miles de kwh) y el número de habitaciones en una residencia privada unifamiliar.2)/($D$14 -CONTAR($F$4:$F$13)*POTENCIA(PROMEDIO($B$4:$B$13). En una muestra aleatoria de 10 casas se obtuvo la siguiente información: Número habitaciones 12 9 14 Consumo energía (miles kwh) 9 7 10 ANIANO URTECHO AGUILAR 12 .ESTAND.63 18.NORM.63 29.$C$4:$C$13.$B$4:$B$13) =F4-$C$19*$C$17*RAIZ(1+1/CONTAR($F$4:$F$13) +POTENCIA(B4-PROMEDIO($B$4:$B$13).72 56.INV(0.2) =SUMA(D4:D13) =PRONOSTICO(B4.TIPICO.INV(1-C16.63 54.47 79.900824 8 2.63 66.2))) =F4+$C$19*$C$17*RAIZ(1+1/CONTAR($F$4:$F$13) +POTENCIA(B4-PROMEDIO($B$4:$B$13). se requiere ingresar los datos y fórmulas siguientes: Celda A1:C13 D4 D14 F4 E4 G4 C16 C17 C18 C19 Fórmula Datos =POTENCIA(B4.2)/($D$14 -CONTAR($F$4:$F$13)*POTENCIA(PROMEDIO($B$4:$B$13).86 18.47 30.63 66.72 66.T.32 56.63 42.XY(C4:C13.63 18.

6 4. Suponiendo que existe una relación lineal.A.6 69.0 12.2 18. Anticipe el consumo de energía para una casa de 6 habitaciones Un reciente artículo en una revista de negocios presentó una lista de las mejores empresas pequeñas.9 19.5 11.) 4. A MERCA S.9 4. determine los parámetros “a” y “b” de la recta de regresión e interprete su significado.6 1.6 46. en miles de nuevos soles.8 Trace un diagrama de dispersión ¿qué relación existe entre las variables? Calcule el coeficiente de determinación e interprete el resultado. supervisora de mantenimiento. 1.C. Existe interés en los resultados actuales de las ventas y ganancias de las empresas. Si hay relación MERCA piensa que puede pronosticar mejor el presupuesto anual de mantenimiento de autobuses.2 Ganancias (miles S/.5 8.7 3.000.) 89. reúne los siguientes datos: AUTO BÚS COSTO DE ANTIGÜE MANTENIMI DAD ENTO (AÑOS) ANIANO URTECHO AGUILAR 13 .0 6.8 17.2 6. Calcule el coeficiente de correlación e interprete el resultado. Estime las ganancias de una empresa pequeña con ventas de S/ 50.6 51. le gustaría determinar si existe una relación entre el costo anual de mantenimiento de un autobús y su antigüedad. 5 8 6 8 10 4 7 Elabore el diagrama de dispersión. A continuación se indican las ventas y ganancias. Determine la ecuación de regresión e interprete los valores de los parámetros a y b.PRODUCCIÓN PRONÓSTICOS 6 10 8 10 10 5 7 a) b) c) 1. Por ello. Empresa A B C D E F G H I J K L a) b) c) d) e) Ventas (miles S/.3 8.4 1.2 28.2 71. Se seleccionó una muestra aleatoria de doce empresas.7 58.6 18.1 2.

El Sr. le contrata a Ud.9 8 987 9.) ANIANO URTECHO AGUILAR 14 .8 6 888 9. Al incrementarse la tasa de interés en 1% ¿cuál es la disminución promedio en el número de permisos de construcción? Calcule e interprete el coeficiente de determinación. 1. Aguilar observa el precio y el volumen de ventas de latas de leche de 10 semanas elegidas en forma aleatoria. Determine la ecuación de regresión de la muestra. para predecir el número de permisos de construcción que se emitirán cada mes.2 2 494 12.5 7 509 10. ¿Deberá usar MERCA el análisis de regresión para pronosticar el presupuesto mensual de mantenimiento de autobuses? ¿Por qué? Si se usa el análisis de regresión para formular dicho presupuesto. se pregunta si es posible emplear el conocimiento de las tasas de interés sobre primeras hipotecas.7 5 343 10. estima el costo mensual de mantenimiento para un autobús que tiene 5 años de antigüedad.C. ¿cuál es el incremento mensual en el costo de mantenimiento por cada año de antigüedad de un autobús? 2.2 9 187 14. Los datos obtenidos se presentan en la siguiente tabla: Venta Sema s Preci na (latas o ) (S/. Redacte un memo explicando los resultados de su análisis. Usted reúne una muestra aleatoria de nueve meses de datos: Mes Permisos construcción Tasa Interés % a) b) c) d) e) 1 796 10. Nuevo Milenio S.A. Como analista de medio tiempo. La empresa quedó complacida cuando usted determinó que existe una relación positiva entre el número de permisos de construcción y la cantidad de trabajo disponible en la empresa.PRODUCCIÓN PRONÓSTICOS MENSUAL (US$) 1 2 3 4 5 a) b) c) d) e) 70 60 40 60 90 8 5 3 9 10 ¿Qué porcentaje de la varianza no se puede explicar con la recta de regresión? Calcula el costo mensual de mantenimiento para un autobús con 20 años de antigüedad. Con un 95% de confianza. Ahora.5 4 892 9.6 3 289 13.2 Grafique los datos en un diagrama de dispersión.

0 1.0 1.8 y de S/.6 1. Si el tamaño del lote se incrementa en 2 unidades ¿cuál es el efecto en las horas-trabajador? 15 ANIANO URTECHO AGUILAR . Se seleccionó una muestra aleatoria de 14 corridas de producción (dos por cada tamaño de lote: 20. Qué cantidad de horas-trabajador no se ven afectadas por la variación en el tamaño del lote de producción. 10 6 5 12 10 15 5 12 17 20 1. 40. 50.2 1. 70 y 80) y los resultados se muestran a continuación: Tamaño de lote 20 20 30 30 40 40 50 50 60 60 70 70 80 80 a) b) c) d) Horastrabajador 50 55 73 67 87 95 108 112 128 135 148 160 170 162 Elabore un diagrama de dispersión ¿qué relación existe entre las variables? Suponiendo que existe una relación lineal.3 2. 30.1.4 1.5 1.3 con 95% de confianza.6 1.PRODUCCIÓN PRONÓSTICOS 1 2 3 4 5 6 7 8 9 10 a) b) c) d) 1. determine los coeficientes de regresión a y b.1 Elaborar un diagrama de dispersión ¿Qué tipo de relación existe entre las ventas y el precio? Establezca la ecuación de pronóstico.7 1. Pronostique las ventas para un precio de S/. 60. ¿Qué porcentaje de las ventas se puede explicar mediante la variabilidad en el precio? Al gerente de una empresa que fabrica partes le gustaría desarrollar un modelo para estimar el número de horas-trabajador requeridas para las corridas de producción de lotes de tamaño variable.

es decir X = 0. Calcule el coeficiente de correlación e interprete su significado. ANIANO URTECHO AGUILAR 16 . estimar la venta e interpretar el resultado. Por cada m2 de incremento en el espacio del estante ¿cuál es el efecto en las ventas? Estime las ventas semanales promedio (en miles S/. Calcule el coeficiente de determinación e interprete su significado. Calcule el error estándar de la estimación e interprete el resultado. Si no se dispone de ningún espacio en estantes para alimentos de mascotas.) 1.PRODUCCIÓN PRONÓSTICOS e) f) g) h) i) j) Estime el número promedio de horas-trabajador requerido para una corrida de producción con tamaño de lote de 45.3 2. Establezca una estimación de intervalo de confianza del 90% de las horas-trabajador promedio para todas las corridas de producción con un tamaño de lote de 45.6 2. Interprete el significado de a y b.8 2.1 Elabore un diagrama de dispersión ¡qué relación existe entre las variables? Suponiendo que existe una relación lineal.6 2. Al gerente de Comercialización de una cadena grande se supermercados le gustaría determinar el efecto del espacio en estantes sobre las ventas de comida para mascotas.9 2.6 2. Calcule el coeficiente de determinación e interprete el resultado. Se selecciona una muestra aleatoria de 12 supermercados de igual tamaño y los resultados se presentan a continuación: Tienda 1 2 3 4 5 6 7 8 9 10 11 12 a) b) c) d) e) f) g) h) i) Espacio estante (m2) 5 5 5 10 10 10 15 15 15 20 20 20 Venta semanal (miles S/.4 2.2 1. 1. Calcule el coeficiente de correlación e interprete el resultado. ¿Sería apropiado estimar el número promedio de horas-trabajador requerido para una corrida de producción con un tamaño de lote de 100? Explique su respuesta.4 1. Establezca un intervalo de confianza del 90% de las horastrabajador para una sola corrida de producción con un tamaño de lote de 45. calcule los coeficientes de regresión a y b.) de alimentos para mascotas en estantes de 8 m2 de espacio.9 3.7 2.

3 5.) 1 3. Proyecto 1 2 3 4 5 6 7 8 Número de licitadores 9 9 3 10 5 10 7 11 Oferta ganadora (millones de soles) 5.5 8. El Gobierno Regional de Arequipa estudia la relación entre el número de licitadores en un proyecto para una carretera y la licitación más alta (menor costo) para el proyecto.5 9 3 10 5 215 1070 550 1350 325 670 1215 a) b) c) d) e) f) g) h) 2. Con un 95% de confianza ¿cuál es la venta estimada para una sola tienda que disponga de 8m2 de espacio en estantes para alimentos de mascotas? 1. ¿cuál es el efecto en el tiempo de entrega? Determina el tiempo de entrega mínimo.. así como el tiempo de entrega con una aproximación de medio día desde el momento en que el embarque estuvo disponible para recogerlo.000 Km.7 5.8 7.1 8.5 17 ANIANO URTECHO AGUILAR . Elabora un diagrama de dispersión ¿Qué tipo de relación existe entre el tiempo de entrega y la distancia? Establece la recta de regresión. Estima el tiempo de entrega desde el momento en que el embarque está disponible para enviarlo en un camión que recorrerá c1) 1.5 825 2 1 3 4 4 2 5 1 480 6 3 920 7 4. tal como se indica: Camión muestreado Tiempo entrega (días) Distancia (Km. Un analista extrae una muestra aleatoria de 10 embarques recientes en camión que ha realizado una empresa y registra la distancia en Km..PRODUCCIÓN PRONÓSTICOS j) k) Establezca una estimación de intervalo del 95% de las ventas semanales promedio para todas las tiendas que poseen 8m2 de espacio en estantes para alimento de mascotas.5 8 1. c2) 2500 km.7 7. ¿Qué porcentaje de la varianza en el tiempo de entrega es estadísticamente explicable por la distancia del recorrido en camión? Calcula el coeficiente de correlación e interpreta el resultado Presenta en un cuadro los intervalos de pronóstico del 95% para la muestra de 10 observaciones.0 9. Al incrementarse la distancia en 100 Km. De interés particular resulta saber si el número de licitadores aumenta o disminuye la cantidad de la oferta ganadora.

7 174 28. Se construye una nueva entrada en la carretera.4 8. Para qué número de licitadores no habrá oferta ganadora? En la siguiente tabla se muestra el número de automóviles vendidos en Lima durante los doce últimos años y el porcentaje de automóviles importados por la compañía Alfa SAC.01. Hay siete licitadores en el proyecto.6 171 27.2 78 50. Determine un intervalo de predicción de 95% para la oferta ganadora.0 155 31.8 9.0 103 49. Para qué oferta ganadora no se presentarán licitadores. ¿Cuánta variación en el mercado de ALFA se explica por la variación en los automóviles vendidos? ANIANO URTECHO AGUILAR 18 .9 101 39. Interprete la ecuación.0 154 40.3 8.8 ¿El número de automóviles vendidos se relaciona de forma directa o indirecta con el porcentaje del mercado de la empresa ALFA? Trace un diagrama de dispersión para apoyar su conclusión. Año 1 2 3 4 5 6 7 8 9 10 11 12 a) b) c) d) Automóviles Porcentaje vendidos de Alfa 60 50.5 108 43.PRODUCCIÓN PRONÓSTICOS 9 10 11 12 13 14 15 a) b) c) d) e) f) 3. Interprete el valor. ¿Es razonable concluir que hay una asociación negativa entre ambas variables? Utilice el nivel de significancia de 0. 6 6 4 7 7 7 6 10.1 7. ¿Más licitadores tienden a aumentar o a disminuir la cantidad de la oferta ganadora? Estime la cantidad de la oferta ganadora si hubiera habido siete licitadores.1 135 36. Interprete su valor.1 115 44.4 73 44.0 8. Determine el coeficiente de determinación.8 Determine la ecuación de regresión.6 8. Determine el coeficiente de correlación entre las dos variables.

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->