Está en la página 1de 30

Universidad Autonoma de Nuevo Leon

Facultad de Ciencias de la Comunicacion

L92 Proyeccion y Analisis de Me

Evidencia 4.3- Excel “Regresión y co


Melanie Alejandra Hernandez Godina
Daniela Tellez Tellez
ma de Nuevo Leon
de la Comunicacion

alisis de Mercados
=

gresión y correlación”
ernandez Godina
ez Tellez
I. Evaluación de la capacidad predictora de una ecuación de regresión

Bradford Electric Illuminating Company

Problema 27.- Con los datos del Problema 15 (página 397). Determine en Excel el error estándar de estimación y el coeficiente de determin
determinación.

Datos del Problema 15. La Bradford Electric Illuminating Company estudia la relación entre kilowatts-hora (miles) consumidos y el número
familiar. Una muestra aleatoria de 10 casas reveló lo siguiente:

Número de
Kilowatts-hora
habitaciones (miles) (Y) X - X̅ Y -Y̅ (X - X̅) (Y - Y̅) 1.33 + 0.667X
(X)
12 9 2.9 1.6 4.64 9.334
9 7 -0.1 -0.4 0.04 7.333
14 10 4.9 2.6 12.74 10.668
6 5 -3.1 -2.4 7.44 5.332
10 8 0.9 0.6 0.54 8
8 6 -1.1 -1.4 1.54 6.666
10 8 0.9 0.6 0.54 8
10 10 0.9 2.6 2.34 8
5 4 -4.1 -3.4 13.94 4.665
7 7 -2.1 -0.4 0.84 5.999
Total = 91 74 44.6

n= 10
Media =
Desviación 9.1 7.4
estandar = 2.72641400622 2.0110804172
a= 1.33
b= 0.667
Error estándar de estimación

S y*x = ?
∑(Y - Y prima) 2 = 6.667 S y*x = √ ∑(Y - Y prima) 2 =
n= 10 √n-2

El error estándar de estimación es igual a 0.913

Coeficiente de determinación

*Coeficiente de Correlación

r= ?
∑(X - X̅ ) (Y - Y̅) = 44.6 r= ∑(X - X̅ ) (Y - Y̅) = 44.6
n= 10 (n - 1) sx xy (10 - 1) (2.726) (2.011)
sx = 2.726
sy = 2.011

El coeficiente de correlación es igual a 0.904

*Coeficiente de determinación

r= 0.904 r2= (r)2 = (0.904)2

El coeficiente de determinación es igual a 0.82.


El 82% de la variación en las horas-kilowatts puede explicarse por la variación en el número de habitaciones.
mación y el coeficiente de determinación. Interprete el coeficiente de

ra (miles) consumidos y el número de habitaciones de una residencia privada

Y prima Y - Y prima Y - Y prima 2

9.334 -0.334 0.111556


7.333 -0.333 0.110889
10.668 -0.668 0.446224
5.332 -0.332 0.110224
8 0 0
6.666 -0.666 0.443556
8 0 0
8 2 4
4.665 -0.665 0.442225
5.999 1.001 1.002001
6.666675
√6.667 = √ 6.667 = 0.9128937507
√ 10 - 2 √8

= 44.6 = 0.9039708521
.726) (2.011) 49.337874

= 0.817216
II. Significancia de la pendiente

Revisa la información de este tema en el cap. 13 páginas 399 a 401 del libro base 17ª. Edición, dentro del subtema: Probar la significancia de
hipótesis.

Bloomberg Business Week

Problema 23.- Remítase al ejercicio anterior (Problema 17 página 398, capítulo 13, ed. 17 libro base). La ecuación de regresión es Y prima =
Aplique el nivel de significancia 0.05. ¿Podemos concluir que la pendiente de la recta de regresión es distinta a cero?

H0: β = 0
H1: β ≠ 0

Donde: β es la pendiente de la población.

1. Hipótesis nula y alternativa

H0: β = 0
H1: β ≠ 0

2. Nivel de significacncia

α = 0.05

3. Estadístico de prueba

Información problema 17
Ventas (miles de Ingresos (miles de
Compañía dólares) (X) dólares) (Y) X - X̅ Y -Y̅

Papa John's International 89.2 4.9 47.441666666667 -0.44166666666667


Applied Innovation 18.6 4.4 -23.158333333333 -0.94166666666667
Integracare 18.2 1.3 -23.558333333333 -4.04166666666667
Wall Data 71.7 8 29.941666666667 2.65833333333333
Davidson & Associates 58.6 6.6 16.841666666667 1.25833333333333
Chico's FAS 46.8 4.1 5.0416666666667 -1.24166666666667
Checkmate Electronics 17.5 2.6 -24.258333333333 -2.74166666666667
Royal Grip 11.9 1.7 -29.858333333333 -3.64166666666667
M-Wave 19.6 3.5 -22.158333333333 -1.84166666666667
Serving-N-Slide 51.2 8.2 9.4416666666667 2.85833333333333
Daig 28.6 6 -13.158333333333 0.658333333333332
Cobra Golf 69.2 12.8 27.441666666667 7.45833333333333
Total = 501.1 64.1

n= 12
Media = 41.7583333333333 5.34166666666667
Desviación estandar = 26.1705753691338 3.24750486970965

*Coeficiente de correlación

r= ? r= ∑(X - X̅ ) (Y - Y̅)
∑(X - X̅ ) (Y - Y̅) = 629.64 (n - 1) sx xy
n= 12
Sx = 26.17
Sy = 3.248

El coeficiente de correlación es igual a 0.6734


*Pendiente de la recta de regresión

b= ? b= (r)
r= 0.6734
Sx = 26.17
Sy= 3.248

La pendiente de la recta es igual a 0.08

*Estadístico de prueba

t= ? t= b-0
b= 0.08 sb
sb = 0.03

El estadistico de prueba "t" es igual a 2.667

4. Regla de descisión

n= 12
α= 0.05
Grados de libertad = 10 = n-2 =
Valor crítico = 2.228

Rechazar H0 si t no se encuentra entre -2.228 y 2.228

5 y 6. Toma de desición e interpretación


Se rechaza H0 , podemos concluir que la pendiente es distinta a 0.
ubtema: Probar la significancia de la pendiente. Realiza esta prueba en Excel indicando los seis pasos de una prueba de

cuación de regresión es Y prima = 1.85 + .08X, el tamaño de la muestra es 12, y el error estándar de la pendiente es 0.03.
nta a cero?
(X - X̅) (Y - Y̅)

-20.9534027777778
21.8074305555556
95.2149305555556
79.5949305555555
21.1924305555555
-6.26006944444445
66.5082638888889
108.734097222222
40.8082638888889
26.9874305555555
-8.66256944444443
204.669097222222
629.640833333333

eficiente de correlación

= 629.64 = 629.64 = 0.67341049711


(12 - 1) (26.17) (3.248) 935.00176
nte de la recta de regresión

Sy = 0.6734 * 3.248 = (0.6734)*(0.1241) = 0.08357673672


Sx 26.17

= 0.08 - 0 = 2.66666667
0.03

12 - 2
III. Análisis de regresión múltiple.

Con base en el capítulo 14 resuelve los siguiente casos en Excel.

Terry and Associates: Tiempo para entregar equipos médicos

Terry and Associates es un centro especializado en pruebas médicas de Denver, Colorado. Una de las fuentes principales de ingresos de la c
en la sangre.

Los trabajadores en talleres de hojalatería de autos, en la industria de jardinería y los pintores comerciales de casas están expuestos a grand
prueba de forma aleatoria. Es muy costoso realizar la prueba, por lo que los equipos se suministran por pedido a diversos lugares del área d

Kathleen Terry, la propietaria, tiene interés en determinar los costos adecuados por entrega. Para investigar esto, Terry reunió información

Los factores que se consideran relacionados con el costo de entrega de un equipo son:
• Preparación X1: El tiempo en minutos desde la recepción del pedido por teléfono y cuando el equipo está listo para su entrega.
• Entrega X2: El tiempo de recorrido real en minutos desde la planta de Terry hasta el cliente.
• Millas X3: La distancia en millas desde la planta de Terry hasta el cliente.

Numero de Muesta Costo Preparacion Entrega Millas


1 $32.60 10 51 20
2 23.37 11 33 12
3 31.49 6 47 19
4 19.31 9 18 8
5 28.35 8 88 17
6 22.63 9 20 11
7 22.63 9 39 11
8 21.53 10 23 10
9 21.16 13 20 8
10 21.53 10 32 10
11 28.17 5 35 16
12 20.42 7 23 9
13 21.53 9 21 10
14 27.55 7 37 16
15 23.37 9 25 12
16 17.1 15 15 6
17 27.06 13 34 15
18 15.99 8 13 4
19 17.96 12 12 4
20 25.22 6 41 14
21 24.29 3 28 13
22 22.76 4 26 10
23 28.17 9 54 16
24 19.68 7 18 8
25 25.15 6 50 13
26 20.36 9 19 7
27 21.16 3 19 8
28 25.95 10 45 14
29 18.76 12 12 5
30 18.76 8 16 5
31 24.29 7 25 13
32 19.56 2 12 6
33 22.63 8 30 11
34 21.16 5 13 8
35 21.16 11 20 8
36 19.68 5 19 8
37 18.76 5 14 7
38 17.96 5 11 4
39 23.37 10 25 12
40 25.22 6 32 14
41 27.06 8 44 16
42 21.98 9 28 9
43 22.63 8 31 11
44 19.68 7 19 8
45 22.76 8 28 10
46 21.98 13 18 9
47 25.95 10 32 14
48 26.14 8 44 15
49 24.29 8 34 13
50 24.35 3 33 12

Formule la ecuación de regresión lineal múltiple que describa la relación entre el costo de entrega y las demás variables. 1. ¿Estas tres varia
dependiente? Estime el costo de entrega de un equipo cuya preparación tarda 10 minutos, 30 minutos su entrega, y debe recorrer una dista

De manera general la ecuación queda de la siguiente manera : Y prima = a + b 1X1 + b2X2 + b3X3

*Analisis de los datos

Estadísticas
Coeficiente de de la regresión
correlación múltiple
Coeficiente de 0.978003274133
determinación R^2 0.956490404214
R2 ajustado 0.95365282188
Error típico 0.773151665482
Observaciones 50

ANÁLISIS DE VARIANZA

Grados de Suma de Promedio de los


libertad cuadrados cuadrados F Valor crítico de F
Regresión 3 604.4811910994 201.493730366482 337.07934842995 2.621237218E-31
Residuos 46 27.49712090055 0.59776349783812
Total 49 631.978312

Coeficientes Error típico Estadístico t Probabilidad Inferior 95%

Intercepción 13.39590281684 0.468463068402 28.5954298650036 6.1189513913E-31 12.45293556819


Preparacion -0.014144671433 0.038855711549 -0.3640306886474 0.7175030557195 -0.092357162202
Entrega 0.004260222866 0.013916161107 0.30613491993727 0.7608832265175 -0.02375155658
Millas 0.880241343113 0.050688677675 17.3656402866675 7.8930836621E-22 0.778210326906

Al ya tener los resultados de los coeficientes ya podemos determinar la ecuación de regregresión la cual quedaria de la siguiente manera:

Y prima = 13.396 - 0.014X1 + 0.004X2 + 0.880X3

*Variable dependiente y independiente

Variable dependiente: El costo de entrega de un equipo


Variable independiente: X1 Preparación
X2 Entrega
X3 Millas

*Valor de la intersección?

El valor de la intersección con el eje y es : 13.396

*¿Estas tres variables explican una cantidad razonable de la variación de la variable dependiente?
Estas tres variables tienen un gran impacto en la varición del costo de la entrega de un equipo, observando y analizando más a fondo podem
inversa con la variable dependiente, es decir mientras más se tarde en prepara menos costo va tener. Por lo contario las variables de entre
entre más tiempo y distancia se realize para entregar el producto el costo va a ser más elevado.

*Estime el costo de entrega de un equipo cuya preparación tarda 10 minutos, 30 minutos su entrega, y debe recorrer una distancia de 1

X1 preparación: 10 Y prima = 13.396 - 0.014X1 + 0.004X2 + 0.880X3


X2 entrega: 30 Y prima = 13.396 - 0.014(10) + 0.004(30) + 0.880(14)
X3 millas: 14 Y prima = 13.396 - 0.14 + 0.12 + 12.32
Y prima = 25.696

El costo estimado para la entrega de un equipo que cuenta con una preparación de 10 minutos, una entrega de 30 minutos y se tienen que
s principales de ingresos de la compañía es un equipo para detectar cantidades elevadas de plomo

e casas están expuestos a grandes cantidades de plomo y, por lo tanto, se deben someter a una
do a diversos lugares del área de Denver.

esto, Terry reunió información sobre una muestra aleatoria de 50 entregas recientes.

isto para su entrega.


ás variables. 1. ¿Estas tres variables explican una cantidad razonable de la variación de la variable
ntrega, y debe recorrer una distancia de 14 millas
Superior 95% Inferior 95.0% Superior 95.0%

14.3388700655 12.452935568 14.338870065


0.06406781934 -0.092357162 0.0640678193
0.03227200231 -0.023751557 0.0322720023
0.98227235932 0.7782103269 0.9822723593

daria de la siguiente manera:


analizando más a fondo podemos notar que la variable de preparación cuenta con un relación
contario las variables de entrega y millas cuentan con una relación directa con el costo, es decir

ebe recorrer una distancia de 14 millas

80(14)

de 30 minutos y se tienen que recorrer 14 millas para que llegue al cliente seria de $25.696
IV. Análisis de regresión múltiple

Salsberry Realty

Salsberry Realty vende casas en la costa este de los Estados Unidos. Una de las preguntas mas frecuentes de los posibles compradores es: “
durante el invierno? Al departamento de investigación de Salsberry se le pidió desarrollar algunas directrices en relación a los costos de las
relacionan con dichos costos: 1) la temperatura externa diaria media, 2) el número de pulgadas de aislamiento en el ático y 3) los años de u
investigación de Salsberry seleccionó un muestra aleatoria de 20 casas de venta reciente y determinó el costo de calefacción de cada casa e
en la región, el número de pulgadas de aislamiento del ático y los años de uso del calentador. La información muestral se reporta en la sigui

Costo de Temperatura externa Aislamiento del Antigüedad del


Casa Garage
calefacción ($) media (F) ático (pulgadas) calentador (años)
1 250 35 3 6 0
2 360 29 4 10 1
3 165 36 7 3 0
4 43 60 6 9 0
5 92 65 5 6 0
6 200 30 5 5 0
7 355 10 6 7 1
8 290 7 10 10 1
9 230 21 9 11 0
10 120 55 2 5 0
11 73 54 12 4 0
12 205 48 5 1 1
13 400 20 5 15 1
14 320 39 4 7 1
15 72 60 8 6 0
16 272 20 5 8 1
17 94 58 7 3 0
18 190 40 8 11 1
19 235 27 9 8 0
20 139 30 7 5 0

Las instrucciones básicas de Excel para utilizar estos datos se encuentran en el apéndice C del libro base.

Determine la ecuación de regresión múltiple.

La ecuación de forma general queda de la siguiente manera : Y prima = a + b 1X1 + b2X2 + b3X3

*Analisis de los datos

Resumen

Estadísticas
Coeficiente de de la regresión
correlación 0.8967552991129
múltiple
Coeficiente de
determinación R2 0.804170066487
R^2 ajustado 0.7674519539534
Error típico 51.048553582817
Observaciones 20

ANÁLISIS DE VARIANZA
Promedio de los Valor crítico de
Grados de libertad Suma de cuadrados cuadrados F F
Regresión 3 171220.472833637 57073.4909445457 21.9011820324202 6.5617825E-06
Residuos 16 41695.2771663631 2605.95482289769
Total 19 212915.75
Coeficientes Error típico Estadístico t Probabilidad Inferior 95%

Intercepción 427.19380331965 59.6014293122365 7.16750937434215 2.237641734891E-06 300.84441748


Temperatura
externa media (F) -4.582662625763 0.772319353431061 -5.93363691509838 2.100350192323E-05 -6.2199065158
Aislamiento del
ático (pulgadas)
-14.83086268743 4.75441228052759 -3.11938927723472 0.0066059631520916 -24.909766476
Antigüedad del
calentador (años)
6.1010320605629 4.01212016612042 1.52065038133252 0.147862484322644 -2.4042827407

Al ya tener los resultados de los coeficientes ya podemos determinar la ecuación de regregresión la cual quedaria de la siguiente manera:

Y prima = 427.194 - 4.583X1 - 14.831X2 + 6.101X3

¿Cuáles son las variables dependientes y las variables independientes?

Variable dependiente: El costo de la calefacción en enero


Variable independiente: X1 La temperatura externa media en enero
X2 El número de pulgadas de aislamiento del ático
X3 La antigüedad en años del calentador

Analice los coeficientes de regresión ¿Qué indica si algunos coeficientes son positivos y otros son negativos?

Analizando los coeficientes nos podemos dar cuenta que unos cuentan con signos positivos y otros cuentan con signos negativos, los cuales
negativo nos indica que la variable cuenta con una relación inversa con la variable dependiente, en cambio si el coeficiente es positivo este
¿Cuál es el valor de la intersección?

El valor de la intersección con el eje y es : 427.194

¿Cuál es el costo de calefacción estimado de una casa si la temperatura externa media es de 30 grados, si el ático tiene 5 pulgadas de aisl

X1 temperatura: 30 Y prima = 427.194 - 4.583X1 - 14.831X2 + 6.101X3


X2 aislamiento: 5 Y prima = 427.194 - 4.583(30) - 14.831(5) + 6.101(10)
X3 años: 10 Y prima = 427.194 - 137.49 - 74.155 + 61.01
Y prima = 276.559

El costo estimado para la calefacción de una casa que cuenta con una temperatura media de 30 grados, tiene 5 pulgadas de aislamiento en
mes de enero seria de $276.56.
s posibles compradores es: “Si compramos esta casa ¿cuánto gastaremos en calefacción
n relación a los costos de las casas unifamiliares. Se considera que tres variables se
en el ático y 3) los años de uso del calentador. Para el estudio el departamento de
de calefacción de cada casa en enero pasado, así como la temperatura externa en enero
muestral se reporta en la siguiente tabla.
Superior Inferior Superior
95% 95.0% 95.0%
553.543189 300.844417 553.543189

-2.94541874 -6.21990652 -2.94541874

-4.7519589 -24.9097665 -4.7519589

14.6063469 -2.40428274 14.6063469

ria de la siguiente manera:

n signos negativos, los cuales tambien proporcionar cierta información. Si el valor es


l coeficiente es positivo este va contar con una relación directa.
ático tiene 5 pulgadas de aislamiento y el calentador tiene 10 años?

1(10)

pulgadas de aislamiento en el ático y su calentador tiene 10 años, todo esto durante el

También podría gustarte