Está en la página 1de 12

Nombre: Pablo Alberto Ortega Vega Matrícula: 2940594

Nombre del curso: Nombre del profesor:


Estadistica y pronosticos para la toma de Aaron Vazquez Jimenez
desciciones
Módulo: 2 Actividad:
Evidencia 2
Fecha: 17-Agosto-2022

Instrucciones:

Analiza y resuelve los siguientes ejercicios, sin olvidar incluir los procedimientos
utilizados que te llevaron a la respuesta.

1. ¿Existe alguna relación entre el tiempo en minutos que se utiliza para llegar a un
centro comercial y la distancia desde la casa en donde tú vives? Entrevista a 20
personas y pregúntales el tiempo que tardan en llegar al centro comercial y la
distancia a su casa. Después denomina a la variable tiempo en minutos como Y
y a la distancia en km como X.

Persona Tiempo en Distancia en Xy X2 Y2


minutos (x) kilometros(y
)
10 13 23 100 169
1
2 15 12 27 225 144
3 12 15 25 100 225
4 10 20 32 144 400
5 15 21 36 225 441
6 13 13 26 169 169
6 15 13 28 225 169
7 20 15 35 400 225
8 10 17 27 100 289
9 12 13 25 144 169
10 14 12 26 196 144
11 15 14 29 225 196
12 12 12 24 144 144
13 20 18 38 400 324
14 15 9 21 144 81
15 12 12 27 225 144
16 15 13 23 100 169
17 10 15 23 64 225
18 8 11 22 121 121
19 11 9 19 100 81
20 10 11 21 64 124
Suma 259 277 536 3551 4,029.00
Promedio 12.95 13.85 26.80 177.55 201.45

2. Contesta lo siguiente:

a. Realiza el diagrama de dispersión y describe el comportamiento de ambas

variables. ¿Qué clase de relación crees que existe entre estas dos variables?

Normalmente suele existir una relacion exponencial para los tramos rectos de las
mismas variables, en este caso existe, es que generalmente se incrementa el
tiempo conforme se incrementa la distancia.

b. ¿A mayor distancia mayor tiempo?

Generalmente en la mayoria de los casos funciona asi, conforme aumenta el


tiempo aumenta tambien la distancia, pero hay excepciones ya que existe
otra variable que involucra los tramos viables.

c. ¿Calcula la recta de regresion de minimos cuadrados?ç

Los siguientes datos son necesarios para obtener la recta

Kms Minutos
X Y XY X2 Y2

Suma = 259+277+536+3551+4,029

R= 8652

d. ¿Existe evidencia que indique que a mayor distancia es mayor el tiempo en


llegar? Prueba la significancia de la recta de regresión con un nivel de
significancia α = 0.01.

Si, en el analisis de la hipotesis; la variable independiente afecta la variable


Y.

e. ¿Es significativa esta regresión? Realiza todas las etapas de una prueba de
hipótesis. Concluye en el contexto del problema.

Ho: 1-2… k-0 (las variables independientes no afectan a Y)


En oposicion a:
Ha: i0 (al menos una variable x afecta a y)
Fcalculada: 52.7761
Fteorica -3.07

Al ser Fcalculada mayor que Fteorica se rechaza ho concluyendo que al


menos una variable afecta el precio de la casa.

f. Pronostica el tiempo en llegar al centro comercial si la distancia es de 3, 4 y


6 kilómetros de distancia.
Regresión 1 85121.958 85121.958 31.316

Residual 18 48926.242 2718.125

Total 19 134048.2

Establecimiento de hipótesis

H0 : β1 = ... βk = 0 (Las variable independiente no afectan a Y)

Ha : βi ≠ 0 (Al menos una variable X afecta a Y)

Estadística de prueba

Fcalculada= (CM Regresión) / (CM Error)= 85121.958 / 2718.125=31.316

Regla de decisión

Rechazar H0 si Fcalculada es mayor

Fteórica: F118 (0.01) = 8.29

Fcalculada = 31.316

Conclusion : Ya que Fcalculada nos da como resultado 31.316 es menor que


Fteorica = 8.29, en este caso se acepta Ho

g. Calcula el coeficiente de correlacion

Ŷ = b0 + b1X0
Ŷ = 35.3096+ 0.5636X0
Pronostica los metros de construcción X0 = 90
Ŷ=35.3096+ 0.5636 *90 =86.0364
Pronostica los metros de construcción X0 = 100
Ŷ=35.3096+ 0.5636 *100 =91.6727
Pronostica los metros de construcción X0 = 150
Ŷ=35.3096+ 0.5636 *150 =119.8543

h. Determina e interpreta el coeficiente de determinacion en el contexto del


problema.

Se calcula Sx:

S_x= √( (∑X^2 -n( X


̄ )^2)/(n-1))= √((1672979-20(265.05)^2)/(20-
1))=√(267948.95/19)=118.7543

Se calcula Sy:

S_y= √( (∑Y^2 -n( Y


̄ )^2)/(n-1))= √((816330-20(184.7)^2)/(20-

1))=√(134048.2/19)=83.9950 Y se calcula el coeficiente de correlación r:

r=b_1 S_x/S_y = 0.5636118.7543/83.9950= 0.7969

i. Realiza un breve resumen de los hallazgos

R2= [(0.7969)]2=0.6350

3. ¿Existe relación entre el peso de una persona y la medida de su cintura en


centímetros? Selecciona 10 personas del género masculino y 10 personas del género
femenino y pídeles que te den su peso en kilogramos y la medida de su cintura en
centímetros. Posteriormente denomina a la variable peso como Y y a la medida de la
cintura como X.

4. Investiga acerca de 20 casas en venta en donde las variables son Y (metros de


construcción) y X (metros de terreno), y realiza lo que se te indica:
5. Contesta lo siguiente:

a. Realiza el diagrama de dispersión y describe el comportamiento de ambas


variables
Casas Y (metros de X (metros Xy X2 Y2
cosntruccion) de terreno)
1 6 4 10 16 36
2 8 3 11 9 64
3 7 6 13 36 49
4 8 5 13 25 64
5 5 4 9 16 25
6 9 5 14 25 81
7 7 6 13 36 49
8 6 7 13 49 36
9 5 5 10 25 25
10 9 6 15 36 81
11 5 3 8 9 25
12 7 4 11 16 49
13 5 6 11 36 25
14 8 4 12 15 64
15 9 5 14 25 81
16 6 7 13 49 36
17 6 5 11 25 36
18 7 7 14 49 49
19 8 5 13 25 64
20 9 9 18 81 81
Suma 140 106 246 604 1020
Promedio 7 5.3 13.3 30.2 51

b. ¿Qué clase de relacion crees que existe entre estas dos variables?

La correlacion sugiere que a mayor se construya en metroas, el terreno tendra


que ser mayor en metros. Por lo tanto, ua variable dependera de la otra para asi
incrementar o disminuir su valor.

c. Calcula la recta de regresion de minimos cuadrados.


d. Prueba la significancia de la recta de regresión con un nivel de significancia α =
0.01.
e. ¿Es significativa esta regresión? Explica. Concluye en el contexto del problema.
Realiza todas las etapas de una prueba de hipótesis.

Ho: -i = 0 ( la variable independiente x1 no afecta a y)


En oposición a:
Ha: -i * 0 (La variable independiente x1 afecta a y)
Calculada – bi – i / Sbi = 9.14198458 – 0 / 4.18496603 = 21845
Teorica = t / 2 (n – k – 1) = T0 025 (21) – 2.080
Al ser mayor la hipótesis t calculada que la t teórica concluimos que variable
x1 afecta el precio de la casa.
Ho: -i = 0 (la variable independiente x2 no afecta a y)
En oposición a:
Ha: -i * 0 (la variable independiente x2 afecta a y)
Teorica: t/2 (n – k -1) = t0 025 (21) = 2.080
Calculada : 5.934450532-0 / 5.216922985 – 1.1375
Al ser calculada menor que t teorica se acepta Ho y concluimos que x2
no afecta el precio de las casas.

f. Pronostica los metros de construccion cuando los metros de terreno son de 90,
100 y 150 metros

y90= 29.81034592 + 0.752384989(90)


y90= 97.52499494
y100= 29.81034592 + 0.752384989(100)
y100= 105.0488448
y150= 29.81034592 + 0.752384989(150)
y150= 142.6680943

Metros de terreno x Metros de construccion Y


90 97.52499494
100 105.0488448
150 142.6680943
g. Calcula el coeficientw de correlacion

h. Determina e interpreta el coeficiente de determinacion en el contexto del


problema.

R2=(r)2= (0.977697871)2= 0.9558931280 como es mas comun expresarlo, en


porcentaje, 95.5893128%, lo cual se interpreta como la variabilidad de Y
(metros de construccion) que se explica por la X(metros de terreno).

i. Realiza un breve resumen de los hallazgos.


Como nos podemos dar cuenta, a mayor metro de terreno el metro de
construccion sera mucho mayor, como nos podemos percatar en el diagrama de
dispersion y asi como se realizo la hipotesis.

Revisa la siguiente informacion tomada de la seccion de avisos de ocasión.


6.

Precio Metros Metros de  Número de


(miles de pesos) de  construcción X2recámaras X3
Y terreno X1

2700 288 378 4

1895 160 252 4

1397 230 252 4

1795 234 167 2

650 72 124 4

850 128 262 4

3875 188 246 4

4300 390 380 3

11850 885 775 4

11900 885 775 3

3250 150 233 3

6700 406 420 3

5499 320 390 4

4250 170 244 4

4250 170 233 3

470 160 127 3

500 90 73 2

550 91 73 2

650 110 90 2

550 90 74 2

620 172 76 2

1700 189 374 4

2330 300 330 4

1600 136 140 3

1100 144 290 3


Suma de cuadrados total= SS total = (Y-Y)=2
Suma de cuadrados de la regresion= SSR-(Y-Y)=2
Suma de cuadrados del error o residuos= SSE= (Y-Y)=2

7. Utiliza Excel o cualquier otro paquete estadístico como Minitab para realizar lo
siguiente:

a. Estima el modelo de regresión múltiple e interpreta los coeficientes de la ecuación de


regresión lineal múltiple.

Y= -602.56+9.14+5.93-77.81

• La variable x1 se encarga de estimar que cuando los metros de terreno cambian


el precio
• La variable x2 se encarga de estimar que cuando los metros de construcción
cambian el
precio de la casa se elevará en 5.93.
• La variable x3 se encarga de estimar que cuando el número de recámaras el
costo
cambiará en -77.81.
Prueba la significancia global del modelo de regresión múltiple; realiza todas las
etapas de una prueba de hipótesis.

Hipótesis nula:
• H0: β1 = β2 =... βk = 0 (Las variables independientes no afectan a Y) Hipótesis
alternativa:
• Ha: βi ≠ 0 (Al menos una variable X afecta a Y)
F=52.77
Coeficiente de significancia= 0.05F teórica: 3.072
b. Pronostica el precio para los siguientes datos:
Metros Metros de  Número de
de  construcción  recámaras
terreno  (X2 ) ( X3  )
( X1 )

180 390 4

200 250 3

230 200 4

250 180 2

100 120 3

El precio pronosticado para (1) = es:$3,096.18


El precio pronosticado para (2) = es: $ 2,976.01
El precio pronosticado para (3) = es: $2,375.74
El precio pronosticado para (4) = es: $2,59551
El precio pronosticado para (5) = es: $790.33

4. Prueba la significancia de los coeficientes de regresión individuales. Realiza


todas las etapas de una prueba de hipótesis para cada uno de los coeficientes.

Meteros de terreno Metros de construccion Numero de recamaras


H0:B1=0 H0:b2=0 H0:B3=0
H1:B1=0 H1:B2=0 H1:B3=0

1. Barra de los coeficientes de regresión individuales. t= b1 – 0/S b1

Para metros de terreno: 2.184482386 cae en la región de rechazo


Para metros de construcción 1.137538459 cae en la región de rechazo
Metros de numero de recamas -0.174760572 no se rechaza
e. Calcula el error estándar de estimación.
Error estándar de estimación multiple

Sr.122.x = √£ (y -y ́) 2 = √ SSE

n – (k +1) n – (k +1)

el valor es: $1,162.00

Se espera que los residuos sean aproximados a una distribución mas o menos

normal, por lo que alrededor de 68% de ellos estará dentro de +- $1,16200 y

cero de 95% dentro de +-2($1,162.00) = $2,324.00

f. Construye un intervalo de confianza para las pendientes de la población (β1, β2 y β3).

Inferior 95% Superior 95%


Intercepcion -2999.476927 1794.339
X1 0.438871316 17.8450978
X2 -4.914734694 16.7836358

X3 -1003.736198 848115631

Coeficiente de determinación multiple

R2 = SSR/SS Total

Coeficiente de determinación: 88.29%

Es decir que las variables independientes, x1, x2, x3 ayudan a explicar a la Superior
95% variable independiente el 88% de las veces.

g. calcula e interpreta R2 en el contexto del problema.

R2 = suma de cuadrados de regresión /suma de cuadrados totales. R2 =


1747.164539/13480 = 0.129611612

Se interpreta que el 12.96% de la variación en el precio final se dice por x1

(metros de terreno) x2 (metros de construcción) y x3 (número de recamaras)


Calcula R2ajustada.

Coeficiente de determinación ajustado

h. Determina el Factor de Inflación de Varianza (VIF) para cada variable explicativa en


el modelo. ¿Existe alguna razón para sospechar que existe multicolinealidad?

Factor de inflación de la varianza

VIF=1/1-R2

i. Finalmente prepara un documento presentando un resumen de tus hallazgos.

En esta evidencia se aprendio sobre la relación entre el tiempo en minutos y el


desplazamiento de un lugar a otro, la significativa de las regresiones, el tiempo que
tardan las personas en llegar a los centros comerciales, los coeficientes de correlación,
coeficientes de determinación, diagramas de dispersión, recta de regresión, etc.

También podría gustarte