Está en la página 1de 11

Estadística Básica Actividad 5- Página 1 de 7 25/01/2023

Universidad de las Fuerzas Armadas


Estadística Básica

Actividad 5

Apellidos: Ninabanda Agualongo


Nombres: Amanda Graciela Firma: 0250221017
NRC: 6425 Fecha límite de entrega: 25/01/2023

Usted debe realizar la Actividad en estas hojas asegurándose de que el archivo electrónico
resultante sea legible. El formato de entrega es pdf, con el nombre del archivo
A5.Apellido.Nombre.EstadísticaBásica.pdf. Si se incumple estas reglas su trabajo tendrá
una calificación de cero.

Debe utilizar esfero o un lápiz que permita leer con facilidad el procedimiento realizado. También
podría usar word pero DEBE enviar en pdf.

Se requiere que usted muestre su trabajo y esfuerzo en cada problema de esta actividad. Se aplican
las siguientes reglas:

• Organice su trabajo, de una manera coherente y ordenada en el espacio disponible.

• Respuestas misteriosas y no sustentadas no recibirán la nota completa. Una respuesta


correcta, que no se encuentre soportada por sus respectivos cálculos, explicación o desarrollo
estadístico y matemático no recibirá una calificación completa; una respuesta incorrecta
soportada por cálculos y explicaciones sustancialmente correctas podría recibir una
calificación parcial.

Ejercicio 1:
Conteste las siguientes preguntas. Sustente adecuadamente las mismas e indique la bibliografía que
tomó como referencia para la misma:

a. ¿Cuál es la interpretación de Análisis de Regresión?

El análisis de regresión es una técnica de análisis que calcula la relación estimada entre una variable
dependiente y una o varias variables explicativas. Con el análisis de regresión, es posible modelar la relación
entre las variables elegidas, así como predecir valores basándose en el modelo.

El análisis de regresión se puede usar para resolver los siguientes tipos de problemas:

 Determinar qué variables explicativas están relacionadas con la variable dependiente.


 Comprender la relación entre las variables dependientes y explicativas.
 Predecir valores desconocidos de la variable dependiente.

Bibliografía:

Análisis de regresión. (s/f). Arcgis.com. Recuperado el 17 de enero de 2023, de


https://doc.arcgis.com/es/insights/latest/analyze/regression-analysis.htm
Estadística Básica Actividad 5- Página 2 de 7 25/01/2023

b. ¿Cuál es el objetivo del análisis de correlación?

La correlación es una medida estadística que expresa hasta qué punto dos
variables están relacionadas linealmente (esto es, cambian conjuntamente a una
tasa constante). Es una herramienta común para describir relaciones simples sin
hacer afirmaciones sobre causa y efecto.

Bibliografía:

Correlación. (2020, agosto 7). Jmp.com. https://www.jmp.com/es_co/statistics-knowledge


portal/what-is-correlation.html

c. Para el análisis de regresión lineal se realizan suposiciones que permiten validar cualquier
conclusión encontrada, cuatro de estas suposiciones son: la linealidad, la independencia de los
errores, la Normalidad y la igualdad de varianza u homocedasticidad. Explique cada una
(utilice al menos media carilla por suposición)

Linealidad

El gráfico del diagrama de dispersión constituye una primera aproximación no muy rigurosa
al estudio de la linealidad. Aparentemente lo es. Podemos completarlo mediante un gráfico
en el que se comparan las puntuaciones residuales y predichas.
La relación entre la variable de predicción (independiente) y de criterio (dependiente) debe
ser lineal en el rango de valores observados de la variable de predicción. Una manera
sencilla de comprobar este supuesto es la de representar un diagrama de dispersión y ver si
la distribución de los puntos tiene lugar, de forma aproximada, a lo largo de una línea recta.

Un método numérico que permite comprobar el supuesto de linealidad es la prueba RESET


de Ramsey. Para que el modelo sea correcto, la mediana de los residuos debe estar
próxima a cero y los valores absolutos de los residuos deben distribuirse de manera
uniforme entre los cuartiles (similar entre máximo y mínimo y entre primer y tercer cuartil). Si
esto se cumple significará que los residuos siguen una distribución normal cuya media es
cero, condición necesaria para la validez del modelo

Bibliografía
Regresión lineal simple. (2022). En Estadística inferencial aplicada (pp. 280–316). Editorial
Universidad del Norte.

La Independencia De Los Errores

El supuesto de independencia de las variables aleatorias error  , se puede chequear

gráficamente por medio de un diagrama de dispersión entre los residuales   y el

orden en que se tomaron las observaciones (si se tiene)  . Para los datos del ejemplo,
el gráfico se muestra en la figura 1. No se observa un patrón característico, por lo tanto,
parece indicar que los residuos se encuentran independientes o aleatoriamente distribuidos.
Estadística Básica Actividad 5- Página 3 de 7 25/01/2023

El supuesto de la independencia de los errores implica que los errores en la medición de las


variables explicativas sean independientes entre sí.

Bibliografía

Hothorn, Torsten, Achim Zeileis, Richard W. Farebrother, and Clint Cummins. 2019. Lmtest:
Testing Linear Regression Models. https://CRAN.R-project.org/package=lmtest

NORMALIDAD

Para cada valor de la variable X, los residuos tienen distribución normal de media cero. Por
lo tanto, para ver si un modelo de regresión lineal ajustado es válido, debemos comprobar
que se cumplen estas tres condiciones sobre los residuos.
Una forma sencilla de comprobarlo sería representar el histograma o el gráfico de cuantiles
teóricos de los residuos, en el que deberíamos ver su distribución a lo largo de la diagonal
del gráfico.

HOMOCEDASTICIDAD

La homocedasticidad en un modelo estadístico predictivo ocurre si en todos los grupos de


datos de una o más observaciones, la varianza del modelo respecto de las variables
explicativas (o independientes) se mantiene constante.

Un modelo estadístico de regresión de varias variables independientes se llama


homocedástico, solo si la varianza del error de la variable predicha (o la desviación estándar
de la variable dependiente) se mantiene uniforme para diferentes grupos valores de las
variables explicativas o independientes.

A nivel gráfico significa que los puntos están igualmente dispersos o desparramados en
torno al valor predicho por el ajuste de regresión, y que el modelo de regresión tiene el
mismo error y validez para el rango de la variable explicativa.

BIBLIOGRAFÍA

Regresión lineal simple. (2022). En Estadística inferencial aplicada (pp. 280–316). Editorial

Universidad del Norte.

Ejercicio 2:
Lee Iacocca, presidente y director ejectuvo de Chryler Corporation, manifiesta su preocupación por la
elevada estructura de costes de la empresa después de haber adquirido AMC y lo que él llamaba
“beneficios escasos frente a ventas crecientes”. En el 2021 ordenó a los ejecutivos que emprendieran
un estudio concertado de la estructura de costes de Chryler en relación a sus ventas oficiales. Se
recogieron los datos sobre la producción del vehículo K. Los resultados obtenidos fueron los
siguientes:
Estadística Básica Actividad 5- Página 4 de 7 25/01/2023

Mes Costes Ventas


1 15,8 23
2 12,3 18
3 14,5 21
4 15,7 23
5 12,7 18
6 13,5 19
7 13,7 20
8 15,9 22
9 13,7 19
10 14,3 21

meses costes (x) ventas (y) x^2 y^2 x*y


1 15,8 23 249,64 529 363,4
2 12,3 18 151,29 324 221,4
3 14,5 21 210,25 441 304,5
4 15,7 23 246,49 529 361,1
5 12,7 18 161,29 324 228,6
6 13,5 19 182,25 361 256,5
7 13,7 20 187,69 400 274
8 15,9 22 252,81 484 349,8
9 13,7 19 187,69 361 260,3
10 14,3 21 204,49 441 300,3
total 142,1 204 2033,89 4194 2919,9
promedio 14,21 20,4 203,39 419,4 291,99

Medias
x=14,21

y=20,4

Varianza

2 2 2 2
s x=x −( x ) =203,39−( 14,21 ) =¿ 1,46
2 2 2 2
s y= y −( y ) =419,4−( 20,4 ) =¿3,24

Covarianza

sxy=xy −x y
sxy=¿ 291,99 –(14,21)2( 20,4)2
sxy=¿ 2,106

Coeficiente de correlacion
sxy
rxy=
sx∗sy

2,106
rxy= = 0,9667 2
R =0,9345
√ 1,46∗√ 3,24
Estadística Básica Actividad 5- Página 5 de 7 25/01/2023

Ecuación de la tendencia lineal

sxy
b= a= y−bx
sx
2,106
b= a=20,4 – 1,4376(14,21)
1,46
b=1,4376 a=−0,0289

Y^ =a+bx
Y^ =−0,0289+1,4376 x

a) Elabore el correspondiente diagrama de dispersión.

ventas y costos
24
23
22 f(x) = 1.43764079459349 x − 0.0288756911734644
R² = 0.934466516485767
21
20
costos

19
18
17
16
15
14
11 12.5 14 15.5 17
ventas

b) Explique qué tipo de relación se establece entre las dos variables mostradas.

En este caso se establece una correlación positiva ya que existe una mediana relación positiva entre la
variable independiente y la variable dependiente.
Mientras aumenta una variable x también aumenta la otra variable Y. esto quiere decir que mientras
mas elevado sea el costo de la empresa, mayor también son las ventas.

Ejercicio 3:
En su famoso libro de 1936 A General Theory of Employment, Interest and Money, el famoso economista
británico John Maynard Keynes propuso una relación teórica entre renta y gastos de consumo
personal. Keynes afirmaba que cuando la renta crece el consumo aumenta en una cantidad más
pequeña. Esta relación teórica se ha comprobado muchas veces de manera empírica desde 1936.
Milton Fredman, antiguo profesor de Economía de la Universidad de Chicago y ganador del premio
Nobel de Economía, recogió numerosos datos sobre la renta y el consumo en Estados Unidos a lo
largo de un período. A continuación se muestra diez observaciones de niveles anuales de consumo y
renta utilizadas por Friedman para su estudio: (las cifras están en millones de dólares actuales)
Estadística Básica Actividad 5- Página 6 de 7 25/01/2023

Año Renta Consumo


1950 284,8 191,0
1951 328,4 206,3
1952 345,5 216,7
1953 364,6 230,0
1954 364,7 236,5
1955 398,0 254,4
1956 419,2 266,7
1957 441,1 281,4
1958 447,3 290,1
1959 483,7 311,2

consumo(y
año renta(x) ) x^2 y^2 x*y
1950 284,8 191 81111,04 36481 54396,8
1951 328,4 206,3 107846,56 42559,69 67748,92
1952 345,5 216,7 119370,25 46958,89 74869,85
1953 364,6 230 132933,16 52900 83858
1954 364,7 236,5 133006,09 55932,25 86251,55
1955 398 254,4 158404 64719,36 101251,2
1956 419,2 266,7 175728,64 71128,89 111800,64
1957 441,1 281,4 194569,21 79185,96 124125,54
1958 447,3 290,1 200077,29 84158,01 129761,73
1959 483,7 311,2 233965,69 96845,44 150527,44
1537011,9
total 3877,3 2484,3 3 630869,49 984591,67
153701,19
promedio 387,73 248,43 3 63086,949 98459,167

Medias
x=387,73

y=248,43

Varianza

2 2 2 2
s x=x −( x ) =153701,193−( 387,73 ) =¿ 3366,6401

s2 y= y 2−( y )2=63086,949−( 248,43 )2=¿ 1369,4841

Covarianza

sxy=xy −x y
sxy=¿ 98459,167–(387,73 ¿(248,43)
sxy=¿ 2135,4031

Coeficiente de correlación
sxy
rxy=
sx∗sy
Estadística Básica Actividad 5- Página 7 de 7 25/01/2023
2135,4031
rxy= = 0,99449597 2
R =¿0,989
√3366,6401∗√1369,4841

a) ¿Las variables descritas presentan una relación lineal? Justifique gráficamente y razone su
respuesta.

rentas y consumo
310
f(x) = 0.634283153699738 x + 2.49939281600072
290 R² = 0.989022225733177
270
250
Consumo

230
210
190
170
150
250 285 320 355 390 425 460 495 530
rentas

Tiene una relación lineal positiva porque a medida que va aumentando el consumo también va en
incrementando la renta las variables son directamente proporcional.

b) Calcule la ecuación de regresión lineal para predecir los gastos de consumo personal en
función de la renta. Grafique la misma en el diagrama de dispersión correspondiente.
sxy
b= a= y−bx
sx
2135,4031
b= a=1369,4841 – 0,6343(3366,6401)
3366,6401
b=0,6343 a=2,4994

Y^ =a+bx
Y^ =2,4994+0,6343 x
Estadística Básica Actividad 5- Página 8 de 7 25/01/2023

320
310
300 f(x) = 0.634283153699738 x + 2.49939281600072
R² = 0.989022225733177
290
280
270
260
250
240
Renta

230
220
210
200
190
180
170
160
150
250 285 320 355 390 425 460 495 530

c) ¿Puede afirmar que el modelo lineal encontrado en el ítem b) es el adecuado? Justifique su


respuesta.

Según la definición para el análisis de la regresión lineal se realizan suposiciones que permiten
validar cualquier conclusión encontradas.

Como podemos ver en la imagen en modelo lineal encontrado anteriormente resultaría ser el
adecuado después de realizar las suposiciones y de haberte comprobado. El valor de r = 0,994 existe
una correlación positiva es por tal motivo que mientras la renta sube el consumo también incrementa.
Por tal motivo tiene una pendiente positiva en crecimiento constante.

Ejercicio 4:
La teoría económica sostiene que cuando los tipos de interés bajan, las empresas pueden invertir más
en bienes de equipo. En la tabla se dan cifras mensuales de tipos de interés e inversiones nuevas de
capital en miles de millones de dólares:

Tipo de Inversión
Mes
Interés de Capital
Enero 10,0 10
Febrero 9,5 11
Marzo 9,0 12
Julio 7,5 16
Agosto 7,0 17
Septiembre 6,5 18
Octubre 6,0 19
Noviembre 5,5 20
Diciembre 5,0 21
Estadística Básica Actividad 5- Página 9 de 7 25/01/2023
inversion
tipo de de capital x^2 y^2 x*y
interes(x) (y) ^y   ( y− ^
2
y)  ( y− y )2
10 10 100 100 100 10,00 0,00 36,00
9,5 11 90,25 121 104,5 11,13 0,02 25,00
9 12 81 144 108 12,25 0,06 16,00
7,5 16 56,25 256 120 15,63 0,14 0,00
7 17 49 289 119 16,75 0,06 1,00
6,5 18 42,25 324 117 17,88 0,02 4,00
6 19 36 361 114 19,00 0,00 9,00
5,5 20 30,25 400 110 20,13 0,02 16,00
5 21 25 441 105 21,25 0,06 25,00
66 144 510 2436 997,5 144,0000 0,3750 132
7,33 16,00 56,67 270,67 110,83

Determine en función del comportamiento de las variables tipo de interés e inversión de capital.

Medias
x=7,33

y=16

Varianza

2 2 2 2
s x=x −( x ) =56,76−( 7,33 ) =¿ 2,89
2 2 2 2
s y= y −( y ) =270,67−( 16 ) =¿ 14,67

Covarianza

sxy=xy −x y
sxy=¿ 110,83 –(7,33) (16)
sxy=¿ -6,50

Coeficiente de correlación
sxy
rxy=
sx∗sy

−6,50
rxy= = -0,9985785 R2=0,9972
√ 2,86∗√ 14,67
Ecuación de la tendencia lineal

sxy
b= a= y−bx
sx
−6,5
b= a=16 -(-2,25) *(7,33)
2,86
b=−2,25 a=32,5

Y^ =a+bx
Y^ =32,5−2,25 x
Estadística Básica Actividad 5- Página 10 de 7 25/01/2023

a) Coeficiente de determinación. ¿Qué conclusiones puede obtener?

2 22
2 ∑ ( y −^y )
R =1− 2 20 f(x) = − 2.25 x + 32.5
∑( y− y) R² = 0.997159090909091
18

inversion de capital
0,3750 16
R2=1−
132 14

2 12
R =0,9972
10
2
R =99,72% 8
3 4.5 6 7.5 9 10.5
tipo de interes

Se puede decir que el 99,72% de la variable de la inversión de capital es explicada por el tipo de
interés. Si la correlación es -1 los activos se mueven en dirección opuesta la ventaja es poder reducir
los riesgos.

b) Coeficiente de correlación. ¿Qué conclusiones puede obtener?

sxy
rxy=
sx∗sy

−6,50
r=
√ 2,86∗√ 14,67

r =¿-0,9985785

En conclusión, se puede decir que existe una alta correlación negativa directa entre las variables tipo
de interés e inversión de capital. Es decir, a medida que aumenta la inversión disminuye el interés.

c) El error estándar de estimación.


2
∑ ( y− ^y )
s yx =
n−2

s yx =
√ 0,3750
9−2

s yx =0,2314

El error estándar de la regresión es la desviación de los puntos reales de la línea de regresión, y


cuanto menor sea el error estimado, más precisa será la predicción de la línea de regresión. En este
caso, los valores observados caen un promedio de 23,14 % de la línea de regresión.

d) De una predicción puntual de la inversión cuando el tipo de interés es del 6.0%. Compare con
Estadística Básica Actividad 5- Página 11 de 7 25/01/2023
el valor de tabla y calcule el porcentaje de diferencia entre estos valores.
x=¿ 0,06

Y^ =32,5−2,25(0,06)

Y^ =32,365

valor nuevo−valor antiguo


Porcentaje de diferencia = ∗100
valor antiguo
La predicción de la inversión
32,365−19 cuando ternemos un interés
Porcentaje de diferencia =
19
∗100 = 70,342 del 6 % el porcentaje de
diferencia es del 70,342%

También podría gustarte