Está en la página 1de 5

2.

Se supone que se puede establecer cierta relación lineal entre las exportaciones de un país y
la producción interna de dicho país. En el caso de España, tenemos los datos anuales
(expresados en miles de millones de pesetas) para tales variables correspondientes al
quinquenio 1992-96 en la siguiente tabla:

Años Producción Exportaciones


1992 52654 10420
1993 53972 11841
1994 57383 14443
1995 61829 16732
1996 65381 18760

A partir de esta información: Se sugiere el uso del complemento análisis de datos en Excel.

a. Analice la relación entre las variables a través del diagrama de dispersión.

Por medio de Excel realice el grafico pedido:

Diagrama de dispersion: Exportaciones


en funcion de la produccion
20000
Exportaciones en miles de millones de pesetas

18000
16000
14000
12000
10000
8000
6000
4000
2000
0
0 10000 20000 30000 40000 50000 60000 70000
Produccion en miles de millones de pesetas
Diagrama de dispersion: Exportaciones
en funcion de la produccion
20000
Exportaciones en miles de millones de pesetas

18000 y = 0.6369x - 22654


R² = 0.9876
16000
14000
12000
10000
8000
6000
4000
2000
0
0 10000 20000 30000 40000 50000 60000 70000
Produccion en miles de millones de pesetas

A simple vista podemos observar que existe una relación lineal entre estas dos variables (la
cual no es lineal perfecta, pero si muestra una buena tendencia de linealidad).

b. Estime la recta de regresión.

Continuando los cálculos en Excel, obtenemos la recta de regresión, la cual es:

̂ = 𝟎. 𝟔𝟑𝟔𝟗𝒙 − 𝟐𝟐𝟔𝟓𝟒
𝒚
Donde:

X=Producción en miles de pesetas.

Y=Exportaciones en miles de pesetas.

Coeficientes
Intercepción -22654,29285
Producción 0,636865947

c. Evalué la buena especificación del modelo usando la tabla ANOVA.


Mediante la función análisis de datos obtenemos la tabla ANOVA:

Análisis de varianza de un factor


RESUMEN
Grupos Cuenta Suma Promedio Varianza
Producción 5 291219 58243,8 28507099,7
Exportaciones 5 72196 14439,2 11707717,7

ANÁLISIS DE VARIANZA (TABLA ANOVA) CON SIGNIFICANCIA=0.05=ALFA


Valor
Origen de las Suma de Grados de Promedio de los crítico
variaciones cuadrados libertad cuadrados F Probabilidad para F
Entre grupos 4797107453 1 4797107453 238,57 3,07E-07 5,318
Dentro de los grupos 160859269,6 8 20107408,7

Total 4957966723 9

A partir de la tabla ANOVA vamos a verificar si la variable independiente (x) crea efectos
significativos en la variable dependiente (y), esto lo podemos medir con el valor F que en este
caso es 238.57 y el cual es significativo comparado con el Fcritico calculado, esto es:

𝑭𝒄𝒂𝒍𝒄𝒖𝒍𝒂𝒅𝒐 ≫ 𝑭𝒄𝒓𝒊𝒕𝒊𝒄𝒐

Por otro lado, tenemos que el Pvalor es mucho menor al nivel de significancia:

𝑝𝑣𝑎𝑙𝑜𝑟 ≪ 𝛼 → 3.07 ∗ 10−7 ≪ 0.05.

Por lo tanto podemos decir que la prueba ANOVA es significativa y que la variable
independiente está teniendo efecto significativo sobre la variable dependiente.

d. Evalué significación de los parámetros del modelo usando la prueba t. Incluya los
intervalos de confianza y sus interpretaciones.

El modelo de regresión lineal simple es 𝑦 = 𝛽0 + 𝛽1 𝑥 + 𝜖. Si x y y se relacionan


linealmente entonces 𝛽1 ≠ 0. El objetivo de la prueba t es determinar si se puede concluir
que 𝛽1 ≠ 0. Para probar la hipótesis siguiente acerca del parámetro 𝛽1 se emplearan los
siguientes datos muéstrales:

𝐻𝑜 : 𝛽1 = 0
𝐻1 : 𝛽1 ≠ 0 (Prueba de dos colas)

Si 𝐻𝑜 es rechazada, se concluirá que 𝛽1 ≠ 0 y que entre las dos variables existe una
relación estadísticamente significativa. Si 𝐻𝑜 no es rechazada, habrá evidencia insuficiente
para concluir que existe esta relación significativa.

El estadístico de prueba es:


𝑏1
𝑡=
𝑠𝑏1

Donde:

𝑏1 =Pendiente estimada
𝑠𝑏1 =Error de estimación de la pendiente

Coeficientes Error típico Estadístico t Probabilidad


Intercepción -22654,29285 2408,701263 -9,405189923 0,002546654
Produccion 0,636865947 0,041217183 15,45146704 0,000588913

𝑏1
𝑡= = 15.45146704
𝑠𝑏1
Ahora calculamos el tcritico mediante Excel:

𝑡𝑐𝑟𝑖𝑡𝑖𝑐𝑜 = ±3.182446305

Por lo tanto la región de aceptación de 𝐻𝑜 esta entre estos dos valores ±3.182446305.

De acuerdo a la prueba de hipótesis anterior concluimos que rechazamos 𝐻𝑜 debido a que


cae en la región de rechazo y decimos que entre las dos variables existe una relación
estadísticamente significativa con un nivel de significancia de 0.05.

Intervalos de confianza para 𝜷𝟏

La fórmula de un intervalo de confianza para 𝛽1 es la siguiente:

𝑏1 ± 𝑡𝛼 ∗ 𝑠𝑏1
2
Para calcular 𝑠𝑏1 retomamos la ecuación del estadístico t:

𝑏1 0.6369 0.6369
𝑡= = 15.45146704 = → 𝑠𝑏1 = = 0.04122
𝑠𝑏1 𝑠𝑏1 15.45146704
El coeficiente de confianza para el intervalo es 1 − 𝛼, y 𝑡𝛼 es el valor t que proporciona un
2
𝛼
área 2 en la cola superior de la distribución t con n-2 grados de libertad. En la tabla de
distribución t encontramos que el valor t correspondiente a un 𝛼 = 0.05y n-2=5-2=3
grados de libertad es 𝑡0.025 = 3.182, por lo tanto procedo con el cálculo de los intervalos
de confianza:

0.6369 ± 3.182 ∗ 0.04122 = 0.6369 ± 0.1312


0.5057 ≤ 𝛽1 ≤ 0.7681

Como cero (0), que es el valor hipotético de 𝛽1 , no está incluido en el intervalo de


confianza (0.5057 𝑎 0.7681), Ho puede ser rechazada y concluimos que entre las dos
variables si existe una relación estadísticamente significativa.

e. Si la producción para el año 1997 fue de 2.210.6100 millones de pesetas, ¿Cuál sería la
predicción de las exportaciones para este año? ¿Qué grado de precisión tendría dicha
predicción?

Como la producción para el año 1997 fue de 2210.6100 millones de pesetas, tenemos a
partir de la regresión:

̂ = 𝟎. 𝟔𝟑𝟔𝟗𝒙 − 𝟐𝟐𝟔𝟓𝟒
𝒚
𝟐. 𝟐𝟏𝟎. 𝟔𝟏𝟎𝟎 = 𝟎. 𝟔𝟑𝟔𝟗(𝒙) − 𝟐𝟐𝟔𝟓𝟒

𝟐. 𝟐𝟏𝟎. 𝟔𝟏𝟎𝟎 + 𝟐𝟐𝟔𝟓𝟒 = 𝟎. 𝟔𝟑𝟔𝟗𝒙

𝟐𝟐𝟏𝟐𝟖𝟕𝟓𝟒 = 𝟎. 𝟔𝟑𝟔𝟗𝒙
𝟐𝟐𝟏𝟐𝟖𝟕𝟓𝟒
=𝒙
𝟎. 𝟔𝟑𝟔𝟗
𝒙 = 𝟑𝟒𝟕𝟒𝟒𝟒𝟕𝟏. 𝟔𝟔 Millones de exportaciones
y según el coeficiente de regresión tendría un 99.37% de precisión.