Está en la página 1de 7

PRÁCTICA 2

CURSO 2022/2023
Se dispone de una base de datos para 27 observaciones sobre beneficios y ventas en
empresas alemanas (Fichero data 3-10.gdt, recogido en Ramanathan, R. (2002), Introductory
econometrics with applications, 5th. Ed., South-Western). Las variables que se consideran
son:

Profites (Beneficios), en millones de dólares.


Sales (Ventas), en billones de dólares.

El objeto de nuestra investigación se centra en estudiar el comportamiento de los beneficios


de las empresas en función de sus ventas.

1. Escribir la tabla de estadísticos descriptivos de las dos variables e interpretar los


resultados.

Estadísticos principales, usando las observaciones 1 - 27


Variable Media Mediana Mínimo Máximo
profits 472.85 232.00 26.000 1618.0
sales 21.118 17.253 1.1990 58.112
Variable Desv. Típica. C.V. Asimetría Exc. de
curtosis
profits 474.47 1.0034 1.2756 0.30433
sales 16.429 0.77798 0.74244 -0.29329
Variable Porc. 5% Porc. 95% Rango IQ Observaciones
ausentes
profits 51.600 1597.6 548.00 0
sales 1.6362 57.943 24.404 0

Dados estos resultados, se puede extraer como conclusiones que:

 Tanto en el caso de la variable “beneficios” como en el caso de la variable “ventas”,


tanto la media como la mediana no son valores cercanos, especialmente en el caso de
“beneficios”. De tal manera que no estamos ante una distribución como la Normal,
sino ante otra distribución de datos con otro comportamiento distinto.

 La desviación típica es elevada en ambos casos, sobre todo en la variable “beneficios”,


lo que nos indica que hay una importante dispersión en los datos de ambas variables.
Esta situación también se observa al ver los valores mínimo y máximo, que son
bastante distantes entre sí en el caso de ambas variables.

 En relación con la forma de la distribución, en cuanto a su asimetría, esta es positiva en


ambas variables, la cola se alarga a la derecha en ambos casos. En cuanto a su
apuntamiento o curtosis, es positiva en el caso de la variable “beneficios”, distribución
por tanto más apuntada que la normal y negativa en el caso de la variable “ventas”,
distribución menos apuntada que la normal.

2. Representar e interpretar el gráfico de frecuencias de ambas variables.


Variable “Beneficios”:

 El primer intervalo concentra la mayor parte de observaciones, concretamente el


59,26%.

 La media se sitúa, sin embargo, en el segundo intervalo.


 Asimetría muy marcada, cola se alarga a la derecha.
 Los intervalos segundo a séptimo presentan una concentración baja en relación con el
primero, no habiendo por tanto otro intervalo que sea muy representativo en la
distribución, como ocurre con el primero.
Distribución de frecuencias para profits, observaciones 1-27
número de cajas = 7, Media = 472.852, Desv.típ.=474.47

intervalo punto medio frecuencia rel acum.

< 265.33 132.67 16 59.26% 59.26% *********************


265.33 - 530.67 398.00 3 11.11% 70.37% ***
530.67 - 796.00 663.33 3 11.11% 81.48% ***
796.00 - 1061.3 928.67 0 0.00% 81.48%
1061.3 - 1326.7 1194.0 3 11.11% 92.59% ***
1326.7 - 1592.0 1459.3 1 3.70% 96.30% *
>= 1592.0 1724.7 1 3.70% 100.00% *

0.6

0.5

0.4
Frecuencia relativa

0.3

0.2

0.1

0
0 500 1000 1500
profits
Variable “Ventas”:

 El primer y segundo intervalo de la distribución concentran la mayor parte de los datos,


concretamente el 55,56% de las observaciones. Y los intervalos 1 a 4 concentran la
práctica totalidad de la distribución, en concreto el 85,19% de observaciones.

 Por tanto, los intervalos 5, 6 y 7 son poco representativos, dado que solo concentran el
14,81% de los valores de la serie.

 Asimetría positiva, cola se alarga a la derecha, pero de manera poco pronunciada.


Distribución de frecuencias para sales, observaciones 1-27
número de cajas = 7, Media = 21.1176, Desv.típ.=16.4291

intervalo punto medio frecuencia rel acum.

< 9.4855 4.7428 8 29.63% 29.63% **********


9.4855 - 18.971 14.228 7 25.93% 55.56% *********
18.971 - 28.456 23.714 3 11.11% 66.67% ***
28.456 - 37.942 33.199 5 18.52% 85.19% ******
37.942 - 47.428 42.685 2 7.41% 92.59% **
47.428 - 56.913 52.170 0 0.00% 92.59%
>= 56.913 61.656 2 7.41% 100.00% **

0.3

0.25

0.2
Frecuencia relativa

0.15

0.1

0.05

0
0 10 20 30 40 50 60 70
sales
3. ¿Cuál es el coeficiente de correlación entre ambas variables? ¿Qué indica el valor
resultante?

 En este caso se constata una correlación positiva, de 0.6382, lo que indica que las
variables están asociadas en sentido directo, de manera que ante incrementos en las
ventas se producen incrementos en los beneficios, dada la muestra “n” considerada.

Coeficientes de correlación, usando las observaciones 1 - 27


Valor crítico al 5% (a dos colas) = 0.3809 para n = 27

profits sales
1.0000 0.6383 profits
1.0000 sales

4. Realizar un análisis gráfico de la relación existente entre las variables e interpretar el


resultado.

profits con respecto a sales (con ajuste mínimo-cuadrático)


1800
Y = 83.6 + 18.4X

1600

1400

1200

1000
profits

800

600

400

200

0
0 10 20 30 40 50
sales

 Regresión lineal directa.

 Dada la muestra considerada, la mayor parte de las observaciones se encuentran


próximas a la recta de regresión, bien hay observaciones (en torno a 5 de las 27) que
están bastante alejadas de dicha recta.
5. ¿Cuáles son los coeficientes estimados del modelo econométrico considerado para
analizar la relación entre el gasto sanitario y la renta?

6. Escriba la ecuación del modelo estimado e interprete los valores de los coeficientes
estimados del modelo.

Modelo 1: MCO, usando las observaciones 1-27


Variable dependiente: profits

Coeficiente Desv. Típica Estadístico t valor p


const 83.5753 118.131 0.7075 0.4858
sales 18.4338 4.44633 4.146 0.0003 ***

Media de la vble. dep. 472.8519 D.T. de la vble. dep. 474.4696


Suma de cuad. residuos 3468497 D.T. de la regresión 372.4780
R-cuadrado 0.407414 R-cuadrado corregido 0.383711
F(1, 25) 17.18799 Valor p (de F) 0.000340
Log-verosimilitud −197.1172 Criterio de Akaike 398.2343
Criterio de Schwarz 400.8260 Crit. de Hannan-Quinn 399.0050

Ecuación:

^profits = 83.6 + 18.4*sales


(118) (4.45)

n = 27, R-cuadrado = 0.407


(Desviaciones típicas entre paréntesis)

 B1 indica que ante ausencia de valores de X, o un valor X de 0, se estima que la variable


Y tiene un valor promedio de 83,6. Este es el valor que marca el origen de la función
estimada en el eje de ordenadas.

 B2 indica que se estima que, ante variaciones unitarias de X, el valor medio de Y varía
en promedio en 18,4. Este es el valor que marca la pendiente de la función estimada.

7. Calcular la matriz de varianzas-covarianzas estimada insesgada de .


Matriz de covarianzas de los coeficientes

const sales
13954.9 -417.491 const
19.7698 sales

 Cov de la X es positiva, lo que muestra, dada la estimación realizada para la muestra


“n” considerada, una dependencia directa en este modelo, de modo que a incrementos
de X se producen incrementos de Y.
8. ¿Cuál es el coeficiente de determinación convencional y el coeficiente ajustado (o
corregido) del modelo?

9. Interpretar los valores del coeficiente de determinación ajustado.

R-cuadrado 0.407414 R-cuadrado corregido 0.383711

 La estimación supone un modelo aceptable para explicar el comportamiento de Y, en


tanto hay una parte considerable de la variabilidad de Y que es explicada por la
variabilidad de X, concretamente el 38,37%.

 En todo caso, dados estos valores, resulta obvio que buena parte de la variabilidad de Y
no se explica por la variabilidad de X, de modo que sería preciso seguir profundizando
en el estudio de las variables explicativas y causales de la variabilidad de Y.

10. Calcular un intervalo del 95% de confianza para la pendiente de regresión.


11. Justificar, a partir de los valores obtenidos en la pregunta anterior, si se puede
aceptar, o no, la hipótesis alternativa por la cual el comportamiento de la variable
beneficios se explica en función de la variable ventas.

 El intervalo de confianza, dado el nivel de significación del 5% y del grado de confianza


del 95%, sería: IC = 9.27638, 27.5911

 Puesto que nuestra hipótesis nula, Ho, supone que beta 2 es igual a 0, entonces se
rechaza la Ho dado que su valor no se encuentra dentro del IC.

 Además, se acepta la Hipótesis alternativa, H1, dado que el IC contiene valores


distintos de 0.

12. Contrastar la significatividad global del modelo.


13. Contrastar la significatividad individual de los coeficientes del modelo.
Valor p de F (0,000340) < Alpha (0,05)  Se rechaza Ho  Modelo significativo globalmente.

Valor p de X (0,0003) < Alpha (0,05)  Se rechaza Ho  Modelo significativo.

Valor p de const (0,4858) > Alpha (0,05)  No se rechaza Ho.


14. A partir de los estadísticos descriptivos de los valores muestrales de las variables
endógena y explicativa, estimación de la endógena y errores de la estimación,
comprobar que se cumplen las propiedades de la regresión lineal mínimo-cuadrática.

 La media de los residuos es 0 (prácticamente 0), concretamente -1.0948e-013

 La media de la variable dependiente (Y) y de la variable estimada (Y1) coinciden,


concretamente es 472.85.

 Los coeficientes de asimetría y curtosis de la variable dependiente estimada (Y1)


coinciden con las de la variable independiente (X), efectivamente son en concreto
0.74244 en el caso de la asimetría y -0.29329 en el caso de la curtosis.

 Los valores de Y1 y X están perfectamente correlacionados.

 La correlación es la misma entre Y e Y1 y entre Y y X, en concreto 0.6383.

 Los residuos e1 y los valores de X están incorrelacionados.

 Los residuos e1 y los valores de Y1 están incorrelacionados.

15. Suponiendo unas ventas de 45 billones de dólares, dado el modelo estimado a partir
de la muestra “n” considerada, ¿sería razonable que hubiera una empresa con unos
beneficios de 1.400 millones de dólares?

Predicción puntual = 913.09 millones de dólares.

Predicción en el intervalo = 101.85, 1724.34

Por tanto, atendiendo al modelo estimado, alcanzar unos beneficios de 1.400 millones de
dólares se alejaría mucho de la predicción puntual (prácticamente la duplica), pero podría
considerarse razonable dado que sí entraría dentro del intervalo de confianza, dado un grado
de confianza del 95%.

También podría gustarte