Está en la página 1de 33

ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL

FACULTAD DE CIENCIAS NATURALES Y


MATEMÁTICAS

ESTG1034 - ESTADÍSTICA

REGRESIÓN LINEAL MÚLTIPLE

PERIODO:
1T-2022

ELABORADO POR:
DAVINSON STEVEN MERCHÁN BECERRA

CORREO:
dsmercha@espol.edu.ec

DIRIGIDO POR:
MSC. VANESSA MIREYA SALAZAR VILLALBA

PARALELO:
10
1. Introducción

La Estadística es una Ciencia Inductiva que nos permite tener inferencias con
respecto a las característica cualitativas y cuantitativas de una población con
respecto a una muestra de esta (Rodríguez L 2007, pp. 8).

El proyecto a realizarse tiene el fin de definir una Regresión Lineal Múltiple,


donde se realiza mediante el uso del programa Microsoft Excel el análisis de una
muestra de 36 observaciones, consistirá en predecir los valores del dinero
conseguido en las Exportaciones Nacionales de Crudo [$] , siendo esta la variable
Y, con respecto a la Producción Nacional de Petróleo en barriles (X1) y por el
gasto a causa de la importación de derivados [$] (X2), en estas variables sus
valores son expresados en millones, ya que se consiguen grandes cantidades de
las variables mencionadas. Las observaciones realizadas son los trimestres que
comienzan desde el año 2014 hasta el segundo trimestre del año 2021.

2. Objetivos

Objetivo General:

• Aplicar Modelo de Regresión Lineal Multivariante en los datos


correspondientes a Exportaciones Nacionales de Crudo con respecto a la
Producción Nacional de Petróleo y a las Importaciones de Derivados.

Objetivos Específicos:

• Observar el comportamiento de la variable Y (Exportaciones Nacionales


de Crudo) con respecto a los datos de las variables independientes X1
(Producción Nacional de Petróleo) y X2 (Importaciones de Derivados) por
medio de los diagramas de dispersión.

• Evaluar la eficiencia del modelo de mínimos cuadrado para explicar la


variación de Exportaciones Nacionales de Crudo por medio del coeficiente
de determinación.

• Comprobar la dependencia lineal entre Exportaciones Nacionales de


Crudo con la Producción Nacional de Petróleo y de las importaciones de
derivados
• Analizar la diferencia entre la diferencia de una distribución esperada, de
Exportaciones Nacionales, de frente a una función de distribución
acumulada por medio de la suposición de la normalidad de los errores del
modelo por medio de la Prueba de KOLMOGOROV -SMIRNOV.

3. Variables y Metodología

• Variable:

Los datos obtenidos para realizar el proyecto de regresión lineal, consisten


en datos estadísticos respecto a las actividades petroleras en el país.

Variable Y: Exportaciones Nacional de Crudo, representa el dinero


obtenido por la venta del petróleo a través de exportaciones.

Variable X1: Producción Nacional de Petróleo (X1), estos valores


representan la cantidad de barriles producidos en cada trimestre
analizados,

Variable X2: Importación de derivados, representa el dinero usado para la


compra de derivados provenientes del exterior del país, los datos provistos
por el Banco Central del Ecuador, por cada trimestre, nos daba el total de
cada uno de los derivados que se importó (Nafta Alto Octano, Diesel y
Gas Licuado de Petróleo), se decidió realizar una suma de entre los tres
derivados para tener Importaciones totales en cada uno de los trimestres
(X2)

• Metodología:

Diagrama de dispersión: Establece la relación o correlación entre dos o


más variables, herramienta gráfica (Data Viz Catalogue, s.f.).

Recta de mínimos cuadrados: Método para calcular la recta de regresión


lineal que disminuye la diferencia que exista entra los valores reales y los
estimados por la recta (Molina M, 2020).

Tabla ANOVA: Mide el efecto de uno o varios factores sobre la varianza


de unas variables, como lo es la medición de la significacnacia de una
variables con respecto a otra (Mendoza J, 2021).
Coeficiente de determinación: Medida de la relación entre las variables
X1, X2 y Y e interpreta la eficiencia del modelo de mínimos cuadrados
para explicar la variación que existe en la variable de respuesta (Y)
(Rodríguez L 2007, pp. 316).

Matriz de varianza-covarianza: Expresión ordenada de las varianzas y


covarianzas de los estimadores del modelo de regresión lineal (Rodríguez
L 2007, pp. 318).

Prueba KOLMOGOROV-SMIRNOV: Compara la función de


distribución acumulada de un variables con una distribución teórica
determinada (en regresión múltiple con la Distribución Normal, para
probar la normalidad del error del modelo), se calcula a partir de la
diferencia mayor que existe entre cada una de las funciones de
distribuciones acumuladas teóricas con las determinadas, con el fin de
determinar si las observaciones proceden de la distribución especificada
(IBM, 2021).

4. Estadística inferencial

Los datos tomados se obtuvieron de acuerdo con estadísticas dadas por el Banco
Central del Ecuador, ubicándolos en el Cuadro 1:
Cuadro 1
Regresión Lineal
Tabla de datos muestral
Producción
Observaciones Exportaciones
Nacional de Importaciones de
trimestrales desde Nacionales de
Petróleo en Derivados [$]
enero e 2014 Crudo [$]
Barriles (millones)
hasta el segundo (millones)
(millones) X2
trimestre de 2016 Y
X1
1 3413,41 49,73 1572,06
2 3622,39 50,65 1460,34
3 3453,58 51,14 1450,44
4 2526,65 51,55 1631,70
5 1661,14 49,91 1058,60
6 1946,31 49,51 1051,56
7 1633,14 49,49 895,98
8 1113,80 49,32 781,66
9 837,08 49,31 516,65
10 1343,26 50,38 495,87
11 1364,88 50,72 650,96
12 1508,72 50,30 668,37
13 1537,26 48,06 687,97
14 1460,56 48,57 672,89
15 1480,88 49,26 751,92
16 1711,12 48,04 776,50
17 1817,30 46,11 773,69
18 1989,30 47,00 1056,27
19 2205,80 48,22 974,77
20 1840,90 47,47 1120,41
21 1777,60 47,61 887,74
22 2096,20 48,28 1073,14
23 1995,60 50,25 963,70
24 1861,70 47,68 891,48
25 1327,35 48,90 819,89
26 724,71 32,12 352,13
27 1297,59 47,49 597,78
28 1335,14 46,94 671,68
29 1769,87 45,40 886,39
30 1975,89 45,24 848,00
Donde se considera a Exportaciones Nacionales de Crudo una variable dependiente de
las variables tales como la Producción Nacional de Petróleo en Barriles y de los Gatos
por Importaciones de Derivados.

a. Dibuje un diagrama de dispersión Y vs X1 y Y vs. X2

Cuadro 2
Regresión Lineal
Diagrama de dispersión Y vs X1 y Y vs. X2

Exportaciones Nacionales de Crudo vs Producción Nacional de Petróleo en barriles


Exportaciones Nacionales de Crudo *10^6

4000,00

3500,00

3000,00

2500,00
[$] (millones)

2000,00

1500,00

1000,00

500,00

0,00
0,00 10,00 20,00 30,00 40,00 50,00 60,00
Producción Nacional de Petróleo en barriles *10^6 (millones)

Exportaciones Nacionales de Crudo vs


Gastos por importaciones de derivados

4000,00
Exportaciones Nacionales de Crudo

3500,00
3000,00
*10^6 [$] (millones)

2500,00
2000,00
1500,00
1000,00
500,00
0,00
0,00 200,00 400,00 600,00 800,00 1000,001200,001400,001600,001800,00
Gastos por importaciones de derivados *10^6 (millones)

b. Escriba la matriz de diseño y con ella escriba el modelo propuesto en


notación matricial
La matriz de diseño está expresada como:

1 𝑥1,1 𝑥2,1 1 49,73 1572,06


1 𝑥1,2 𝑥2,2 1 50,65 1460,34
𝑋= . . . = . . .
. . . . . .
[1 𝑥1,30 𝑥2,30 ] [ 1 45,24 848 ]

Se opta presentar una matriz simplificada, ya que las observaciones son 30 y


no se es adecuado, por lo que se presentará las matrices calculadas, como
imágenes realizadas en el programa de Excel, por medio de Cuadros en
Anexos.

La matriz de diseño con los datos correspondientes se encuentra en el Cuadro


13:

Modelo en notación matricial:

Modelo de regresión lineal propuesto:

̂𝑜 + 𝛽
𝑦̂ = 𝛽 ̂1 𝑥1 + 𝛽
̂2 𝑥2 Ecuación 1

El modelo en notación matricial es:

𝑌 = 𝑋𝛽 + 𝜀 Ecuación 2

y1 1 𝑥1,1 𝑥2,1 ̂ 𝜀1
𝛽
y2 1 𝑥1,1 𝑥2,2 ̂𝑜 𝜀2
[⋮]= [𝛽1 ] + [ … ]
⋮ ⋮ ⋮
̂2 𝜀30
y30
[1 𝑥1,30 𝑥2,30 ] 𝛽

3413,41 1 49,73 1572,06 𝛽 ̂𝑜 𝜀1


3622,39 1 50,65 1460,34 ̂ 𝜀2
[ ⋮ ]=[ ] [𝛽1 ] + [ … ]
⋮ ⋮ ⋮
̂2
𝛽 𝜀30
1975,89 1 45,24 848

c. Use el modelo de mínimos cuadrados para encontrar los estimadores del


modelo propuesto.

El modelo de mínimos cuadrado para hallar los estimadores es expresado


como:
𝛽̂ = (𝑋 𝑇 𝑋)−1 (𝑋 𝑇 𝑌) Ecuación 3
Entonces con los datos:

1 49,73 1572,06 −1 3413,41


1 1 … 1 1 1 … 1
1 50,65 1460,34 3622,39
𝛽̂ = ([ 49,73 50,65 … 45,24] [ ]) ([ 49,73 50,65 … 45,24] [ ])
⋮ ⋮ ⋮ ⋮
1572,06 1460,34 … 848 1572,06 1460,34 … 848
1 45,24 848 1975,89

7,2662 −0,1587 0,0004541 54629,13


̂
𝛽 = [ −0,1587 0,0036 −0,0000177 ] [2657294,8]
0,0004541 −0,0000177 0,0000004 54795617

̂𝑜
𝛽 117,8958
̂1 ] = [ −1,8409 ]
[𝛽
̂2
𝛽 1,9878

Por lo que el modelo de regresión lineal es:

𝑦̂ = 117,8958 − 1,8409𝑥1 + 1,9878𝑥2

d. Calcule SCT, SCR, SCE y escriba la Tabla ANOVA

Para el cálculo de las Sumas cuadráticas, se expresan como:

Sumatoria Cuadrática Total:


𝑛

𝑺𝑪𝑻 = ∑(𝑦𝑖 − 𝑦̅)2 Ecuación 4


𝑖=0

Calculamos el promedio de Exportaciones Nacionales de Crudo:

3413,41 + 3622,39 + 3453,58 + 2526,65 + ⋯ + 1975,89


̅=
𝒚 = 1820,97
30

Una vez que poseemos el valor promedio, procedemos a calcular el SCT:

𝑺𝑪𝑻 = (3413,41 − 1820,97)2 + (3622,39 − 1820,97)2 + (3453,58 − 1820,97)2 + ⋯


+ (1975,89 − 1820,97)2

𝑆𝐶𝑇 = 13629525,9893

Sumatoria Cuadrática de Regresión:


𝑛

𝑺𝑪𝑹 = ∑(𝑦̂𝑖 − 𝑦̅)2 Ecuación 5


𝑖=0
Los valores de 𝑦̂𝑖 se hayan con respecto a la ecuación modelo de regresión lineal:
Encontramos sus respectivos valores, se realiza el primer calculo:

Con 𝑥1 = 49,73 millones de barriles y 𝑥2 = 1572,06 millones de dólares en gastos


de derivados, el valor esperado de Exportaciones de crudo en dólares es:

𝑦̂1 = 117,8958 − 1,8409(49,73) + 1,9878(1572,06) = 3151,2887 millones de


dólares

Presentamos los demás valores de 𝑦̂𝑖 en el Cuadro 3:


Cuadro 3
Regresión Lineal
Tabla de datos muestral
K ̂𝒊
Valores 𝒚
1 3151,2887
2 2927,5181
3 2906,9368
4 3266,4907
5 2130,3016
6 2117,0438
7 1807,8187
8 1580,8864
9 1054,1179
10 1010,8416
11 1318,5036
12 1353,8844
13 1396,9689
14 1366,0540
15 1521,8796
16 1572,9857
17 1570,9529
18 2131,0270
19 1966,7754
20 2257,6593
21 1794,9001
22 2162,2048
23 1941,0334
24 1802,2056
25 1657,6531
26 758,7301
27 1218,7385
28 1366,6495
29 1796,2850
30 1720,2679

Realizando el cálculo de SCR:


𝑺𝑪𝑹 = (3151,2887 − 1820,97)2 + (2927,5181 − 1820,97)2 + ⋯ + (1720,2679 − 1820,97)2

𝑺𝑪𝑹 = 10994252,4242

Sumatoria Cuadrática de Error:


𝑛

𝑺𝑪𝑬 = ∑(𝑦𝑖 − 𝑦̂𝑖 )2 Ecuación 6


𝑖=0
También podemos calcular SCE de la siguiente manera:

𝑺𝑪𝑬 = 𝑆𝐶𝑇 − 𝑆𝐶𝑅 Ecuación 7

𝑺𝑪𝑬 = 13629525,9893 − 10994252,4242

𝑺𝑪𝑬 = 2635273,5651

Una vez calculado los respectivos valores de las Sumatorias Cuadráticas,


calcularemos los Cuadrados medios:

𝑺𝑪𝑹 10994252,4242
= = 5497126,212
𝒌 2

𝑺𝑪𝑬 2635273,5651
= = 97602,72463
𝒏−𝑲−𝟏 30 − 2 − 1

Donde el valor k representa la cantidad de variables en la regresión lineal (x1


y x2).

Los grados de libertad:

En SCR: k = 2

En SCE: n − k − 1 = 30 − 2 − 1 = 27

En SCT: 𝑛 − 1 = 29

Calculamos el estadístico Fo:

𝑆𝐶𝑅
𝑘 5497126,212
𝑭𝒐 = = = 56,3214
𝑆𝐶𝐸 97602,72463
𝑛−𝐾−1

Con los valores obtenidos, podemos determinar la tabla ANOVA:


Cuadro 4
Regresión Lineal
Tabla ANOVA
Fuente de Grados de Suma de Cuadrados
Fo
Variación libertad cuadrados medios
Regresión 2 10994252,4242 5497126,212 56,3214
Error 27 2635273,3631 97602,72463
Total 29 13629525,9893
e. Pruebe con 5% de significancia la dependencia lineal del modelo
propuesto para la determinación del valor
Hipótesis:

𝑯𝒐 : 𝛽1 = 𝛽2 = 0

𝑯𝒂 : ¬𝐻𝑜

Con: ∝= 0,05

Usando la tabla de Distribución F, determinamos el estadístico:

𝐹0,05;2;27 = 3,35

La región de Rechazo es:

𝐹 > 3,35 , se rechaza Ho en favor de Ha

El estadístico de prueba es Fo:

𝑆𝐶𝑅
𝑘 5497126,212
𝑭𝒐 = = = 56,3214
𝑆𝐶𝐸 97602,72463
𝑛−𝐾−1

Cuadro 5
Regresión Lineal
Prueba de dependencia lineal del modelo para determinación de valor
Hipótesis Estadístico
𝐹0,05;2;27 = 3,35
𝑯𝒐 : 𝛽1 = 𝛽2 = 0
Región de rechazo
𝐹 > 3,35
𝑯𝒂 : ¬𝐻𝑜
Estadístico de Prueba
𝑭𝒐 = 56,3214
Resultado
Como 56,3214 > 3,35 se rechaza la hipótesis nula, por lo que al
menos una de las variables independientes x1, x2 contribuye al
modelo para el valor que se puede obtener para Exportaciones.
f. Encuentre el coeficiente de determinación e interprete su significado

El coeficiente de determinación se expresa:

𝑆𝐶𝑅 Ecuación 8
𝑟2 =
𝑆𝐶𝑇

Con respecto al modelo:

𝑆𝐶𝑅 10994252,4242
𝑟2 = =
𝑆𝐶𝑇 13629525,9893

𝑟 2 = 0,8066

Con este valor de 0,8066, en el poder de explicación, se acerca a 1 por lo que


el modelo de mínimos cuadrados se ajusta bien a los datos.

g. Calcule una estimación de la varianza


La estimación de la varianza es calculada de la siguiente manera:

𝑆𝐶𝐸 Ecuación 9
𝑆2 =
𝑛−𝑘−1

Como se puede puede apreciar, la estimación de la varianza muestral va a ser


igual al cuadrado medio del Error por lo que su valor en el modelo será:

𝑆𝐶𝐸
𝑆2 = = 97602,72463
𝑛−𝐾−1

h. Encuentre la matriz varianza y covarianza


La Matriz varianza y covarianza es expresada:

𝜎00 𝜎01 … 𝜎0𝑘


𝜎 𝜎11 … 𝜎1𝑘
[𝜎𝑖𝑗 ] = (𝑋 𝑇 𝑋)−1 ∗ 𝑆 2 = [ 10 ] Ecuación 10
⋮ ⋮ ⋮
𝜎𝑘𝑜 𝜎𝑘1 … 𝜎𝑘𝑘

La matriz de Varianza y Covarianza del modelo es:


7,2662 −0,1587 0,0004541
[𝜎𝑖𝑗 ] = (𝑋 𝑇 𝑋)−1 ∗ 𝑆 2 = [ −0,1587 0,0036 −0,0000177] ∗ 97602,72463
0,0004541 −0,0000177 0,0000004

709199,9119 −15489,5271 44,3242


[𝜎𝑖𝑗 ] = [−15489,5271 354,0278 −1,7293]
44,3242 −1,7293 0,04321

i. Calcule la varianza de los estimadores del modelo mínimos cuadrados


La varianza de los estimadores del modelo de mínimos cuadrados son los
siguientes:
𝑉[𝛽̂0 ] = 𝜎𝛽̂2 = 𝜎00
0

𝑉[𝛽̂1 ] = 𝜎𝛽̂2 = 𝜎11


1

𝑉[𝛽̂2 ] = 𝜎𝛽̂2 = 𝜎22


2

Entonces nuestras varianzas de los estimadore son:

Cuadro 6
Regresión Lineal
Varianza de los estimadores del modelo cuadrático
Ubicación en
matriz de
Varianza Valor
varianzas y
covarianzas
𝝈𝟐𝜷̂𝟎 𝜎00 709199,9119
𝝈𝟐𝜷̂𝟏 𝜎11 354,0278
𝝈𝟐𝜷̂𝟐 𝜎22 0,04321

j. Encuentre un intervalo de confianza de 95% para cada parámetro


El intervalo de confianza para un parámetro es el siguiente:

𝛽̂𝑖 − 𝑡∝√𝜎𝛽̂2 ≤ 𝛽𝑖 ≤ 𝛽̂𝑖 + 𝑡∝√𝜎𝛽̂2 Ecuación 11


2 𝑖 2 𝑖

Con 𝑣 = 𝑛 − 𝑘 − 1=27
Para 𝜷𝒐 :

𝛽̂0 − 𝑡∝ √𝜎𝛽̂2 ≤ 𝛽0 ≤ 𝛽̂0 + 𝑡∝ √𝜎𝛽̂2


2 𝑖 2 0
117,8958 − 𝑡0,05 √709199,9119 ≤ 𝛽0 ≤ 117,8958 + 𝑡0,05 √709199,9119
2 2

Usando la tabla de Distribución t de Student:

117,8958 − 2,052 ∗ √709199,9119 ≤ 𝛽0 ≤ 117,8958 + 2,052 ∗ √709199,9119

El intervalo de confianza es:


−1610,1756 ≤ 𝛽0 ≤ 1845,96

Para 𝜷𝟏 :

𝛽̂1 − 𝑡∝ √𝜎𝛽̂2 ≤ 𝛽1 ≤ 𝛽̂1 + 𝑡∝ √𝜎𝛽̂2


2 1 2 1

−1,8409 − 𝑡0,05 √354,0278 ≤ 𝛽1 ≤ −1,8409 + 𝑡0,05 √354,0278


2 2

Usando la tabla de Distribución t de Student:

−1,8409 − 2,052 ∗ √354,0278 ≤ 𝛽1 ≤ −1,8409 + 2,052 ∗ √354,0278

El intervalo de confianza es:


−40,4506 ≤ 𝛽1 ≤ 36,7688

Para 𝜷𝟐 :

𝛽̂2 − 𝑡∝ √𝜎𝛽̂2 ≤ 𝜷𝟐 ≤ 𝛽̂2 + 𝑡∝√𝜎𝛽̂2


2 2 2 2

1,9878 − 𝑡0,05 √ 0,04321 ≤ 𝛽2 ≤ 1,9878 + 𝑡0,05 √ 0,04321


2 2

Usando la tabla de Distribución t de Student:


1,9878 − 2,052 ∗ √ 0,04321 ≤ 𝛽2 ≤ 1,9878 + 2,052 ∗ √ 0,04321

El intervalo de confianza es:


1,5612 ≤ 𝛽2 ≤ 2,4143

Cuadro 7
Regresión Lineal
Intervalo de confianza de los parámetros
Intervalos de confianza
𝜷𝒐 −1610,1756 ≤ 𝛽0 ≤ 1845,96
𝜷𝟏 −40,4506 ≤ 𝛽1 ≤ 36,7688
𝜷𝟐 1,5612 ≤ 𝛽2 ≤ 2,4143

k. Pruebe con 5% de significancia si el aporte de cada variable X1 y X2 al


modelo es significativo7

Aporte de la variable x1:

Hipótesis:

𝑯𝒐 : 𝛽1 = 0

𝑯𝒂 : 𝛽1 ≠ 0

Con: ∝= 0,05, v=n-k-1=27

Usando la tabla de Distribución T, determinamos el estadístico:

𝑡0,025 = 2,052

La región de Rechazo es:

𝑡<−2,052 ∨𝑡>2,052 , se rechaza Ho en favor de Ha

El estadístico de prueba es Fo:

𝛽̂1 − 𝑜 −1,8409
𝒕= = = −0,09784
2 √354,0278
√𝜎𝛽̂1
Cuadro 8
Regresión Lineal
Tabla de resultado de Prueba KOLMOGOROV-SMIRNOV
Hipótesis Estadístico
𝑡0,025 = 2,052
𝑯𝒐 : 𝛽1 = 0
Región de rechazo
𝑡 < −2,052 ∨ 𝑡 > 2,052
𝑯𝒂 : 𝛽1 ≠ 0
Estadístico de Prueba
𝑡 = −0,09784
Resultado
El valor del estadístico de prueba, -0,09784, cae en la región de
rechazo por lo que el aporte de x1 (Producción Nacional de
Petróleo en barriles) si es significativo para el modelo.

Aporte de la variable x2:


Hipótesis:

𝑯𝒐 : 𝛽2 = 0

𝑯𝒂 : 𝛽2 ≠ 0

Con: ∝= 0,05, y con grados de libertad v = n – k - 1 = 27

Usando la tabla de Distribución T, determinamos el estadístico:

𝑡0,025 = 2,052

La región de Rechazo es:

𝑡 < −2,052 ∨ 𝑡 > 2,052 , se rechaza Ho en favor de Ha

El estadístico de prueba es Fo:

𝛽̂2 − 𝑜 1,9878
𝒕= = = 9,5627
√0,04321
√𝜎𝛽̂22
Cuadro 9
Regresión Lineal
Tabla de resultado de Prueba KOLMOGOROV-SMIRNOV
Hipótesis Estadístico
𝑡0,025 = 2,052
𝑯𝒐 : 𝛽2 = 0
Región de rechazo
𝑡 < −2,052 ∨ 𝑡 > 2,052
𝑯𝒂 : 𝛽2 ≠ 0
Estadístico de Prueba
𝑡 = 9,5627
Resultado
El valor del estadístico de prueba, 9,5627, cae en la región de
rechazo por lo que el aporte de x2 (Gastos por importación de
derivados) si es significativo para el modelo.

l. Pruebe la normalidad del error con 5% de significancia mediante la


prueba KOLMOGOROV-SMIRNOV.
Sea:
𝑯𝒐 : 𝜀~𝑁(0, 𝜎 2 )

𝑯𝒂 : ¬𝐻𝑜

Con: ∝= 0,05.
El estadístico de Prueba será:

𝐷𝑛 = max |𝑆𝑛 (𝑥𝑖 ) − 𝐹𝑜 (𝑥𝑖 )| Ecuación 12

Con muestra n=30


Calculamos la Región de rechazo de Ho:
• Con ayuda de la tabla para la prueba KOLMOGOROV-SMIRNOV

𝐷30 , 0,05 = 0,240

Entonces la Región de Rechazo de Ho es:

𝐷30 > 0,240


Cálculos de los errores (𝑒𝑖 ):

Donde: 𝑒𝑖 = 𝑦𝑖 − 𝑦̂𝑖

El cálculo se lo realizó por medio de Microsoft Excel:


Cuadro 10
Regresión Lineal
Tabla con datos de errores, y errores ordenados.
𝑒𝑖 𝑦𝑖 − 𝑦̂𝑖 𝑒𝑖 𝑜𝑟𝑑𝑒𝑛𝑎𝑑𝑜
1 262,12 -739,84
2 694,87 -469,16
3 546,64 -467,09
4 -739,84 -416,76
5 -469,16 -330,30
6 -170,73 -217,04
7 -174,68 -174,68
8 -467,09 -170,73
9 -217,04 -141,73
10 332,42 -66,00
11 46,38 -41,00
12 154,84 -34,02
13 140,29 -31,51
14 94,51 -26,41
15 -41,00 -17,30
16 138,13 46,38
17 246,35 54,57
18 -141,73 59,49
19 239,02 78,85
20 -416,76 94,51
21 -17,30 138,13
22 -66,00 140,29
23 54,57 154,84
24 59,49 239,02
25 -330,30 246,35
26 -34,02 255,62
27 78,85 262,12
28 -31,51 332,42
29 -26,41 546,64
30 255,62 694,87
El modelo propuesto es 𝜀~𝑁(0, 𝜎 2 )

𝑒𝑖 −𝑜
𝐹𝑜 (𝑥𝑖 ) = 𝐹𝑜 (𝑒𝑖 ) = 𝑃 (𝑍 < ), Distribución Normal estándar acumulada
𝜎

Consideramos que 𝜎 2 = 𝑆 2 = 97602,72463, 𝑆 = 312,4143

Los cálculos de los porcentajes los realizaremos de acuerdo con los 𝑒𝑖


ordenado de menor a mayor, para hallar sus valores usaremos las Tablas de
Distribución Estándar:

−739,84
1- 𝑃 (𝑍 < ) = 0,008894
312,4143
−469,16
2- 𝑃 (𝑍 < 312,4143) = 0,066807
−467,09
3- 𝑃 (𝑍 < 312,4143) = 0,068112
−416,76
4- 𝑃 (𝑍 < 312,4143) = 0,091759
−330,30
5- 𝑃 (𝑍 < 312,4143) = 0,146859
−217,04
6- 𝑃 (𝑍 < 312,4143) = 0,245097
−174,68
7- 𝑃 (𝑍 < 312,4143) = 0,287740
−170,73
8- 𝑃 (𝑍 < 312,4143) = 0,294599
−141,73
9- 𝑃 (𝑍 < 312,4143) = 0,326355
−66,00
10- 𝑃 (𝑍 < 312,4143) = 0,416834
−41,00
11- 𝑃 (𝑍 < 312,4143) = 0,448283
−34,02
12- 𝑃 (𝑍 < 312,4143) = 0,456205
−31,51
13- 𝑃 (𝑍 < 312,4143) = 0,460172
−26,41
14- 𝑃 (𝑍 < 312,4143) = 0,468119
−17,30
15- 𝑃 (𝑍 < 312,4143) = 0,476078
46,38
16- 𝑃 (𝑍 < 312,4143) = 0,5557
54,57
17- 𝑃 (𝑍 < 312,4143) = 0,567495
59,49
18- 𝑃 (𝑍 < 312,4143) = 0,575345
78,85
19- 𝑃 (𝑍 < 312,4143) = 0,598706
94,51
20- 𝑃 (𝑍 < 312,4143) = 0,617911
138,13
21- 𝑃 (𝑍 < 312,4143) = 0,670031
140,29
22- 𝑃 (𝑍 < 312,4143) = 0,673645
154,84
23- 𝑃 (𝑍 < 312,4143) = 0,691562
239,02
24- 𝑃 (𝑍 < 312,4143) = 0,776373
246,35
25- 𝑃 (𝑍 < 312,4143) = 0,785236
255,62
26- 𝑃 (𝑍 < 312,4143) = 0,793892
262,12
27- 𝑃 (𝑍 < 312,4143) = 0,799546
332,42
28- 𝑃 (𝑍 < 312,4143) = 0,855428
546,64
29- 𝑃 (𝑍 < 312,4143) = 0,959071
694,87
30- 𝑃 (𝑍 < 312,4143) = 0,986791

Presentamos el Cuadro 11:


Cuadro 11
Regresión Lineal
Datos de tabla de prueba KOLMOGOROV-SMIRNOV
𝑒𝑖 𝑒𝑖 𝑜𝑟𝑑𝑒𝑛𝑎𝑑𝑎𝑠 𝑆𝑛 (𝑥𝑖 ) 𝐹0 (𝑥𝑖 ) |𝑆𝑛 (𝑥𝑖 ) − 𝐹0 (𝑥𝑖 )|

1 -739,84 0,03333333 0,008894 0,02444


2 -469,16 0,06666667 0,066807 0,00014
3 -467,09 0,1 0,068112 0,03189
4 -416,76 0,13333333 0,091759 0,04157
5 -330,30 0,16666667 0,146859 0,01981
6 -217,04 0,2 0,245097 0,04510
7 -174,68 0,23333333 0,28774 0,05441
8 -170,73 0,26666667 0,294599 0,02793
9 -141,73 0,3 0,326355 0,02636
10 -66,00 0,33333333 0,416834 0,08350
11 -41,00 0,36666667 0,448283 0,08162
12 -34,02 0,4 0,456205 0,05621
13 -31,51 0,43333333 0,460172 0,02684
14 -26,41 0,46666667 0,468119 0,00145
15 -17,30 0,5 0,476078 0,02392
16 46,38 0,53333333 0,55576 0,02243
17 54,57 0,56666667 0,567495 0,00083
18 59,49 0,6 0,575345 0,02466
19 78,85 0,63333333 0,598706 0,03463
20 94,51 0,66666667 0,617911 0,04876
21 138,13 0,7 0,670031 0,02997
22 140,29 0,73333333 0,673645 0,05969
23 154,84 0,76666667 0,691562 0,07510
24 239,02 0,8 0,776373 0,02363
25 246,35 0,83333333 0,785236 0,04810
26 255,62 0,86666667 0,793892 0,07277
27 262,12 0,9 0,799546 0,10045
28 332,42 0,93333333 0,855428 0,07791
29 546,64 0,96666667 0,958071 0,00860
30 694,87 1 0,986791 0,01321
De acuerdo con el Cuadro 9 el máximo valor que se obtiene en la diferencia
de |𝑆𝑛 (𝑥𝑖 ) − 𝐹0 (𝑥𝑖 )| siendo el valor de 0,10045.

Cuadro 12
Regresión Lineal
Tabla de resultado de Prueba KOLMOGOROV-SMIRNOV
Hipótesis Estadístico
𝐷30 = 0,240
𝑯𝒐 : 𝛽1 = 𝛽2 = 0
Región de rechazo
𝐷30 > 0,240
𝑯𝒂 : ¬𝐻𝑜
Estadístico de Prueba
𝐷30 = 𝑚𝑎𝑥|𝑆𝑛 (𝑥𝑖 ) − 𝐹0 (𝑥𝑖 )| = 0,10045
Resultado
Como 0,10045 es menor a 0,240 , no cae en la región de
rechazo, por lo que el error en este proyecto tiende a una
distribución normal con media 0 y varianza 𝜎 2 .

5. Conclusiones

• Con ayuda de los diagramas de dispersión se observa que el


comportamiento de la variable Y (Exportaciones Nacionales de Crudo) es
creciente cuando los datos de Producción Nacional de Petróleo y
Importaciones de Derivados también crecen ya que se infiere que a mayor
producción de barriles de petróleo mayor presencia de dinero por
exportaciones de crudo y si se presenta grandes inversiones a derivados
importado se necesitaría que la exportación sea mayor para que haya una
ganancia y no pérdidas económicas.

• Al evaluar la eficiencia del modelo de mínimos, por medio del coeficiente


de determinación, de este obtuvimos un valor de 0,8066, se acerca a 1, por
lo que el modelo de mínimos cuadrados se ajusta bien a los datos sin que
exista gran diferencia entre los valores esperados con los obtenidos.

• Realizado el análisis de dependencia lineal entre Exportaciones


Nacionales de Crudo con la Producción Nacional de Petróleo y de las
importaciones de derivados (Producción Nacional de Petróleo en barriles)
se comprobó por medio de Análisis de Hipótesis que ambas variables
independientes (x1 y x2) son significativos para obtener resultados
cercanos a los valores esperados, ya que sus estadísticos de prueba se
encontraban em las Regiones de rechazo , donde: en el caso de Producción
Nacional de Petróleo en barriles el valor del estadístico de prueba, -
0,09784, cae en la región de rechazo (𝑡<−2,052 ∨𝑡>2,052) por lo que el
aporte de x1 (Producción Nacional de Petróleo en barriles) si es
significativo para el modelo, y en el caso de Gastos por importación de
derivados su valor del estadístico de prueba es de 9,5627, cae en la región
de rechazo (< −2,052 ∨ 𝑡 > 2,052) por lo que el aporte de x2 (Gastos
por importación de derivados) si es significativo para el modelo.

• El análisis de errores, de Exportaciones Nacionales de Petróleo, por medio


de la Prueba de KOLMOGOROV -SMIRNOV, se determinó que el error
posee una distribución normal ya que la diferencia entre una distribución
esperada con la función de distribución normal es mínima, ya que el
estadístico de prueba 𝐷30 es igual a 0,10045 el cual era menor para poder
estar dentro de la región de rechazo hallada (
𝐷30 > 0,240).

6. Referencias Bibliográfica y Electrónicas:

Rodríguez L. (2007). Probabilidad y Estadística Básica para Ingenieros. Guayaquil. Instituto de


Ciencias Matemáticas
Banco Central del Ecuador. (s.f.). Recuperado el 5 de septiembre de 2022, de Banco Central del
Ecuador:
https://contenido.bce.fin.ec/documentos/Estadisticas/Hidrocarburos/ASP201712.pdf
Banco Central del Ecuador. (abril de 2017). Recuperado el 5 de septiembre de 2022, de Banco
Central del Ecuador:
https://contenido.bce.fin.ec/documentos/Estadisticas/Hidrocarburos/ASP201612.pdf
Banco Central del Ecuador. (2021). Recuperado el 5 de septiembre de 2022, de Banco Central
del Ecuador:
https://contenido.bce.fin.ec/documentos/Estadisticas/Hidrocarburos/ASP202004.pdf
Banco Central del Ecuador. (2021). Recuperado el 5 de septiembre de 2022, de Banco Central
del Ecuador:
https://contenido.bce.fin.ec/documentos/Estadisticas/Hidrocarburos/ASP202004.pdf
Data Viz Catalogue. (s.f.). Recuperado el 5 de septiembre de 2022, de Data Viz Catalogue:
https://datavizcatalogue.com/ES/metodos/diagrama_de_dispersion.html
IBM. (10 de junio de 2021). Recuperado el 5 de septiembre de 2022, de IBM:
https://www.ibm.com/docs/es/spss-statistics/saas?topic=tests-one-sample-kolmogorov-
smirnov-test
Mendoza, J. (1 de febrero de 2021). Estadísticamente. Recuperado el 5 de septiembre de 2022,
de Estadísticamente: https://estadisticamente.com/tabla-anova-que-es-y-para-que-se-
utiliza-el-analisis-de-la-varianza/
Molina, M. (17 de junio de 2020). Anestesiar. Recuperado el 5 de septiembre de 2022, de
Anestesiar: https://anestesiar.org/2020/la-distancia-mas-corta-el-metodo-de-los-
minimos-
cuadrados/#:~:text=El%20m%C3%A9todo%20de%20los%20m%C3%ADnimos%20cu
adrados%20se%20utiliza%20para%20calcular,de%20regresi%C3%B3n%20con%20est
e%20m%C3%A9todo.
Anexos

Cuadro 13
Regresión Lineal
Matriz de diseño
Tablas de Distribuciones

También podría gustarte