Está en la página 1de 12

REPÚBLICA BOLIVARIANA DE VENEZUELA

UNIVERSIDAD NACIONAL ABIERTA


Centro Local: Bolívar. Oficina de Apoyo: Ciudad Bolívar
Asignatura: Estadística Aplicada. Cód.: 746

Nombre Completo: Betania Dariana Del Milagro Díaz Lezama


Número de cédula de identidad: 27.490.394
Fecha completa en la que entregó el trabajo: 16/04/2023
Correo electrónico del estudiante: betania.dariana.2106@gmail.com

N° Objetivo 5 6 7 8
0= NL
1= L
P:1, O:5 Se desea probar la efectividad de un nuevo insecticida para el
control de plagas en la siembra de maíz. Se probaron distintas dosis en
gramos de dicho insecticida en 10 parcelas de 100 plantas cada una. A las
tres semanas de la aplicación se realizó una evaluación del daño,
considerando el tamaño promedio de las manchas en hoja. Los datos se
resumen en el siguiente cuadro:

Dosis (X) 200 250 275 300 325 350


Daño (Y) 39 30 25 15 10 5

(a) Ajuste un modelo de regresión lineal para el daño en función de la dosis


de fungicida.
(b) Determine el intervalo de confianza al 95% para el coeficiente de
regresión.

Respuesta:

a) Se realiza una tabla con los datos a necesitar para facilitar los cálculos:

n Dosis (X) Daño (Y) XY X2 Y2


1 200 39 200.39=7800 (200)2=40000 (39)2=1521
2 250 30 7500 62500 900
3 275 25 6875 75625 625
4 300 15 4500 90000 225
5 325 10 3250 105625 100
6 350 05 1750 122500 25
n= ∑ X = 1700 ∑ Y =124 ∑ XY =31675 ∑ X 2=496250 ∑ Y 2=3396
6

Ahora bien, el modelo de la recta de regresión viene dada por:


Y^ =b0 +b 1 X
donde:
SC XY
b 1=
SC X
Y a su vez:
( ∑ X ) .(∑ Y )
SC XY =∑ XY −
n
Sustituyendo con los datos de la tabla anterior:
(∑ X ) . (∑ Y ) ( 1700 ) ( 124 )
SC XY =∑ XY − =31675− =−3458,3333
n 6

(∑ X )
2
(1700 )2
SC X =∑ X − 2
=496250− =14583,3333
n 6
Sustituyendo para calcular b 1:
SC XY −3458,3333
b 1= = =−0,2371
SC X 14583,3333
Obteniendo los promedios de X y Y:

Y=
∑ Y = 124 =20 ,67
n 6

X=
∑ X = 1700 =283 ,33
n 6
Para calcular b 0:
b 0=Y −b1 X=20 , 67−(−0,2371 ) .283 ,33=87,8475
De allí que la recta de regresión es:
Y^ =b0 +b 1 X ,
Y^ =87,8475−0,2371 X
El intercepto b 0=87,8475 representa el valor esperado de daño en las hojas si no
se aplica la dosis de insecticida en los cultivos y b 1, la pendiente de la recta, indica
que por cada incremento de la dosis reducirá 0,2371 el daño en las hojas. Las
dosis pueden utilizarse como variable explicativa del daño. Es una relación lineal
negativa tal como se observa en la siguiente gráfica:
45 Modelo de Regresión Lineal
40

35

30

25
Daño

20

15 Y=-0,2371X+87,8475
10

0
180 200 220 240 260 280 300 320 340 360
Dosis

b) El intervalo de confianza de β 1 a nivel de significación del 95% viene dado por:


b 1−t ∝ /2 ,n−2 S b < β 1< b1 +t ∝ /2 ,n −2 S b
1 1

Previamente se calcularon:
Sb es el error estándar del coeficiente de regresión:
1

Se 1,8176
Sb = = =0,0151
1
√ SC X √ 14583,3333
Se que es el error estándar de estimación
Se= √ CME=√ 3,3036=1,8176
CME es el cuadrado medio del error
SCE 13,2143 13,2143
CME= = = =3,3036
n−2 6−2 4
SCE es la suma de cuadrados del error
2
( SC XY ) (−3458,3333 )2
SCE=SCY − =833,3333− =13,2143
SC X 14583,3333

(∑ Y )
2
( 124 )2
SCY =∑ Y − 2
=3396− =833,3333
n 6
Luego, t ∝/2 , n−2
Como n=6  n-2=4 y el nivel de significancia, α=100%-95%=5%  α=0,05, en
este caso ∝/2=0,05/2=0,025 entrando a tabla de Distribución T de Student para
hallar el valor de t, se tiene que t ∝/2=¿ 0,025;n=4 = 2,776.
De modo que sustituyendo para obtener el intervalo de confianza queda:
b 1−t ∝ /2 ,n−2 S b < β 1< b1 +t ∝ /2 ,n −2 S b
1 1

−0,2371−( 2,776 ) ( 0,0151 ) < β 1←0,2371+(2,776)(0,0151)


−0,2790< β1 ←0,1952
Como puede observarse el cero no está contenido en el intervalo de confianza,
por lo que la relación entre las variables “dosis” y “daño” es estadísticamente
significativa, y esto se evidencia más claramente si se plantea una prueba de
hipótesis:
H 0 : β 1=0 y H A : β1≠ 0
El estadístico t sería:
b1−β 1 −0,2371−0
t= = =−15,702
S b1 0,0151
De tabla T∝/2=¿ 0,025;n=4 = ±2,776, así la regla de decisión sería: “no rechazar si t
está entre ±2,776, de lo contrario rechazar”, como t= -15,702, la hipótesis nula de
que β 1=0, se rechaza. Entonces, al nivel de significancia 5% parece existir una
relación entre la dosis de insecticida y el daño en la hoja.

P:2, O:6 Se lleva a cabo, sobre una región, un estudio de factibilidad de


explotación aurífera. Para ello se ha recopilado información sobre: locación
y tipo de yacimiento, elementos asociados al oro, porcentaje de oro presente
en sus compuestos, tenores de oro y plata, y cantidad de material
procesado. Las variables consideradas son:
Locación y tipo:
X1: Zonas.
X2: Residuales.
X3: Eluviones.
X4: Aluviones.
X5: Compuestos; oxidado= 0 y sulfurado= 1.

Elementos asociados en (%):


X6: Oro electrum. X7: Pirita. X16: Cobre
X8: Galena. X9: Cuarzo. X17: Zinc

X10: Moscovita. X11: Zircon. X18: Plomo

X12: Titanita. X13: Hematita-Goethita.


X14: Magnetita. X15: Rutilo.

Otras:
X19: Porcentaje de oro presente en los composites.
X20: Tenores de oro, gr/t.
X21: Tenores de plata, gr/t.
X22: Cantidad de materia procesada, m3/cuadrillas de dos hombres por día.

Se aplicó un modelo de regresión lineal múltiple para estudiar si existe una


relación lineal entre porcentaje de oro presente en los composites y alguna
de las variables: X7, X9, X11, X13, X16 y X17. Responda:

(a) ¿Cuál es la ecuación de regresión lineal? Pueden utilizar el procedimiento


que deseen mientras sea válido.

Respuesta:
El modelo de regresión lineal múltiple permite relacionar una variable dependiente
con varias variables independientes o explicativas. En el caso dado, la variable
dependiente sería “X19: Porcentaje de oro presente en los composites” que pasa a
llamarse Y^ y las variables independientes serían “X7: Pirita”, “X9: Cuarzo”, “X11:
Zircon”, “X13: Hematita-Goethita”, “X16: Cobre” y “X17: Zinc”. La ecuación de
regresión lineal múltiple viene dada por:
X 19=Y^ =b 0+ b1 X 7 +b2 X 9 +b 3 X 11 +b 4 X 13+ b5 X 16+ b6 X 17
Siempre que cumplan dos condiciones, la primera es que el número de
observaciones “n” exceda el número de variables independientes “k” en por lo
menos 2, n=k+2. Así para el caso en estudio, n debería ser como mínimo
n=6+2=8. Asimismo, los grados de libertad serán gl=n-(k+1)=n-7, con n ≥ 8 . Por
tanto, tendrá al menos un grado de libertad.
La segunda condición es que ninguna de las variables independientes tenga algún
tipo de relación lineal entre ellas para evitar problemas de multicolinealidad.
Además, para poder obtener el intersecto b 0 y los coeficientes de regresión en una
ecuación de regresión múltiple, normalmente, se hace uso de software
especializado (SPSS, AD+, Minitab y Excel), ya que de manera manual los
cálculos resultan largos y tediosos porque se tienen que atender tantas
ecuaciones como variables independientes haya, generadas por el método de
mínimo de cuadrados, en este caso serían 6 ecuaciones diferentes y como no se
cuenta con valores numéricos ni observaciones, es decir, no hay datos
cuantitativos, se deja planteada solamente la ecuación general, señalando
además que se puede obtener el error estándar de regresión múltiple y el
coeficiente de determinación múltiple de existir dichos datos, inclusive puede
realizarse un análisis de varianza ANOVA y pruebas individuales para los
coeficientes de regresión..
Un aumento en una unidad en X 7 se asocia con un aumento de b 1 unidades en Y,
suponiendo que las demás variables independientes se mantienen constantes, y
así sucesivamente. Por tanto, b, es la cantidad por la cual Y cambiaría si X
cambia, cambia en una unidad asumiendo que todas la otras variables
independientes se mantienen constantes.
P:3, O:7 La siguiente tabla recoge el número de nuevas empresas
registradas durante los últimos 10 años en el Registro Mercantil de un
determinado distrito:

Año 2013 2014 2015 2016 2017 2018 2019 2020 2021 2022
Nº de casas 240 350 230 260 280 320 220 310 240 310

(a) ¿Cuántas nuevas empresas se esperan registrar para el año 2023? Utilice
el método de medias móviles de tres años.

(b) ¿Cuántas nuevas empresas se esperan registrar para el año 2023? Utilice
el método de suavizado exponencial con 𝛼 = 0, 2.

Respuestas:
Claramente hay un error de transcripción en el enunciado y no se refiere a número
de casas sino número de empresas.

a) Empleando el método de promedio móvil, tomando grupos de tres años, se


tiene que:

Año 2013 2014 2015 2016 2017 2018 2019 2020 2021 2022 2023
Nº de empresas 240 350 230 260 280 320 220 310 240 310
Pronóstico 273,33 280,00 256,67 286,67 273,33 283,33 256,67 286,67

Para el año 2016:


240+350+230
=273 , 33
3
Para el año 2017:
350+230+260
=280 , 00
3
Para el año 2018:
230+260+280
=256 ,6 7
3
Para el año 2019:
260+280+320
=286 ,67
3
Para el año 2020:
280+320+220
=273 , 33
3
Para el año 2021:
320+220+310
=283 , 33
3
Para el año 2022:
220+310+240
=256 ,67
3
Para el año 2023:
310+240+310
=286 ,6 7
3
De manera que para el año 2023, por el método del promedio móvil, se espera
registrar 286,67, aproximadamente 287 nuevas empresas.

b) Se emplea la fórmula Fi+1 = αXi + (1 − α)Fi, se tiene que:

Año 2013 2014 2015 2016 2017 2018 2019 2020 2021 2022 2023
Nº de empresas 240 350 230 260 280 320 220 310 240 310
Pronóstico (α=0,2) 240 262 255,60 256,48 261,18 272,94 262,35 271,88 265,50 274,40

Para el 2015:
F2014+1= (0,2).350 + (1 – 0,2).240 = 262
Para el 2016:
F2015+1= (0,2).230 + (1 – 0,2).262 = 255,60
Para el 2017:
F2016+1= (0,2).260 + (1 – 0,2).255,60 = 256,48
Para el 2018:
F2017+1= (0,2).280 + (1 – 0,2).256,48 = 261,18
Para el 2019:
F2018+1= (0,2).320 + (1 – 0,2).261,18 = 272,94
Para el 2020:
F2019+1 = (0,2).220 + (1 – 0,2).272,94 = 262,35
Para el 2021:
F2020+1= (0,2).310 + (1 – 0,2).262,35 = 271,88
Para el 2022:
F2021+1= (0,2).240 + (1 – 0,2).271,88 = 265,50
Entonces, para el año 2023:
F2022+1 = (0,2).310 + (1 – 0,2).265,50 = 274,40

De manera que para el 2023, por el método de suavizado exponencial, se esperan


registrar 274,40, aproximadamente 275 nuevas empresas.

P: 4, O:4 La siguiente tabla muestra el precio promedio de una cesta de un


mercado (en dólares) durante los últimos 11 años:

Año 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021 2022
Precio 33,22 48,36 56,35 64,74 86,74 57,08 71,97 101,06 103,42 98,08 88,42

Construya una tabla que muestre ¿cuál ha sido el comportamiento del precio
promedio de dicha cesta con relación al precio de 49,60 dólares? Realizar los
cálculos correspondientes.

Respuesta:
Si se considera como precio base de la cesta de mercado los 49,60$, los índices
relativos son:

Año 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021 2022
Precio 33,22 48,36 56,35 64,74 86,74 57,08 71,97 101,06 103,42 98,08 88,42
Índice 0,67 0,98 1,14 1,31 1,75 1,15 1,45 2,04 2,09 1,98 1,78

Para el año 2012:


P 2012 33 ,22
IPR2012 = = =0 , 67(67 % )
P Base 49 , 60
Para el año 2013:
P 2013 48 , 36
IPR2013 = = =0 , 98(98 %)
P Base 49 , 60
Para el año 2014:
P2014 56 , 35
IPR2014 = = =1 , 14(114 % )
PBase 49 , 60
Para el año 2015:
P 2015 64 , 74
IPR2015 = = =1 , 31(131 %)
P Base 49 , 60
Para el año 2016:
P 2016 86 , 74
IPR2016 = = =1 , 75(175 %)
PBase 49 , 60
Para el año 2017:
P 2017 57 , 08
IPR2017 = = =1 ,15 (115 % )
PBase 49 , 60
Para el año 2018:
P 2018 71, 97
IPR2018 = = =1 , 45(145 %)
P Base 49 , 60
Para el año 2019:
P 2019 101 , 06
IPR2019 = = =2 , 04 (204 % )
P Base 49 ,60
Para el año 2020:
P 2020 103 , 42
IPR2020 = = =2, 09(209 %)
P Base 49 , 60
Para el año 2021:
P 2021 98 ,08
IPR2021 = = =1 ,98 (198 %)
P Base 49 , 60
Para el año 2022:
P 2022 88 , 42
IPR2022 = = =1 ,78(178 %)
P Base 49 , 60
Cabe señalar que para expresar estos índices como porcentajes bastó con
multiplicarlos por 100, ejemplo, para el año 2022: 1,78x100=178%, quiere decir
que la cesta de mercado para ese año tuvo precio de 178% respecto al precio
base de 49,60$.
En los valores obtenidos puede observarse la evolución temporal de los precios de
la cesta de mercado, respecto al precio base, así hay periodos en que los mismos
tienen incrementos progresivos, de 2012 a 2016 por ejemplo. Luego, los precios
experimentan también decrecidas (2016-2017; 2020-2022).

También podría gustarte