Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ejercicio 1
Para estudiar el efecto de las aguas residuales de las alcantarillas que afluyen a un lago, se toman
medidas de la concentracin de nitrato en el agua. Para monitorizar la variable se ha utilizado un
antiguo mtodo manual. Se idea un nuevo mtodo automtico. Si se pone de manifiesto una alta
correlacin positiva entre las medidas tomadas empleando los dos mtodos, entonces se har uso
habitual del mtodo automtico. Los datos obtenidos son los siguientes:
Manual = X
Automtico = Y
25
30
40
80
120
150
75
80
150
200
300
350
270
240
400
320
450
470
575
583
Comprobar la idoneidad del modelo lineal de regresin. Si el modelo es apropiado, hallar la recta de
regresin de Y sobre X y utilizarla para predecir la lectura que se obtendra empleando la tcnica
automtica con una muestra de agua cuya lectura manual es de 100. Realizar el ejercicio en R
SOLUCION:
Manual = X
25
40
120
75
150
300
270
400
450
575
2405
>
datos=read.table("agua.txt",
header=T)
> attach(datos)
> datos
> regresion<lm(y~x,data=datos)
Automtico
=Y
30
80
150
80
200
350
240
320
470
583
2503
625
1600
14400
5625
22500
90000
72900
160000
202500
330625
900775
x y
1 25 30
2 40 80
3 120 150
4 75 80
5 150 200
6 300 350
7 270 240
8 400 320
9 450 470
10 575 583
Call:
lm(formula = y ~ x, data = datos)
XY
750
3200
18000
6000
30000
105000
64800
128000
211500
335225
902475
Angie Camacho
> regresin
> summary(regresion)
Coefficients:
(Intercept)
x
26.1150
0.9322
Call:
lm(formula = y ~ x, data = datos)
Residuals:
Min 1Q Median 3Q Max
-78.98 -18.57 14.31 23.53 44.24
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 26.11496 21.20188 1.232 0.253
x
0.93216 0.07064 13.195 1.04e-06
***
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 .
0.1 1
Y m X bn
Y=0.9(100)+26.11=116.11
Angie Camacho
Ejercicio 2
Sobre una hoja de papel cuadriculado dibuje aproximadamente 5 cuadrados de diversos tamaos.
a. Cuntos cuadritos encierra cada uno de los cuadrados dibujados?. Represente esta variable
mediante la letra N
b. Cunto mide el lado de cada cuadrado?. Represente esta variable mediante la letra L
c. Coleccione su informacin en una tabla de datos.
d. Existe alguna relacin entre una y otra variable?. Detalle su respuesta.
Represente las parejas (L,N) en un plano cartesiano
e. Qu clase de curva obtiene?
Solucin
N2
NL
1
4
9
25
1
2
3
5
1
16
81
625
1
8
27
125
Angie Camacho
36
75
6
17
>
cuadrititos=read.table("cuadras.txt",h
eader=T)
> attach(cuadrititos)
> cuadrititos
> regresion <- lm(L ~ N, data =
cuadrititos)
> summary(regresion)
1296
2019
216
377
NL
1 11
2 42
3 93
4 25 5
5 36 6
Call:
lm(formula = L ~ N, data = cuadrititos)
Residuals:
1
2
3
4
5
-0.4895 0.1011 0.4188 0.2353 -0.2658
Coefficients:
Estimate Std. Error t value Pr(>|
t|)
(Intercept) 1.35302 0.28808 4.697
0.01826 *
N
0.13647 0.01434 9.519
0.00246 **
--Signif. codes: 0 *** 0.001 ** 0.01 *
0.05 . 0.1 1
Residual standard error: 0.4287 on 3
degrees of freedom
Multiple R-squared: 0.968, Adjusted
R-squared: 0.9573
F-statistic: 90.61 on 1 and 3 DF, pvalue: 0.002459
> plot(cuadrititos)
> abline(lm(L~N))
Angie Camacho
Ejercicio 3
A partir de las siguientes observaciones para 5 aos de las variables X e Y, ajstese el modelo de
regresin de Y en funcin de X ms idneo. Donde:
Y: produccin nacional de un subsector industrial, en millones de toneladas.
X: tiempo
Ao
1995
1,25
1996
1997
11,25
Ejercicio 4
Cinco nias de 2,4, 6,7 y 8 aos pesan respectivamente 15, 19, 25, 38, y 34
kilogramos
Angie Camacho
Ejercicio 6
Dado Los siguientes datos expuestos en la tabla
Edad
Estatura
1
60
2
8
3
10
4
110
5
112
B. y = 7,5x + 85,5
D. y = 14,4x + 47
E. y = 14x + 48,8
C. y = 13,4x + 52,2
Ejercicio 7
B
Angie Camacho
Ejercicio 8
El diagrama de dispersin para la regresin lineal esta dado por
C
Angie Camacho
Rta:
Ejercicio 9
Los siguientes datos corresponden a 100 salarios tomados en una encuesta aplicada a 380 habitantes
de Villavicencio. Determinar en R el grado de asimetra de los datos. establecer una conclusin.
289000
350000
886900
310000
650000
961200
320000
756000
1200000
345000
289000
350000
889000
320000
665500
965000
320000
756000
1300000
320000
289000
350000
890000
320000
689500
996000
320000
759600
1700100
750000
289000
566700
896500
320000
689500
999000
340000
759600
1700100
1120000
310000
566700
900000
320000
690000
1000000
340000
789000
1700100
345000
310000
566700
936200
320000
690000
1025000
340000
789000
1700100
863000
310000
600000
942500
320000
699000
1025000
340000
800000
1700100
886000
320000
700000
1096000
320000
699000
1063000
340000
800000
1700100
345000
320000
700000
1116300
345000
859600
1777000
340000
800000
1700100
850000
320000
750000
1120000
345000
862300
1800000
345000
800000
1700100
1750000
Angie Camacho
>
salarios=c(289000,350000,886900,31
0000,650000,961200,320000,756000,
1200000,345000,289000,350000,8890
00,320000,665500,965000,320000,75
6000,1300000,320000,289000,350000
,890000,320000,689500,996000,3200
00,759600,1700100,750000,289000,5
66700,896500,320000,689500,999000
,340000,759600,1700100,1120000,31
0000,566700,900000,320000,690000,
1000000,340000,789000,1700100,345
000,310000,566700,936200,320000,6
90000,1025000,340000,789000,17001
00,863000,310000,600000,942500,32
0000,699000,1025000,340000,800000
,1700100,886000,320000,700000,109
6000,320000,699000,1063000,340000
,800000,1700100,345000,320000,700
000,1116300,345000,859600,1777000
,340000,800000,1700100,850000,320
000,750000,1120000,345000,862300,
1800000,345000,800000,1700100,175
0000)
> par(mfrow=c(1,2))
> f=table(salarios)
> dd <- density(salarios)
> barplot(f)
> plot(dd,add=T)
> summary(salarios)
Min.
Qu.
Mean 3rd
Max.
289000
Esta es una asimetra positiva ya que
947200 1800000
x > Me
Ejercicio 10
En una distribucin asimtrica negativa:
A La moda se encuentra entre la media y la mediana
700000
750900
Angie Camacho
B
C
D
E
Ejercicio 11
Los momentos de segundo orden con respecto a la media de dos distribuciones son 9 y 16, mientras
que los momentos de tercer orden son 8.1 y 12. 8 respectivamente. La distribucin ms asimtrica es:
A
B
C
D
Ejercicio 12
Uno de los siguientes enunciados es verdadero
A
B
C
D
Ejercicio 13
En el anlisis de regresin lineal se puede afirmar todo lo siguiente, excepto
A
B
C
D
E
Ejercicio 14
Dado que el grado de asimetra de una distribucin es de 2,27, la media es de 189,87 y la mediana
189,16, entonces la varianza toma un valor correspondiente a:
A
B
C
D
E
0.93
0.88
0.78
1.88
1.78
Ejercicio 15
Tomando una distribucin ligeramente asimtrica, calcular la moda sabiendo que su media es igual a 3
y que la diferencia entre la media y la mediana es igual a -2
A 2.9
B. 0.9
B 19
C 9
Angie Camacho
D 1/9
Ejercicio 16
En la siguiente distribucin de datos el coeficiente de asimetra segn el coeficiente de Pearson es:
Xi
f
A
B
C
D
E
1
2
2
8
3
3
4
5
5
7
6
5
2
1/3
3
1
Ejercicio 17
Retome los 100 datos y elabore una tabla en R para determinar el coeficiente de Gini. Utilice la librera
ineq, y compare los resultados. Establezca conclusiones
289000
350000
886900
310000
650000
961200
320000
756000
1200000 345000
289000
350000
889000
320000
665500
965000
320000
756000
1300000 320000
289000
350000
890000
320000
689500
996000
320000
759600
1700100 750000
289000
566700
896500
320000
689500
999000
340000
759600
1700100 1120000
310000
566700
900000
320000
690000
1000000 340000
789000
1700100 345000
310000
566700
936200
320000
690000
1025000 340000
789000
1700100 863000
310000
600000
942500
320000
699000
1025000 340000
800000
1700100 886000
320000
700000
1096000 320000
699000
1063000 340000
800000
1700100 345000
320000
700000
1116300
345000
859600
1777000 340000
800000
1700100 850000
320000
750000
1120000
345000
862300
1800000 345000
800000
1700100 1750000
> library(ineq)
>salarios=c(289000,350000,886
900,310000,650000,961200,320
000,756000,1200000,345000,28
9000,350000,889000,320000,66
5500,965000,320000,756000,13
00000,320000,289000,350000,8
90000,320000,689500,996000,3
20000,759600,1700100,750000,
289000,566700,896500,320000,
689500,999000,340000,759600,
1700100,1120000,310000,56670
0,900000,320000,690000,10000
[1] 0.3122976
Angie Camacho
00,340000,789000,1700100,345
000,310000,566700,936200,320
000,690000,1025000,340000,78
9000,1700100,863000,310000,6
00000,942500,320000,699000,1
025000,340000,800000,1700100
,886000,320000,700000,109600
0,320000,699000,1063000,3400
00,800000,1700100,345000,320
000,700000,1116300,345000,859
600,1777000,340000,800000,17
00100,850000,320000,750000,1
120000,345000,862300,1800000
,345000,800000,1700100,17500
00)
> g=ineq(salarios,type="Gini")
>g
>
plot(Lc(salarios),col="darkred",lw
d=2)