Está en la página 1de 12

Angie Camacho

Ejercicio 1
Para estudiar el efecto de las aguas residuales de las alcantarillas que afluyen a un lago, se toman
medidas de la concentracin de nitrato en el agua. Para monitorizar la variable se ha utilizado un
antiguo mtodo manual. Se idea un nuevo mtodo automtico. Si se pone de manifiesto una alta
correlacin positiva entre las medidas tomadas empleando los dos mtodos, entonces se har uso
habitual del mtodo automtico. Los datos obtenidos son los siguientes:
Manual = X
Automtico = Y

25
30

40
80

120
150

75
80

150
200

300
350

270
240

400
320

450
470

575
583

Comprobar la idoneidad del modelo lineal de regresin. Si el modelo es apropiado, hallar la recta de
regresin de Y sobre X y utilizarla para predecir la lectura que se obtendra empleando la tcnica
automtica con una muestra de agua cuya lectura manual es de 100. Realizar el ejercicio en R

SOLUCION:
Manual = X
25
40
120
75
150
300
270
400
450
575
2405

>
datos=read.table("agua.txt",
header=T)
> attach(datos)
> datos

> regresion<lm(y~x,data=datos)

Automtico
=Y
30
80
150
80
200
350
240
320
470
583
2503

625
1600
14400
5625
22500
90000
72900
160000
202500
330625
900775

x y
1 25 30
2 40 80
3 120 150
4 75 80
5 150 200
6 300 350
7 270 240
8 400 320
9 450 470
10 575 583
Call:
lm(formula = y ~ x, data = datos)

XY

750
3200
18000
6000
30000
105000
64800
128000
211500
335225
902475

Angie Camacho
> regresin

> summary(regresion)

Coefficients:
(Intercept)
x
26.1150
0.9322
Call:
lm(formula = y ~ x, data = datos)
Residuals:
Min 1Q Median 3Q Max
-78.98 -18.57 14.31 23.53 44.24
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 26.11496 21.20188 1.232 0.253
x
0.93216 0.07064 13.195 1.04e-06
***
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 .
0.1 1

Residual standard error: 40.11 on 8 degrees of


freedom
Multiple R-squared: 0.9561, Adjusted Rsquared: 0.9506
F-statistic: 174.1 on 1 and 8 DF, p-value:
1.036e-06
Se observa el intercepto=26.11496 y el valor de x=0.93216, adems de que entrega el valor de
R=0.9561, valor que garantiza en cierta forma el uso del modelo lineal para el problema

Y m X bn
Y=0.9(100)+26.11=116.11

Angie Camacho

Ejercicio 2
Sobre una hoja de papel cuadriculado dibuje aproximadamente 5 cuadrados de diversos tamaos.
a. Cuntos cuadritos encierra cada uno de los cuadrados dibujados?. Represente esta variable
mediante la letra N
b. Cunto mide el lado de cada cuadrado?. Represente esta variable mediante la letra L
c. Coleccione su informacin en una tabla de datos.
d. Existe alguna relacin entre una y otra variable?. Detalle su respuesta.
Represente las parejas (L,N) en un plano cartesiano
e. Qu clase de curva obtiene?

Solucin

N2

NL

1
4
9
25

1
2
3
5

1
16
81
625

1
8
27
125

Angie Camacho
36
75

6
17

>
cuadrititos=read.table("cuadras.txt",h
eader=T)
> attach(cuadrititos)
> cuadrititos
> regresion <- lm(L ~ N, data =
cuadrititos)
> summary(regresion)

1296
2019

216
377

NL
1 11
2 42
3 93
4 25 5
5 36 6
Call:
lm(formula = L ~ N, data = cuadrititos)
Residuals:
1
2
3
4
5
-0.4895 0.1011 0.4188 0.2353 -0.2658
Coefficients:
Estimate Std. Error t value Pr(>|
t|)
(Intercept) 1.35302 0.28808 4.697
0.01826 *
N
0.13647 0.01434 9.519
0.00246 **
--Signif. codes: 0 *** 0.001 ** 0.01 *
0.05 . 0.1 1
Residual standard error: 0.4287 on 3
degrees of freedom
Multiple R-squared: 0.968, Adjusted
R-squared: 0.9573
F-statistic: 90.61 on 1 and 3 DF, pvalue: 0.002459

> plot(cuadrititos)
> abline(lm(L~N))

Angie Camacho
Ejercicio 3
A partir de las siguientes observaciones para 5 aos de las variables X e Y, ajstese el modelo de
regresin de Y en funcin de X ms idneo. Donde:
Y: produccin nacional de un subsector industrial, en millones de toneladas.
X: tiempo

Ao

1995

1,25

1996

1997

11,25

Ejercicio 4
Cinco nias de 2,4, 6,7 y 8 aos pesan respectivamente 15, 19, 25, 38, y 34

kilogramos

respectivamente, entonces una nia de 12 aos pesara aproximadamente:


A. 45
B. 55
C. 15
D. 51
E. 61
Ejercicio 5
En el anlisis de Regresin lineal se puede afirmar todo lo siguiente excepto:
A. Ajusta los datos a una lnea recta
B. Predice valores de una variable si se conoce el valor de la otra
C. Establece una relacin cuantitativa entre dos variables relacionadas
D. El mtodo grfico para determinar la relacin entre dos variables es ms concreto que el mtodo
matemtico o de mnimos cuadrados
E. Una relacin lineal entre dos variables queda representada por una lnea recta llamada ecuacin de
regresin

Angie Camacho
Ejercicio 6
Dado Los siguientes datos expuestos en la tabla
Edad
Estatura

1
60

2
8

3
10

4
110

5
112

La frmula de regresin para los datos propuestos est dada por:


A. y = 11,5x + 67,5

B. y = 7,5x + 85,5

D. y = 14,4x + 47

E. y = 14x + 48,8

C. y = 13,4x + 52,2

Ejercicio 7
B

El Grafico para los puntos


dispersos est dado por:
Rta:

Angie Camacho

Ejercicio 8
El diagrama de dispersin para la regresin lineal esta dado por
C

Angie Camacho

Rta:

Ejercicio 9
Los siguientes datos corresponden a 100 salarios tomados en una encuesta aplicada a 380 habitantes
de Villavicencio. Determinar en R el grado de asimetra de los datos. establecer una conclusin.
289000

350000

886900

310000

650000

961200

320000

756000

1200000

345000

289000

350000

889000

320000

665500

965000

320000

756000

1300000

320000

289000

350000

890000

320000

689500

996000

320000

759600

1700100

750000

289000

566700

896500

320000

689500

999000

340000

759600

1700100

1120000

310000

566700

900000

320000

690000

1000000

340000

789000

1700100

345000

310000

566700

936200

320000

690000

1025000

340000

789000

1700100

863000

310000

600000

942500

320000

699000

1025000

340000

800000

1700100

886000

320000

700000

1096000

320000

699000

1063000

340000

800000

1700100

345000

320000

700000

1116300

345000

859600

1777000

340000

800000

1700100

850000

320000

750000

1120000

345000

862300

1800000

345000

800000

1700100

1750000

Angie Camacho
>
salarios=c(289000,350000,886900,31
0000,650000,961200,320000,756000,
1200000,345000,289000,350000,8890
00,320000,665500,965000,320000,75
6000,1300000,320000,289000,350000
,890000,320000,689500,996000,3200
00,759600,1700100,750000,289000,5
66700,896500,320000,689500,999000
,340000,759600,1700100,1120000,31
0000,566700,900000,320000,690000,
1000000,340000,789000,1700100,345
000,310000,566700,936200,320000,6
90000,1025000,340000,789000,17001
00,863000,310000,600000,942500,32
0000,699000,1025000,340000,800000
,1700100,886000,320000,700000,109
6000,320000,699000,1063000,340000
,800000,1700100,345000,320000,700
000,1116300,345000,859600,1777000
,340000,800000,1700100,850000,320
000,750000,1120000,345000,862300,
1800000,345000,800000,1700100,175
0000)
> par(mfrow=c(1,2))
> f=table(salarios)
> dd <- density(salarios)
> barplot(f)
> plot(dd,add=T)
> summary(salarios)

Min.
Qu.

Mean 3rd

Max.

289000
Esta es una asimetra positiva ya que

1st Qu. Median


340000

947200 1800000
x > Me

Ejercicio 10
En una distribucin asimtrica negativa:
A La moda se encuentra entre la media y la mediana

700000

750900

Angie Camacho
B
C
D
E

La moda est ubicada a la derecha de la media


La media es menor que la desviacin tpica
La media es menor que la mediana
La moda y la mediana son iguales

Ejercicio 11
Los momentos de segundo orden con respecto a la media de dos distribuciones son 9 y 16, mientras
que los momentos de tercer orden son 8.1 y 12. 8 respectivamente. La distribucin ms asimtrica es:
A
B
C
D

La primera porque tiene mayor grado de deformacin


La primera porque tiene menor grado de deformacin
La segunda porque tiene mayor grado de deformacin
La segunda porque tiene menor grado de deformacin

Ejercicio 12
Uno de los siguientes enunciados es verdadero
A
B
C
D

La media en una muestra de datos agrupados la divide en dos partes.


Una distribucin de datos permite calcular todas las medidas de tendencia central
La moda es un dato que permite analizar un resultado esperado
Una medida de dispersin est libre del clculo de la media.

Ejercicio 13
En el anlisis de regresin lineal se puede afirmar todo lo siguiente, excepto
A
B
C
D
E

Ajusta todos los datos a una lnea recta


Predice el valor de una variable si se conoce el valor de la otra
Establece una relacin cuantitativa entre dos variables
El mtodo grafico es ms concreto que el mtodo matemtico
Una relacin lineal de datos queda representada por una recta.

Ejercicio 14
Dado que el grado de asimetra de una distribucin es de 2,27, la media es de 189,87 y la mediana
189,16, entonces la varianza toma un valor correspondiente a:
A
B
C
D
E

0.93
0.88
0.78
1.88
1.78

Ejercicio 15
Tomando una distribucin ligeramente asimtrica, calcular la moda sabiendo que su media es igual a 3
y que la diferencia entre la media y la mediana es igual a -2
A 2.9
B. 0.9
B 19
C 9

Angie Camacho
D 1/9

Ejercicio 16
En la siguiente distribucin de datos el coeficiente de asimetra segn el coeficiente de Pearson es:
Xi
f
A
B
C
D
E

1
2

2
8

3
3

4
5

5
7

6
5

2
1/3
3
1

Ejercicio 17
Retome los 100 datos y elabore una tabla en R para determinar el coeficiente de Gini. Utilice la librera
ineq, y compare los resultados. Establezca conclusiones

289000

350000

886900

310000

650000

961200

320000

756000

1200000 345000

289000

350000

889000

320000

665500

965000

320000

756000

1300000 320000

289000

350000

890000

320000

689500

996000

320000

759600

1700100 750000

289000

566700

896500

320000

689500

999000

340000

759600

1700100 1120000

310000

566700

900000

320000

690000

1000000 340000

789000

1700100 345000

310000

566700

936200

320000

690000

1025000 340000

789000

1700100 863000

310000

600000

942500

320000

699000

1025000 340000

800000

1700100 886000

320000

700000

1096000 320000

699000

1063000 340000

800000

1700100 345000

320000

700000

1116300

345000

859600

1777000 340000

800000

1700100 850000

320000

750000

1120000

345000

862300

1800000 345000

800000

1700100 1750000

> library(ineq)
>salarios=c(289000,350000,886
900,310000,650000,961200,320
000,756000,1200000,345000,28
9000,350000,889000,320000,66
5500,965000,320000,756000,13
00000,320000,289000,350000,8
90000,320000,689500,996000,3
20000,759600,1700100,750000,
289000,566700,896500,320000,
689500,999000,340000,759600,
1700100,1120000,310000,56670
0,900000,320000,690000,10000

[1] 0.3122976

Angie Camacho
00,340000,789000,1700100,345
000,310000,566700,936200,320
000,690000,1025000,340000,78
9000,1700100,863000,310000,6
00000,942500,320000,699000,1
025000,340000,800000,1700100
,886000,320000,700000,109600
0,320000,699000,1063000,3400
00,800000,1700100,345000,320
000,700000,1116300,345000,859
600,1777000,340000,800000,17
00100,850000,320000,750000,1
120000,345000,862300,1800000
,345000,800000,1700100,17500
00)
> g=ineq(salarios,type="Gini")
>g
>
plot(Lc(salarios),col="darkred",lw
d=2)

También podría gustarte