Está en la página 1de 20

Actividad 1

Actividad 2. Definición de Conceptos.

1. Diagrama de dispersión: se utiliza cuando se desea realizar un análisis grafico de datos


bivariados, ósea que se refiere a dos conjuntos de datos.

2. Correlación lineal simple: método estadístico que estudia la relación lineal entre dos
variables además genera un modelo matemático que pretende predecir el valor de
una a partir de otra.

3. Coeficiente de determinación R2: es el cuadrado de coeficiente de Pearson para una


regresión lineal simple se encuentra entre valores de 0 y 1 para predecir resultados y
formular hipótesis.

4. Correlación positiva: el valor x sube, el valor y sube, y además con la misma intensidad
(+1)
correlación negativa: siempre el valor x sube, y el valor y baja, y además con la misma
intensidad.

5. ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir? Cuantifica el


grado de variación conjunta entre dos variables el coeficiente señala lo conforme o lo
deficientemente que un conjunto de puntos se aproxima a una recta.

Actividad 3. Ejercicio práctico.

En esta actividad cada estudiante deberá resolver un ejercicio de los que aparecen a
continuación; posterior a ello compartirá su elección en el foro del entorno de Aprendizaje
Foro de discusión Unidad 3- Paso 4 Descripción de la Información. En cada ejercicio deberá
responder los siguientes interrogantes:

EJERCICIOS

3.1 Temperatura – Consumo de gas.

En una ciudad del norte de la costa colombiana fue registrada la temperatura media del día y
la cantidad de gas consumida en algunas de las residencias. Los datos están representados en
la siguiente tabla. Para estudiar la relación entre la temperatura y el consumo de gas.

Temperatura 2. Volumen de
Media en grados Gas consumido –
centígrados (X) cm3 (Y)
3 7
6 5
3 8
1 8
5 7
7 5
9 4

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

Temperatura y consumo de Gas


Valores Y Linear (Valores Y)
9
8 8
8
7 7
7
6
Gas consumido

5 5
5
4
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
Temperatura

b. Encuentre el coeficiente de determinación y correlación.

 Análisis de regresión lineal

Variable N R2 R2 AJ ECMP AIC BIC


Volumen del 8 0.92 0.87 0.87 0.75 18.90 19.10
gas
consumido

 Coeficiente de regresión y estadísticos asociados

Coeficiente EST E.E LI LS T P-Valor CpMallows VIF


Constante 8,65 0.45 7.60 9.64 20.20 0.0001 56.20 1.00
por 0.48 0.04 -0.64 0.30 -7.78 0.0004
temperatura
media
 Cuadro de Análisis de la Varianza

F.V SC GL CM F P-valor
Modelo 22.50 1 22.50 56.20 0.0004
Y temperatura 22.50 1 22.50 56.20 0.0004
Error 2.35 6 0.40
Total 24.75 7

Pendiente m, -0.48
Ordenada al origen b, 8.65
Coeficiente determinación, r2 092

Y= m (x)+b
Y = m(xº)+8.65
Y = -0.48(1°)+8.65= -14.5°c

 Volumen de gas consumido seria de -14.5°c


 Coeficiente de determinación 0.92 se puede decir que la confiabilidad del
modelo de 90 %.

c. Determine el modelo matemático que permite predecir el efecto de una variable sobre
la otra. ¿Es confiable?

 Raíz cuadrada de 92 es 0.95 aceptable su correlación.

d. Determine el grado de relación de las dos variables.

Y= -0.48-1°+8.65= 9.2°C Volumen de gas

Actividad 4. Regresión y correlación Lineal Simple.

Descripción de la Actividad Individual: A partir de la base de datos suministrada: Anexo 1-


Pruebas SABER 11 - 160 estudiantes 2020 (16-4), cada estudiante, deberá:

 Identificar dos variables cuantitativas de la situación estudiada que puedan estar


relacionadas e identificar la variable dependiente e independiente.

 Edad del estudiante.


 Puntaje lectura crítica.
PUNT_LECTURA_CRITICA PUNT_SOCIALES_CIUDADANAS X ^2 Y^2 X*Y

57 52 3249 2704 2964


70 73 4900 5329 5110

57 51 3249 2601 2907


44 34 1936 1156 1496

49 38 2401 1444 1862


70 76 4900 5776 5320

51 42 2601 1764 2142


63 52 3969 2704 3276

76 75 5776 5625 5700


65 68 4225 4624 4420

69 81 4761 6561 5589


71 72 5041 5184 5112

73 74 5329 5476 5402


67 65 4489 4225 4355

69 64 4761 4096 4416


74 74 5476 5476 5476

66 65 4356 4225 4290


70 66 4900 4356 4620

69 77 4761 5929 5313


69 66 4761 4356 4554

66 66 4356 4356 4356


70 70 4900 4900 4900

77 76 5929 5776 5852


77 80 5929 6400 6160

70 69 4900 4761 4830


69 69 4761 4761 4761

72 69 5184 4761 4968


75 64 5625 4096 4800
68 46 4624 2116 3128

71 75 5041 5625 5325


63 70 3969 4900 4410

71 72 5041 5184 5112


59 42 3481 1764 2478

51 48 2601 2304 2448


35 35 1225 1225 1225

34 26 1156 676 884


49 43 2401 1849 2107

57 35 3249 1225 1995


35 40 1225 1600 1400

50 37 2500 1369 1850


44 32 1936 1024 1408

36 33 1296 1089 1188


57 59 3249 3481 3363

38 31 1444 961 1178


38 28 1444 784 1064

52 54 2704 2916 2808


46 46 2116 2116 2116

28 26 784 676 728


47 36 2209 1296 1692

41 29 1681 841 1189


41 37 1681 1369 1517

38 29 1444 841 1102


50 50 2500 2500 2500

45 52 2025 2704 2340


45 44 2025 1936 1980

35 33 1225 1089 1155


43 40 1849 1600 1720

27 38 729 1444 1026


42 47 1764 2209 1974
36 38 1296 1444 1368

55 43 3025 1849 2365


41 42 1681 1764 1722

55 36 3025 1296 1980


51 42 2601 1764 2142

37 37 1369 1369 1369


45 53 2025 2809 2385

40 26 1600 676 1040


41 31 1681 961 1271

42 38 1764 1444 1596


64 48 4096 2304 3072

38 33 1444 1089 1254


51 42 2601 1764 2142

60 61 3600 3721 3660


53 42 2809 1764 2226

61 54 3721 2916 3294


52 46 2704 2116 2392

63 60 3969 3600 3780


53 53 2809 2809 2809

58 49 3364 2401 2842


60 62 3600 3844 3720

62 64 3844 4096 3968


66 59 4356 3481 3894

56 58 3136 3364 3248


65 59 4225 3481 3835

33 43 1089 1849 1419


44 40 1936 1600 1760

58 45 3364 2025 2610


51 58 2601 3364 2958

57 58 3249 3364 3306


58 57 3364 3249 3306
52 37 2704 1369 1924

48 44 2304 1936 2112


64 53 4096 2809 3392

70 48 4900 2304 3360


38 34 1444 1156 1292

50 37 2500 1369 1850


56 60 3136 3600 3360

45 40 2025 1600 1800


72 68 5184 4624 4896

47 42 2209 1764 1974


43 35 1849 1225 1505

49 48 2401 2304 2352


74 64 5476 4096 4736

63 59 3969 3481 3717


63 55 3969 3025 3465

72 46 5184 2116 3312


74 76 5476 5776 5624

57 53 3249 2809 3021


65 63 4225 3969 4095

63 62 3969 3844 3906


73 82 5329 6724 5986

75 74 5625 5476 5550


60 74 3600 5476 4440

64 65 4096 4225 4160


69 71 4761 5041 4899

55 61 3025 3721 3355


59 65 3481 4225 3835

69 73 4761 5329 5037


71 76 5041 5776 5396

62 53 3844 2809 3286


62 62 3844 3844 3844
67 61 4489 3721 4087

80 79 6400 6241 6320


78 68 6084 4624 5304

73 64 5329 4096 4672


67 70 4489 4900 4690

59 62 3481 3844 3658


60 75 3600 5625 4500

69 60 4761 3600 4140


62 52 3844 2704 3224

73 74 5329 5476 5402


66 70 4356 4900 4620

74 74 5476 5476 5476


76 66 5776 4356 5016

64 67 4096 4489 4288


75 73 5625 5329 5475

60 40 3600 1600 2400


68 70 4624 4900 4760

52 49 2704 2401 2548


76 67 5776 4489 5092

65 58 4225 3364 3770


77 79 5929 6241 6083

70 70 4900 4900 4900


73 79 5329 6241 5767

60 65 3600 4225 3900


74 71 5476 5041 5254

79 81 6241 6561 6399


51 47 2601 2209 2397

67 62 4489 3844 4154


65 53 4225 2809 3445

73 78 5329 6084 5694


67 52 4489 2704 3484
78 81 6084 6561 6318

56 65 3136 4225 3640


63 62 3969 3844 3906

69 48 4761 2304 3312


64 71 4096 5041 4544

76 73 5776 5329 5548


74 77 5476 5929 5698

69 61 4761 3721 4209


9470 8972 89680900 80496784 84964840

 Realizar el diagrama de dispersión de dichas variables y determinar el tipo de relación


entre las variables.

Diagrama de Dispersion
90
80
70
60
50
40
30
20
10
0
0 20 40 60 80 100 120 140 160 180

PUNT_LECTURA_CRITICA PUNT_SOCIALES_CIUDADANAS
Linear (PUNT_SOCIALES_CIUDADANAS)

Podemos observar una alta asociación entre las variables

 Determine al coeficiente de determinación y de correlación de las dos variables.


Interprete los resultados.

Coeficiente de correlación 0,86798828


Coeficiente de Determinación 0,753403654
Desviación X 12,76107855
Desviación Y 15,12569973
Covarianza 167,5393082
C.C. Pearson 0,86798828

 Encuentre el modelo matemático que permite predecir el efecto de una variable sobre
la otra. ¿Es confiable?

Esto nos permite predecir el efecto de una variable sobre la otra, teniendo en cuenta que R2 =
0.75 es cercano a 1 se puede determinar que es confiable

 Determine el tipo de correlación de las dos variables.

La raíz cuadrada del coeficiente de determinación: √0,7534 = 0.86 que multiplicado por 100
nos daría un porcentaje 86%, lo cual indica que las dos variables se encuentran relacionadas
entre sí, adicionalmente el coeficiente de correlación tiene un valor que se encuentra cercano
al 1 por lo tanto su relación es buena.

 Relacionar la información obtenida con el problema.

Se pudo determinar la relación que tiene el puntaje de lectura crítica y el puntaje de sociales y
ciencias ciudadanas, por esta razón se dice que son dependientes la una de la otra.

Actividad 5. Regresión y correlación múltiple.

A partir de la base de datos suministrada “Anexo 1- Pruebas SABER 11 - 160 estudiantes 2020
(16-4)”, cada estudiante, deberá:

a. Identificar una variable cuantitativa dependiente y varias variables cuantitativas


independientes del estudio de investigación.

N° DE LIBROS DE PUNT_SOCIALES_CIUDADAN PUNT_LECTURA_CRITI


No
CONSULTA AS CA

1 11 52 57
2 13 73 70
3 13 51 57
4 9 34 44
5 8 38 49
6 45 76 70
7 26 42 51
8 11 52 63
9 26 75 76
10 13 68 65
11 12 81 69
12 23 72 71
13 45 74 73
14 56 65 67
15 3 64 69
16 14 74 74
17 16 65 66
18 12 66 70
19 12 77 69
20 6 66 69
21 7 66 66
22 8 70 70
23 19 76 77
24 12 80 77
25 15 69 70
26 12 69 69
27 7 69 72
28 8 64 75
29 9 46 68
30 0 75 71
31 3 70 63
32 6 72 71
33 3 42 59
34 5 48 51
35 6 35 35
36 7 26 34
37 0 43 49
38 7 35 57
39 7 40 35
40 7 37 50
41 7 32 44
42 7 33 36
43 4 59 57
44 2 31 38
45 3 28 38
46 1 54 52
47 2 46 46
48 12 26 28
49 12 36 47
50 1 29 41
51 2 37 41
52 5 29 38
53 6 50 50
54 6 52 45
55 6 44 45
56 6 33 35
57 6 40 43
58 3 38 27
59 4 47 42
60 4 38 36
61 4 43 55
62 4 42 41
63 3 36 55
64 4 42 51
65 4 37 37
66 4 53 45
67 4 26 40
68 4 31 41
69 7 38 42
70 7 48 64
71 7 33 38
72 9 42 51
73 9 61 60
74 9 42 53
75 9 54 61
76 9 46 52
77 5 60 63
78 4 53 53
79 4 49 58
80 4 62 60
81 4 64 62
82 4 59 66
83 4 58 56
84 4 59 65
85 4 43 33
86 4 40 44
87 4 45 58
88 4 58 51
89 5 58 57
90 33 57 58
91 5 37 52
92 6 44 48
93 7 53 64
94 8 48 70
95 5 34 38
96 6 37 50
97 5 60 56
98 5 40 45
99 5 68 72
10
0 6 42 47
10
1 6 35 43
10
2 7 48 49
10
3 7 64 74
10
4 7 59 63
10
5 13 55 63
10
6 1 46 72
10
7 4 76 74
10
8 1 53 57
10
9 5 63 65
11
0 34 62 63
11
1 14 82 73
11
2 14 74 75
11
3 14 74 60
11
4 20 65 64
11
5 20 71 69
11
6 13 61 55
11
7 12 65 59
11
8 23 73 69
11
9 23 76 71
12
0 34 53 62
12
1 34 62 62
12
2 32 61 67
12
3 20 79 80
12
4 30 68 78
12
5 35 64 73
12 7 70 67
6
12
7 7 62 59
12
8 7 75 60
12
9 7 60 69
13
0 9 52 62
13
1 9 74 73
13
2 23 70 66
13
3 7 74 74
13
4 54 66 76
13
5 43 67 64
13
6 43 73 75
13
7 34 40 60
13
8 26 70 68
13
9 26 49 52
14
0 5 67 76
14
1 7 58 65
14
2 10 79 77
14
3 12 70 70
14
4 15 79 73
14
5 15 65 60
14
6 2 71 74
14
7 2 81 79
14
8 2 47 51
14
9 2 62 67
15
0 3 53 65
15
1 3 78 73
15
2 0 52 67
15
3 0 81 78
15
4 0 65 56
15
5 0 62 63
15
6 34 48 69
15
7 35 71 64
15
8 30 73 76
15
9 41 77 74
16
0 32 61 69

b. Realizar el diagrama de dispersión de dichas variables.

Relacion : libros de consulta vs puntaje sociales ciudania


90
80
70
60
50
40
30
20
10
0
0 20 40 60 80 100 120 140 160 180

PUNT_SOCIALES_CIUDADANAS Linear (PUNT_SOCIALES_CIUDADANAS)


N° DE LIBROS DE CONSULTA
Relacion libros de consulta vs puntaje lectura critica
90
80
70
60
50
40
30
20
10
0
0 20 40 60 80 100 120 140 160 180

PUNT_LECTURA_CRITICA N° DE LIBROS DE CONSULTA


Linear (N° DE LIBROS DE CONSULTA)

Resumen
Estadística de la regresión
Coeficiente de correlación múltiple
Coeficiente de determinación R2
R2 ajustado
Error típico
Observaciones

Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,378498828
Coeficiente de determinación R^2 0,143261363
R^2 ajustado 0,132347495
Error típico 10,77858935
Observaciones 160

ANÁLISIS DE
VARIANZA
Grados de Suma de Promedio de los Valor
  libertad cuadrados cuadrados F crítico de F
13,12654 5,35298E-
Regresión 2 3050,03083 1525,015415 348 06
Residuos 157 18239,94417 116,1779883
Total 159 21289,975      
Coeficient Error Estadístico Probabilid Inferior Superior Inferior Superior
  es típico t ad 95% 95% 95,0% 95,0%
- -
Intercepción 8,407927333 4,092109578 -2,054668179 0,041568615 -16,49061783 -0,32523684 16,49061783 -0,32523684

Variable X 1 0,276883426 0,134890903 2,052647132 0,04176692 0,010448375 0,543318476 0,010448375 0,543318476


-
Variable X 2 0,062548187 0,113803225 0,549616994 0,583363065 -0,162234711 0,287331084 0,162234711 0,287331084

b. Calcular la recta de regresión y el coeficiente de correlación para probar


estadísticamente su relación.

R^2 - 0,1432*100
 R^2 -14.32%  El modelo matemático es confiable un 14.32 %
 R- 0.6  No hay correlación entre las variables

d. Relacionar la información obtenida con el problema.

No hay relación entre las variables de los libros de consulta vs notas de lectura crítica y sociales
esto se identificó mediante el modelo matemático de regresión múltiple de lo que se obtuvo
un 14.32 % de confiabilidad por esto decimos que la cantidad de libros consultados no
interfirió en el puntaje obtenido en las pruebas de lectura crítica y ciencias sociales y políticas.
Conclusiones

También podría gustarte