Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Por
ALIRIO MURILLO ACUÑA
Presentado a
MARIA JOSE CHARFUELAN
Tutor
INTRODUCCION
En base a un registro histórico de datos sobre la problemática de las víctimas del
una sola variable para entender una investigación cualquiera sea su especia.
tanto en las variables, como los grados y resultados que se manejan para los
Partiendo de una base de datos sobre la problemática de las víctimas del conflicto
se presenta las soluciones de las actividades planteadas dentro del periodo
histórico comprendido entre los años 2006 a 2012. Para ello, en primer lugar
aplicaremos el proceso de regresión lineal simple para determinar tanto la
naturaleza como la fuerza de una relación entre dos variables y segundo lugar la
regresión lineal múltiple con la cual describiremos la relación entre dos o más
variables independientes y una variable dependiente utilizando la ecuación de
regresión múltiple; estas ecuaciones de estimaciones nos permitirá realizar una
interpretación de correlación de la investigación realizada en estas instituciones
educativas. El trabajo de laboratorio constituye una de las mejores metodologías
para la aplicación de modelos estadísticos a las variables de los hechos, es por
eso que se trabaja en este sentido y no otro para la práctica de la unidad 3 de
regresión y determinación
OBJETIVOS
Objetivos Generales
1. Potencializar en el estudiante habilidades y destrezas para caracterizar una
situación mediante el análisis de las medidas estadísticas bivariantes.
2. Calcular e interpretar adecuadamente las medidas estadísticas bivariantes,
asociadas a una situación específica.
3. Determinar la relación entre dos o más variables inscritas en una situación
específica a partir del análisis de regresión lineal simple y múltiple.
Objetivos Específicos
1. Interpretar correctamente los datos de cada tabla propuestos en cada uno
de los ejercicios.
2. Realizar diagramas de dispersión en los ejercicios de laboratorio y
actividades colaborativas que permitan determinar el tipo de asociación
entre las variables escogidas en cada ejercicio.
3. En los ejercicios propuestos de laboratorio y de regresión y correlación
lineal simple crear modelos matemáticos que permita predecir el efecto de
una variable sobre la otra para determinar su fiabilidad.
4. Determinar porcentajes que permitan una explicación de modelo y grado de
relación de dos variables de los ejercicios de laboratorio y de regresión y
correlación lineal simple.
5. En la práctica de regresión y correlación lineal múltiple identificar una
variable cuantitativa dependiente y varias variables independientes del
estudio de investigación, diagramarlas y calcular la recta de regresión y el
coeficiente de correlación para probar estadísticamente su relación.
6. Relacionar o analizar la información obtenida en cada problema planteado
en los ejercicios de laboratorio y colaborativo.
ESTADISTICA DESCRIPTIVA 100105_97
LABORATORIO Y TRABAJO COLABORATIVO
PASO 4- DESCRIPCIÓN DE LA INFORMACIÓN: DETALLAR Y
RELACIONAR VARIABLES DE LA PROBLEMÁTICA UTILIZANDO
MEDIDAS BIVARIANTES.
LABORATORIO REGRESIÓN Y CORRELACIÓN LINEAL
Actividad individual
Aporte por: Ricardo Martínez – CC 1052404207
Ejercicios
X (sal) Y (Tensión)
1,6 98
2,3 102
3,3 109
4,2 113
4,6 115
5,0 120
Realice el diagrama de dispersión y determine el tipo de asociación entre las
variables
140
120
f(x) = 4.37 x + 94.2
R² = 0.98
100
80
Tension
60 Y (Tensión)
Linear (Y (Tensión) )
40
20
0
0 1 2 3 4 5 6 7
Sal
El modelo matemático que permite predecir el efecto de una variable sobre la otra
es:
y=4.371x + 94.2
R² = 0.979
Se puede asegurar que la ecuación de la recta es confiable porque el R² está
cercano a 1 y tiene un grado alto de confiabilidad.
Para hallar el valor de la tensión arterial esperada para una dosis de sal de 6.5
debemos reemplazar este valor en la formula hallada.
Y =¿4.371*6.5)+94.2=122.61
Según lo anterior para dicha dosis de sal la tensión arterial esperada es de 126.6
2. EN UN NUEVO PROCESO ARTESANAL DE FABRICACIÓN DE CIERTO
ARTÍCULO QUE ESTÁ IMPLANTADO, SE HA CONSIDERADO QUE ERA
IMPORTANTE IR ANOTANDO PERIÓDICAMENTE EL TIEMPO MEDIO
(MEDIDO EN MINUTOS) QUE SE UTILIZA PARA REALIZAR UNA PIEZA Y EL
NÚMERO DE DÍAS DESDE QUE EMPEZÓ DICHO PROCESO DE
FABRICACIÓN. CON ELLO, SE PRETENDE ANALIZAR COMO LOS
OPERARIOS VAN ADAPTÁNDOSE AL NUEVO PROCESO MEJORANDO
PAULATINAMENTE SU PROCESO DE PRODUCCIÓN.
X 12 23 35 42 53 65 70
Y 45 30 27 25 23 21 20
20 Y
15 Linear (Y)
10
5
0
0 10 20 30 40 50 60 70 80
Y
y = -0.356x + 42.56
R² = 0.796
Estatura (cm) 120 124 107 118 112 110 115 104 110 116
Peso (kg) 24 23 19 24 21 19 22 16 20 23
25
f(x) = 0.39 x − 22.75
R² = 0.83
20
Peso()kg)
15
Peso ( kg)
10 Linear (Peso ( kg))
0
100 105 110 115 120 125 130
Estatura(cm)
X (sal) Y (Tensión)
1,6 98
2,3 102
3,3 109
4,2 113
4,6 115
5,0 120
Diagrama de dispersión
140
120
100
80
Tension
60
40
20
0
0 1 2 3 4 5 6 7
Sal
Por medio de la regresión lineal obtuvimos r= 0.9934808689 por tal razón es una
correlación excelente.
d. Si a un paciente se le administra una dosis de sal de 5,6. ¿Cuál es la
tensión arterial esperada?
Variable dependiente: Y
Variable independiente: X
Diagrama de dispersión.
50
45
40
35
30
25
20
15
10
5
0
0 10 20 30 40 50 60 70 80
Y = A × Xb
A= 126.104
B= -0.4331
Ahora tomamos distintos valores de X para remplazar en la ecuación y obtenemos
los siguientes resultados:
X= 12 Y= 42.98
X= 23 Y= 32.42
X= 35 Y= 27.03
X= 42 Y= 24.98
X= 53 Y= 22.58
X= 65 Y= 20.67
X= 70 Y= 20.02
Para saber si es confiable el método hallamos un porcentaje de error teniendo en
cuenta el valor obtenido como teórico y los valores suministrados como
experimentales.
valor teorico−valor experimental
% de error= ∙100
valor teorico
X= 12 un porcentaje de error igual a 4.69%
X= 23 un porcentaje de error igual a 7.46%
X= 35 un porcentaje de error igual a 0.11%
X= 42 un porcentaje de error igual a 0.08%
X= 53 un porcentaje de error igual a 1.86%
X= 65 un porcentaje de error igual a 1.59%
X= 70 un porcentaje de error igual a 0.09%
Ya que solo es inconsistente en unos datos en el porcentaje de error por este
método matemático se puede decir que es confiable para predecir el efecto de una
variable sobre otra.
c. Determine el grado de correlación de las dos variables.
Por medio de la regresión potencial obtuvimos r= -0.990311 por tal razón es una
correlación aceptable.
d. ¿Que tiempo deberá tardarse un empleado cuando lleven 90 días?
Variable dependiente: Y
Variable independiente: X
Diagrama de dispersión.
30
25
20
Peso (Kg)
15
10
0
100 105 110 115 120 125 130
Estatura (cm)
Por medio de la regresión lineal obtuvimos r= 0.91266241211 por tal razón es una
correlación excelente.
d. ¿Cuál es el peso que debería tener un estudiante que mida 128 cm?
X (Sal) Y (Tensión)
1,6 98
2,3 102
3,3 109
4,2 113
4,6 115
5,0 120
80
60
40
20
0
1 1.5 2 2.5 3 3.5 4 4.5 5 5.5
Consumo de sal
El tipo de asociación entre las variables es directo, ya que a medida que
aumenta el consumo de sal (X) también lo hace la tensión arterial (Y).
y = 6,1062x + 88,128
R² = 0,987 coeficiente de determinación
y = 6,1062x + 88,128
y = 6,1062(5,6) + 88,128
y = 34,19472+ 88,128
y = 122,32272
35
30
25
20
15
10
5
0
0 10 20 30 40 50 60 70 80
Días transcurridos
y = -0,3566x + 42,569
R² = 0,7963 coeficiente de determinación
y = -0,3566(90) + 42,569
y = -32,094 + 42,569
Estatur 120 124 107 118 112 110 115 104 110 116
a (cm)
Peso 24 23 19 24 21 19 22 16 20 23
(kg)
a. Identifique la variable dependiente (y) y la variable independiente (x), realice
el diagrama de dispersión y determine el tipo de asociación entre las
variables
Peso (kg)
30
25
20
Axis Title
15
10
0
100 105 110 115 120 125 130
Axis Title
El tipo de asociación entre las variables es Directo, ya que son directamente
proporcionales.
y = 0,386x - 22,751
R² = 0,8329. El modelo tiene una confiabilidad del 83,29%.
d. ¿Cuál es el peso que debería tener un estudiante que mida 128 cm?
y = 0,386(128) - 22,751
y = 49,408 - 22,751
y = 26,657
El peso que debería tener un estudiante que mida 128cm será de 26,657 kg.
TRABAJO COLABORATIVO
Aporte Ricardo Martínez – CC 1052404207
y = 2E-08x + 3245,4
R² = 0,9943
Se puede asegurar que la ecuación de la recta es confiable porque el R²
está cercano a 1 y tiene un grado alto de confiabilidad.
4. Determine el porcentaje de explicación del modelo y el grado de
relación de las dos variables. - Relacionar la información obtenida con
el problema.
El R² afirma además que el modelo explica el 99.4% de la información y el
valor de r coeficiente de correlación lineal es excelente porque el 0.994 está
muy cercano al extremo 1 positivo que es la correlación perfecta positiva.
Mediante el análisis del diagrama de dispersión se puede determinar que el
gasto de defensa total se encuentra directamente proporcional al mismo
tipo de gasto per cápita o por persona durante el periodo de tiempo
comprendido entre 2006-2012 en la problemática de las víctimas del
conflicto.
500000
450000
400000
f(x) = − 3391.41 x + 406876.81
350000 R² = 0.13
300000
250000
200000
150000
100000
50000
0
0 2 4 6 8 10 12 14 16
Minas anti persona.
R2=0,1293
En este caso se puede asegurar que la ecuación de la recta no es tan confiable
porque el R² no está cercano a 1 por tal razón no tiene alto grado de confiabilidad.
efectivos de
fuerza pública
disponibles gasto en defensa y seguridad
Colombia Colombia per cápita
350488 21432
351129 21447
352171 21786
355681 22430
357113 22692
357213 23045
357606 25134
358033 26202
358363 27738
358414 28636
358458 28822
361013 28881
363119 22577
363589 23952
367869 24054
368141 24453
368374 25503
369661 25974
369719 26626
371549 28763
371654 30058
371766 30111
373732 30236
374032 30730
377984 32129
378771 32563
379339 33621
379430 33672
379674 33856
382802 33861
384498 34225
385640 34482
385904 34703
386634 34704
387000 35855
387226 36251
391414 34603
391986 35187
393097 35956
394267 36967
395717 37051
398293 37067
398351 37892
398665 38575
399493 38650
399502 40302
399516 40378
400562 41000
403632 33730
403925 34207
404898 34349
405837 34795
406771 35057
407217 35578
408833 37198
409567 38219
410815 38412
412550 39090
413073 39960
414072 40018
415242 35325
415455 35942
415997 36049
416181 36397
416664 36522
419366 37984
419523 38153
419621 38497
420432 39838
421819 40346
421864 40657
422600 40870
423810 35227
428796 36035
432890 36668
434453 38608
435939 39182
436745 39546
437154 40071
440608 40158
440647 40423
440997 40931
443239 41060
445565 41679
pública disponibles.
45000
40000 f(x) = 0.19 x − 41954.61
R² = 0.77
35000
30000
25000
20000
15000
10000
5000
0
340000 360000 380000 400000 420000 440000 460000
efectivos de fuerza pública disponibles Colombia
El tipo de asociación entre las variables es Directo. Ya que a medida que una
aumenta la otra también lo hace.
- Encuentre el modelo matemático que permite predecir el efecto de una
variable sobre la otra. ¿Es confiable?
y = 0,1919x - 41955
R² = 0,7717. El modelo tiene una confiabilidad del 77,17%. Aceptable.
- Determine el porcentaje de explicación del modelo y el grado de relación de
las dos variables.
R² = 0,7717
R = 0,8784
El grado de correlación entre las variables es aceptable ya que el valor de R
está entre 0,80 y 0,90.
- Relacionar la información obtenida con el problema.
El gasto en defensa y seguridad en Colombia per cápita es un valor que
cambia y se relaciona con el número de efectivos de fuerza pública
disponibles, ya que para mantener el número de efectivos que puedan
garantizar la seguridad en el país, se utilizará parte del gasto per cápita en el
sostenimiento de estos.
CONCLUSIONES
REFERENCIAS BIBLIOGRAFICAS
Pava, M. (2017). ESTADÍSTICA DESCRIPTIVA. [online]