Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADISTICA DESCRIPTIVA 100105 97 Paso 4 Descripcion de La Informacion
ESTADISTICA DESCRIPTIVA 100105 97 Paso 4 Descripcion de La Informacion
Por
RICARDO ANDRES MARTINEZ PEÑA
LINA MARÍA MARTÍNEZ MOLANO
JUAN CAMILO CELY
Presentado a
MARIA JOSE CHARFUELAN
Tutor
En base a un registro histórico de datos sobre la problemática de las víctimas del conflicto
actividad que apela a diversas técnicas con el propósito de llegar a la esencia de la realidad.
La regresión lineal simple y la regresión lineal múltiple son técnicas de análisis de las
variables de una investigación estadística, en este caso desde la encuesta realizada. Si bien
es cierto estas técnicas mencionadas se pueden utilizar para solucionar problemas comunes
con mayor frecuencia en las ciencias económicas, también es cierto que en muchos casos se
requiere conocer más que el comportamiento de una sola variable para entender una
hace necesario que practiquemos estas técnicas de regresión por medio de ejercicios
los comportamientos que se dan en el plano cartesiano tanto en las variables, como los
grados y resultados que se manejan para los ejemplos que se plantean en el laboratorio
propuesto, que es de vital importancia reconocer y manejar las fórmulas que se obtienen de
la herramienta de Excel.
JUSTIFICACIÓN
Partiendo de una base de datos sobre la problemática de las víctimas del conflicto se
presenta las soluciones de las actividades planteadas dentro del periodo histórico
comprendido entre los años 2006 a 2012. Para ello, en primer lugar aplicaremos el proceso
de regresión lineal simple para determinar tanto la naturaleza como la fuerza de una
relación entre dos variables y segundo lugar la regresión lineal múltiple con la cual
describiremos la relación entre dos o más variables independientes y una variable
dependiente utilizando la ecuación de regresión múltiple; estas ecuaciones de estimaciones
nos permitirá realizar una interpretación de correlación de la investigación realizada en
estas instituciones educativas. El trabajo de laboratorio constituye una de las mejores
metodologías para la aplicación de modelos estadísticos a las variables de los hechos, es
por eso que se trabaja en este sentido y no otro para la práctica de la unidad 3 de regresión y
determinación
OBJETIVOS
Objetivos Generales
1. Potencializar en el estudiante habilidades y destrezas para caracterizar una situación
mediante el análisis de las medidas estadísticas bivariantes.
2. Calcular e interpretar adecuadamente las medidas estadísticas bivariantes, asociadas
a una situación específica.
3. Determinar la relación entre dos o más variables inscritas en una situación
específica a partir del análisis de regresión lineal simple y múltiple.
Objetivos Específicos
1. Interpretar correctamente los datos de cada tabla propuestos en cada uno de los
ejercicios.
2. Realizar diagramas de dispersión en los ejercicios de laboratorio y actividades
colaborativas que permitan determinar el tipo de asociación entre las variables
escogidas en cada ejercicio.
3. En los ejercicios propuestos de laboratorio y de regresión y correlación lineal simple
crear modelos matemáticos que permita predecir el efecto de una variable sobre la
otra para determinar su fiabilidad.
4. Determinar porcentajes que permitan una explicación de modelo y grado de relación
de dos variables de los ejercicios de laboratorio y de regresión y correlación lineal
simple.
5. En la práctica de regresión y correlación lineal múltiple identificar una variable
cuantitativa dependiente y varias variables independientes del estudio de
investigación, diagramarlas y calcular la recta de regresión y el coeficiente de
correlación para probar estadísticamente su relación.
6. Relacionar o analizar la información obtenida en cada problema planteado en los
ejercicios de laboratorio y colaborativo.
ESTADISTICA DESCRIPTIVA 100105_97
LABORATORIO Y TRABAJO COLABORATIVO
PASO 4- DESCRIPCIÓN DE LA INFORMACIÓN: DETALLAR Y
RELACIONAR VARIABLES DE LA PROBLEMÁTICA UTILIZANDO
MEDIDAS BIVARIANTES.
LABORATORIO REGRESIÓN Y CORRELACIÓN LINEAL
Actividad individual
Aporte por: Ricardo Martínez – CC 1052404207
Ejercicios
X (sal) Y (Tensión)
1,6 98
2,3 102
3,3 109
4,2 113
4,6 115
5,0 120
Realice el diagrama de dispersión y determine el tipo de asociación entre las variables
140
120
f(x) = 4.37 x + 94.2
R² = 0.98
100
80
Tension
60 Y (Tensión)
Linear (Y (Tensión) )
40
20
0
0 1 2 3 4 5 6 7
Sal
Encuentre el modelo matemático que permite predecir el efecto de una variable sobre
la otra. ¿Es confiable?
El modelo matemático que permite predecir el efecto de una variable sobre la otra es:
y=4.371x + 94.2
R² = 0.979
Se puede asegurar que la ecuación de la recta es confiable porque el R² está cercano a 1 y
tiene un grado alto de confiabilidad.
Para hallar el valor de la tensión arterial esperada para una dosis de sal de 6.5 debemos
reemplazar este valor en la formula hallada.
Y =¿4.371*6.5)+94.2=122.61
Según lo anterior para dicha dosis de sal la tensión arterial esperada es de 126.6
2. EN UN NUEVO PROCESO ARTESANAL DE FABRICACIÓN DE CIERTO
ARTÍCULO QUE ESTÁ IMPLANTADO, SE HA CONSIDERADO QUE ERA
IMPORTANTE IR ANOTANDO PERIÓDICAMENTE EL TIEMPO MEDIO
(MEDIDO EN MINUTOS) QUE SE UTILIZA PARA REALIZAR UNA PIEZA Y EL
NÚMERO DE DÍAS DESDE QUE EMPEZÓ DICHO PROCESO DE
FABRICACIÓN. CON ELLO, SE PRETENDE ANALIZAR COMO LOS
OPERARIOS VAN ADAPTÁNDOSE AL NUEVO PROCESO MEJORANDO
PAULATINAMENTE SU PROCESO DE PRODUCCIÓN.
X 12 23 35 42 53 65 70
Y 45 30 27 25 23 21 20
20 Y
15 Linear (Y)
10
5
0
0 10 20 30 40 50 60 70 80
Y
Encuentre el modelo matemático que permite predecir el efecto de una variable sobre
la otra. ¿Es confiable?
y = -0.356x + 42.56
R² = 0.796
Se puede asegurar que la ecuación de la recta tiene un grado de confianza mediana porque
el R² está un poco alejado a 1, teniendo entonces un grado medio alto de confiabilidad.
Estatura (cm) 120 124 107 118 112 110 115 104 110 116
Peso (kg) 24 23 19 24 21 19 22 16 20 23
30
25
f(x) = 0.39 x − 22.75
R² = 0.83
20
Peso()kg)
15
Peso ( kg)
10 Linear (Peso ( kg))
0
100 105 110 115 120 125 130
Estatura(cm)
X (sal) Y (Tensión)
1,6 98
2,3 102
3,3 109
4,2 113
4,6 115
5,0 120
60
40
20
0
0 1 2 3 4 5 6 7
Sal
El modelo matemático a utilizar es la regresión lineal simple ya que esta nos permite
calcular la tensión (Y) sabiendo el nivel sal consumido de la siguiente manera:
Y = A +B ∙ X .
A= 88.12
B= 6.10
Ahora tomamos distintos valores de X para remplazar en la ecuación y obtenemos los
siguientes resultados:
X= 1.6 valor tensión Y= 97.89
X= 3.3 valor tensión Y= 108.27
X=4.2 valor tensión Y= 113.77
X= 5.0 valor tensión Y= 118.65
Para saber si es confiable el método hallamos un porcentaje de error teniendo en cuenta el
valor obtenido como teórico y los valores suministrados como experimentales.
valor teorico−valor experimental
% de error= ∙100
valor teorico
Se obtienen los siguientes porcentajes de error:
X= 1.6 un porcentaje de error igual a 0.11%
X= 3.3 un porcentaje de error igual a 0.67%
X=4.2 un porcentaje de error igual a 0.68%
X= 5.0 un porcentaje de error igual a 1.14%
Ya que se obtiene un porcentaje de error muy bajo por método matemático se puede decir
que es confiable para predecir el efecto de una variable sobre otra.
c. Determine el grado de relación de las dos variables.
Por medio de la regresión lineal obtuvimos r= 0.9934808689 por tal razón es una
correlación excelente.
d. Si a un paciente se le administra una dosis de sal de 5,6. ¿Cuál es la tensión arterial
esperada?
Variable dependiente: Y
Variable independiente: X
Diagrama de dispersión.
50
45
40
35
30
25
20
15
10
5
0
0 10 20 30 40 50 60 70 80
El modelo matemático a utilizar es la regresión potencial ya que esta nos permite calcular X
y Y.
Y = A × Xb
A= 126.104
B= -0.4331
Ahora tomamos distintos valores de X para remplazar en la ecuación y obtenemos los
siguientes resultados:
X= 12 Y= 42.98
X= 23 Y= 32.42
X= 35 Y= 27.03
X= 42 Y= 24.98
X= 53 Y= 22.58
X= 65 Y= 20.67
X= 70 Y= 20.02
Para saber si es confiable el método hallamos un porcentaje de error teniendo en cuenta el
valor obtenido como teórico y los valores suministrados como experimentales.
valor teorico−valor experimental
% de error= ∙100
valor teorico
X= 12 un porcentaje de error igual a 4.69%
X= 23 un porcentaje de error igual a 7.46%
X= 35 un porcentaje de error igual a 0.11%
X= 42 un porcentaje de error igual a 0.08%
X= 53 un porcentaje de error igual a 1.86%
X= 65 un porcentaje de error igual a 1.59%
X= 70 un porcentaje de error igual a 0.09%
Ya que solo es inconsistente en unos datos en el porcentaje de error por este método
matemático se puede decir que es confiable para predecir el efecto de una variable sobre
otra.
c. Determine el grado de correlación de las dos variables.
Por medio de la regresión potencial obtuvimos r= -0.990311 por tal razón es una
correlación aceptable.
d. ¿Que tiempo deberá tardarse un empleado cuando lleven 90 días?
Variable dependiente: Y
Variable independiente: X
Diagrama de dispersión.
30
25
20
Peso (Kg)
15
10
0
100 105 110 115 120 125 130
Estatura (cm)
El modelo matemático a utilizar es la regresión lineal simple ya que esta nos permite
calcular X y Y.
Y = A +B ∙ X .
A= -22.75
B= 0.38
Ahora tomamos distintos valores de X para remplazar en la ecuación y obtenemos los
siguientes resultados:
X= 120 Y= 23.57
X= 124 Y= 25.11
X= 107 Y= 18.55
X= 118 Y= 22.79
X= 112 Y= 20.48
X= 110 Y= 19.71
X= 115 Y= 21.64
X= 104 Y= 17.39
X= 110 Y= 19.71
X= 116 Y= 22.02
Para saber si es confiable el método hallamos un porcentaje de error teniendo en cuenta el
valor obtenido como teórico y los valores suministrados como experimentales.
valor teorico−valor experimental
% de error= ∙100
valor teorico
Se obtienen los siguientes porcentajes de error:
X= 120 un porcentaje de error igual a 1.82%
X= 124 un porcentaje de error igual a 8.4%
X= 107 un porcentaje de error igual a 2.42%
X= 118 un porcentaje de error igual a 5.30%
X= 112 un porcentaje de error igual a 2.53%
X= 110 un porcentaje de error igual a 3.60%
X= 115 un porcentaje de error igual a 1.66%
X= 104 un porcentaje de error igual a 7.99%
X= 110 un porcentaje de error igual a 3.60%
X= 116 un porcentaje de error igual a 4.45%
Debido a que el porcentaje de error no es tan alto se puede decir que es confiable para
predecir el efecto de una variable sobre otra.
c. Determine el grado de correlación de las dos variables.
Por medio de la regresión lineal obtuvimos r= 0.91266241211 por tal razón es una
correlación excelente.
d. ¿Cuál es el peso que debería tener un estudiante que mida 128 cm?
X (Sal) Y (Tensión)
1,6 98
2,3 102
3,3 109
4,2 113
4,6 115
5,0 120
80
60
40
20
0
1 1.5 2 2.5 3 3.5 4 4.5 5 5.5
Consumo de sal
El tipo de asociación entre las variables es directo, ya que a medida que aumenta el
consumo de sal (X) también lo hace la tensión arterial (Y).
y = 6,1062x + 88,128
R² = 0,987 coeficiente de determinación
y = 6,1062x + 88,128
y = 6,1062(5,6) + 88,128
y = 34,19472+ 88,128
y = 122,32272
X 12 23 35 42 53 65 70
Y 45 30 27 25 23 21 20
a. Identifique la variable dependiente (y) y la variable independiente (x), realice el
diagrama de dispersión y determine el tipo de asociación entre las variables
Variable Y (tiempo medio para realizar una pieza) dependiente de variable X (días
transcurridos desde que se aprendió el proceso de fabricación).
Tiempo empleado para fabricar según días
transcurridos usando la misma técnica
50
45
40
Tiempo empleado
35
30
25
20
15
10
5
0
0 10 20 30 40 50 60 70 80
Días transcurridos
y = -0,3566x + 42,569
R² = 0,7963 coeficiente de determinación
y = -0,3566x + 42,569
y = -0,3566(90) + 42,569
y = -32,094 + 42,569
Estatura 120 124 107 118 112 110 115 104 110 116
(cm)
Peso 24 23 19 24 21 19 22 16 20 23
(kg)
a. Identifique la variable dependiente (y) y la variable independiente (x), realice el
diagrama de dispersión y determine el tipo de asociación entre las variables
Peso (kg)
30
25
20
Axis Title
15
10
0
100 105 110 115 120 125 130
Axis Title
y = 0,386x - 22,751
R² = 0,8329. El modelo tiene una confiabilidad del 83,29%.
y = 0,386(128) - 22,751
y = 49,408 - 22,751
y = 26,657
El peso que debería tener un estudiante que mida 128cm será de 26,657 kg.
TRABAJO COLABORATIVO
Aporte Ricardo Martínez – CC 1052404207
Figura 4. Diagrama de distribución entre las variables GASTO EN DEFENSA Y SEGURIDAD EN COLOMBIA PER CAPITA y
GASTO EN DEFENSA Y SEGURIDAD
y = 2E-08x + 3245,4
R² = 0,9943
Se puede asegurar que la ecuación de la recta es confiable porque el R² está
cercano a 1 y tiene un grado alto de confiabilidad.
4. Determine el porcentaje de explicación del modelo y el grado de relación de las
dos variables. - Relacionar la información obtenida con el problema.
El R² afirma además que el modelo explica el 99.4% de la información y el valor de
r coeficiente de correlación lineal es excelente porque el 0.994 está muy cercano al
extremo 1 positivo que es la correlación perfecta positiva.
500000
450000
400000
f(x) = − 3391.41 x + 406876.81
350000 R² = 0.13
300000
250000
200000
150000
100000
50000
0
0 2 4 6 8 10 12 14 16
Minas anti persona.
R2=0,1293
En este caso se puede asegurar que la ecuación de la recta no es tan confiable porque el R²
no está cercano a 1 por tal razón no tiene alto grado de confiabilidad.
efectivos de
fuerza pública
disponibles gasto en defensa y seguridad
Colombia Colombia per cápita
350488 21432
351129 21447
352171 21786
355681 22430
357113 22692
357213 23045
357606 25134
358033 26202
358363 27738
358414 28636
358458 28822
361013 28881
363119 22577
363589 23952
367869 24054
368141 24453
368374 25503
369661 25974
369719 26626
371549 28763
371654 30058
371766 30111
373732 30236
374032 30730
377984 32129
378771 32563
379339 33621
379430 33672
379674 33856
382802 33861
384498 34225
385640 34482
385904 34703
386634 34704
387000 35855
387226 36251
391414 34603
391986 35187
393097 35956
394267 36967
395717 37051
398293 37067
398351 37892
398665 38575
399493 38650
399502 40302
399516 40378
400562 41000
403632 33730
403925 34207
404898 34349
405837 34795
406771 35057
407217 35578
408833 37198
409567 38219
410815 38412
412550 39090
413073 39960
414072 40018
415242 35325
415455 35942
415997 36049
416181 36397
416664 36522
419366 37984
419523 38153
419621 38497
420432 39838
421819 40346
421864 40657
422600 40870
423810 35227
428796 36035
432890 36668
434453 38608
435939 39182
436745 39546
437154 40071
440608 40158
440647 40423
440997 40931
443239 41060
445565 41679
pública disponibles.
45000
40000 f(x) = 0.19 x − 41954.61
R² = 0.77
35000
30000
25000
20000
15000
10000
5000
0
340000 360000 380000 400000 420000 440000 460000
efectivos de fuerza pública disponibles Colombia
El tipo de asociación entre las variables es Directo. Ya que a medida que una aumenta la
otra también lo hace.
- Encuentre el modelo matemático que permite predecir el efecto de una variable
sobre la otra. ¿Es confiable?
y = 0,1919x - 41955
R² = 0,7717. El modelo tiene una confiabilidad del 77,17%. Aceptable.
- Determine el porcentaje de explicación del modelo y el grado de relación de las dos
variables.
R² = 0,7717
R = 0,8784
El grado de correlación entre las variables es aceptable ya que el valor de R está entre
0,80 y 0,90.
- Relacionar la información obtenida con el problema.
El gasto en defensa y seguridad en Colombia per cápita es un valor que cambia y se
relaciona con el número de efectivos de fuerza pública disponibles, ya que para
mantener el número de efectivos que puedan garantizar la seguridad en el país, se
utilizará parte del gasto per cápita en el sostenimiento de estos.
CONCLUSIONES
Se pudo evidenciar que para manejar cualquier tipo de variables se necesita realizar un
diagrama de dispersión y aplicar conceptos, fórmulas de relación y correlación que
permita el despeje de las ecuaciones y datos para obtener un resultado.
Los ejemplos nos muestran que son acordes a un tipo de forma lineal y la correlación es
confiable para los tipos de datos.