Está en la página 1de 33

ESTADISTICA DESCRIPTIVA

LABORATORIO REGRESIÓN Y CORRELACIÓN LINEAL

Por
ALIRIO MURILLO ACUÑA

Presentado a
MARIA JOSE CHARFUELAN
Tutor

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


UNAD
AGUADA, MAYO 2018

INTRODUCCION
En base a un registro histórico de datos sobre la problemática de las víctimas del

conflicto se presenta las soluciones de las actividades planteadas. La

investigación estadística es una actividad que apela a diversas técnicas con el

propósito de llegar a la esencia de la realidad. La regresión lineal simple y la

regresión lineal múltiple son técnicas de análisis de las variables de una

investigación estadística, en este caso desde la encuesta realizada. Si bien es

cierto estas técnicas mencionadas se pueden utilizar para solucionar problemas

comunes en los negocios o para evaluar el comportamiento de su economía y en

general se utiliza con mayor frecuencia en las ciencias económicas, también es

cierto que en muchos casos se requiere conocer más que el comportamiento de

una sola variable para entender una investigación cualquiera sea su especia.

Entonces, sin importar la situación presentada se hace necesario que

practiquemos estas técnicas de regresión por medio de ejercicios salientes de la

cotidianidad, a continuación, veremos pues los resultados de dicha práctica.

La realización de este trabajo es dar a conocer y poner en práctica la regresión y

correlación y medias de dispersión y estadísticas bivariantes sobre la unidad 2 de

este curso, además de los comportamientos que se dan en el plano cartesiano

tanto en las variables, como los grados y resultados que se manejan para los

ejemplos que se plantean en el laboratorio propuesto, que es de vital importancia

reconocer y manejar las fórmulas que se obtienen de la herramienta de Excel.


JUSTIFICACIÓN

Partiendo de una base de datos sobre la problemática de las víctimas del conflicto
se presenta las soluciones de las actividades planteadas dentro del periodo
histórico comprendido entre los años 2006 a 2012. Para ello, en primer lugar
aplicaremos el proceso de regresión lineal simple para determinar tanto la
naturaleza como la fuerza de una relación entre dos variables y segundo lugar la
regresión lineal múltiple con la cual describiremos la relación entre dos o más
variables independientes y una variable dependiente utilizando la ecuación de
regresión múltiple; estas ecuaciones de estimaciones nos permitirá realizar una
interpretación de correlación de la investigación realizada en estas instituciones
educativas. El trabajo de laboratorio constituye una de las mejores metodologías
para la aplicación de modelos estadísticos a las variables de los hechos, es por
eso que se trabaja en este sentido y no otro para la práctica de la unidad 3 de
regresión y determinación
OBJETIVOS

Objetivos Generales
1. Potencializar en el estudiante habilidades y destrezas para caracterizar una
situación mediante el análisis de las medidas estadísticas bivariantes.
2. Calcular e interpretar adecuadamente las medidas estadísticas bivariantes,
asociadas a una situación específica.
3. Determinar la relación entre dos o más variables inscritas en una situación
específica a partir del análisis de regresión lineal simple y múltiple.

Objetivos Específicos
1. Interpretar correctamente los datos de cada tabla propuestos en cada uno
de los ejercicios.
2. Realizar diagramas de dispersión en los ejercicios de laboratorio y
actividades colaborativas que permitan determinar el tipo de asociación
entre las variables escogidas en cada ejercicio.
3. En los ejercicios propuestos de laboratorio y de regresión y correlación
lineal simple crear modelos matemáticos que permita predecir el efecto de
una variable sobre la otra para determinar su fiabilidad.
4. Determinar porcentajes que permitan una explicación de modelo y grado de
relación de dos variables de los ejercicios de laboratorio y de regresión y
correlación lineal simple.
5. En la práctica de regresión y correlación lineal múltiple identificar una
variable cuantitativa dependiente y varias variables independientes del
estudio de investigación, diagramarlas y calcular la recta de regresión y el
coeficiente de correlación para probar estadísticamente su relación.
6. Relacionar o analizar la información obtenida en cada problema planteado
en los ejercicios de laboratorio y colaborativo.
ESTADISTICA DESCRIPTIVA 100105_97
LABORATORIO Y TRABAJO COLABORATIVO
PASO 4- DESCRIPCIÓN DE LA INFORMACIÓN: DETALLAR Y
RELACIONAR VARIABLES DE LA PROBLEMÁTICA UTILIZANDO
MEDIDAS BIVARIANTES.
LABORATORIO REGRESIÓN Y CORRELACIÓN LINEAL
Actividad individual
Aporte por: Ricardo Martínez – CC 1052404207
Ejercicios

1. SE QUIERE ESTUDIAR LA ASOCIACIÓN ENTRE CONSUMO DE SAL Y


TENSIÓN ARTERIAL. A UNA SERIE DE VOLUNTARIOS SE LES ADMINISTRA
DISTINTAS DOSIS DE SAL EN SU DIETA Y SE MIDE SU TENSIÓN ARTERIAL
UN TIEMPO DESPUÉS.

X (sal) Y (Tensión)
1,6 98
2,3 102
3,3 109
4,2 113
4,6 115
5,0 120
Realice el diagrama de dispersión y determine el tipo de asociación entre las
variables
140

120
f(x) = 4.37 x + 94.2
R² = 0.98
100

80
Tension

60 Y (Tensión)
Linear (Y (Tensión) )
40

20

0
0 1 2 3 4 5 6 7
Sal

Figura 1. Diagrama de distribución entre las variables TENSION Y SAL

El tipo de asociación del diagrama de dispersión es LINEAL.

Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?

El modelo matemático que permite predecir el efecto de una variable sobre la otra
es:

y=4.371x + 94.2
R² = 0.979
Se puede asegurar que la ecuación de la recta es confiable porque el R² está
cercano a 1 y tiene un grado alto de confiabilidad.

Determine el grado de relación de las dos variables.

El R² afirma además que el modelo explica el 97.9% de la información y el valor de


r coeficiente de correlación lineal es excelente porque el 0.979 está muy cercano
al extremo 1 positivo que es la correlación perfecta positiva.

Si a un paciente se le administra una dosis de sal de 5,6. ¿Cuál es la tensión


arterial esperada?

Para hallar el valor de la tensión arterial esperada para una dosis de sal de 6.5
debemos reemplazar este valor en la formula hallada.
Y =¿4.371*6.5)+94.2=122.61
Según lo anterior para dicha dosis de sal la tensión arterial esperada es de 126.6
2. EN UN NUEVO PROCESO ARTESANAL DE FABRICACIÓN DE CIERTO
ARTÍCULO QUE ESTÁ IMPLANTADO, SE HA CONSIDERADO QUE ERA
IMPORTANTE IR ANOTANDO PERIÓDICAMENTE EL TIEMPO MEDIO
(MEDIDO EN MINUTOS) QUE SE UTILIZA PARA REALIZAR UNA PIEZA Y EL
NÚMERO DE DÍAS DESDE QUE EMPEZÓ DICHO PROCESO DE
FABRICACIÓN. CON ELLO, SE PRETENDE ANALIZAR COMO LOS
OPERARIOS VAN ADAPTÁNDOSE AL NUEVO PROCESO MEJORANDO
PAULATINAMENTE SU PROCESO DE PRODUCCIÓN.

Los siguientes datos representan dicha situación:

X 12 23 35 42 53 65 70
Y 45 30 27 25 23 21 20

Identifique la variable dependiente (y) y la variable independiente (x), realice


el diagrama de dispersión y determine el tipo de asociación entre las
variables.
50
45
40
35 f(x) = − 0.36 x + 42.57
R² = 0.8
30
25
X

20 Y
15 Linear (Y)
10
5
0
0 10 20 30 40 50 60 70 80
Y

Figura 2. Diagrama de distribución entre las variables X y Y

El tipo de asociación del diagrama de dispersión es LINEAL. Son variables


inversamente proporcionales.

Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?

y = -0.356x + 42.56
R² = 0.796

Se puede asegurar que la ecuación de la recta tiene un grado de confianza


mediana porque el R² está un poco alejado a 1, teniendo entonces un grado
medio alto de confiabilidad.
Determine el grado de correlación de las dos variables.
El R² afirma además que el modelo explica el 79.6% de la información y el valor de
r coeficiente de correlación lineal es sobresaliente porque el 0.796 está un poco
alejado al extremo 1 positivo que es la correlación perfecta positiva.

¿Qué tiempo deberá tardarse un empleado cuando lleven 90 días?


Para hallar el valor del tiempo de 100 días debemos reemplazar este valor en la
formula hallada.
Y = (−0.356∗100 )+ 42.56= 6.96 minutos
Según lo anterior para dicho número de días se espera realizar para una pieza el
obrero se demore 6.96 minutos.

3. Una Nutricionista de un hogar infantil desea encontrar un modelo


matemático que permita determinar la relación entre el peso y la estatura de
sus estudiantes. Para ello selecciona 10 niños y realiza las mediciones
respectivas.
A continuación, se presentan los resultados:

Estatura (cm) 120 124 107 118 112 110 115 104 110 116
Peso (kg) 24 23 19 24 21 19 22 16 20 23

Identifique la variable dependiente (y) y la variable independiente (x), realice


el diagrama de dispersión y determine el tipo de asociación entre las
variables.
30

25
f(x) = 0.39 x − 22.75
R² = 0.83
20
Peso()kg)
15
Peso ( kg)
10 Linear (Peso ( kg))

0
100 105 110 115 120 125 130
Estatura(cm)

Figura 3. Diagrama de distribución entre las variables PESO Y ESTATURA

El tipo de asociación del diagrama de dispersión es LINEAL.


Encuentre el modelo matemático que permite predecir el efecto de una
variable sobre la otra. ¿Es confiable?
y = 0.386x - 22.75
R² = 0.832
Se puede asegurar que la ecuación de la recta es aceptable porque el R² se aleja
un poco de 1 y tiene un grado de confiabilidad aceptable.
c. Determine el grado de correlación de las dos variables.
La correlación lineal es aceptable porque el 0.832 está un poco retirado del 1
positivo.
d. Cuál es el peso que debería tener un estudiante que mida 128 cm?
y = 0.386(128) - 22.75=24.354

Aporte por: Lina María Martínez


1. Se quiere estudiar la asociación entre consumo de sal y tensión arterial. A
una serie de voluntarios se les administra distintas dosis de sal en su dieta
y se mide su tensión arterial un tiempo después.

X (sal) Y (Tensión)
1,6 98
2,3 102
3,3 109
4,2 113
4,6 115
5,0 120

a. Realice el diagrama de dispersión y determine el tipo de asociación entre


las variables.

Diagrama de dispersión
140
120
100
80
Tension

60
40
20
0
0 1 2 3 4 5 6 7
Sal

La relación entre la variable X y Y que se observa en el diagrama de dispersión es


directa de aumento ya que se muestra que a mayor consumo de sal (X) la tensión
(Y) aumenta.
b. Encuentre el modelo matemático que permite predecir el efecto de una
variable sobre la otra. ¿Es confiable?

El modelo matemático a utilizar es la regresión lineal simple ya que esta nos


permite calcular la tensión (Y) sabiendo el nivel sal consumido de la siguiente
manera:
Y = A +B ∙ X .
A= 88.12
B= 6.10
Ahora tomamos distintos valores de X para remplazar en la ecuación y obtenemos
los siguientes resultados:
X= 1.6 valor tensión Y= 97.89
X= 3.3 valor tensión Y= 108.27
X=4.2 valor tensión Y= 113.77
X= 5.0 valor tensión Y= 118.65
Para saber si es confiable el método hallamos un porcentaje de error teniendo en
cuenta el valor obtenido como teórico y los valores suministrados como
experimentales.
valor teorico−valor experimental
% de error= ∙100
valor teorico
Se obtienen los siguientes porcentajes de error:
X= 1.6 un porcentaje de error igual a 0.11%
X= 3.3 un porcentaje de error igual a 0.67%
X=4.2 un porcentaje de error igual a 0.68%
X= 5.0 un porcentaje de error igual a 1.14%
Ya que se obtiene un porcentaje de error muy bajo por método matemático se
puede decir que es confiable para predecir el efecto de una variable sobre otra.
c. Determine el grado de relación de las dos variables.

Por medio de la regresión lineal obtuvimos r= 0.9934808689 por tal razón es una
correlación excelente.
d. Si a un paciente se le administra una dosis de sal de 5,6. ¿Cuál es la
tensión arterial esperada?

Si a un paciente se le suministra una dosis de sal de 5,6 la tensión arterial


esperada es de 122.32 obtenida gracias a la regresión lineal.
2. En un nuevo proceso artesanal de fabricación de cierto artículo que está
implantado, se ha considerado que era importante ir anotando
periódicamente el tiempo medio (medido en minutos) que se utiliza para
realizar una pieza y el número de días desde que empezó dicho proceso de
fabricación. Con ello, se pretende analizar como los operarios van
adaptándose al nuevo proceso mejorando paulatinamente su proceso de
producción.

Los siguientes datos representan dicha situación:


X Y
12 45
23 30
35 27
42 25
53 23
65 21
70 20

a. Identifique la variable dependiente (y) y la variable independiente (x), realice


el diagrama de dispersión y determine el tipo de asociación entre las
variables

Variable dependiente: Y
Variable independiente: X

Diagrama de dispersión.
50
45
40
35
30
25
20
15
10
5
0
0 10 20 30 40 50 60 70 80

El tipo de asociación entre las variables es inversa.


b. Encuentre el modelo matemático que permite predecir el efecto de una
variable sobre la otra. ¿Es confiable?

El modelo matemático a utilizar es la regresión potencial ya que esta nos permite


calcular X y Y.

Y = A × Xb
A= 126.104
B= -0.4331
Ahora tomamos distintos valores de X para remplazar en la ecuación y obtenemos
los siguientes resultados:
X= 12 Y= 42.98
X= 23 Y= 32.42
X= 35 Y= 27.03
X= 42 Y= 24.98
X= 53 Y= 22.58
X= 65 Y= 20.67
X= 70 Y= 20.02
Para saber si es confiable el método hallamos un porcentaje de error teniendo en
cuenta el valor obtenido como teórico y los valores suministrados como
experimentales.
valor teorico−valor experimental
% de error= ∙100
valor teorico
X= 12 un porcentaje de error igual a 4.69%
X= 23 un porcentaje de error igual a 7.46%
X= 35 un porcentaje de error igual a 0.11%
X= 42 un porcentaje de error igual a 0.08%
X= 53 un porcentaje de error igual a 1.86%
X= 65 un porcentaje de error igual a 1.59%
X= 70 un porcentaje de error igual a 0.09%
Ya que solo es inconsistente en unos datos en el porcentaje de error por este
método matemático se puede decir que es confiable para predecir el efecto de una
variable sobre otra.
c. Determine el grado de correlación de las dos variables.

Por medio de la regresión potencial obtuvimos r= -0.990311 por tal razón es una
correlación aceptable.
d. ¿Que tiempo deberá tardarse un empleado cuando lleven 90 días?

El tiempo que debe dársele a un empleado cuando lleva 90 días es de 18 minutos.

3. Una Nutricionista de un hogar infantil desea encontrar un modelo


matemático que permita determinar la relación entre el peso y la estatura de
sus estudiantes. Para ello selecciona 10 niños y realiza las mediciones
respectivas.

A continuación, se presentan los resultados:


Estatura (cm) Peso (kg)
120 24
124 23
107 19
118 24
112 21
110 19
115 22
104 16
110 20
116 23

a. Identifique la variable dependiente (y) y la variable independiente (x), realice


el diagrama de dispersión y determine el tipo de asociación entre las
variables

Variable dependiente: Y
Variable independiente: X

Diagrama de dispersión.
30

25

20
Peso (Kg)

15

10

0
100 105 110 115 120 125 130
Estatura (cm)

El tipo de asociación entre las variables es Directa.


b. Encuentre el modelo matemático que permite predecir el efecto de una
variable sobre la otra. ¿Es confiable?

El modelo matemático a utilizar es la regresión lineal simple ya que esta nos


permite calcular X y Y.
Y = A +B ∙ X.
A= -22.75
B= 0.38
Ahora tomamos distintos valores de X para remplazar en la ecuación y obtenemos
los siguientes resultados:
X= 120 Y= 23.57
X= 124 Y= 25.11
X= 107 Y= 18.55
X= 118 Y= 22.79
X= 112 Y= 20.48
X= 110 Y= 19.71
X= 115 Y= 21.64
X= 104 Y= 17.39
X= 110 Y= 19.71
X= 116 Y= 22.02
Para saber si es confiable el método hallamos un porcentaje de error teniendo en
cuenta el valor obtenido como teórico y los valores suministrados como
experimentales.
valor teorico−valor experimental
% de error= ∙100
valor teorico
Se obtienen los siguientes porcentajes de error:
X= 120 un porcentaje de error igual a 1.82%
X= 124 un porcentaje de error igual a 8.4%
X= 107 un porcentaje de error igual a 2.42%
X= 118 un porcentaje de error igual a 5.30%
X= 112 un porcentaje de error igual a 2.53%
X= 110 un porcentaje de error igual a 3.60%
X= 115 un porcentaje de error igual a 1.66%
X= 104 un porcentaje de error igual a 7.99%
X= 110 un porcentaje de error igual a 3.60%
X= 116 un porcentaje de error igual a 4.45%
Debido a que el porcentaje de error no es tan alto se puede decir que es confiable
para predecir el efecto de una variable sobre otra.
c. Determine el grado de correlación de las dos variables.

Por medio de la regresión lineal obtuvimos r= 0.91266241211 por tal razón es una
correlación excelente.
d. ¿Cuál es el peso que debería tener un estudiante que mida 128 cm?

El peso que debería tener un estudiante que mide 128cm es de 27 kg.

Aporte por: Juan Camilo Cely

1. Se quiere estudiar la asociación entre consumo de sal y tensión arterial. A


una serie de voluntarios que se les administra distintas dosis de sal en su
dieta y se mide su tensión arterial un tiempo después.

X (Sal) Y (Tensión)
1,6 98
2,3 102
3,3 109
4,2 113
4,6 115
5,0 120

a. Realice el diagrama de dispersión y determine el tipo de asociación entre


las variables.

Consumo de sal y tensión arterial


140
120
100
Tensión arterial

80
60
40
20
0
1 1.5 2 2.5 3 3.5 4 4.5 5 5.5
Consumo de sal
El tipo de asociación entre las variables es directo, ya que a medida que
aumenta el consumo de sal (X) también lo hace la tensión arterial (Y).

b. Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?

y = 6,1062x + 88,128
R² = 0,987 coeficiente de determinación

El modelo tiene es de gran confiabilidad con valor del 98,7%

c. Determine el grado de relación de las dos variables.

R = 0.99348087 coeficiente de correlación. El grado de correlación es


excelente.

d. Si a un paciente se le administra una dosis de sal de 5,6. ¿Cuál es la


tensión arterial esperada?

y = 6,1062x + 88,128

y = 6,1062(5,6) + 88,128

y = 34,19472+ 88,128

y = 122,32272

La tensión arterial esperada es de 122,322 para una dosis de sal de 5,6.

2. En un nuevo proceso artesanal de fabricación de cierto artículo que está


implantado, se ha considerado que era importante ir anotando
periódicamente el tiempo medio (medido en minutos) que se utiliza para
realizar una pieza y el número de días desde que empezó dicho proceso de
fabricación. Con ello, se pretende analizar como los operarios van
adaptándose al nuevo proceso mejorando paulatinamente su proceso de
producción.
Los siguientes datos representan dicha situación:
X 12 23 35 42 53 65 70
Y 45 30 27 25 23 21 20
a. Identifique la variable dependiente (y) y la variable independiente (x),
realice el diagrama de dispersión y determine el tipo de asociación entre
las variables

Variable Y (tiempo medio para realizar una pieza) dependiente de variable


X (días transcurridos desde que se aprendió el proceso de fabricación).

Tiempo empleado para fabricar según días


transcurridos usando la misma técnica
50
45
40
Tiempo empleado

35
30
25
20
15
10
5
0
0 10 20 30 40 50 60 70 80
Días transcurridos

El tipo de asociación entre las variables es inverso, ya que son


inversamente proporcionales.

b. Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?

y = -0,3566x + 42,569
R² = 0,7963 coeficiente de determinación

El modelo tiene una confiabilidad aceptable de 79,63%

c. Determine el grado de correlación de las dos variables.

R= 0.89235 coeficiente de correlación. El grado de correlación es


aceptable.

d. ¿Qué tiempo deberá tardarse un empleado cuando lleven 90 días?


y = -0,3566x + 42,569

y = -0,3566(90) + 42,569

y = -32,094 + 42,569

El tiempo empleado para un empleado a los 90 días será de y = 10,475


minutos.

3. Una nutricionista de un hogar infantil desea encontrar un modelo


matemático que permita determinar la relación entre el peso y la estatura de
sus estudiantes. Para ellos selecciona 10 niños y realiza las mediciones
respectivas.
A continuación, se presentan los resultados:

Estatur 120 124 107 118 112 110 115 104 110 116
a (cm)
Peso 24 23 19 24 21 19 22 16 20 23
(kg)
a. Identifique la variable dependiente (y) y la variable independiente (x), realice
el diagrama de dispersión y determine el tipo de asociación entre las
variables

Peso (kg)
30

25

20
Axis Title

15

10

0
100 105 110 115 120 125 130
Axis Title
El tipo de asociación entre las variables es Directo, ya que son directamente
proporcionales.

b. Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?

y = 0,386x - 22,751
R² = 0,8329. El modelo tiene una confiabilidad del 83,29%.

c. Determine el grado de correlación de las dos variables.

R= 0,9126. El grado de correlación es excelente.

d. ¿Cuál es el peso que debería tener un estudiante que mida 128 cm?

y = 0,386(128) - 22,751

y = 49,408 - 22,751

y = 26,657

El peso que debería tener un estudiante que mida 128cm será de 26,657 kg.

TRABAJO COLABORATIVO
Aporte Ricardo Martínez – CC 1052404207

- Participar En el foro Paso 4- Descripción de la información, que se


encuentra en Entorno de Aprendizaje Colaborativo.
Regresión y Correlación lineal Simple A partir de la base de datos:
1. Identificar dos variables cuantitativas de la situación estudiada que
puedan estar relacionadas.
Variables seleccionadas: GASTO EN DEFENSA Y SEGURIDAD
COLOMBIA Y GASTO EN DEFENSA Y SEGURIDAD COLOMBIA
PERCÁPITA

GASTO EN DEFENSA Y SEGURIDAD GASTO EN DEFENSA Y SEGURIDAD


COLOMBIA COLOMBIA PERCÁPITA
930297398000 21432
930907040000 21447
945646042000 21786
973586647000 22430
984986702000 22692
1000296660000 23045
GASTO EN DEFENSA Y SEGURIDAD GASTO EN DEFENSA Y SEGURIDAD
COLOMBIA COLOMBIA PERCÁPITA
1090946473000 25134
1137336556000 26202
1203975384000 27738
1242964507000 28636
1251036750000 28822
1253615208000 28881
991743027000 22577
1052121201000 23952
1056599089000 24054
1074164468000 24453
1120264662000 25503
1140977760000 25974
1169610451000 26626
1263487853000 28763
1320338397000 30058
1322692233000 30111
1328188077000 30236
1349860034000 30730
1428183046000 32129
1447474515000 32563
1494470371000 33621
1496777889000 33672
1504949556000 33856
1505141872000 33861
1521330214000 34225
1532770950000 34482
1542576688000 34703
1542654662000 34704
1593811071000 35855
1611411721000 36251
1556419048000 34603
1582692569000 35187
1617274677000 35956
1662719957000 36967
1666490584000 37051
1667248878000 37067
1704358187000 37892
1735058941000 38575
1738409852000 38650
GASTO EN DEFENSA Y SEGURIDAD GASTO EN DEFENSA Y SEGURIDAD
COLOMBIA COLOMBIA PERCÁPITA
1812748961000 40302
1816140263000 40378
1844125957000 41000
1535045794000 33730
1556728140000 34207
1563206205000 34349
1583492740000 34795
1595444146000 35057
1619146801000 35578
1692873981000 37198
1739330590000 38219
1748092023000 38412
1778951441000 39090
1818569870000 39960
1821216679000 40018
1626506239000 35325
1654924863000 35942
1659855091000 36049
1675891403000 36397
1681624486000 36522
1748980725000 37984
1756725512000 38153
1772587672000 38497
1834302387000 39838
1857727271000 40346
1872057842000 40657
1881842638000 40870
1639611249000 35227
1677226350000 36035
1706698678000 36668
1796985625000 38608
1823707230000 39182
1840629953000 39546
1865077150000 40071
1869120621000 40158
1881476337000 40423
1905121693000 40931
1911136585000 41060
1939944070000 41679
2. Realizar el diagrama de dispersión de dichas variables y determinar el
tipo de asociación entre las variables.
45000
40000 f(x) = 0 x + 3245.41
R² = 0.99
Gasto en defensa y seguridad
35000
30000
25000
20000
15000
10000
5000
0
500000000000 1000000000000 1500000000000 2000000000000 2500000000000
Gasto en defensa y seguridad en Colombia Per capita

Figura 4. Diagrama de distribución entre las variables GASTO EN DEFENSA Y


SEGURIDAD EN COLOMBIA PER CAPITA y GASTO EN DEFENSA Y
SEGURIDAD
El tipo de asociación del diagrama de dispersión es LINEAL. Es una relación lineal
positiva que indica que entre las variables existe una relación directa es decir los
valores menores de GASTO EN DEFENSA Y SEGURIDAD COLOMBIA están
asociados a los valores menores de GASTO EN DEFENSA SEGURIDAD
COLOMBIA PERCÁPITA y viceversa.

3. - Encuentre el modelo matemático que permite predecir el efecto de


una variable sobre la otra. ¿Es confiable?
El modelo matemático que permite predecir el efecto de una variable sobre
la otra es:

y = 2E-08x + 3245,4
R² = 0,9943
Se puede asegurar que la ecuación de la recta es confiable porque el R²
está cercano a 1 y tiene un grado alto de confiabilidad.
4. Determine el porcentaje de explicación del modelo y el grado de
relación de las dos variables. - Relacionar la información obtenida con
el problema.
El R² afirma además que el modelo explica el 99.4% de la información y el
valor de r coeficiente de correlación lineal es excelente porque el 0.994 está
muy cercano al extremo 1 positivo que es la correlación perfecta positiva.
Mediante el análisis del diagrama de dispersión se puede determinar que el
gasto de defensa total se encuentra directamente proporcional al mismo
tipo de gasto per cápita o por persona durante el periodo de tiempo
comprendido entre 2006-2012 en la problemática de las víctimas del
conflicto.

Aporte por: Lina María Martínez


1. Identificar dos variables cuantitativas de la situación estudiada que
puedan estar relacionadas.
Variables seleccionadas: efectivos de fuerza pública disponibles Colombia y minas
anti persona.

minas anti persona


efectivos de fuerza pública
disponibles Colombia
6
350488
1
351129
9
352171
5
355681
7
357113
14
357213
15
357606
8
358033
15
358363
11
358414
2
358458
2
361013
2
363119
5
363589
1
367869
2
368141
5
368374
4
369661
2
369719
2
371549
3
371654
2
371766
4
373732
2
374032
2
377984
1
378771
1
379339
4
379430
2
379674
2
382802
2
384498
3
385640
2
385904
1
386634
2
387000
2
387226
2
391414
4
391986
1
393097
1
394267
2
395717
3
398293
2
398351
2
398665
2
399493
3
399502
2
399516
3
400562
2
403632
2
403925
1
404898
2
405837
2
406771
3
407217
1
408833
3
409567
3
410815
3
412550
2
413073
3
414072
1
415242
4
415455
3
415997
4
416181
4
416664
3
419366
3
419523
2
419621
4
420432
4
421819
4
421864
3
422600
2
423810
2
428796
3
432890
4
434453
4
435939
4
436745
1
437154
4
440608
1
440647
4
440997
1
443239
3
445565

2. Realizar el diagrama de dispersión de dichas variables y determinar el


tipo de asociación entre las variables.
Efectivos de fuerza publica disponibles en COlombia.

500000
450000
400000
f(x) = − 3391.41 x + 406876.81
350000 R² = 0.13
300000
250000
200000
150000
100000
50000
0
0 2 4 6 8 10 12 14 16
Minas anti persona.

El tipo de asociación del diagrama de dispersión es LINEAL.


3. Encuentre el modelo matemático que permite predecir el efecto de
una variable sobre la otra. ¿Es confiable?
El modelo matemático que permite predecir el efecto de una variable sobre la otra
es:
y=−3391,4 x+ 406877

R2=0,1293
En este caso se puede asegurar que la ecuación de la recta no es tan confiable
porque el R² no está cercano a 1 por tal razón no tiene alto grado de confiabilidad.

Aporte por: Juan Camilo Cely Vásquez – CC 1053610066

- Identificar dos variables cuantitativas de la situación estudiada que puedan


estar relacionadas.

efectivos de
fuerza pública
disponibles gasto en defensa y seguridad
Colombia Colombia per cápita
350488 21432
351129 21447
352171 21786
355681 22430
357113 22692
357213 23045
357606 25134
358033 26202
358363 27738
358414 28636
358458 28822
361013 28881
363119 22577
363589 23952
367869 24054
368141 24453
368374 25503
369661 25974
369719 26626
371549 28763
371654 30058
371766 30111
373732 30236
374032 30730
377984 32129
378771 32563
379339 33621
379430 33672
379674 33856
382802 33861
384498 34225
385640 34482
385904 34703
386634 34704
387000 35855
387226 36251
391414 34603
391986 35187
393097 35956
394267 36967
395717 37051
398293 37067
398351 37892
398665 38575
399493 38650
399502 40302
399516 40378
400562 41000
403632 33730
403925 34207
404898 34349
405837 34795
406771 35057
407217 35578
408833 37198
409567 38219
410815 38412
412550 39090
413073 39960
414072 40018
415242 35325
415455 35942
415997 36049
416181 36397
416664 36522
419366 37984
419523 38153
419621 38497
420432 39838
421819 40346
421864 40657
422600 40870
423810 35227
428796 36035
432890 36668
434453 38608
435939 39182
436745 39546
437154 40071
440608 40158
440647 40423
440997 40931
443239 41060
445565 41679

- Realizar el diagrama de dispersión de dichas variables y determinar el tipo


de asociación entre las variables.

Gasto en defensa y seguridad colombia percápita según efectivos de fuerza


gasto en defensa y seguridad colombia percápita

pública disponibles.
45000
40000 f(x) = 0.19 x − 41954.61
R² = 0.77
35000
30000
25000
20000
15000
10000
5000
0
340000 360000 380000 400000 420000 440000 460000
efectivos de fuerza pública disponibles Colombia

El tipo de asociación entre las variables es Directo. Ya que a medida que una
aumenta la otra también lo hace.
- Encuentre el modelo matemático que permite predecir el efecto de una
variable sobre la otra. ¿Es confiable?
y = 0,1919x - 41955
R² = 0,7717. El modelo tiene una confiabilidad del 77,17%. Aceptable.
- Determine el porcentaje de explicación del modelo y el grado de relación de
las dos variables.
R² = 0,7717
R = 0,8784
El grado de correlación entre las variables es aceptable ya que el valor de R
está entre 0,80 y 0,90.
- Relacionar la información obtenida con el problema.
El gasto en defensa y seguridad en Colombia per cápita es un valor que
cambia y se relaciona con el número de efectivos de fuerza pública
disponibles, ya que para mantener el número de efectivos que puedan
garantizar la seguridad en el país, se utilizará parte del gasto per cápita en el
sostenimiento de estos.

CONCLUSIONES

Pude evidenciar que para manejar cualquier tipo de variables se necesita


realizar un diagrama de dispersión y aplicar conceptos, fórmulas de relación y
correlación que permita el despeje de las ecuaciones y datos para obtener un
resultado.

Los ejemplos me muestran que son acordes a un tipo de forma lineal y la


correlación es confiable para los tipos de datos.

Hallé los comportamientos que tienen tendencia lineal y determinamos el grado


de correlación entre las variables.

REFERENCIAS BIBLIOGRAFICAS
Pava, M. (2017). ESTADÍSTICA DESCRIPTIVA. [online]

Estadisticadescriptivaunad100105.blogspot.com.co. Available at:

http://estadisticadescriptivaunad100105.blogspot.com.co/ [Accessed 22 jun. 2017].

Robles Fabián, D. (2017). Regresión múltiple - Monografias.com. [online]

Monografias.com. Available at: http://www.monografias.com/trabajos30/regresion-

multiple/regresion-multiple.shtml [Accessed 22 jun. 2017].

También podría gustarte