Está en la página 1de 32

ESTADISTICA 100105_97

LABORATORIO REGRESIN Y CORRELACIN LINEAL

Por
RICARDO ANDRES MARTINEZ PEA
LINA MARA MARTNEZ MOLANO
JUAN CAMILO CELY

Presentado a
MARIA JOSE CHARFUELAN
Tutor

Universidad Nacional Abierta y a Distancia UNAD


CEAD SOGAMOSO
ECBTI
2017
INTRODUCCION

En base a un registro histrico de datos sobre la problemtica de las vctimas del conflicto se

presenta las soluciones de las actividades planteadas. La investigacin estadstica es una

actividad que apela a diversas tcnicas con el propsito de llegar a la esencia de la realidad.

La regresin lineal simple y la regresin lineal mltiple son tcnicas de anlisis de las

variables de una investigacin estadstica, en este caso desde la encuesta realizada. Si bien

es cierto estas tcnicas mencionadas se pueden utilizar para solucionar problemas comunes

en los negocios o para evaluar el comportamiento de su economa y en general se utiliza con

mayor frecuencia en las ciencias econmicas, tambin es cierto que en muchos casos se

requiere conocer ms que el comportamiento de una sola variable para entender una

investigacin cualquiera sea su especia. Entonces, sin importar la situacin presentada se

hace necesario que practiquemos estas tcnicas de regresin por medio de ejercicios salientes

de la cotidianidad, a continuacin, veremos pues los resultados de dicha prctica.

La realizacin de este trabajo es dar a conocer y poner en prctica la regresin y correlacin

y medias de dispersin y estadsticas bivariantes sobre la unidad 2 de este curso, adems de

los comportamientos que se dan en el plano cartesiano tanto en las variables, como los grados

y resultados que se manejan para los ejemplos que se plantean en el laboratorio propuesto,

que es de vital importancia reconocer y manejar las frmulas que se obtienen de la

herramienta de Excel.
JUSTIFICACIN

Partiendo de una base de datos sobre la problemtica de las vctimas del conflicto se presenta
las soluciones de las actividades planteadas dentro del periodo histrico comprendido entre
los aos 2006 a 2012. Para ello, en primer lugar aplicaremos el proceso de regresin lineal
simple para determinar tanto la naturaleza como la fuerza de una relacin entre dos variables
y segundo lugar la regresin lineal mltiple con la cual describiremos la relacin entre dos o
ms variables independientes y una variable dependiente utilizando la ecuacin de regresin
mltiple; estas ecuaciones de estimaciones nos permitir realizar una interpretacin de
correlacin de la investigacin realizada en estas instituciones educativas. El trabajo de
laboratorio constituye una de las mejores metodologas para la aplicacin de modelos
estadsticos a las variables de los hechos, es por eso que se trabaja en este sentido y no otro
para la prctica de la unidad 3 de regresin y determinacin
OBJETIVOS

Objetivos Generales
1. Potencializar en el estudiante habilidades y destrezas para caracterizar una situacin
mediante el anlisis de las medidas estadsticas bivariantes.
2. Calcular e interpretar adecuadamente las medidas estadsticas bivariantes, asociadas
a una situacin especfica.
3. Determinar la relacin entre dos o ms variables inscritas en una situacin especfica
a partir del anlisis de regresin lineal simple y mltiple.

Objetivos Especficos
1. Interpretar correctamente los datos de cada tabla propuestos en cada uno de los
ejercicios.
2. Realizar diagramas de dispersin en los ejercicios de laboratorio y actividades
colaborativas que permitan determinar el tipo de asociacin entre las variables
escogidas en cada ejercicio.
3. En los ejercicios propuestos de laboratorio y de regresin y correlacin lineal simple
crear modelos matemticos que permita predecir el efecto de una variable sobre la
otra para determinar su fiabilidad.
4. Determinar porcentajes que permitan una explicacin de modelo y grado de relacin
de dos variables de los ejercicios de laboratorio y de regresin y correlacin lineal
simple.
5. En la prctica de regresin y correlacin lineal mltiple identificar una variable
cuantitativa dependiente y varias variables independientes del estudio de
investigacin, diagramarlas y calcular la recta de regresin y el coeficiente de
correlacin para probar estadsticamente su relacin.
6. Relacionar o analizar la informacin obtenida en cada problema planteado en los
ejercicios de laboratorio y colaborativo.
ESTADISTICA DESCRIPTIVA 100105_97
LABORATORIO Y TRABAJO COLABORATIVO
PASO 4- DESCRIPCIN DE LA INFORMACIN: DETALLAR Y
RELACIONAR VARIABLES DE LA PROBLEMTICA UTILIZANDO
MEDIDAS BIVARIANTES.
LABORATORIO REGRESIN Y CORRELACIN LINEAL
Actividad individual
Aporte por: Ricardo Martnez CC 1052404207
Ejercicios

1. SE QUIERE ESTUDIAR LA ASOCIACIN ENTRE CONSUMO DE SAL Y


TENSIN ARTERIAL. A UNA SERIE DE VOLUNTARIOS SE LES ADMINISTRA
DISTINTAS DOSIS DE SAL EN SU DIETA Y SE MIDE SU TENSIN ARTERIAL
UN TIEMPO DESPUS.

X (sal) Y (Tensin)
1,6 98
2,3 102
3,3 109
4,2 113
4,6 115
5,0 120
Realice el diagrama de dispersin y determine el tipo de asociacin entre las variables
140
y = 4.3714x + 94.2
120 R = 0.9793

100
Tension

80

60 Y (Tensin)
Linear (Y (Tensin) )
40

20

0
0 2 4 6 8
Sal

Figura 1. Diagrama de distribucin entre las variables TENSION Y SAL


El tipo de asociacin del diagrama de dispersin es LINEAL.

Encuentre el modelo matemtico que permite predecir el efecto de una variable sobre
la otra. Es confiable?

El modelo matemtico que permite predecir el efecto de una variable sobre la otra es:

y=4.371x + 94.2
R = 0.979
Se puede asegurar que la ecuacin de la recta es confiable porque el R est cercano a 1 y
tiene un grado alto de confiabilidad.

Determine el grado de relacin de las dos variables.

El R afirma adems que el modelo explica el 97.9% de la informacin y el valor de r


coeficiente de correlacin lineal es excelente porque el 0.979 est muy cercano al extremo
1 positivo que es la correlacin perfecta positiva.

Si a un paciente se le administra una dosis de sal de 5,6. Cul es la tensin arterial


esperada?

Para hallar el valor de la tensin arterial esperada para una dosis de sal de 6.5 debemos
reemplazar este valor en la formula hallada.
= (4.371*6.5)+94.2=122.61
Segn lo anterior para dicha dosis de sal la tensin arterial esperada es de 126.6
2. EN UN NUEVO PROCESO ARTESANAL DE FABRICACIN DE CIERTO
ARTCULO QUE EST IMPLANTADO, SE HA CONSIDERADO QUE ERA
IMPORTANTE IR ANOTANDO PERIDICAMENTE EL TIEMPO MEDIO
(MEDIDO EN MINUTOS) QUE SE UTILIZA PARA REALIZAR UNA PIEZA Y EL
NMERO DE DAS DESDE QUE EMPEZ DICHO PROCESO DE
FABRICACIN. CON ELLO, SE PRETENDE ANALIZAR COMO LOS
OPERARIOS VAN ADAPTNDOSE AL NUEVO PROCESO MEJORANDO
PAULATINAMENTE SU PROCESO DE PRODUCCIN.

Los siguientes datos representan dicha situacin:

X 12 23 35 42 53 65 70
Y 45 30 27 25 23 21 20

Identifique la variable dependiente (y) y la variable independiente (x), realice el


diagrama de dispersin y determine el tipo de asociacin entre las variables.
50
45 y = -0.3566x + 42.569
40 R = 0.7963
35
30
25
X
Y
20
15 Linear (Y)
10
5
0
0 20 40 60 80
Y

Figura 2. Diagrama de distribucin entre las variables X y Y

El tipo de asociacin del diagrama de dispersin es LINEAL. Son variables inversamente


proporcionales.

Encuentre el modelo matemtico que permite predecir el efecto de una variable sobre
la otra. Es confiable?

y = -0.356x + 42.56
R = 0.796

Se puede asegurar que la ecuacin de la recta tiene un grado de confianza mediana porque el
R est un poco alejado a 1, teniendo entonces un grado medio alto de confiabilidad.

Determine el grado de correlacin de las dos variables.


El R afirma adems que el modelo explica el 79.6% de la informacin y el valor de r
coeficiente de correlacin lineal es sobresaliente porque el 0.796 est un poco alejado al
extremo 1 positivo que es la correlacin perfecta positiva.

Qu tiempo deber tardarse un empleado cuando lleven 90 das?


Para hallar el valor del tiempo de 100 das debemos reemplazar este valor en la formula
hallada.
= (. ) + . = 6.96 minutos
Segn lo anterior para dicho nmero de das se espera realizar para una pieza el obrero se
demore 6.96 minutos.
3. Una Nutricionista de un hogar infantil desea encontrar un modelo matemtico que
permita determinar la relacin entre el peso y la estatura de sus estudiantes. Para ello
selecciona 10 nios y realiza las mediciones respectivas.
A continuacin, se presentan los resultados:

Estatura (cm) 120 124 107 118 112 110 115 104 110 116
Peso (kg) 24 23 19 24 21 19 22 16 20 23

Identifique la variable dependiente (y) y la variable independiente (x), realice el


diagrama de dispersin y determine el tipo de asociacin entre las variables.

30
y = 0.386x - 22.751
25 R = 0.8329

20
Peso()kg)

15
Peso ( kg)
10 Linear (Peso ( kg))

0
100 105 110 115 120 125
Estatura(cm)

Figura 3. Diagrama de distribucin entre las variables PESO Y ESTATURA

El tipo de asociacin del diagrama de dispersin es LINEAL.


Encuentre el modelo matemtico que permite predecir el efecto de una variable sobre
la otra. Es confiable?
y = 0.386x - 22.75
R = 0.832
Se puede asegurar que la ecuacin de la recta es aceptable porque el R se aleja un poco de
1 y tiene un grado de confiabilidad aceptable.
c. Determine el grado de correlacin de las dos variables.
La correlacin lineal es aceptable porque el 0.832 est un poco retirado del 1 positivo.
d. Cul es el peso que debera tener un estudiante que mida 128 cm?
y = 0.386(128) - 22.75=24.354
Aporte por: Lina Mara Martnez
1. Se quiere estudiar la asociacin entre consumo de sal y tensin arterial. A una serie
de voluntarios se les administra distintas dosis de sal en su dieta y se mide su tensin
arterial un tiempo despus.

X (sal) Y (Tensin)
1,6 98
2,3 102
3,3 109
4,2 113
4,6 115
5,0 120

a. Realice el diagrama de dispersin y determine el tipo de asociacin entre las


variables.

Diagrama de dispersin
140
120
100
Tension

80
60
40
20
0
0 1 2 3 4 5 6 7
Sal

La relacin entre la variable X y Y que se observa en el diagrama de dispersin es directa de


aumento ya que se muestra que a mayor consumo de sal (X) la tensin (Y) aumenta.
b. Encuentre el modelo matemtico que permite predecir el efecto de una variable sobre
la otra. Es confiable?

El modelo matemtico a utilizar es la regresin lineal simple ya que esta nos permite calcular
la tensin (Y) sabiendo el nivel sal consumido de la siguiente manera:
= + .
A= 88.12
B= 6.10
Ahora tomamos distintos valores de X para remplazar en la ecuacin y obtenemos los
siguientes resultados:
X= 1.6 valor tensin Y= 97.89
X= 3.3 valor tensin Y= 108.27
X=4.2 valor tensin Y= 113.77
X= 5.0 valor tensin Y= 118.65
Para saber si es confiable el mtodo hallamos un porcentaje de error teniendo en cuenta el
valor obtenido como terico y los valores suministrados como experimentales.

% = 100

Se obtienen los siguientes porcentajes de error:
X= 1.6 un porcentaje de error igual a 0.11%
X= 3.3 un porcentaje de error igual a 0.67%
X=4.2 un porcentaje de error igual a 0.68%
X= 5.0 un porcentaje de error igual a 1.14%
Ya que se obtiene un porcentaje de error muy bajo por mtodo matemtico se puede decir
que es confiable para predecir el efecto de una variable sobre otra.
c. Determine el grado de relacin de las dos variables.

Por medio de la regresin lineal obtuvimos r= 0.9934808689 por tal razn es una correlacin
excelente.
d. Si a un paciente se le administra una dosis de sal de 5,6. Cul es la tensin arterial
esperada?

Si a un paciente se le suministra una dosis de sal de 5,6 la tensin arterial esperada es de


122.32 obtenida gracias a la regresin lineal.
2. En un nuevo proceso artesanal de fabricacin de cierto artculo que est implantado,
se ha considerado que era importante ir anotando peridicamente el tiempo medio
(medido en minutos) que se utiliza para realizar una pieza y el nmero de das desde
que empez dicho proceso de fabricacin. Con ello, se pretende analizar como los
operarios van adaptndose al nuevo proceso mejorando paulatinamente su proceso de
produccin.

Los siguientes datos representan dicha situacin:


X Y
12 45
23 30
35 27
42 25
53 23
65 21
70 20

a. Identifique la variable dependiente (y) y la variable independiente (x), realice el


diagrama de dispersin y determine el tipo de asociacin entre las variables

Variable dependiente: Y
Variable independiente: X

Diagrama de dispersin.
50
45
40
35
30
25
20
15
10
5
0
0 10 20 30 40 50 60 70 80

El tipo de asociacin entre las variables es inversa.


b. Encuentre el modelo matemtico que permite predecir el efecto de una variable sobre
la otra. Es confiable?

El modelo matemtico a utilizar es la regresin potencial ya que esta nos permite calcular X
y Y.
=
A= 126.104
B= -0.4331
Ahora tomamos distintos valores de X para remplazar en la ecuacin y obtenemos los
siguientes resultados:
X= 12 Y= 42.98
X= 23 Y= 32.42
X= 35 Y= 27.03
X= 42 Y= 24.98
X= 53 Y= 22.58
X= 65 Y= 20.67
X= 70 Y= 20.02
Para saber si es confiable el mtodo hallamos un porcentaje de error teniendo en cuenta el
valor obtenido como terico y los valores suministrados como experimentales.

% = 100

X= 12 un porcentaje de error igual a 4.69%
X= 23 un porcentaje de error igual a 7.46%
X= 35 un porcentaje de error igual a 0.11%
X= 42 un porcentaje de error igual a 0.08%
X= 53 un porcentaje de error igual a 1.86%
X= 65 un porcentaje de error igual a 1.59%
X= 70 un porcentaje de error igual a 0.09%
Ya que solo es inconsistente en unos datos en el porcentaje de error por este mtodo
matemtico se puede decir que es confiable para predecir el efecto de una variable sobre otra.
c. Determine el grado de correlacin de las dos variables.

Por medio de la regresin potencial obtuvimos r= -0.990311 por tal razn es una correlacin
aceptable.
d. Que tiempo deber tardarse un empleado cuando lleven 90 das?

El tiempo que debe drsele a un empleado cuando lleva 90 das es de 18 minutos.

3. Una Nutricionista de un hogar infantil desea encontrar un modelo matemtico que


permita determinar la relacin entre el peso y la estatura de sus estudiantes. Para ello
selecciona 10 nios y realiza las mediciones respectivas.

A continuacin, se presentan los resultados:


Estatura (cm) Peso (kg)
120 24
124 23
107 19
118 24
112 21
110 19
115 22
104 16
110 20
116 23

a. Identifique la variable dependiente (y) y la variable independiente (x), realice el


diagrama de dispersin y determine el tipo de asociacin entre las variables

Variable dependiente: Y
Variable independiente: X

Diagrama de dispersin.
30

25

20
Peso (Kg)

15

10

0
100 105 110 115 120 125
Estatura (cm)

El tipo de asociacin entre las variables es Directa.


b. Encuentre el modelo matemtico que permite predecir el efecto de una variable sobre
la otra. Es confiable?

El modelo matemtico a utilizar es la regresin lineal simple ya que esta nos permite calcular
X y Y.
= + .
A= -22.75
B= 0.38
Ahora tomamos distintos valores de X para remplazar en la ecuacin y obtenemos los
siguientes resultados:
X= 120 Y= 23.57
X= 124 Y= 25.11
X= 107 Y= 18.55
X= 118 Y= 22.79
X= 112 Y= 20.48
X= 110 Y= 19.71
X= 115 Y= 21.64
X= 104 Y= 17.39
X= 110 Y= 19.71
X= 116 Y= 22.02
Para saber si es confiable el mtodo hallamos un porcentaje de error teniendo en cuenta el
valor obtenido como terico y los valores suministrados como experimentales.

% = 100

Se obtienen los siguientes porcentajes de error:
X= 120 un porcentaje de error igual a 1.82%
X= 124 un porcentaje de error igual a 8.4%
X= 107 un porcentaje de error igual a 2.42%
X= 118 un porcentaje de error igual a 5.30%
X= 112 un porcentaje de error igual a 2.53%
X= 110 un porcentaje de error igual a 3.60%
X= 115 un porcentaje de error igual a 1.66%
X= 104 un porcentaje de error igual a 7.99%
X= 110 un porcentaje de error igual a 3.60%
X= 116 un porcentaje de error igual a 4.45%
Debido a que el porcentaje de error no es tan alto se puede decir que es confiable para predecir
el efecto de una variable sobre otra.
c. Determine el grado de correlacin de las dos variables.

Por medio de la regresin lineal obtuvimos r= 0.91266241211 por tal razn es una correlacin
excelente.
d. Cul es el peso que debera tener un estudiante que mida 128 cm?

El peso que debera tener un estudiante que mide 128cm es de 27 kg.

Aporte por: Juan Camilo Cely

1. Se quiere estudiar la asociacin entre consumo de sal y tensin arterial. A una serie
de voluntarios que se les administra distintas dosis de sal en su dieta y se mide su
tensin arterial un tiempo despus.

X (Sal) Y (Tensin)
1,6 98
2,3 102
3,3 109
4,2 113
4,6 115
5,0 120

a. Realice el diagrama de dispersin y determine el tipo de asociacin entre las


variables.

Consumo de sal y tensin arterial


140
120
Tensin arterial

100
80
60
40
20
0
0 1 2 3 4 5 6
Consumo de sal
El tipo de asociacin entre las variables es directo, ya que a medida que aumenta el
consumo de sal (X) tambin lo hace la tensin arterial (Y).

b. Encuentre el modelo matemtico que permite predecir el efecto de una variable


sobre la otra. Es confiable?

y = 6,1062x + 88,128
R = 0,987 coeficiente de determinacin

El modelo tiene es de gran confiabilidad con valor del 98,7%

c. Determine el grado de relacin de las dos variables.

R = 0.99348087 coeficiente de correlacin. El grado de correlacin es excelente.

d. Si a un paciente se le administra una dosis de sal de 5,6. Cul es la tensin arterial


esperada?

y = 6,1062x + 88,128

y = 6,1062(5,6) + 88,128

y = 34,19472+ 88,128

y = 122,32272

La tensin arterial esperada es de 122,322 para una dosis de sal de 5,6.

2. En un nuevo proceso artesanal de fabricacin de cierto artculo que est implantado,


se ha considerado que era importante ir anotando peridicamente el tiempo medio
(medido en minutos) que se utiliza para realizar una pieza y el nmero de das desde
que empez dicho proceso de fabricacin. Con ello, se pretende analizar como los
operarios van adaptndose al nuevo proceso mejorando paulatinamente su proceso
de produccin.
Los siguientes datos representan dicha situacin:
X 12 23 35 42 53 65 70
Y 45 30 27 25 23 21 20
a. Identifique la variable dependiente (y) y la variable independiente (x), realice el
diagrama de dispersin y determine el tipo de asociacin entre las variables

Variable Y (tiempo medio para realizar una pieza) dependiente de variable X (das
transcurridos desde que se aprendi el proceso de fabricacin).

TIEMPO EMPLEADO PARA FABRICAR


SEGN DAS TRANSCURRIDOS
USANDO LA MISMA TCNICA
50
TIEMPO EMPLEADO

40

30

20

10

0
0 10 20 30 40 50 60 70 80
DAS TRANSCURRIDOS

El tipo de asociacin entre las variables es inverso, ya que son inversamente


proporcionales.

b. Encuentre el modelo matemtico que permite predecir el efecto de una variable


sobre la otra. Es confiable?

y = -0,3566x + 42,569
R = 0,7963 coeficiente de determinacin

El modelo tiene una confiabilidad aceptable de 79,63%

c. Determine el grado de correlacin de las dos variables.

R= 0.89235 coeficiente de correlacin. El grado de correlacin es aceptable.

d. Qu tiempo deber tardarse un empleado cuando lleven 90 das?

y = -0,3566x + 42,569

y = -0,3566(90) + 42,569
y = -32,094 + 42,569

El tiempo empleado para un empleado a los 90 das ser de y = 10,475 minutos.

3. Una nutricionista de un hogar infantil desea encontrar un modelo matemtico que


permita determinar la relacin entre el peso y la estatura de sus estudiantes. Para
ellos selecciona 10 nios y realiza las mediciones respectivas.
A continuacin, se presentan los resultados:

Estatura 120 124 107 118 112 110 115 104 110 116
(cm)
Peso 24 23 19 24 21 19 22 16 20 23
(kg)
a. Identifique la variable dependiente (y) y la variable independiente (x), realice el
diagrama de dispersin y determine el tipo de asociacin entre las variables

Peso (kg)
30

25

20
Axis Title

15

10

0
100 105 110 115 120 125
Axis Title

El tipo de asociacin entre las variables es Directo, ya que son directamente


proporcionales.

b. Encuentre el modelo matemtico que permite predecir el efecto de una variable


sobre la otra. Es confiable?

y = 0,386x - 22,751
R = 0,8329. El modelo tiene una confiabilidad del 83,29%.
c. Determine el grado de correlacin de las dos variables.

R= 0,9126. El grado de correlacin es excelente.

d. Cul es el peso que debera tener un estudiante que mida 128 cm?

y = 0,386(128) - 22,751

y = 49,408 - 22,751

y = 26,657

El peso que debera tener un estudiante que mida 128cm ser de 26,657 kg.

TRABAJO COLABORATIVO
Aporte Ricardo Martnez CC 1052404207

- Participar En el foro Paso 4- Descripcin de la informacin, que se encuentra en


Entorno de Aprendizaje Colaborativo.
Regresin y Correlacin lineal Simple A partir de la base de datos:
1. Identificar dos variables cuantitativas de la situacin estudiada que puedan estar
relacionadas.
Variables seleccionadas: GASTO EN DEFENSA Y SEGURIDAD COLOMBIA Y
GASTO EN DEFENSA Y SEGURIDAD COLOMBIA PERCPITA

GASTO EN DEFENSA Y SEGURIDAD GASTO EN DEFENSA Y SEGURIDAD


COLOMBIA COLOMBIA PERCPITA
930297398000 21432
930907040000 21447
945646042000 21786
973586647000 22430
984986702000 22692
1000296660000 23045
1090946473000 25134
1137336556000 26202
1203975384000 27738
1242964507000 28636
1251036750000 28822
1253615208000 28881
991743027000 22577
1052121201000 23952
GASTO EN DEFENSA Y SEGURIDAD GASTO EN DEFENSA Y SEGURIDAD
COLOMBIA COLOMBIA PERCPITA
1056599089000 24054
1074164468000 24453
1120264662000 25503
1140977760000 25974
1169610451000 26626
1263487853000 28763
1320338397000 30058
1322692233000 30111
1328188077000 30236
1349860034000 30730
1428183046000 32129
1447474515000 32563
1494470371000 33621
1496777889000 33672
1504949556000 33856
1505141872000 33861
1521330214000 34225
1532770950000 34482
1542576688000 34703
1542654662000 34704
1593811071000 35855
1611411721000 36251
1556419048000 34603
1582692569000 35187
1617274677000 35956
1662719957000 36967
1666490584000 37051
1667248878000 37067
1704358187000 37892
1735058941000 38575
1738409852000 38650
1812748961000 40302
1816140263000 40378
1844125957000 41000
GASTO EN DEFENSA Y SEGURIDAD GASTO EN DEFENSA Y SEGURIDAD
COLOMBIA COLOMBIA PERCPITA
1535045794000 33730
1556728140000 34207
1563206205000 34349
1583492740000 34795
1595444146000 35057
1619146801000 35578
1692873981000 37198
1739330590000 38219
1748092023000 38412
1778951441000 39090
1818569870000 39960
1821216679000 40018
1626506239000 35325
1654924863000 35942
1659855091000 36049
1675891403000 36397
1681624486000 36522
1748980725000 37984
1756725512000 38153
1772587672000 38497
1834302387000 39838
1857727271000 40346
1872057842000 40657
1881842638000 40870
1639611249000 35227
1677226350000 36035
1706698678000 36668
1796985625000 38608
1823707230000 39182
1840629953000 39546
1865077150000 40071
1869120621000 40158
1881476337000 40423
1905121693000 40931
GASTO EN DEFENSA Y SEGURIDAD GASTO EN DEFENSA Y SEGURIDAD
COLOMBIA COLOMBIA PERCPITA
1911136585000 41060
1939944070000 41679

2. Realizar el diagrama de dispersin de dichas variables y determinar el tipo de


asociacin entre las variables.
45000
40000 y = 2E-08x + 3245.4
Gasto en defensa y seguridad

R = 0.9943
35000
30000
25000
20000
15000
10000
5000
0
0 1000000000000 2000000000000 3000000000000
Gasto en defensa y seguridad en Colombia Per capita

Figura 4. Diagrama de distribucin entre las variables GASTO EN DEFENSA Y SEGURIDAD EN COLOMBIA PER CAPITA y
GASTO EN DEFENSA Y SEGURIDAD

El tipo de asociacin del diagrama de dispersin es LINEAL. Es una relacin lineal positiva
que indica que entre las variables existe una relacin directa es decir los valores menores de
GASTO EN DEFENSA Y SEGURIDAD COLOMBIA estn asociados a los valores
menores de GASTO EN DEFENSA SEGURIDAD COLOMBIA PERCPITA y viceversa.

3. - Encuentre el modelo matemtico que permite predecir el efecto de una variable


sobre la otra. Es confiable?
El modelo matemtico que permite predecir el efecto de una variable sobre la otra es:

y = 2E-08x + 3245,4
R = 0,9943
Se puede asegurar que la ecuacin de la recta es confiable porque el R est cercano
a 1 y tiene un grado alto de confiabilidad.
4. Determine el porcentaje de explicacin del modelo y el grado de relacin de las
dos variables. - Relacionar la informacin obtenida con el problema.
El R afirma adems que el modelo explica el 99.4% de la informacin y el valor de
r coeficiente de correlacin lineal es excelente porque el 0.994 est muy cercano al
extremo 1 positivo que es la correlacin perfecta positiva.
Mediante el anlisis del diagrama de dispersin se puede determinar que el gasto de
defensa total se encuentra directamente proporcional al mismo tipo de gasto per cpita
o por persona durante el periodo de tiempo comprendido entre 2006-2012 en la
problemtica de las vctimas del conflicto.

Aporte por: Lina Mara Martnez


1. Identificar dos variables cuantitativas de la situacin estudiada que puedan estar
relacionadas.
Variables seleccionadas: efectivos de fuerza pblica disponibles Colombia y minas anti
persona.

minas anti persona


efectivos de fuerza pblica
disponibles Colombia
6
350488
1
351129
9
352171
5
355681
7
357113
14
357213
15
357606
8
358033
15
358363
11
358414
2
358458
2
361013
2
363119
5
363589
1
367869
2
368141
5
368374
4
369661
2
369719
2
371549
3
371654
2
371766
4
373732
2
374032
2
377984
1
378771
1
379339
4
379430
2
379674
2
382802
2
384498
3
385640
2
385904
1
386634
2
387000
2
387226
2
391414
4
391986
1
393097
1
394267
2
395717
3
398293
2
398351
2
398665
2
399493
3
399502
2
399516
3
400562
2
403632
2
403925
1
404898
2
405837
2
406771
3
407217
1
408833
3
409567
3
410815
3
412550
2
413073
3
414072
1
415242
4
415455
3
415997
4
416181
4
416664
3
419366
3
419523
2
419621
4
420432
4
421819
4
421864
3
422600
2
423810
2
428796
3
432890
4
434453
4
435939
4
436745
1
437154
4
440608
1
440647
4
440997
1
443239
3
445565

2. Realizar el diagrama de dispersin de dichas variables y determinar el tipo de


asociacin entre las variables.

500000
Efectivos de fuerza publica disponibles

450000
400000
350000
en COlombia.

300000
250000 y = -3391.4x + 406877
200000 R = 0.1293
150000
100000
50000
0
0 2 4 6 8 10 12 14 16
Minas anti persona.

El tipo de asociacin del diagrama de dispersin es LINEAL.


3. Encuentre el modelo matemtico que permite predecir el efecto de una variable
sobre la otra. Es confiable?
El modelo matemtico que permite predecir el efecto de una variable sobre la otra es:
= 3391,4 + 406877
2 = 0,1293
En este caso se puede asegurar que la ecuacin de la recta no es tan confiable porque el R
no est cercano a 1 por tal razn no tiene alto grado de confiabilidad.

Aporte por: Juan Camilo Cely Vsquez CC 1053610066

- Identificar dos variables cuantitativas de la situacin estudiada que puedan estar


relacionadas.

efectivos de
fuerza pblica
disponibles gasto en defensa y seguridad
Colombia Colombia per cpita
350488 21432
351129 21447
352171 21786
355681 22430
357113 22692
357213 23045
357606 25134
358033 26202
358363 27738
358414 28636
358458 28822
361013 28881
363119 22577
363589 23952
367869 24054
368141 24453
368374 25503
369661 25974
369719 26626
371549 28763
371654 30058
371766 30111
373732 30236
374032 30730
377984 32129
378771 32563
379339 33621
379430 33672
379674 33856
382802 33861
384498 34225
385640 34482
385904 34703
386634 34704
387000 35855
387226 36251
391414 34603
391986 35187
393097 35956
394267 36967
395717 37051
398293 37067
398351 37892
398665 38575
399493 38650
399502 40302
399516 40378
400562 41000
403632 33730
403925 34207
404898 34349
405837 34795
406771 35057
407217 35578
408833 37198
409567 38219
410815 38412
412550 39090
413073 39960
414072 40018
415242 35325
415455 35942
415997 36049
416181 36397
416664 36522
419366 37984
419523 38153
419621 38497
420432 39838
421819 40346
421864 40657
422600 40870
423810 35227
428796 36035
432890 36668
434453 38608
435939 39182
436745 39546
437154 40071
440608 40158
440647 40423
440997 40931
443239 41060
445565 41679

- Realizar el diagrama de dispersin de dichas variables y determinar el tipo de


asociacin entre las variables.

Gasto en defensa y seguridad colombia percpita segn


efectivos de fuerza pblica disponibles.
50000
gasto en defensa y seguridad colombia

y = 0.1919x - 41955
40000 R = 0.7717

30000
percpita

20000

10000

0
0 50000 100000 150000 200000 250000 300000 350000 400000 450000 500000
efectivos de fuerza pblica disponibles Colombia
El tipo de asociacin entre las variables es Directo. Ya que a medida que una aumenta la
otra tambin lo hace.
- Encuentre el modelo matemtico que permite predecir el efecto de una variable
sobre la otra. Es confiable?
y = 0,1919x - 41955
R = 0,7717. El modelo tiene una confiabilidad del 77,17%. Aceptable.
- Determine el porcentaje de explicacin del modelo y el grado de relacin de las dos
variables.
R = 0,7717
R = 0,8784
El grado de correlacin entre las variables es aceptable ya que el valor de R est entre
0,80 y 0,90.
- Relacionar la informacin obtenida con el problema.
El gasto en defensa y seguridad en Colombia per cpita es un valor que cambia y se
relaciona con el nmero de efectivos de fuerza pblica disponibles, ya que para
mantener el nmero de efectivos que puedan garantizar la seguridad en el pas, se
utilizar parte del gasto per cpita en el sostenimiento de estos.
CONCLUSIONES

Se pudo evidenciar que para manejar cualquier tipo de variables se necesita realizar un
diagrama de dispersin y aplicar conceptos, frmulas de relacin y correlacin que
permita el despeje de las ecuaciones y datos para obtener un resultado.

Los ejemplos nos muestran que son acordes a un tipo de forma lineal y la correlacin es
confiable para los tipos de datos.

Hallamos los comportamientos que tienen tendencia lineal y determinamos el grado de


correlacin entre las variables.
REFERENCIAS BIBLIOGRAFICAS

Pava, M. (2017). ESTADSTICA DESCRIPTIVA. [online]

Estadisticadescriptivaunad100105.blogspot.com.co. Available at:

http://estadisticadescriptivaunad100105.blogspot.com.co/ [Accessed 22 jun. 2017].

Robles Fabin, D. (2017). Regresin mltiple - Monografias.com. [online]

Monografias.com. Available at: http://www.monografias.com/trabajos30/regresion-

multiple/regresion-multiple.shtml [Accessed 22 jun. 2017].