Está en la página 1de 20

TRABAJO COLABORATIVO

Unidad 2: Paso 4. Descripción de la información

Estudiantes

Luis Alberto Giraldo

Ruben Dario Andrade Bonilla

Diego Stivel Rubio

Juan Gabriel Forero

Grupo del curso

204040A_471

Presentado a

Leidi Mildrec Rojas

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

13 de mayo de 2018

1
INTRODUCCIÓN
La Estadística Descriptiva nos ofrece dentro del proceso de aprendizaje una clara
orientación a un proceso mediante el cual se recopila, organiza, presenta, analiza
e interpreta datos de manera que describa fácil y rápidamente las características
esenciales de estos mediante el empleo de métodos gráficos, tabulares o
numéricos en un estudio planteado.

Dentro de este contexto se formula un nivel descriptivo referido al estudio y


análisis de los datos obtenidos en una muestra, describiendo y resumiendo las
observaciones obtenidas sobre un fenómeno en concreto. Pretendemos dar un
acercamiento general hacia temas y conceptos básicos como son: la población,
muestra, variable, hallazgo de las medidas de tendencia central, análisis de datos
y resultados presentes en gráficos, histogramas y polígonos de frecuencia, que
nos permitan observar, como en la vida cotidiana, obtenemos muestras y datos
que necesitamos para realizar la representación de la información mediante
estos temas y conceptos.

En este trabajo se analizara la información de dos variables cuantitativas


relacionadas con el desempleo en Colombia comprendido entre el año 2004 al
2017, mediante un estudio realizado por el DANE y suministradas por el centro
Nacional De Memoria Histórica, realizando la Regresión y correlación lineal
simple de las dos variables de los datos recolectados en el estudio.

2
JUSTIFICACIÓN

Este estudio de caso corroborara que los métodos estadísticos se utilizan para
propósitos descriptivos, en donde podemos organizar y resumir datos numéricos,
ya que al poner en práctica estos diferentes tipos de representación estadística,
lograremos gran parte de la utilidad que tiene la Estadística Descriptiva;
proporcionando así un medio informativo basado en recopilación de datos, en
donde veremos reflejada la eficacia con que se pueda realizar dicho proceso de
información en el entorno de la presentación detallada de datos, observando a
través de la forma gráfica una de las formas más rápidas y eficientes en el
análisis de los resultados.

La información obtenida a través de instrumentos de recolección de datos es muy


claramente dispendiosa para analizar, por lo tanto, es necesario procesar esa
información para poderla ponderar claramente, pudiendo así poder expresar más
clara una información para las personas al igual que nos permite comprender
más rápido información que nos suministren, herramienta que nos será muy útil
en nuestra vida cotidiana tanto en lo personal como en lo laboral, haciéndonos
cada día más profesionales en nuestra labor.

En el trabajo se va a plasmar las causas del desempleo en Colombia en el que


a través de diferentes variables que afectan la economía en el país como el
ámbito político, financiero, sector empresarial, gobernabilidad, tasa, el dólar y el
contexto social, histórico y cultura

3
OBJETIVOS

GENERALES

• Conocer y Aprender la temática de la variación cualitativa y cuantitativa.

ESPECÍFICOS

• Entender la variación presentada a través de los resultados gráficos que


nos brindan los Histogramas y polígonos de frecuencia.

• Aplicar lo aprendido en la Unidad N° 1 la variación cualitativa y


cuantitativa.
• Analizar la variable cuantitativa seleccionada.
• Realizar el diagrama de dispersión de dichas variables.
• Realizar el laboratorio de Regresión y Correlación lineal Simple.

4
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE

Estudiante 1: Diego Stiven Rubio Moreno

Variable Y: Población Cantidad de Personas


Variable X: Año

Año * P_C de
AÑO(X) Población Cantidad de Personas(Y) X^2 Y^2
Personas
TOTALES:
319.611 7.250.105.880 1,46E+13 6,4E+08 3,31E+17

Diagrama de dispersión:

La grafica anterior nos muestra claramente que desde el año 2004 hasta el año
2017 la población cantidad de personas ha aumentado exponencialmente un
digito más o menos cada año y medio.

5
Tipo de asociación de las variables Directa
Modelo matemático y = 524758x - 1E+09
R2 0.9943
R 0.9947
Confiabilidad 99.43%
% de explicación 99.47%
Grado de relación Excelente
Método de Mínimos Cuadrados.

Ecuación lineal: Y = a + bX

Y = Variable independiente
A = intercepto con el eje y
X = variable dependiente
B= pendiente

Desconocemos dos valores, el valor a y el valor b la cual se hallan con


la siguiente ecuación-

159 * (1,45749E+13) – ( 319.611 )*( 7.250.105.880 )


B= ------------------------------------------------------------------
159*(642462651) – ( 319.611 )^2
B= 524758,328

Ahora calculamos a:

7.250.105.880 - (524758,328)*( 319.611 )


A = -----------------------------------------------------------
159
A = -1009235397
𝑌 = 524758 𝑥 – 1𝐸 + 09

𝑅^2 = 0.9943
2=
R Coeficiente de determinación 99.43 % por lo tanto es confiable

R= coeficiente de correlación
R= raíz cuadrada de 0,9943
R = 0.997 La correlación es Excelente.
6
Estudiante 2: Luis Alberto Giraldo
Variable Y: Personas con empleo
Variable X: Cantidad de empresa

Diagrama de dispersión:

Empresas /personas con empleo


35,000,000
30,000,000 y = 95.596x + 1E+06
Persona con empleo

R² = 0.9646
25,000,000
20,000,000
15,000,000 Series1
10,000,000 Linear (Series1)
5,000,000
-
- 100,000 200,000 300,000 400,000
Empresas

Tipo de asociación de las variables Directa


Modelo matemático Y = 95.596x + 1E+06
R2 0.9646
R 0.98
Confiabilidad 96.46%
% de explicación 98%
Grado de relación Excelente

Análisis e interpretación de resultados

El modelo matemático presentado en el problema es confiable, ya que el


coeficiente de determinación R2, próximo de 1 mayor será el poder explicativo
del modelo matemático de regresión, es decir que las variables cantidad de
empresas está directamente relacionada/ personas con empleo.

7
Estudiante 3: Ruben Dario Andrade Bonilla

Variable Y: Índice de Precios.


Variable X: Inversión Nacional e internacional en el país Billones.

Inversión X-Indice de Y-Inversión Nacional


Nacional e Precios e internacional en el
Indice de
internacional (Variable pais Biilones X*Y X2 Y2
Precios
en el pais Independie (Variable
Biilones nte) Dependiente)

Sumatorias 16.581 4309562054,00 4,71232E+11 1768319,075 1,294E+17


X Y X*Y X2 Y2

Diagrama de dispersión:

Relación entre el Indice de Precios con


la Inversión Nacional e internacional
en el pais Biilones
Inversión Nacional e internacional en el pais Biilones

50,000,000
45,000,000
40,000,000
35,000,000
30,000,000
25,000,000
20,000,000
15,000,000
10,000,000
y = 556018x - 3E+07
5,000,000
R² = 0.9638
-
0.0 20.0 40.0 60.0 80.0 100.0 120.0 140.0 160.0
Indice de precios

8
Tipo de asociación de las variables Directa
Modelo matemático y = 556018x - 3E+07
R2 0,9638
R 0,981733161
Confiabilidad 0.96%
% de explicación 0.98%
Grado de relación Excelente

Análisis e interpretación de resultados

Con los resultados obtenidos se puede asegurar que la ecuación de la recta es


una excelente estimación de las relaciones entre las dos variables, además
nuestro R² afirma que el modelo matemático explica el 96,4% de la información,
al extraer del R² y calculando su raíz cuadrada se puede concluir que el
coeficiente de correlación es excelente, así confirmando que la variable Índice de
precios está directamente relacionada con la variable Inversión Nacional e
internacional en el país Billones.

Entre más se acerque el Valor de R² a 1 (valor a la unidad), mayor será el poder


explicativo del modelo matemático de regresión.

9
REGRESIÓN Y CORRELACIÓN LINEAL MÚLTIPLE

Estudiante: Ruben Dario Andrade Bonilla

Variable Y: Inversión Nacional e internacional en el país Billones.


Variable X1: Índice de Precios
Variable X2: Tasa de empleo (%)

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,99511851
Coeficiente de determinación R^2 0,99026084
R^2 ajustado 0,99013598
Error típico 886587,365
Observaciones 159

ANÁLISIS DE VARIANZA
Grados
de
libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 2 1,2468E+16 6,23399E+15 7930,90812 1,2725E-157
Residuos 156 1,22622E+14 7,86037E+11
Total 158 1,25906E+16

Inferior Superior
Coeficientes Error típico
Estadístico t Probabilidad Inferior 95% Superior 95% 95,0% 95,0%
- - -
Intercepción -62835462 1622461,444 38,72847781 6,3833E-82 66040289,85 -59630634,2 -66040289,8 59630634,2
Variable X 1 435535,735 7367,218187 59,11807192 1,024E-108 420983,3606 450088,109 420983,361 450088,109
Variable X 2 803526,797 39030,99788 20,58688839 2,5037E-46 726429,3547 880624,24 726429,355 880624,24

Y=A+B1X1+B2X2

y=-62835462 + 435535,735x1 + 803526,797x2

10
Diagrama de dispersión:
(X1,Y)

Relacion: Indice de Precios e Inversion


Nacional e Internacional en el pais Billones
50,000,000
Inversión Nacional e internacional en el pais

45,000,000
40,000,000
35,000,000
30,000,000
25,000,000
Biilones

20,000,000
15,000,000
10,000,000
5,000,000 y = 556018x - 3E+07
R² = 0.9638
-
0.0 20.0 40.0 60.0 80.0 100.0 120.0 140.0 160.0
Indice de Precios

(X2,Y)

Relacion: Tasa de empleo e Inversion Nacional e


Internacional en el Pais Billones
50,000,000
Inversión Nacional e internacional en el pais

45,000,000
40,000,000
35,000,000
30,000,000
25,000,000
Biilones

20,000,000
15,000,000
10,000,000
5,000,000 y = 3E+06x - 1E+08
R² = 0.7721
-
0.0 10.0 20.0 30.0 40.0 50.0 60.0 70.0
Tasa de empleo (%)

11
Tipo de asociación de las variables Directa
Modelo matemático y=-62835462 + 435535,735x1 + 803526,797x2
R2 (X1,Y) 0,9902
R 0,9951
Confiabilidad 99.02%
% de explicación 99,51%
Grado de relación Excelente

Análisis e interpretación de resultados

R^2= 0,9902 por ser tan cercano a 1 se puede determinar que el modelo es
bastante confiable

R^2= 99,02% el modelo matemático explica el 99,02% de confiabilidad

La correlación entre las variables son excelentes ya que su valor es de


coeficiente es de 0,9951

La correlación entre las variables es excelentes ya que ofrecen un 99,5%

Lo anterior comprueba estadísticamente la relación de las tres variables Índice


de Precios, Tasa de empleo (%) e Inversión Nacional e internacional en el país
Billones

Los resultados obtenidos indican que las variables Índice de Precios, Tasa de
empleo (%) e Inversión Nacional e internacional en el país Billones se encuentran
relacionadas a través de un modelo matemático de reversión múltiple y=-
62835462 + 435535,735x1 + 803526,797x2, que explica el 99,02% de
confiabilidad, esto debido a que dichas variables se encuentran bajo una
correlación excelente de 0,995 que equivale a un 99,5%

12
CONCLUSIONES

• El coeficiente de correlación nos permite interpretar, que tan acertado es


la correlación entre variables.

• Entre la forma de la gráfica de dispersión de los datos y el valor de


coeficiente de correlación, podemos definir si la relación que hay entre
variables es o no lineal.

• El modelo matemático dado en una gráfica de dispersión nos permite


determinar qué tan acertado es, que grado de confiablidad hay, en el
cálculo de la relación entre variables para cualquier valor dado.

• Para las variables población cantidad de personas vs cantidad de


empresas, el coeficiente de correlación es 0.87, nos indica que el
porcentaje de acierto en el modelo matemático para correlación entre
variables no es tan acertado.

13
REFERENCIAS BIBLIOGRÁFICAS

• García, M.S. (2004). Introducción a la estadística económica y


empresarial. Paraninfo. Páginas 74 – 98. Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052900012&v=2.1&u=unad&i
t=r&p=GVRL&sw=w&asid=4a9b0a469e755a4327207c94b4c0d549

• Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo.


Paginas. 130 – 172. Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&i
t=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219

• Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple.


México City: Cengage Learning. Páginas 675 – 686 Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900232&v=2.1&u=unad&i
t=r&p=GVRL&sw=w&asid=e558184ed89e57d11ede116134cfce41

• Churchill, G.A. (2009). "Análisis de Regresión Múltiple." Investigación de


mercados. México City: Cengage Learning. Páginas 686 – 695.Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900234&v=2.1&u=unad&i
t=r&p=GVRL&sw=w&asid=49575112db86a0eb46dae86bbaf74cb9

• Montero, J.M. (2007). Regresión y Correlación Múltiple. Madrid: Paraninfo.


Páginas 191 – 225. Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100012&v=2.1&u=unad&i
t=r&p=GVRL&sw=w&asid=47eaa8f46c19ad13af26a0a74e510de2

•http://www.conevyt.org.mx/bachillerato/material_bachilleres/cb6/5sempdf/edin1
/edi1_f03.pdf

14
ANEXO
LABORATORIO DE REGRESIÓN Y CORRELACIÓN LINEAL

2.1. El rendimiento del producto de un proceso químico está relacionado con la


temperatura de operación del proceso. Se desea establecer la relación que
existe entre la pureza (y) del oxígeno producido y el porcentaje de hidrocarburo
(x) que está presente en el condensador principal en un proceso de destilación,
de acuerdo con los siguientes datos:

15
Diagrama de dispersión:

Rendimiento de un proceso quimico


102
100
98 y = 14.947x + 74.283
96 R² = 0.8774
Pureza

94
92
90
88
86
0 0.5 1 1.5 2
% Hidrocarburos

Tipo de asociación de las variables Directa


Modelo matemático Y = 14.947x + 74.283
R2 0.8774
R 0.93
Confiabilidad 87.74%
% de explicación 93%
Grado de relación Aceptable

d. ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual


a 91,3?
R/ El porcentaje de hidrocarburo es de 1.14

X
(% de Y
y = 14,947x + 74,283
Hidro (Pureza)
carburos)
1,14 91,3 (91,3)=14,947x + 74,283
91,3 - 74,283=14,947x
x=17,017/14,947
x=1,138
A la variable rendimiento de un proceso químico donde intervienen la pureza y el
% de hidrocarburos podemos determinar que efectivamente la pureza si depende
del % de hidrocarburos, encontramos un modelo matemático que es confiable y
que permite determinar la pureza a partir del % de hidrocarburos, además hay
una correlación aceptable entre las dos variables.

16
2.2 El número de libras de vapor (y) consumidas mensualmente por una planta
química, se relaciona con la temperatura ambiental promedio (en o F). Para el
año 2014, se registraron los siguientes valores de temperatura y consumo
anual:

Diagrama de dispersión:

Registros de temperatura vs
consumos de vapor en el año 2014
800
700
600
Consumo de Vapor

500
400
300
200
100 y = 9.2087x - 6.3184
R² = 0.9999
0
0 10 20 30 40 50 60 70 80
Temperatura °F

17
Tipo de asociación de las variables Directa
Modelo matemático y = 9,2087x - 6,3184
R2 0,9999
R 1
Confiabilidad 0.99%
% de explicación 100%
Grado de relación Perfecta

d. ¿Cuál es el de consumo de vapor cuando la temperatura es de 70 °F?

R/ el consumo de vapor para cuando la temperatura es de 70°F es de 638,29

Consumo
Temperatura y = 9,2087x -
de vapor
(oF) 6,3184
(Lb)
70 638,29 y=9,2087(70) -6,3184
y=644,609 - 6,3184
y=638,29

A la variable Registros de temperatura y consumos de vapor en el año 2014,


donde intervienen la Temperatura y el Consumo de vapor podemos determinar
que efectivamente la Temperatura si depende del Consumo de vapor, también
encontramos un modelo matemático que es bastante confiable y que permite
determinar la temperatura a partir del Consumo de vapor, además hay una
correlación perfecta entre las dos variables.

18
2.3 Los investigadores están estudiando la correlación entre la obesidad y la
respuesta individual al dolor. La obesidad se mide como porcentaje sobre el
peso ideal (x). La respuesta al dolor se mide utilizando el umbral de reflejo de
reflexión nociceptiva (y) que es una medida de sensación de punzada.
Obsérvese que ambas, X e Y, son variables aleatorias:

Diagrama de dispersión:

CORRELACIÓN ENTRE LA OBESIDAD Y


LA RESPUESTA INDIVIDUAL AL DOLOR
16
umbral de reflejo de flexión nociceptiva

14
12 y = -0.0629x + 11.642
10 R² = 0.1115

8
6
4
2
0
0 20 40 60 80 100
Porcentaje de Sobrepeso

19
Tipo de asociación de las variables Inversa
Modelo matemático y = -0,0629x + 11,642
R2 0,1115
R 0.33
Confiabilidad 11.15%
% de explicación 0.33%
Grado de relación mínima

d. ¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un


porcentaje de sobrepeso, de 40?
R/ el umbral de reflejo de flexión nociceptiva, cuando hay un porcentaje de
sobrepeso de 40 es de 9,126.

x y (umbral
(porcentaje de reflejo
y = -0,0629x + 11,642
de de flexión
sobrepeso) nociceptiva)

y= -0,0629(40) +
40 9,126 11,642
y=-2,516+11,642
y=9,126

A la variable correlación entre la obesidad y la respuesta individual al dolor,


donde intervienen el umbral de reflejo de flexión nociceptiva y porcentaje de
sobrepeso podemos determinar que el umbral de reflejo de flexión nociceptiva
no depende del porcentaje de sobrepeso, también encontramos que el modelo
matemático no es confiable y que no permite determinar el umbral de reflejo de
flexión nociceptiva a partir del porcentaje de sobrepeso, además hay una
correlación muy mínima entre las dos variables.

20

También podría gustarte