Está en la página 1de 23

ESTADISTICA DESCRIPTIVA

Descripción de la información

TANIA SORAIRE RINCÓN MENDOZA 49716085

Tutor

GENARO PENAGOS

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD

PROGRAMA PSICOLOGÍA

ESTADISTICA DESCRIPTIVA

MAYO

2018
DESCRIPCIÓN DEL INFORME

1. A partir de la base de datos suministrada se obtuvo

a. Población. La población para este estudio es la conformada 49064312

personas encuestadas

b. Tamaño de la muestra. La muestra está conformada por todas las

Personas que son una parte de la población

El tamaño de la muestra de la base de datos suministrada es 384 personas

c. Instrumento de Recolección de la información. El instrumento o técnica

de recolección de datos o información que se aplica en este estudio es la

ENCUESTA, cuestionarios vía web, censos.

d. Ubicación espacio temporal del estudio. La investigación se realizó en

todo el territorio nacional colombiano, fue realizada a una población

determinada por el DANE de enero del 2001 hasta marzo del 2017.

e. Unidad estadística. La definición de una unidad estadística para este

estudio es igual a:
2. SE CLASIFICARON LAS VARIABLES QUE INTERVIENEN EN EL
PROBLEMA:

Id Consecutivo del mes muestreado


Mes Mes muestreado
Año Año muestreado
Es el porcentaje de personas que se
Tasa de encuentran sin empleo, tomando como 100%
desempleo (%) la cantidad de personas empleables.
Es el porcentaje de personas que se
Tasa de empleo encuentran con empleo, tomando como 100%
(%) la cantidad de personas empleables.
Población
Cantidad de Cantidad de personas en Colombia en dicho
personas mes.
Personas Sin Es el número de personas que se encuentran
Empleo sin empleo en dicho mes.
Personas Con Es el número de personas que se encuentran
Empleo empleadas en dicho mes.
Es la cantidad de dinero producida de bienes o
Produccion servicios en cada mes, es decir es el Producto
Millones Interno Bruto del mes.
Este indicador muestra como van subiendo los precios a través del tiempo, se conoce como IPC, se toma
como 100 pesos en diciembre de 2008, sube a partir de ahí y es menor a 100 antes de esa fecha. Se pued
Indice de entender por ejemplo que si algo valia 100 pesos en diciembre de 2008, hoy en día valdría más de 136
Precios pesos.
Es el valor del dólar en pesos colombianos de
Valor Dolar cada mes
Tasa de Interés
Esta es la tasa de interés que reconoce un
que pagan los banco por tener uno depositado dinero en el
bancos mismo.
Esto expresa la cantidad de productos o
Exportaciones servicios exportados, expresados en valor
Mill monetario.
Es un indicador que muestra en un momento
Optimismo determinado, como el nivel de optimosmo de la
Poblacion población.
Cantidad Es un valor estimado de cúantas empresas hay
Empresas en Colombia en cada mes.
Facilidad Es una calificación de que tan fácil se percibe
Crédito Bancos que es obtener un crédito en la banca.

Producción por Corresponde al producto interno bruto, per


persona capita, es decir, por persona por cada mes.
Inversión
Nacional e
internacional
Es la cantidad de dinero invertida en el país
en el pais tanto por agentes internos del país, como de
Biilones agentes externos al país.
Tasa de
Corresponde a un indicador estimado, e qué
incertidumbre tan seguro perciben los empresarios realizar
empresarial negocios en el país.
Presidente Es el presidente del país en cada mes
Favorabilidad Según las encuestas el presidente del país
Presidente tiene un valor de favorabilidad.
Ministro El el nombre del ministro de hacienda en cada
Hacienda páis.
Incertidumbre Como atributo cual es el nivel de incertidumbre
Empresarial empresarial.

A partir de la base de datos suministrada, se caracterizaron las variables cualitativas.

a.) Organiza cada variable cualitativa a través de tablas de frecuencias, que


contenga como mínimo lo siguiente:

Solución

b.) Representar la información por medio de diferentes diagramas estadísticos,


según corresponda: (diagrama de barras, diagramas circulares, etc).
Solución

Frecuencia Variable Favorabilidad presidente

14.36% 9.74% mala


regula r
15.38% buena
Excelente
10.77% Muy buena
45.13% Muy Mala
4.62%

c.) Hallar la moda para cada una de las variables cualitativas y la asocia con la
situación objeto de estudio.
Solución

MUY
5
MODA BUENA

MODA 2 buena
MODA 1 Alta

Alvaro
1
MODA Uribe

MODA 4 Muy buena


Mauricio
4
MODA Cardenas

MODA 4 Muy alta

d.) Realizar una tabla de contingencias o de doble entrada, con dos variables
cualitativas.

Solución
4. A partir de la base de datos se identificaron la variables discretas
dentro del problema de estudio y se calcularon las medidas univariantes
de tendencia central más adecuadas

LABORATORIO DE REGRESIÓN Y CORRELACIÓN LINEAL

1. El rendimiento del producto de un proceso químico está relacionado con la


temperatura de operación del proceso. Se desea establecer la relación que
existe entre la pureza (y) del oxígeno producido y el porcentaje de
hidrocarburo (x) que está presente en el condensador principal en un proceso
de destilación, de acuerdo con los siguientes datos:

X Y
(% de Hidro
0,99 (Pureza)
90,01
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45
0,87 87,59
1,23 91,77
1,55 99,42
a. Realice el diagrama de dispersión y
1,4 93,65
determine el tipo de asociación entre las
variables. 1,19 93,54
1,15 92,52
0,98 90,56
1,01 89,54
1,11 89,85
1,2 90,39
1,26 93,25
1,32 93,41
1,43 94,98
0,95 87,33
El porcentaje de hidrocarburos es directamente proporcional a la pureza, esto
quiere decir que entre mayor es el porcentaje de hidrocarburos mayor va a ser
la pureza.
La asociación de las variables es fuerte porque una variable depende de la
otra, en este caso la pureza depende del porcentaje de hidrocarburos, esto se
puede observar con el coeficiente de determinación R2 que es 87.74%.

b. Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. Es confiable?
El modelo lineal que predice el efecto de una variable sobre la otra es el
siguiente
y = 14.947x + 74.283
El modelo es confiable porque el coeficiente de determinación R 2 es cercano a
1.

c. Determine el porcentaje de explicación del modelo y el grado de relación de


las dos variables.
Esta ecuación hace una buena estimación entre las variables debido a que el
coeficiente de determinación R 2 explica el 87.74% de la información y el valor
del coeficiente de correlación R confirma el grado de relación de la variables,
que es el 93.67%.

d. ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es


igual a 91,3?
y = 14.947x + 74.283
x=(y-74.283)/14.947
x=(91.3-74.283)/14.947
x=1.14

Cuando la pureza del oxigeno sea 91.3, el porcentaje de hidrocarburos será


1.14.

2. El número de libras de vapor (y) consumidas mensualmente por una planta


química, se relaciona con la temperatura ambiental promedio (en oF). Para el
año 2014, se registraron los siguientes valores de temperatura y consumo
anual.

2014 Registros de temperatura y consumos de


Mes vapor.
Temperatura Consumo de
(oF) vapor (Lb)
Ene. 21 185,79
Feb. 24 214,47
Mar. 32 288,03
Abr. 47 424,84
May. 50 455
Jun. 59 539
Jul. 68 621,55
Ago. 74 675,06
Sep. 62 562,03
Oct. 50 452,93
Nov. 41 369,95
Dic. 30 273,98

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables.

La temperatura es directamente proporcional al consumo de vapor, esto quiere


decir que entre mayor es la temperatura mayor va a ser el consumo de vapor.
La asociación de las variables es fuerte porque una variable depende de la
otra, en este caso el consumo de vapor depende de la temperatura, esto se
puede observar con el coeficiente de determinación R2 que es 99.99%.

b. Ajuste un modelo matemático que permita predecir el efecto de una variable


sobre la otra. Es confiable?
El mejor modelo que describe el sistema es la función lineal
y = 9.2087x - 6.3184
El modelo es muy confiable porque el coeficiente de determinación R 2 es
aproximadamente 1.

c. Determine el porcentaje de explicación del modelo y el grado de relación de


las dos variables.
Esta ecuación hace una buena estimación entre las variables debido a que el
coeficiente de determinación R 2 explica el 99.99% de la información y el valor
del coeficiente de correlación R confirma el grado de relación de la variables,
que es el 99.99%.

d. ¿Cuál es el de consumo de vapor cuando la temperatura es de 70 oF?


y = 9.2087*70 - 6.3184
y=638.29lb
Cuando la temperatura sea 70 oF, el consumo de vapor será 638.29lb.

3. Los investigadores están estudiando la correlación entre la obesidad y la


respuesta individual al dolor. La obesidad se mide como porcentaje sobre el
peso ideal (x). La respuesta al dolor se mide utilizando el umbral de reflejo de
reflexión nociceptiva (y) que es una medida de sensación de punzada.
Obsérvese que ambas, X e Y, son variables aleatorias

x (porcentaje
de y (umbral de
sobrepeso) reflejo
89 2 de
90 3
75 4
30 4,5
51 5,5
75 7
62 9
45 13
90 15
20 14

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables.

La asociación de las variables no existe, esto se puede observar con el


coeficiente de determinación R2 que es 11.15%.
b. Ajuste un modelo matemático que permita predecir el efecto de una variable
sobre la otra. Es confiable?
El modelo lineal que predice el efecto de una variable sobre la otra es el
siguiente
y = -0.0629x + 11.642
El modelo no es muy confiable porque el coeficiente de determinación R 2 está
muy lejos de 1.

c. Determine el porcentaje de explicación del modelo y el grado de relación de


las dos variables.
Esta ecuación no hace una buena estimación entre las variables debido a que
el coeficiente de determinación R2 explica el 11.15% de la información y el valor
del coeficiente de correlación R confirma el grado de relación de la variables,
que es el 33.39%.

d. ¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un porcentaje


de sobrepeso, de 40?
y = -0.0629*40 + 11.642
y = 9.13

Cuando el porcentaje de sobrepeso sea 40, el umbral de reflejo de flexión


nociceptiva será 9.13.

5. Se aplicó la regresión y correlación simple, para ello se identificaron


dos variables, se realizó el diagramo de dispersión y se determinó el tipo
de asociación, se encontró el modelo matemático para predecir si es
confiable y se determinó el porcentaje de explicación del modelo y el
grado de relación de las variables Y Se aplicó la regresión y correlación
múltiple, se identificó una variable cuantitativa dependiente y dos
independientes, se realizó el diagrama de dispersión y se calculó la recta
de regresión para predecir si es confiable y se determinó el grado de
relación de las dos variables

Regresión Lineal Simple De Dos Variables Cuantitativa

Las variables cuantitativas relacionadas en el problema de estudio son

Cantidad de Empresas (X) y Personas con Empleo (Y).

Media X 253.144
25286285
Media Y ,9
R2 0,9646
Covarian 6,0067E+
za 10
Varianza 63231511
X 4
Varianza
Y 5,99E+12
Sx 25066,68
Sy 2439863,
36
r 0,982
a 1086599
b 95,596

Estadísticas de la
regresión
Coeficiente de
correlación
múltiple 0,982
Coeficiente de
determinación
R^2 0,9646
0,964369
R^2 ajustado 59
462004,2
Error típico 43
Observaciones 159
Análisis de Varianza
Grados Suma de Promedio Valor
de cuadrad de los crítico
libertad os cuadrados F de F
4277,413 8,18E-
Regresión 1 9,13E+14 9,13E+14 69 116
Residuos 157 3,35E+13 2,13E+11
Total 158 9,47E+14

Coeficien Error Estadísti Probabili Inferior Superior Inferior Superior


tes típico co t dad 95% 95% 95,0% 95,0%
Intercepci 1086599,0 371824, 2,922344 0,0039872 352175,4 1821022, 352175,4 1821022,
ón 3 43 36 9 42 61 42 61
Variable 95,596340 1,46167 65,40193 92,70925 98,48342 92,70925 98,48342
X1 4 44 95 8,18E-116 7 38 7 38
Coeficiente de correlación (r)

r= √ R2

r= √ 0,9646

r=0 , 982

r > 0 = Positiva

r < 0 = Negativa o Inversa

r = 1 o -1 Tienen una dependencia exacta


r = -1 Tendencia negativa

r = 1 Tendencia positiva

Diagrama de Dispersión

Correlación Lineal entre Cantidad de Empresas y Personas con Empleo


32,000,000

30,000,000 f(x) = 95.6x + 1086599.03


R² = 0.96
28,000,000
Personas con Empleo (y)

26,000,000

24,000,000

22,000,000

20,000,000
195,000 215,000 235,000 255,000 275,000 295,000 315,000

Cantidad de Empresas (x)

Es una tendencia lineal directa y positiva entre las dos variables, correlación

lineal simple entre las variables Cantidad de Empresas (X) y Personas con

Empleo (Y).

Totales de la Tabla para hallar los Valores de la Ecuación Matemática


4.020.519.46 1.027.322.978.221.2 10.288.964.951.4 102.610.520.960.873.0
40.249.974 0 70 58 00
X Y X*Y X2 Y2

n ΣXY −ΣX∗ΣY
b=
n Σ X 2−( ΣX )2

159(1.027.322 .978 .221.270)−(40.249 .974)( 4.020.519 .460)


b=
159(10.288 .964 .951.458)−(40.249 .974)2

1.518 .549 .805.687 .230


b=
15.885 .020 .281.146
b=95 , 596

ΣY −b ΣX
a=
n

4.020.519 .460−( 95,596∗40.249.974 )


a=
159

172769245
a=
159

a=1086599

Ecuación Matemática:

Y^ =a+bX

Y^ = Variable dependiente (la que se va a predecir)


a = Intercepto de la variable Y
X = Variable independiente
b = Pendiente de la recta
El modelo matemático es:

Y^ =95 ,596 x +1086599

Personas con empleo = 95,596*Cantidad de empresas + 1086599

Es una excelente estimación para las dos variables. El modelo de regresión

lineal ajustado tiene un alto grado de confiabilidad.

El R2 (coeficiente de determinación) afirma que el modelo explica el 95,59% de

la información. La variable de Cantidad de Empresas está directamente

relacionada con el número de Personas con Empleo; esto quiere decir que

entre mayor es la Cantidad de Empresas existentes en Colombia mayor va a


ser el Número de Personas con Empleo. . Es muy poca la Demanda de

Empresas en el país para la cantidad de personas que hay en Colombia, es por

ello que hay mucho desempleo.

Las Personas con Empleo son dependiente de la Cantidad de Empresas en

el país.

Es una Correlación excelente entre las dos variables, lo confirma el valor de

r (0,98) que se acerca a 1. r ¿ √ R 2 r ¿ √ 0,9646 r ¿ 0,98 .

Regresión Lineal Múltiple de Variables Cuantitativas

Variables cuantitativas relacionadas:

Variables independientes (X):

Producción Billones (X1)

Producción por Persona (X2)

Variable dependiente (Y): Índice de Precios

Media X1 48303554,2
Media X2 1048005,0
Media Y 104,3
R2 X1 0,983
R2 X2 0,980
Estadísticas de la regresión
Coeficiente de 0,99140418
correlación múltiple 2
Coeficiente de 0,98288225
determinación R^2 3
0,98266279
R^2 ajustado 4
2,07534005
Error típico 3
Observaciones 159
ANÁLISIS DE VARIANZA
Promedio
Suma de de los Valor
Grados de cuadrado cuadrado crítico
libertad s s F de F
38579,626 4478,67431 1,617E-
Regresión 2 1 19289,813 8 138
671,89766 4,3070363
Residuos 156 8 4
39251,523
Total 158 7

Coeficient Error Estadísti Probabilid Inferior Superior Inferior Superior


es típico co t ad 95% 95% 95,0% 95,0%
Intercepci 53,001718 2,495766 21,23664 6,97447E- 48,07186 57,93157 48,071861 57,93157
ón 54 74 75 48 17 54 68 54
Variable X 1,53976E- 3,018E- 5,1018851 9,4361E- 2,1359E- 9,43613E- 2,1359E-
1 06 07 1 9,651E-07 07 06 07 06
-
Variable X -2,20381E- 1,6211E- 1,359441 0,17596843 -5,406E- 9,9836E- -5,40597E- 9,9836E-
2 05 05 88 1 05 06 05 06
Diagrama de Dispersión
DESEMPLEO EN COLOMBIA
70,020,000

60,020,000

50,020,000 f(x) = 866585.18x - 42427291.72


R² = 0.99
Indice de precios

40,020,000

30,020,000

20,020,000

10,020,000

20,000
75.0 f(x)80.0
= 16910.81x
85.0 - 713133.64
90.0 95.0 100.0 105.0 110.0 115.0
R² = 0.99
PRODUCCIÓN BILLONES Y PRODUCCIÓN POR PERSONA

Produccion Billones (X1) Linear (Produccion Billones (X1))


Producción por Persona (X2) Linear (Producción por Persona (X2))

Es una correlación directa entre la sociedad de las Variables.

Ecuación Matemática:

Y =a+b1 X 1 +b2 X 2

Y = Variable dependiente

a = Intercepto de la variable Y

X1 , X2 = Valores de las dos variables independientes

b1 , b2 = Pendientes asociadas con cada variable independiente,

respectivamente

El modelo matemático es: Y =53 , 0+1 , 540 E−06 X 1−2 ,204 E−05 X 2
Índice de Precio = 53,0 + 1,540E-06 * Producción billones - 2,204E-05 *
Producción por persona
Es una excelente valoración para las dos variables. El modelo de regresión

lineal preciso tiene un alto grado de confiabilidad.

El R2 (coeficiente de determinación) afirma que el modelo explica el 98% de

la encuesta. La variable de Índice de precios está claramente relacionada con

Elaboración por persona y Producción Billones; esto quiere decir que entre

mayor es la manufactura existentes en Colombia mayor va a ser el índice de

precios

El índice de precios depende de la producción en Billones realizadas por

persona. Las variables está muy bien coherentes, es decir existe una

correlación.

Es una Correlación múltiple excelente entre las tres variables, lo confirma el

valor de r (0,99) que se acerca a 1. r ¿ √ R 2 r ¿ √ 0,98 r ¿ 0,99 .


PROPUESTA UNICA

El ministro que menos certidumbre género en el sector empresarial fue el


ministro Roberto Junguito durante su mandato en el año 2013 posibles
causas que se dieron al crecimiento párelo de la economía y el narcotráfico
además de la violencia y la desesperanza por ejemplo el desempleo sigue
siendo muy alto el grado de informalidad laboral que no disminuye con un
desfavorable reporte de 4.966.378 desempleados según el reporte del
DANE hasta el año 2017.
 Para el año 2015 la Certidumbre de los empresarios es muy alta durante
el mandato del ministro Mauricio Cárdenas se pueden observar
evoluciones en la tasa de empleo y desempleo situaciones que se
subsanan gracias al apoyo internacional e intervención al lavado de
activos, las inversiones, la recuperación de la confianza de los
consumidores como en que durante ese tiempo con los bancos se hace
la reducción de tasas de interés. El ministro Cárdenas durante su
gestión mantiene la estabilidad de los indicadores económicos por lo
cual es exaltado como el mejor ministro de hacienda de América Latina.
 El grado de certidumbre porcentual en la variable cualitativa muy alta
hacia los ministros es del 30% sobre el general de la encuesta 195 para
los Ministros de hacienda que han dirigido el presupuesto de la Nación
durante los años 2012 -2107 no es muy favorable muchas de las causas
se han presentado por situaciones climáticas, violencia, narcotráfico,
negocios ilícitos, informalidad laboral, proyecciones financieras, deudas
externas entre otras para que sea favorable se espera una calificación
20 + 1.
 El análisis realizado a cada una de las variables elegidas nos permite
concluir que la incidencia en la fractura económica del país y desempleo
están asociadas a la ilegalidad, el narcotráfico y la violencia que como
consecuencia afectan directamente las exportaciones, el sector
agropecuario y por ende las inversiones y las apuestas a nuevas
empresas y el impulso de las ya existentes.
.Los mandatarios como cada una de las administraciones están sujetas
a los sucesos históricos y las decisiones políticas, económicas, sociales
y culturales en cada uno de los sectores de la economía como se
muestra en la base de datos desempleo en Colombia y en cada una de
las variables elegidas la evolución y el retroceso tanto en la
empleabilidad como en el número de personas que se encuentran
desocupadas.
 Los bancos vienen disminuyendo la tasa de interés como se muestra en
la gráfica que permita la facilidad de acceso y aprobación con un criterio
alto de probabilidad.

También podría gustarte