Está en la página 1de 22

ESTADÍSTICA DESCRIPTIVA

PASO 4. DESCRIPCIÓN DE LA INFORMACIÓN

OSWALDO NOE MARTINEZ ARAUJO


77170862

GRUPO 100105

TUTORA

JHANNA BRIEVA

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA, UNAD


INGENIERÍA ELECTRÓNICA
VALLEDUPAR-CESAR
2019
INTRODUCCIÓN

Por medio de este trabajo se pretende dar a conocer los diferentes métodos de análisis

estadísticos, en este informe se encontrarán con tablas de frecuencias, imágenes y graficas que

demuestran el análisis de datos recopilados por medio de una tabla en Excel los cuales son

resumidos por las diferentes técnicas estadísticas

El desempleo es un factor que a todo colombiano ha afectado en algún momento, esto debido a

fallas en el control de los recursos económicos y falta de creación de métodos alternos para el

control de desempleo, por ejemplo, la falta de apoyo a microempresarios, falta de apoyo a

nuevos proyectos, entre otros. En el siguiente trabajo se da a conocer datos importantes sobre el

desempleo en Colombia durante los años 2005 – 2016 en los cuales los representamos por medio

de tablas de frecuencias y gráficas que nos permiten detallar cada problemática de una manera

más fácil y dinámica.


JUSTIFICACIÓN

Esta actividad se realiza para aprender a organizar datos, darlos a conocer de una manera

didáctica, permitir que las personas comprendan esa información fácilmente y completa. A demás

comprender los conceptos básicos que componen la estadística descriptiva.


OBJETIVO GENERAL

 Relacionar nociones básicas, clasificar, tabular, presentar la información y describir la


problemática.

Objetivos específicos

 Analizar por medio de técnicas estadísticas el problema planteado en Excel


 Realizar tabla de frecuencias para identificar datos
 Realizar graficas de datos seleccionados
 Calcular medidas de tendencia central y medidas de posición
 Realizar histogramas y polígonos de frecuencias
 Temáticas a desarrollar:
 Regresión lineal
 coeficiente de determinación lineal.
 coeficiente de correlación.
 Análisis de correlación.
 Regresión simple.
 Diagramas de dispersión.
ACTIVIDADES A DESARROLLAR
Actividad 1. Mapa Mental
Para el desarrollo de esta actividad, es necesario que el estudiante revise en el Entorno de
conocimiento (Unidad 2), las siguientes referencias:
Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. Paginas. 151 – 158.

Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City: Cengage
Learning. Páginas 675 – 686

Descripción de la Actividad Individual:

Resumir mediante un mapa mental las medidas estadísticas Bivariantes de regresión y


correlación.
Actividad 2. Definición de Conceptos.

Para el desarrollo de esta actividad, es necesario que el estudiante revise en el Entorno de


conocimiento (Unidad 2), las siguientes referencias:
Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. Paginas. 151 – 158.

Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City: Cengage
Learning. Páginas 675 – 686

Descripción de la Actividad Individual:

Definir brevemente los conceptos básicos asociados a Regresión y Correlación como:

-Diagrama de dispersión.

Un diagrama de dispersión o gráfica de dispersión o gráfico de burbujas es un tipo de


diagrama matemático que utiliza las coordenadas cartesianas para mostrar los valores de dos
variables para un conjunto de datos.
Se emplea cuando una o varias variables está bajo el control del experimentador. Si existe un
parámetro que se incrementa o disminuye de forma sistemática por el experimentador, se le
denomina parámetro de control o variable independiente y habitualmente se representa a lo
largo del eje horizontal (eje de las abscisas). La variable medida o dependiente usualmente se
representa a lo largo del eje vertical (eje de las ordenadas). Si no existe una variable
dependiente, cualquier variable se puede representar en cada eje y el diagrama de dispersión
mostrará el grado de correlación (no causalidad) entre las dos variables.
Un diagrama de dispersión puede sugerir varios tipos de correlaciones entre las variables con
un intervalo de confianza determinado. La correlación puede ser positiva (aumento), negativa
(descenso), o nula (las variables no están correlacionadas). Se puede dibujar una línea
de ajuste (llamada también "línea de tendencia") con el fin de estudiar la correlación entre las
variables. Una ecuación para la correlación entre las variables puede ser determinada por
procedimientos de ajuste. Para una correlación lineal, el procedimiento de ajuste es conocido
como regresión lineal y garantiza una solución correcta en un tiempo finito.
Uno de los aspectos más poderosos de un gráfico de dispersión, sin embargo, es su capacidad
para mostrar las relaciones no lineales entre las variables. Además, si los datos son
representados por un modelo de mezcla de relaciones simples, estas relaciones son
visualmente evidentes como patrones superpuestos.
El diagrama de dispersión es una de las herramientas básicas de control de calidad, que
incluyen además el histograma, el diagrama de Pareto, la hoja de verificación, los gráficos de
control, el diagrama de Ishikawa y el diagrama de flujo...

-Correlación lineal simple.


Si entre dos variables cuantitativas existe una relación lineal, el análisis de correlación lineal
simple se usa para determinar la dirección y la magnitud de dicha relación. ... La magnitud de
la relación o grado de relación entre las variables se refiere a la fuerza de la relación que existe
entre las variables

-Coeficiente de determinación R2

el coeficiente de determinación, denominado R² y pronunciado R cuadrado, es


un estadístico usado en el contexto de un modelo estadístico cuyo principal propósito es
predecir futuros resultados o probar una hipótesis. El coeficiente determina la calidad del
modelo para replicar los resultados, y la proporción de variación de los resultados que puede
explicarse por el modelo.
Hay varias definiciones diferentes para R² que son algunas veces equivalentes. Las más
comunes se refieren a la regresión lineal. En este caso, el R² es simplemente el cuadrado
del coeficiente de correlación de Pearson, lo cual es sólo cierto para la regresión lineal simple.
Si existen varios resultados para una única variable, es decir, para una X existe una Y, Z... el
coeficiente de determinación resulta del cuadrado del coeficiente de determinación múltiple.
En ambos casos el R² adquiere valores entre 0 y 1. Existen casos dentro de la definición
computacional de R² donde este valor puede tomar valores negativos.

-Correlación positiva y correlación negativa

Para poder contar con un indicador que nos permita, por un lado establecer la covariación
conjunta de dos variables, y por otro, que tenga la universalidad suficiente para poder
establecer comparaciones entre distintos casos, se utiliza el coeficiente de correlación (lineal,
de Pearson).La correlación es, pues una medida de covariación conjunta que nos informa del
sentido de esta y de su relevancia, que está acotada y permite la comparación entre distintos
casos.

El coeficiente de correlación entre dos variables puede definirse como la covarianza existente
entre sus dos variables tipificadas y tiene por expresión de cálculo:

Interpretación:

**Si r < 0 Hay correlación negativa: las dos variables se correlacionan en sentido inverso. A
valores altos de una de ellas le suelen corresponder valor bajos de la otra y viceversa. Cuánto
más próximo a -1 esté el coeficiente de correlación más patente será esta covariación extrema.
Si r= -1 hablaremos de correlación negativa perfecta lo que supone una determinación
absoluta entre las dos variables (en sentido inverso): Existe una relación funcional perfecta
entre ambas (una relación lineal de pendiente negativa).

** Si r > 0 Hay correlación positiva: las dos variables se correlacionan en sentido directo. A
valores altos de una le corresponden valores altos de la otra e igualmente con los valores
bajos. Cuánto más próximo a +1 esté el coeficiente de correlación más patente será esta
covariación. Si r = 1 hablaremos de correlación positiva perfecta lo que supone una
determinación absoluta entre las dos variables (en sentido directo): Existe una relación lineal
perfecta ( con pendiente positiva).

** Si r = 0 se dice que las variables están incorrelacionadas: no puede establecerse ningún


sentido de covariación.
- ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?

El Coeficiente de correlación es una medida que permite conocer el grado de asociación


lineal entre dos variables cuantitativas (X, Y).
En los siguientes Diagramas de dispersión se puede observar que existe una relación lineal
entre la variable X y la variable Y.

Sin embargo si trazamos una linea recta en los diagramas.

Podemos observar que en un diagrama B los puntos se acercan mas a la recta, caso contrario
en el diagrama A, los puntos están mas alejados. Entonces podemos decir que la relación
lineal del diagrama A es mas débil con comparación a la relación que existe en el diagrama
B.
Un diagrama dispersión no nos da certeza de que tan débil o fuerte es la relación lineal,
necesitamos una medida que nos de la fuerza de la asociación y la dirección que toma esta
relación.
Para esto sirve el coeficiente de correlación que esta dado por la siguiente formula.

¿De donde sacamos estos valores?

Recordar entonces que el coeficiente de relación lineal, mide la fuerza y el sentido de la


relación lineal entre 2 variables cuantitativas.
Luego de haber aplicado la formula, según el resultado se puede clasificar en este rango.

Entre mas cercano es a 1 es mas fuerte, entre mas cercano a 0 es débil hasta llegar hacerse
nula, si los valores del coeficiente de relación es -1 es una Asociación lineal perfecta
Negativa, si es 0 no existe relación y si es 1 es una Asociación Lineal perfecta Positiva.
Socializar las respuestas en el foro paso 4. Descripción de la Información.

Actividad 3. Realizar el laboratorio de regresión y correlación lineal

Para el desarrollo de esta actividad, es necesario que el estudiante revise en el Entorno de


conocimiento (Unidad 2), las siguientes referencias:
Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. Paginas. 151 – 158.

Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City: Cengage
Learning. Páginas 675 – 686

Descripción de la Actividad Individual:

Desarrollar el Laboratorio denominado Regresión y Correlación lineal, el cual se encuentra en el


Entorno de aprendizaje práctico, en la carpeta Guía para el uso de recursos educativos. El
laboratorio lo puede desarrollar con el programa Infostat o Excel.

De optar por el uso del programa Infostat, lo podrá descargar en el entorno de aprendizaje
practico, carpeta: Laboratorios Estadística Descriptiva: Infostat tutoriales, enlace descarga del
Infostat.
Opción Ejercicio 1 Ejercicio 2 Ejercicio 3 Estudiante

1 1.1. Sal-Tensión 1.4. X - Y 1.9. Sobrepeso-R

2 1.2. CH-Pureza. 1.4. X - Y 1.7. PIB-Ventas Oswaldo Noe MArtinez

3 1.1. Sal-Tensión 1.5. Tem-Vapor 1.7. PIB-Ventas

4 1.3. Peso-Altura. 1.6. Estatura-Peso 1.8. %-Umbral

5 1.2. CH-Pureza. 1.5. Tem-Vapor 1.8. %-Umbral

1.2. CH-Pureza. El rendimiento del producto de un proceso químico está relacionado con la
temperatura de operación del proceso. Se desea establecer la relación que existe entre la
pureza (y) del oxígeno producido y el porcentaje de hidrocarburo (x) que está presente en
el condensador principal en un proceso de destilación, de acuerdo con los siguientes
datos:

X
Y
(% de Hidro
(Pureza)
carburos)

0,99 90,01
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45
0,87 87,59
1,23 91,77
1,55 99,42
1,4 93,65
1,19 93,54
1,15 92,52
0,98 90,56
1,01 89,54
1,11 89,85
1,2 90,39
1,26 93,25
1,32 93,41
1,43 94,98
0,95 87,33
a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

Diagrama de dispersión
Y (Pureza) Linear (Y (Pureza))

102
100
y = 14.947x + 74.283
98
R² = 0.8774
96
AXIS TITLE

94
92
90
88
86
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8
AXIS TITLE

b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre
la otra. ¿Es confiable?

El modelo lineal que predice el efecto de una variable sobre la otra es el siguiente

y = 14.947x + 74.283

El modelo es confiable porque el coeficiente de determinación R2 es cercano a 1.

c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos


variables.

Esta ecuación hace una buena estimación entre las variables debido a que el coeficiente de
determinación R2 explica el 87.74% de la información y el valor del coeficiente de correlación R
confirma el grado de relación de las variables, que es el 93.67%.
d. ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a 91,3?

y = 14.947x + 74.283

x=(y-74.283)/14.947
x=(91.3-74.283)/14.947

x=1.14

1.4. X-Y. En un nuevo proceso artesanal de fabricación de cierto artículo que está implantado,
se ha considerado que era importante ir anotando periódicamente el tiempo medio
(medido en minutos) que se utiliza para realizar una pieza y el número de días desde que
empezó dicho proceso de fabricación. Con ello, se pretende analizar como los operarios
van adaptándose al nuevo proceso mejorando paulatinamente su proceso de producción.

Los siguientes datos representan dicha situación:

X 12 23 35 42 53 65 70
Y 45 30 27 25 23 21 20

a. Identifique la variable dependiente (y) y la variable independiente (x),realice el


diagrama de dispersión y determine el tipo de asociación entre las variables

Diagrama de dispersión
Y Linear (Y)

50

40

30
Y

20

10 y = -0.3566x + 42.569
R² = 0.7963
0
0 10 20 30 40 50 60 70 80
X
b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre
la otra. ¿Es confiable?

y = -0,3566x + 42,569
R² = 0,7963

Correlación aceptable 0,892356431

c. Determine el grado de correlación de las dos variables.

La correlación es aceptable, Se identifica que a medida que pasan los días los minutos
utilizados en el proceso de producción disminuyen.

d. ¿Qué tiempo deberá tardarse un empleado cuando lleven 90 días?

X Y
12 45
23 30
35 27
42 25
53 23
65 21
70 20
90 10,45
1.7. PIB-Ventas. Una compañía multinacional del servicio de telecomunicaciones en
Colombia, como medio de planeación estratégica para la toma de decisiones, solicita a su
departamento financiero, hacer predicciones económicas del valor anual de sus ventas
totales, versus el PIB nacional de las últimas dos décadas, para la toma de decisiones para
la apertura de nuevos mercados. Realice el diagrama de dispersión y determine el tipo de
asociación entre las variables.

Año PIB Nación Ventas de la compañía


2001 1,70 339,43
2002 2,50 363,02
2003 3,90 359,75
2004 5,30 336,90
2005 4,70 339,38
2006 6,70 348,40
2007 6,90 372,00
2008 3,50 358,79
2009 1,70 337,94
2010 4,00 357,32
2011 6,60 342,14
2012 4,00 327,84
2013 4,90 362,06
2014 4,40 348,80
2015 3,10 353,52
2016 2,00 355,40
2017 1,80 342,00

a. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la otra.
¿Es confiable?

a = n∑XiYi-∑Xi*∑Yi/n∑Xi² - (∑Xi)²

a = 17*23729,65 - 67,7*5944,82/17*317,95 -(67.7)²

a = 1,15
Parámetro b:

b= μy-aμy

b = 349,7-1,15*3,98

b = 345,12

Ecuación de regresión:

Y = 1,15+ 345,12X

b. Determine el porcentaje de explicación del modelo y el grado de relación de las dos


variables.

ρ = Covarianza/σx*σxy

Covarianza = ∑X1*Yi /n

Covarianza = 23729,65/17 = 1395,86

σx = √∑(Xi-ux)²/n

σx = 49329,77

σy = √∑(Yi-uy)²/n

σy = 80653,13

ρ = 1395,86/49329,77*80653,13

ρ = 3,5 *10⁻⁷

Como el coeficiente de variación tiene un grado de asociación menor a 0,09 su asociación es


nula, esto quiere decir que las variables no están asociadas
c. ¿Cuál podría ser la proyección de ventas para el año 2018 si se espera que el PIB nacional
sea del 3,1?

Y = 1,15 +345,12*3,1
Y =1071

Cada estudiante en el orden de participación escogerá un paquete de ejercicios y socializará a sus


compañeros en el foro la elección; posteriormente al desarrollo, deberá subirlo al foro paso 4–
Descripción de la información, en un archivo en Word utilizando el siguiente protocolo para
nombrar el archivo: Nombre Apellido_lab_Regresión y Correlación Lineal.

Socializar las respuestas en el foro paso 4. Descripción de la Información.

Actividad 4. Regresión y correlación Lineal.

Para el desarrollo de esta actividad, es necesario que el estudiante revise en el Entorno de


conocimiento (Unidad 2), las siguientes referencias:
Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. Paginas. 151 – 158.

Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City: Cengage
Learning. Páginas 675 – 686

Descripción de la Actividad Individual:

A partir de la base de datos suministrada: Desempleo en Colombia_2019 (16-4), cada estudiante,


deberá:

-Identificar dos variables cuantitativas de la situación estudiada que puedan estar relacionadas e
identificar la variable dependiente e independiente.
- Realizar el diagrama de dispersión de dichas variables y determinar el tipo de relación entre las
variables.
- Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra.
¿Es confiable?
- Determine el grado de correlación de las dos variables.
- Relacionar la información obtenida con el problema.

Cada estudiante desarrollará el laboratorio; posteriormente, deberá subirlo al foro paso 4.


Descripción de la Información, en un archivo denominado: Nombre Apellido_lab_Regresión y
Correlación Lineal.

Actividad 4. Consolidación de la Información

A partir del trabajo individual realizado, consolidar toda la información en un informe


descriptivo, que permita detallar la problemática estudiada: Desempleo en Colombia_2019 (16-
4), utilizando las tablas, gráficos, diagramas de dispersión, coeficiente de determinación,
coeficiente de correlación, modelo matemático y demás elementos procesados anteriormente, el
cual deberá contener:

 Portada.
 Introducción.
 Justificación.
 Objetivos.
 Mapa Mental
 Definición de conceptos
 Análisis de correlación lineal simple de las dos variables cuantitativas seleccionadas.
(Laboratorio)
 Análisis y conclusiones, a partir de los resultados obtenidos y aplicados al problema o
situación estudiada.
 Conclusiones.
 Referencias Bibliográficas.

Nota: En el entorno de seguimiento y Evaluación Paso 4–Descripción de la Información. -


Entrega de la actividad, subir el archivo en formato Word o pdf. Paso 4_ Nombre del estudiante.
CONCLUSIONES

 Se pueden emplear análisis de frecuencias cuando los datos de una encuesta son amplios y

resumirlos de manera fácil y concreta

 Las medidas de posición permiten desglosar por segmentos los datos cuando son muy

numerosos y analizarlos de manera sencilla

 Se puede emplear programas especializados para realizar los análisis estadísticos o bien el

programa Excel en el cual se aprende de manera más específica de donde salen los

cálculos estadísticos
REFERENCIAS BIBLIOGRÁFICAS

 Martínez, C. (2011). Capítulo 2. Distribuciones de frecuencia. En: Estadística y muestreo,


13a ed. [Online] Bogotá: Ecoe Ediciones.(pp 2 – 10). Recuperado
de http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?ppg=67&docID=10560
355&tm=1498531579762
 Montero, J. M. (2007). Conceptos Generales Estadística descriptiva. Madrid: Paraninfo. (pp
3 - 16). Recuperado
de http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100007&v=2.1&u=unad&it=r&p
=GVRL&sw=w&asid=0a7332df0d4700de0bd272caa41e1718
 Montero, J. M. (2007). Características de Una Distribución de Frecuencias. Statistical
Descriptive. Cengage Learning Paraninfo, S.A. (pp 4 – 10). Recuperado
de http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052900008&v=2.1&u=unad&it=r&p=
GVRL&sw=w&asid=84a84913a25d9dfd21d0a0d3deb41dea
 García, J. E (2005). Análisis de Datos Unidimensionales.et al. Madrid: Paraninfo. (pp 26 -
42). Recuperado
de http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052300007&v=2.1&u=unad&it=r&p=
GVRL&sw=w&asid=03f8699ec7ccf10e8745c0ceb7b85bf1
 Pacheco, P. N., Vergara, S .C (2013).Universidad Nacional de Colombia. Bogotá. Estadística
Fundamental. Recuperado
de http://168.176.239.58/cursos/ciencias/1000012/un2/html/leccion1.html
 Texto Estadística para las Ciencias Administrativas.
 Martinez, Ciro. Estadística y Muestreo. Ecoe Ediciones. Bogotá. 11ª. Edición.
 https://es.wikipedia.org/wiki/Diagrama_de_dispersi%C3%B3n
 https://es.wikipedia.org/wiki/Coeficiente_de_determinaci%C3%B3n
 https://www.uv.es/ceaces/base/descriptiva/coefcorre.htm
 https://platzi.com/tutoriales/1269-probabilidad-estadistica/2308-coeficiente-de-correlacion-que-es-y-
para-que-sirve/

También podría gustarte