Está en la página 1de 19

PASO 3- DESCRIPCIÓN DE LA INFORMACIÓN.

ESTADISTICA DESCRIPTIVA

PRESENTADO POR:
RAUL ALEJANDRO MORA
Cod.1016003687

PRESENTADO A:

CAMPO RIAÑO

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD

ADMINISTRACION DE EMPRESAS

BOGOTÁ
MAYO
2020
Contenido
1. Introducción .............................................................................................................. 3
2. Justificación ............................................................................................................... 4
3. Objetivos ................................................................................................................... 5
4. Desarrollo de Actividades (Mapa Mental) ................................................................ 6
5. Definición de Conceptos ........................................................................................... 2
6. Laboratorios .............................................................................................................. 3
7. Regresión y Correlación Lineal................................................................................. 8
8. Conclusiones ........................................................................................................... 12
9. Bibliografía.............................................................................................................. 13

2
1. Introducción

Con el desarrollo de esta nueva actividad nos permitirá conocer e ir apropiando nuevos

elementos y conceptos que serán necesarios al momento de tomar decisiones sobre un

determinado problema y como resultado de una respectiva recopilación de datos. La

realización de este trabajo es dar a conocer y poner en pr4actica a regresión y

correlación, medidas de dispersión y estadísticas bivariantes sobre la unidad 2.

Lo anterior con la finalidad que en el proceso de estudio tengamos la capacidad de

comprender la diferencia entre el cálculo de medidas Bivariantes de Regresión y

Correlación; así como los Gráficos de Dispersión mediante el uso de del sistema de

Información Infostat.
2. Justificación

El siguiente trabajo es presentado como un método de enseñanza practica para seguir

con el desarrollo de conocimientos y competencias en la Estadística Descriptiva. Para

lograr los objetivos del presente trabajo práctico, aplicaremos el proceso de regresión

lineal simple para determinar tanto la naturaleza como la fuerza de una relación entre

dos variables.

L a aplicación de estos conceptos son de gran importancia en el campo de la

investigación, facilita la conceptualización y las posibles decisiones que podemos tomar

frente a las variables que estemos analizando.

4
3. Objetivos

 Realizar la lectura de datos y proyectarlos por medio de Diagramas de

Dispersión.

 Determinar el Grado de relación de las variantes.

 Identificar los diferentes conceptos de interpretación de datos correspondientes

al material de estudio.

 Reconocer y presentar el cálculo de las medidas Bivariantes de regresión Lineal

Simple.

 Entender e interpretar los conceptos básicos de Regresión y Correlación

 Indagar y hacer uso de la herramienta informática Infostat.


4. Desarrollo de Actividades (Mapa Mental)

6
5. Definición de Conceptos

Diagrama de dispersión.

Consiste en la representación gráfica de dos variables (X,Y) para un conjunto de datos; donde
se analiza la relación entre dos variables, con el fin de conocer qué tanto se afectan entre sí o
qué tan independientes son una de la otra.

Es así, como ambas variables se representan como un punto en el plano cartesiano y de


acuerdo a la relación que exista entre ellas, definimos su tipo de correlación.

Correlación lineal simple.

El concepto de relación o correlación se refiere al grado de variación conjunta existente entre


dos o más variables. Si entre dos variables cuantitativas existe una relación lineal, el análisis
de correlación lineal simple se usa para determinar la dirección y la magnitud de dicha
relación. La dirección de la relación se refiere a si ésta es positiva o negativa.

Coeficiente de determinación R2

El coeficiente de determinación es una medida estadística de la bondad del ajuste o fiabilidad


del modelo estimado a los datos. Se representa por R2 e indica cuál es la proporción de la
variación total en la variable dependiente (Y), que es explicada por el modelo de regresión
estimado, es decir, mide la capacidad explicativa del modelo estimado.

En un modelo de regresión lineal el coeficiente de determinación es adimensional y se calcula


del siguiente modo:

Correlación positiva y correlación negativa

Correlación positiva

2
Se presenta cuando una variable aumenta o disminuye y la otra también, respectivamente. Hay
una relación proporcional. Por ejemplo para un vendedor de carros, si él vende más carros
(variable 1), va a ganar más dinero (variable 2).

Correlación negativa

Se presenta cuando una variable se comporta de forma contraria o a la otra, es decir que si
una variable aumenta, la otra disminuye. Hay una relación inversa proporcional. Por ejemplo
para la construcción de un edificio, entre más trabajadores estén construyendo un edificio
(variable 1), menos tiempo se necesitará para tenerlo listo (variable 2)

¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?

El Coeficiente de correlación es una medida que permite conocer el grado de asociación


lineal entre dos variables cuantitativas (X, Y). El coeficiente de relación lineal, mide la fuerza
y el sentido de la relación lineal entre 2 variables cuantitativas.

6. Laboratorios
Opción Ejercicio 1 Ejercicio 2 Ejercicio 3 Estudiante
1.2 CH- 1.4 X – Y Montaje
2 1.7 PIB-Energía Alejandro Mora.
Pureza. – Horas de trabajo

6.1.1.2. CH-Pureza.

El rendimiento del producto de un proceso químico está relacionado con la temperatura de


operación del proceso. Se desea establecer la relación que existe entre la pureza (y) del
oxígeno producido y el porcentaje de hidrocarburo (x) que está presente en el condensador
principal en un proceso de destilación, de acuerdo con los siguientes datos:

X (% de Hidro
Y (Pureza)
carburos)

0,95 90,04
1,03 89,06
1,16 91,39
1,27 93,73
1,44 96,71
1,3 94,44
0,82 87,57
1,21 91,78
1,56 99,39
1,42 93,55
1,17 93,43
1,13 92,5
0,97 90,4
1 89,3
1,12 89,83
1,18 90,35
1,23 93,19
1,33 93,31
1,42 94,77
0,93 87,32

102

100
y = 14,247x + 75,263
98 R² = 0,8532

96
PUREZA

94

92

90

88

86
0 0,5 1 1,5 2
% DE HIDROCARBUROS

Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la
otra. ¿Es confiable?

El modelo lineal que predice el efecto de una variable sobre la otra es el siguiente

y = 14.247x + 75.263

El modelo es confiable porque el coeficiente de determinación R2 es cercano a 1.

Determine el porcentaje de explicación del modelo y el grado de relación de las dos


variables.

4
Esta ecuación hace una buena estimación entre las variables debido a que el coeficiente de
determinación R2 explica el 85,32%, tienen una Correlación positiva muy fuerte

¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a 92,3?

y = 14.247x + 75.263

x=(y-75,263)/14,247

x=92,3-75,263)/14,247

x=1,20

Cuando la pureza del oxigeno sea 92.3, el porcentaje de hidrocarburos será 1.20.

6.2.1.4. X-Y Montaje – Horas de trabajo.

En una empresa se desea verificar si la calidad de los computadores con defectos de montaje
tiene relación con las horas trabajadas por día.

Los siguientes datos representan dicha situación:

Horas de trabajo Computadores


(X) con defectos (Y)

15 10
13 9
11 8
7 5
12 9
11 8
8 6
10 7
13 9
13 10
12
y = 0,6599x + 0,6433

COMPUTADORES CON DEFECTOS


10 R² = 0,9461

0
0 2 4 6 8 10 12 14 16
HORAS DE TRABAJO

Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la
otra. ¿Es confiable?

El modelo lineal que predice el efecto de una variable sobre la otra es el siguiente

y = 0,6599X+0,6433

El modelo es confiable porque el coeficiente de determinación R2 es cercano a 1.

Determine el porcentaje de explicación del modelo y el grado de relación de las dos


variables.

Esta ecuación hace una buena estimación entre las variables debido a que el coeficiente de
determinación R2 explica el 94,61%, tienen una Correlación positiva muy fuerte"

Cuál será la cantidad de computadores con defectos producidas si un trabajador labora


6 horas?

y = 0,6599(6)+0,6433

y= 5.

La cantidad de computadores con defectos producido si un trabajador labora 6 horas es de 5


Computadores.

6
6.3.1.7. PIB-Energía.

En un estudio realizado por la UNAD se desea analizar si el crecimiento económico medido


por el PIB es influenciado por el consumo de energía a partir de los siguientes datos:

Consumo de
Año PIB de la Nación
electricidad en MWh

2008 2,057 428,2


2009 2,054 426
2010 2,209 464,7
2011 2,297 481
2012 2,341 498,4
2013 2,412 516,2
2014 2,424 532,6
2015 2,338 524,6
2016 2,257 520

600
CONSUMO DE ELECTRICIDAD EN MWH

500

400 y = 273,62x - 131,92


R² = 0,8465

300

200

100

0
2 2,05 2,1 2,15 2,2 2,25 2,3 2,35 2,4 2,45
PIB DE LA NACIÓN

Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la
otra. ¿Es confiable?

El modelo lineal que predice el efecto de una variable sobre la otra es el siguiente

y = 273,62X-131,92

El modelo es confiable porque el coeficiente de determinación R2 es cercano a 1.}


Determine el porcentaje de explicación del modelo y el grado de relación de las dos
variables.

Esta ecuación hace una buena estimación entre las variables debido a que el coeficiente de
determinación R2 explica el 84,65 %, tienen una Correlación positiva muy fuerte

¿Cuál podría ser la proyección de PIB para el año 2021 si se espera que el PIB nacional
sea del 3,2?

y = 273,62*(3,2)-131,92

y= 743,7

7. Regresión y Correlación Lineal

Identificar dos variables cuantitativas de la situación estudiada que puedan estar


relacionadas e identificar la variable dependiente e independiente.

Las Variables Cuantitativas que seleccione dentro de la Base de Datos Pruebas Saber son las
siguientes:

Variable independiente: PUNT_C_NATURALES

Variable dependiente: Promedio general

Realizar el diagrama de dispersión de dichas variables y determinar el tipo de relación


entre las variables.

Análisis de regresión lineal

Variable N R² R² Aj ECMP AIC BIC


PROMEDIO GENERAL 220 0,91 0,91 19,89 1278,56 1292,14

Coeficientes de regresión y estadísticos asociados

8
Coef Est. E.E. LI(95%) LS(95%) T p-valor CpMallows
VIF
const -9,30 3,51 -16,21 -2,38 -2,65 0,0087
PUNT_C_NATURALES 1,50 0,13 1,25 1,75 11,90 <0,0001 142,68
40,18
PUNT_C_NATURALES^2 -0,01 1,1E-03 -0,01 -3,0E-03 -4,72 <0,0001 23,28
40,18

Cuadro de Análisis de la Varianza (SC tipo I)


F.V. SC gl CM F p-valor
Modelo 40732,22 2 20366,11 1064,75 <0,0001
PUNT_C_NATURALES 40306,10 1 40306,10 2107,22 <0,0001
PUNT_C_NATURALES^2 426,12 1 426,12 22,28 <0,0001
Error 4150,70 217 19,13
Total 44882,92 219

Cuadro de Análisis de la Varianza (SC tipo III)


F.V. SC gl CM F p-valor
Modelo 40732,22 2 20366,11 1064,75 <0,0001
PUNT_C_NATURALES 40732,22 2 20366,11 1064,75 <0,0001
Error 4150,70 217 19,13
Total 44882,92 219
120

100 y = 0,9142x + 6,3597


R² = 0,898
PROMEDIO GENERAL

80

60

40

20

0
0 20 40 60 80 100 120
PUNT_C_NATURALES

Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la
otra. ¿Es confiable?

El modelo lineal que predice el efecto de una variable sobre la otra es el siguiente

y=0,942x+6,3597
El modelo es confiable porque el coeficiente de determinación R2 es cercano a 1.

10
Determine el grado de correlación de las dos variables.

La asociación de las variables es fuerte porque una variable depende de la otra, en este caso el
Promedio depende del Puntaje de Ciencias Naturales, esto se puede observar con el
coeficiente de determinación R2 que es de 89,80% y el valor del coeficiente de correlación R
confirma el grado de relación de la variables, que es el 95%.

Coeficientes de correlación

Correlación de Pearson: Coeficientes\probabilidades

(X)PUNT_C_NATURALES (Y)PROMEDIO GENERAL


(X)PUNT_C_NATURALES 1,00 0,00
(Y)PROMEDIO GENERAL 0,95 1,00

Relacionar la información obtenida con el problema.

El porcentaje de puntaje de Ciencias Naturales es directamente proporcional al Promedio


General, esto quiere decir que entre mayor es el porcentaje de Puntaje en Ciencias Naturales
mayor va a ser el Promedio General.
8. Conclusiones

El desarrollo de este trabajo nos permitió conocer algunos de los instrumentos que nos

proporciona la estadística en el momento de la toma de decisiones cuando se genera algún

tipo de situación a indagar, en donde siempre será importante la recolección y descripción de

datos; así como generar algunas técnicas que nos ayuden al análisis de dicha información.

Como estudiantes disponemos de la utilización de herramientas que permiten observan el

comportamiento de algunos datos como los son las tablas de frecuencia y las gráficas pues

son una buena forma para resumir información e interpretarla fácilmente.

12
9. Bibliografía

 Estadistica Fundamental. (s.f.). Obtenido de


http://168.176.239.58/cursos/ciencias/1000012/un2/html/glosario.html
 Infostat. (14 de 03 de 2020). Obtenido de https://www.infostat.com.ar/
 Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. (pp 151 –
158). Recuperado de
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r
&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219

 Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City:


Cengage Learning. (pp 675–686). Recuperado de
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900232&v=2.1&u=unad&it=r
&p=GVRL&sw=w&asid=e558184ed89e57d11ede116134cfce41

También podría gustarte