Está en la página 1de 23

ESTADISTICA DESCRIPTIVA

PASO 4. DESCRIPCIÓN DE LA INFORMACIÓN

PRESENTADO POR:

YOSELLIN ALVAREZ RIOS


C.C 1.062.814.479

PRESENTADO A:

JOSE FERNANDO VELANDIA

100105_152

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


PROGRAMA ADMINISTRACION DE EMPRESAS
CENTRO VALLEDUPAR
6 DE MAYO DEL 2020
INTRODUCCIÓN

El trabajo está conformado por un análisis de correlación lineal simple de dos

variables cuantitativas seleccionas en el foro colaborativo. Finalmente se encuentra un

análisis de correlación múltiple de variables seleccionadas; las cuales son realizadas

teniendo en cuenta cada una de las referencias propuestas en el entorno correspondiente

Parte de la Estadística corresponde a la Estadística Inferencial y dentro de ella los

capítulos de correlación y regresión son muy usados en la Investigación Científica, una

herramienta muy útil cuando se trata de relacionar 2 o más variables, relacionadas entre sí.
JUSTIFICACIÓN

La estadística descriptiva es una ciencia que analiza series de datos los

cuales dependiendo de la herramienta utilizada podemos graficar dicha información

calculada e interpretada. La presente actividad está basada en fortalecer el conocimiento de

cada uno de los integrantes del grupo, esto con el fin de identificar factores claves en la

investigación de un determinado problema, con el estudio de estos temas vamos a tener

la capacidad de relacionar los temas con las ayudas estadísticas vistas en la presente unida,

lo anterior mediante la relación entre dos variables cuantitativas del problema estudiado.

Aplicando la temática vista en la unidad se lograrán determinar la relación entre

una variable dependiente y variables independientes, calcular recta de regresión y el

coeficiente de correlación para probar estadísticamente su relación, cada uno de los

participantes realizara el diagrama de dispersión para cada variable tratada según el

Documento “PRUEBAS SABER 11”


OBJETIVO GENERAL

 Aplicar las medidas bivariantes, en función de la problemática de estudio.


ACTIVIDAD 1. MAPA MENTAL
ACTIVIDAD 2. DEFINICIÓN DE CONCEPTOS

Definir brevemente los conceptos básicos asociados a Regresión y Correlación como:

1. Diagrama de dispersión.

Dispersión se define como el grado de distanciamiento de un conjunto de valores

respecto a su valor medio. Ahora bien, el diagrama de dispersión, también

conocido como gráfico de dispersión o gráfico de correlación consiste en la

representación gráfica de dos variables para un conjunto de datos. En otras

palabras, analizamos la relación entre dos variables, conociendo qué tanto se

afectan entre sí o qué tan independientes son una de la otra. En este sentido, ambas

variables se representan como un punto en el plano cartesiano y de acuerdo a la

relación que exista entre ellas, definimos su tipo de correlación.


Tipos de correlación en un gráfico de dispersión

Con base en el comportamiento que toman las variables de estudio, podemos

encontrar 3 tipos de correlación: Positiva, negativa y nula.

Estos son pues, los tipos de correlación más visibles. Aunque si lo miramos desde

una perspectiva que evalúa qué tan fuerte o débil es la correlación, encontramos

otra clasificación.

2. Correlación lineal simple.

Si entre dos variables cuantitativas existe una relación lineal, el análisis de

correlación lineal simple se usa para determinar la dirección y la magnitud de dicha

relación.

La dirección de la relación se refiere a si ésta es positiva o negativa.

La magnitud de la relación o grado de relación entre las variables se refiere a la

fuerza de la relación que existe entre las variables.


Se trata de expresar cuantitativamente el grado de relación que existe entre las

variables en estudio.

Coeficiente de Correlación: expresa de manera cuantitativa el grado y la dirección

de la relación entre dos variables.

Coeficiente de correlación r de Pearson (rxy): Se usa cuando los datos están

medidos en una escala de intervalo o de razón.

Coeficiente de correlación rho de Spearman (rs): Se utiliza cuando una o ambas

variables están medidas en la escala ordinal, en la escala de intervalo o la de razón.

3. Coeficiente de determinación R2

Se define como la proporción de la varianza total de la variable explicada por la

regresión. El coeficiente de determinación, también llamado R cuadrado, refleja la

bondad del ajuste de un modelo a la variable que pretender explicar.

Es importante saber que el resultado del coeficiente de determinación oscila entre 0

y 1. Cuanto más cerca de 1 se sitúe su valor, mayor será el ajuste del modelo a la

variable que estamos intentando explicar. De forma inversa, cuanto más cerca de

cero, menos ajustado estará el modelo y, por tanto, menos fiable será.
4. Correlación positiva y correlación negativa

 Correlación positiva

Se presenta cuando una variable aumenta o disminuye y la otra también,

respectivamente. Hay una relación proporcional. Por ejemplo, para un vendedor de

carros, si él vende más carros (variable 1), va a ganar más dinero (variable 2).

 Correlación negativa

Se presenta cuando una variable se comporta de forma contraria o a la otra, es decir

que, si una variable aumenta, la otra disminuye. Hay una relación inversa

proporcional. Por ejemplo, para la construcción de un edificio, entre más

trabajadores estén construyendo un edificio (variable 1), menos tiempo se

necesitará para tenerlo listo (variable 2)

5. ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?

Sean X y Y dos variables aleatorias, el Coeficiente de Correlación se define como

una medida estandarizada de la asociación lineal que existe entre las variables X y

Y en relación con sus dispersiones.  


El coeficiente de correlación toma valores entre -1 y +1, siendo el grado de

asociación lineal mayor en la medida que se aproxima a los extremos de ese

intervalo.  

1. Correlación positiva o directa, cuando el coeficiente tiende a +1. Las variables

se comportan de la misma manera; es decir cuando una aumenta la otra

también.

2. Correlación negativa o inversa, cuando el coeficiente tiende a -1. Las variables

se comportan de manera contraria; es decir cuando una aumenta la otra disminuye.

3. Correlación lineal nula o no asociación, cuando el coeficiente tiende a 0 (cero)

significa que las variables no tienen asociación. Hay ausencia de correlación.  

ACTIVIDAD 3. REALIZAR EL LABORATORIO DE REGRESIÓN Y


CORRELACIÓN LINEAL

Opción Ejercicio 1 Ejercicio 2 Ejercicio 3 Estudiante


3 1.1 Temperatura – 1.5 Temperatura- 1.7 PIB-Energía Yosellin
Consumo de gas consumo de gaseosa. Alvarez
 

1.1. Temperatura – Consumo de gas. En una ciudad del norte de la


costa colombiana fue registrada la temperatura media del día y la
cantidad de gas consumida en algunas de las residencias. Los
datos están representados en la siguiente tabla. Para estudiar la
relación entre la temperatura y el consumo de gas

x Temperatura media- y Volumen de gas


°C consumido c m3
3 7
6 5
3 8
1 8
5 7
7 5
9 4
13 3

a. Realice el diagrama de dispersión y determine el tipo de asociación entre

las variables
Gráfica de Dispersión
9

Volumen de gas consumido cm3


8
f(x) = − 0.51 x + 8.69
7 R² = 0.44
6
5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
Temperatura media- C°

El tipo de asociación entre las variables es lineal negativa

b. Encuentre el modelo matemático que permite predecir el efecto de una

variable sobre la otra. ¿Es confiable?

El modelo matemático que permite predecir el efecto de una variable sobre la otra

es y=a+b x para este caso se tiene y=−0,4678 x +8,6233

Esto nos permite predecir el efecto de una variable sobre la otra, teniendo en cuenta

que R ²=0,905 es cercano a 1 se puede determinar que es confiable

c. Determine el grado de relación de las dos variables.

R=√ 0,905=0.9513

El grado de relación es excelente


d. ¿Determine el Volumen de gas consumido si la temperatura media llega a

ser -1 grado °C?

y=−0,4678 x +8,6233

−1=−0,4678 x +8,6233

−1−8,6233=−0,4678 x

−9,6233
=x
0,4678

x=−20,6

El volumen de gas consumido es de -20,6cm3 si la temperatura media llega a ser -1 grado

°C
1.5. Temperatura-consumo de gaseosa. El número de gaseosas (y) consumidas

mensualmente en un sector de la ciudad de barranquilla, se relaciona con la temperatura

promedio (en o F). Para el año 2018, se registraron los siguientes valores de temperatura y

consumo de gaseosas. 2018 registros de temperatura y consumos gaseosas

Mes Temperatura Consumo de gaseosa

°F ltrs.
Ene. 23 188,14

Feb. 26 216,82

Mar. 34 290,38

Abr. 49 427,19

May. 52 457,35

Jun. 61 541,35

Jul. 70 623,9

Ago. 76 677,41

Sep. 64 564,38

Oct. 52 455,28

Nov. 43 372,3

Dic. 32 276,33
a. Realice el diagrama de dispersión y determine el tipo de asociación entre las

variables.

Diagrama de dispersión
800

700
f(x) = 9.21 x − 22.39
600 R² = 1
Consumo de gaseosa ltrss

500

400

300

200

100

0
20 30 40 50 60 70 80
Temperatura °F

El tipo de asociación entre las variables es lineal positiva

b. Ajuste un modelo matemático que permita predecir el efecto de una variable

sobre la otra. ¿Es confiable?

y=9,2087 x+(−22 ,386)

R ²=0 , 9999

0 , 999∗100=99 %

La confiabilidad del modelo matemático es de un 99%


c. Determine el porcentaje de explicación del modelo y el grado de relación de las

dos variables.

R2= √ 0 , 9999=0,99

Resumen:

Correlación Excelente

d. ¿Cuál es el de consumo de gaseosas cuando la temperatura es de 70 °F?

El de consumo de gaseosas cuando la temperatura es de 70 °F es de 623,9ltrs.


1.7. PIB-Energía.

En un estudio realizado por la UNAD se desea analizar si el crecimiento económico medido

por el PIB es influenciado por el consumo de energía a partir de los siguientes datos:

Año PIB de la Nación Consumo de electricidad

en MWh
2008 2,057 428,2

2009 2,054 426,0

2010 2,209 464,7

2011 2,297 481,0

2012 2,341 498,4

2013 2,412 516,2

2014 2,424 532,6

2015 2,338 524,6

2016 2,257 520,0

a. Ajuste un modelo matemático que permita predecir el efecto de una variable

sobre la otra. ¿Es confiable?


Diagrama de dispersión
600

500 f(x) = 273.62 x − 131.92


R² = 0.85
Consumo de electricidad en MWh

400

300

200

100

0
2 2.05 2.1 2.15 2.2 2.25 2.3 2.35 2.4 2.45
PIB de la Nación

La asociación que existe entre las variables se ajusta al modelo lineal

y = 273,62x - 131,92

R² = 0,8465

El porcentaje de explicación de las variables es de 84,7 % por lo que se puede afirmar que

es confiable

b. Determine el porcentaje de explicación del modelo y el grado de relación de las

dos variables.

R=√ 0,8465=0,92

Hay correlación excelente entre las variables


Resumen

c. ¿Cuál podría ser la proyección de PIB para el año 2021 si se espera que el PIB

nacional sea del 3,2?

No se puede calcular ya que el modelo matemático no se ajusta a la relación entre

las variables.

y=273,62( 3,2)−131,92

y=875,58−131,92

y=743,66

ACTIVIDAD 4. REGRESIÓN Y CORRELACIÓN LINEAL


A partir de la base de datos suministrada: Pruebas SABER 11 - 220 estudiantes

2020 (16-1), cada estudiante, deberá:

-Identificar dos variables cuantitativas de la situación estudiada que puedan

estar relacionadas e identificar la variable dependiente e independiente.

Variable cuantitativa Dependiente: Números de personas en el hogar

Variable cuantitativa independiente: Estrato

- Realizar el diagrama de dispersión de dichas variables y determinar el tipo de

relación entre las variables.

Diagrama de dispersión
14
Numero de personas en el hogar

12

10

4 f(x) = 0.06 x + 4.19


R² = 0
2

0
0 1 2 3 4 5 6 7
Estrato

Vemos en el diagrama de dispersión que tenemos una función lineal en la que

observamos que hay relación mínima entre las dos variables.

- Encuentre el modelo matemático que permite predecir el efecto de una

variable sobre la otra. ¿Es confiable?

y = 0,0581x + 4,1925
R² = 0,0031

Es confiable en un

0,31%

Se utiliza el método de la regresión lineal simple.

Coeficiente de correlación √ 0,0031=0.055

R² = 0,0031 0,31

- Determine el grado de correlación de las dos variables.

Coeficiente de correlación √ 0,0031=0.055

El porcentaje de explicación del modelo es de 31%

Lo que quiere decir que el grado de relación entre las dos variables es de 31% Por lo

cual se obtiene una interpretación de que hay correlación mínima - 0 < r < 0,60

(0.31%)

- Relacionar la información obtenida con el problema.

Observando los resultados anteriores Número de personas en el hogar Vs Estratos

hay una confiabilidad del 0,31% y un grado de correlación del 31%.

CONCLUSIÓN
 Aplicamos las medidas bivariantes, en función de la problemática de estudio

de las Pruebas Saber 11

REFERENCIAS BIBLIOGRÁFICAS
 Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo.

(pp 151 – 158). Recuperado de http://go.galegroup.com/ps/i.do?id=GALE

%7CCX4052100011&v=2.1&u=unad&it=r&p=GVR

L&sw=w&asid=b82c81e98fcc1361e1929abe203c8219

 Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple.

México City: Cengage Learning. (pp 675 – 686). Recuperado de

http://go.galegroup.com/ps/i.do?id=GALE

%7CCX4058900232&v=2.1&u=unad&it=r&p=GVR

L&sw=w&asid=e558184ed89e57d11ede116134cfce41

 Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo.

Paginas. 151 – 158. de http://go.galegroup.com/ps/i.do?id=GALE

%7CCX4052100011&v=2.1&u=unad&it=r&p=G

VRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219

 Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple.

México City: Cengage Learning. Páginas 675 – 686 de

http://go.galegroup.com/ps/i.do?id=GALE

%7CCX4058900232&v=2.1&u=unad&it=r&p=G

VRL&sw=w&asid=e558184ed89e57d11ede116134cfce41

También podría gustarte