Está en la página 1de 17

UNIDAD 2: PASO 4 - DESCRIPCIÓN DE LA INFORMACIÓN

ESTADÍSTICA DESCRIPTIVA

ENTREGADO POR

ANGELA MARBIHT ESCOBAR FANDIÑO


52 602 586

ENTREGADO A
EDGAR GABRIEL DIAZ

GRUPO

100105_168

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA (UNAD)


ZIPAQUIRA- CUNDINAMARCA
2020
INTRODUCCIÓN

Por medio del siguiente trabajo se llevara a cabo la aplicación de


conceptos correspondientes a la unidad 2 referentes a la regresión y
correlación por medio de un mapa mental, así mismo se definirán
algunos conceptos relacionados, se resolverá el laboratorio establecido
para esta actividad el que nos ayudara a poner en práctica dichos
conceptos y finalmente plantearlos en la base de datos pruebas saber
11.
OBJETIVOS

Objetivos Generales

Determinar la relación y correlación entre dos variables cuantitativas


atraves de un laboratorios y actividades practicas.

Objetivos Específicos

 Realizar un mapa mental donde se resuman los conceptos de


medidas estadísticas Bivariantes de regresión y correlación.

 Definir y socializar conceptos básicos asociados a Regresión y


Correlación.

 Realizar el laboratorio asignado para esta actividad, desarrollarlos


en Excel y realizar su respectivo análisis.

 Poner en práctica lo aprendido en la actividad a partir de la base


de datos suministrada Pruebas SABER 11-220 con su respectivo
análisis.
ACTIVIDADES A DESARROLLAR

Actividad 1.

Mapa Mental
Resumir mediante un mapa mental las medidas estadísticas
Bivariantes de regresión y correlación.

Actividad2.

Definición de Conceptos.
Definir brevemente los conceptos básicos asociados a Regresión y
Correlación como:

- Diagrama de dispersión:

El diagrama de dispersión, también conocido como gráfico de


dispersión o gráfico de correlación consiste en la representación gráfica
de dos variables para un conjunto de datos. En otras palabras,
analizamos la relación entre dos variables, conociendo qué tanto se
afectan entre sí o qué tan independientes son una de la otra.

En este sentido, ambas variables se representan como un punto en el


plano cartesiano y de acuerdo a la relación que exista entre ellas,
definimos su tipo de correlación.

- Correlación lineal simple:

Si entre dos variables cuantitativas existe una relación lineal, el análisis


de correlación lineal simple se usa para determinar la dirección y la
magnitud de dicha relación. La dirección de la relación se refiere a si
ésta es positiva o negativa.

- Coeficiente de determinaciónn R2:

Coeficiente de determinación (R cuadrado) El coeficiente de


determinación, se define como la proporción de la varianza total de la
variable explicada por la regresión. El coeficiente de determinación,
también llamado R cuadrado, refleja la bondad del ajuste de un modelo
a la variable que pretender explicar.

- Correlación positiva y correlación negativa:

· Correlación positiva
Se presenta cuando una variable aumenta o disminuye y la otra
también, respectivamente. Hay una relación proporcional.

· Correlación negativa
Se presenta cuando una variable se comporta de forma contraria o a la
otra, es decir que si una variable aumenta, la otra disminuye. Hay una
relación inversa proporcional.

- ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a


medir?

La correlación, también conocida como coeficiente de correlación lineal


(de Pearson), es una medida de regresión que pretende cuantificar el
grado de variación conjunta entre dos variables.

Por tanto, es una medida estadística que cuantifica la dependencia lineal


entre dos variables, es decir, si se representan en un diagrama de
dispersión los valores que toman dos variables, el coeficiente de
correlación lineal señalará lo bien o lo mal que el conjunto de puntos
representados se aproxima a una recta.

De una forma menos coloquial, la podemos definir como el número que


mide el grado de intensidad y el sentido de la relación entre dos
variables.

Valores que puede tomar la correlación

ρ = -1     Correlación perfecta negativa

ρ = 0        No existe correlación

ρ = +1     Correlación perfecta positiva

ACTIVIDAD 3. REALIZAR EL LABORATORIO DE REGRESIÓN Y


CORRELACIÓN LINEAL

Descripción de la Actividad Individual:

Desarrollar el Laboratorio denominado Regresión y Correlación lineal, el


cual se encuentra en el Entorno de aprendizaje práctico, en la carpeta
Guía para el uso de recursos educativos. El laboratorio lo puede
desarrollar con el programa Infostat o Excel.

EJERCICIOS
1.1. Edad – Masa Muscular.

Una nutricionista desea estudiar la relación entre la edad y la


masa muscular de las personas, y para realizar el estudio
seleccionó un grupo de mujeres con características semejantes,
con edades diferentes y midió su masa muscular. La nutricionista
registró los datos de edad y masa muscular en las siguientes
tablas:

Edad Masa muscular


(X) (Y)
57 98
75 83
70 90
62 98
41 67
44 90
66 80
55 69
72 74
67 79
53 100
57 60
75 84
64 110
44 70

a) Realice el diagrama de dispersión y determine el tipo de


asociación entre las variables.
Masa muscular VS Edad Mujeres
120

100
MASA MOSCULAR

80 f(x) = 0.25 x + 68.36


R² = 0.04 Masa muscular (Y)
60 Linear (Masa muscular
(Y))
40

20

0
35 40 45 50 55 60 65 70 75 80
EDAD

La asociación entre estas dos variables es una tendencia lineal creciente


por que a medida que aumenta la edad la masa muscular desciende.

b) Encuentre el modelo matemático que permite predecir el efecto de


una variable sobre la otra. ¿Es confiable?

Y=0,2512x+68,361
R² = 0,0395
R²*100%= 3,95%
Solo es confiable en un 3,95% no es muy confiable.

c) Determine el porcentaje de explicación del modelo y el grado de


relación de las dos variables.

El coeficiente de correlación es la raíz cuadrada de R² en este caso


sería: 0,1987
Es un valor que no es muy directa por que no está ni muy cerca a uno ni
a menos 1 por lo tanto no hay relación.

d) ¿Cuál sería la masa muscular esperada de una persona de 40


años?

Y=0,2512 (40) +68,361


Y= 78.4
La masa muscular esperada en una persona de 40 años es de 78.4
d.2 Estatura-Peso.

Una Nutricionista de un hogar infantil desea encontrar un modelo


matemático que permita determinar la relación entre el peso y la
estatura de sus estudiantes. Para ello selecciona 10 niños y realiza
las mediciones respectivas.
-
- A continuación, se presentan los resultados:
-
-
- Estatura (cm) 120 124 107 118 112 110 115 104 110 116
- Peso (kg) 24 23 19 24 21 19 22 16 20 23
-
-
a. Identifique la variable dependiente (y) y la variable independiente (x),
realice el diagrama de dispersión y determine el tipo de asociación entre
las variables
-
-
- Variable dependiente (y)= Peso Kg
- Variable Independiente (x)= Estatura cm
-

PESO vs ESTATURA
30
25
f(x) = 0.39 x − 22.75
20 R² = 0.83
PESO Kg

PESO(y)
15
Linear (PESO(y))
10
5
0
100 105 110 115 120 125 130
ESTATURA cm
-
-
- Es una variable positiva ya que la tendencia que presenta es creciente
-
b. Encuentre el modelo matemático que permite predecir el efecto de una
variable sobre la otra. ¿Es confiable?
-
- Y=0,386x-22,751
R² = 0,8329
R²*100%= 83,29%

Es confiable en un 83,29%. Es por este porcentaje alto que podemos


decir que Si es confiable.
-
c. Determine el grado de correlación de las dos variables.
El coeficiente de correlación es la raíz cuadrada de R² en este caso
sería: 0.9126

Es un valor con una correlación excelente ya que está muy cerca al


uno positivo.
-
d. ¿Cuál es el peso que debería tener un estudiante que mida 114 cm?
2. y=0,386(114)-22,751

- Y= 21.253
-
- Para un estudiante que mide 114 cm su peso debe ser 21.253
-
-

2.1. PIB – Consumo de electricidad


Una compañía multinacional del servicio de telecomunicaciones en
Colombia, como medio de planeación estratégica para la toma de
decisiones, solicita a su departamento financiero, hacer
predicciones económicas del valor anual de sus ventas totales,
versus el PIB nacional de las últimas dos décadas, para la toma de
decisiones para la apertura de nuevos mercados. Realice el
diagrama de dispersión y determine el tipo de asociación entre las
variables.
Consumo
PIB de
de
Año la
electricidad
Nación
en MWh
2008 2,069 429,4
2009 2,066 427,2
2010 2,221 465,9
2011 2,309 482,2
2012 2,353 499,6
2013 2,424 517,4
2014 2,436 533,8
2015 2,35 525,8
2016 2,269 521,2

Consumo de electricidad VS PIB de


la Nación
CONSUMO DE ELECTRICIDAD

600
Consumo de
500 f(x) = 273.62 x − 134 electricidad en
400 R² = 0.85 MWh(y)
300 Linear (Consumo de
electricidad en
200 MWh(y))
100
0
2 2.1 2.2 2.3 2.4 2.5
PIB

- Es una variable positiva ya que la tendencia que presenta es creciente.

a. Ajuste un modelo matemático que permita predecir el efecto de


una variable sobre la otra. ¿Es confiable?
y = 273,62x – 134
R² = 0,8465

R²*100%= 84.65%
Es confiable en un 84.65%. Es por este porcentaje alto que podemos
decir que Si es confiable.

b. Determine el porcentaje de explicación del modelo y el grado de


relación de las dos variables.
El coeficiente de correlación es la raíz cuadrada de R² en este caso
sería: 0.9200
Es un valor con una correlación excelente ya que está muy cerca al
uno positivo.

c. ¿Cuál podría ser la proyección de PIB para el año 2021 si se


espera que el PIB nacional sea del 3,7

y = 273,62(3,7) – 134
y= 878.39

- Para el año 2021 se espera que el PIB nacional sea de 878.39


-
-
Actividad 4.

Regresión y correlación Lineal.


-
A partir de la base de datos suministrada: Pruebas SABER 11 - 220
estudiantes 2020 (16-1), cada estudiante, deberá:

 Identificar dos variables cuantitativas de la situación estudiada


que puedan estar relacionadas e identificar la variable dependiente
e independiente.

EDAD: (X) INDEPENDIENTE


NUMERO DE LIBROS DE CONSULTA: (Y) DEPENDIENTE

 Realizar el diagrama de dispersión de dichas variables y determinar el


tipo de relación entre las variables.
N° DE LIBROS DE CONSULTA VS
EDAD
NUM LIBROS DE CONSULTA

60 N° DE LIBROS DE
CONSULTA( Y)
40 Linear (N° DE LIBROS
DE CONSULTA( Y))
20
f(x) = − 1.82 x + 40.6
0 R² = 0.07
13 14 15 16 17 18 19 20 21
EDAD

La asociación entre estas dos variables es una tendencia lineal


decreciente por que a medida que aumenta la edad menos libros se
consultan.

Es una variable ya que la tendencia que presenta es decreciente.

 Encuentre el modelo matemático que permite predecir el efecto de una variable


sobre la otra. ¿Es confiable?

y = -1,8161x + 40,598

R² = 0,0729
R²*100%= 7.29%
Solo es confiable en un 7.29%. No es muy confiable.

 Determine el grado de correlación de las dos variables.

El coeficiente de correlación es la raíz cuadrada de R² en este caso


sería: 0,27
Es un valor que no es muy directa por que no está ni muy cerca a uno ni
a menos 1 por lo tanto no hay relación.
 Relacionar la información obtenida con el problema.

a) ¿Cuántos libros se esperaría que consultara un estudiante de 20 años


y uno de 18 años?

y = -1,8161 (20) + 40,598

y = 4.276

 Un estudiante de 20 años consultaría 4.276 libros.

y = -1,8161 (18) + 40,598

y = 7.908

Un estudiante de 18 años consultaría 7.908 libros.

Con respecto a esta problemática Pruebas SABER 11 - 220 estudiantes 2020 los
resultados estadísticos obtenidos indican que no hay relación entre las variables
edad y numero de libros de consulta este se logró identificar mediante el modelo
matemático de regresión y = -1,8161x + 40,598 donde R² = 0,0729 y su grado de
correlación es de 7.29% de confiabilidad por eso no es confiable. Por consiguiente
se puede decir que los estudiantes entre más años tengan menos libros consultan.
CONCLUSION

Por medio de este trabajo podemos identificar las medidas de correlación y


regresión se compararon datos cuantitativos para determinar dichas medidas y de
esta manera ser analizadas partiendo de una realidad que son las PRUEBAS
SABER 11 con ellas se pudo formular propuestas encaminadas a la
transformación de dicha realidad.
REFERENCIAS BIBLIOGRAFICAS

 Churchill, G.A. (2009). Análisis de Correlación y de Regresión


Simple. México City: Cengage Learning. Páginas 675 – 686

 Pruebas SABER 11 - 220 estudiantes 2020 (16-1)

 Montero, J.M. (2007). Regresión y Correlación Simple. Madrid:


Paraninfo. Paginas. 151 – 158.

 https://ingenioempresa.com/diagrama-de-dispersion/

 https://economipedia.com/definiciones/coeficiente-de-correlacion-
lineal.html

También podría gustarte