Está en la página 1de 12

Unidad 2 - Paso 4 - Descripción de la Información

Estudiante
Eudel José Pérez Ortiz

Código
1129538781

N° Grupo
100105_140

Tutor
Edgar Gabriel Diaz

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA (UNAD)


CEAD LA GUAJIRA
INGENIERIA ELECTRONICA
Mayo 03 de 2021
INTRODUCCION

En esta unidad realizaremos un análisis sobre regresión y correlación lineal con la


finalidad de buscar o encontrar la relación que existe entre dos variables
cuantitativas seleccionadas, teniendo en cuenta la información sobre la base de
datos que hemos venido trabajando en actividades anteriores “Anexo 1-Evolución
Covid 19 - 400 Pacientes Colombia - 2021 (16-1)”.
Se definen los conceptos con los que trabajaremos en esta unidad, por ej ¿Qué es
un diagrama de dispersión?, ¿Qué es el coeficiente de correlación lineal y qué nos
ayuda a medir?, entre otros conceptos que nos permitirán apropiarnos de la
temática, los cuales pondremos en práctica mediante la realización de ejercicios.
JUSTIFICACION
OBJETIVOS

El objetivo principal en esta unidad es determinar los conceptos de regresión y


correlación lineal simple, donde se aplicarán las medidas estadísticas bivariantes,
por medio del cálculo e interpretación del software estadístico, en función de la
problemática objeto de estudio anteriores “Anexo 1-Evolución Covid 19 - 400
Pacientes Colombia - 2021 (16-1)”.
Actividad 1. Mapa Mental
Actividad 2. Definición de Conceptos

Descripción de la Actividad Individual:

Definir brevemente los conceptos básicos asociados a Regresión y Correlación


como:

 Diagrama de dispersión.

También se conoce como grafico de dispersión o grafico de correlación que


consiste en la representación gráfica de dos variables para un conjunto de
datos. En otras palabras, analizamos si existe algún tipo de relación entre
dos variables, conociendo que tanto se afectan entre si o que tan
independientes son una de la otra. Ambas variables se representan como
un punto en el plano cartesiano y de acuerdo a la relación que exista entre
ellas, definimos su tipo de correlación.

 Correlación lineal simple.

También conocida como coeficiente de correlación lineal (de Pearson), se


refiere al grado de variación conjunta entre dos variables.
Por tanto, es una medida estadística que cuantifica la dependencia lineal
entre dos variables, es decir, si se representan en un diagrama de
dispersión los valores que toman dos variables, el coeficiente de correlación
lineal señalará lo bien o lo mal que el conjunto de puntos representados se
aproxima a una recta.

 Coeficiente de determinación R2

Se usa para medir qué porcentaje de la información es recogida o explicada


por el modelo de regresión escogido. Se trata pues, de determinar las
variaciones de la variable dependiente. Su principal propósito es predecir
futuros resultados o predecir hipótesis, es importante tener en cuenta que el
resultado del coeficiente de determinación R2 oscila entre 0 y 1.
Cuando el R2 es cercano a 1, se dice que el modelo de regresión lineal
ajustado tiene un alto grado de confiabilidad, si al contrario este se acerca a
0 su grado de confiabilidad es muy bajo y se recomienda no utilizar el
modelo de regresión estimado.
2 Se 2
R =1− 2
sy

Donde:
R2=coeficiente de determinacion ,0 ≤ R2 ≤1
Se2=varianza del error estimado
s2y =varianza de la variable dependiente Y
 Correlación positiva y correlación negativa
o Correlación positiva:
Hablamos de correlación positiva cuando una relación entre una
variable y otra es lineal y directa, de manera que en un cambio en
una variable predice el cambio en la otra variable, es decir, ambas
variables varían al mismo tiempo. Este tipo de correlación es
directamente proporcional, si una variable aumenta la otra también,
igual si disminuye.

o Correlación negativa:
Hablamos de correlación negativa cuando la relación entre una
variable y otra es opuesta o inversa, es decir, si una variable
aumenta, la otra disminuye.

 ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?

Es la relación de medida lineal entre dos variables aleatorias cuantitativas,


se usa para medir el grado de relación de dos variables siempre y cuando
ambas sean cuantitativas y continuas.
Se define como:
r =√ R 2
El coeficiente de correlación lineal oscila entre +1 y -1, se puede entonces
interpretar el grado de correlación partiendo de los siguientes límites de
referencia:
Actividad 3. Ejercicio práctico

En esta actividad cada estudiante deberá resolver un ejercicio de los que


aparecen a continuación; posterior a ello compartirá su elección en el foro del
entorno de Aprendizaje Foro de discusión Unidad 2- Paso 4 Descripción de la
Información.

3.4 Temperatura-Vapor. El número de libras de vapor (y) consumidas


mensualmente por una planta química, se relaciona con la temperatura ambiental
promedio (en o F). Para el año 2020, se registraron los siguientes valores de
temperatura y consumo anual.

2020 Registros de temperatura y consumos de vapor.

Mes Temperatura (°F) Consumo de vapor (Lb)


Enero 21 154,56
Febrero 24 198,23
Marzo 32 220,15
Abril 47 350,97
Mayo 50 410, 25
Junio 59 450,76
Julio 68 534,90
Agosto 74 564,06
Septiembre 76 605,78
Octubre 80 620,56
Noviembre 84 625,44
Diciembre 86 630,98

En cada ejercicio deberá responder los siguientes interrogantes:


a. Realice el diagrama de dispersión y determine el tipo de asociación entre las
variables.

En el grafico podemos notar que existe una asociación directa, debido a que a
medida que la temperatura aumenta, también aumenta el consumo de vapor.

b. Encuentre el coeficiente de determinación y correlación.

Coeficiente de determinación

R2=99 %

Coeficiente de correlación
r =√ R 2
r =√ 0,99
r =0,99

c. Determine el modelo matemático que permite predecir el efecto de una variable


sobre la otra. ¿Es confiable?

y=7,61 x +2,47

Este modelo matemático tiene un 99% de confiabilidad, por lo que podemos decir
que es confiable.

d. Determine el grado de relación de las dos variables.

El grado de relación es excelente, debido a que el coeficiente de correlación es


0,99
Actividad 4. Regresión y correlación Lineal

Descripción de la Actividad Individual:

A partir de la base de datos suministrada: Anexo 1-Evolución Covid 19 - 400


Pacientes Colombia - 2021 (16-1), cada estudiante, deberá:

-Identificar dos variables cuantitativas de la situación estudiada que puedan


estar relacionadas e identificar la variable dependiente e independiente.

Variable dependiente: IMC


Variable independiente: Peso

- Realizar el diagrama de dispersión de dichas variables y determinar el tipo


de relación entre las variables.

En el grafico podemos notar que existe una asociación directa, debido a que a
medida que peso aumenta, también aumenta el IMC.
- Determine al coeficiente de determinación y de correlación de las dos
variables. Interprete los resultados

Coeficiente de determinación
0,08∗10 0=8

R2=8 %

Coeficiente de correlación
r =√ R 2
r =√ 0 ,08
r =0,28

- Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?

y=0 , 47 x+(−6,39)

Este modelo matemático tiene un 8% de confiabilidad, por lo que podemos decir


que es no para nada confiable, ya que solo explica el 8%

- Determine el tipo de correlación de las dos variables.

No hay correlación, debido a que el coeficiente de correlación nos dio 0,28

- Relacionar la información obtenida con el problema.

El IMC y el peso, no tienen nada que ver con el contagio de las personas
infectadas con COVID en el país.

También podría gustarte