Está en la página 1de 15

Unidad 2 _Paso 4_ Descripción de la información

Presentado por;
Daniela Cordoba Mosquera
CC. 1056772827

Grupo
100105ª_951

Presentado a:
Edgar Gabriel Diaz

Universidad Nacional Abierta y a Distancia ( UNAD)


Puerto Boyacá
2021
INTRODUCCIÓN
En el presente trabajo se realizan ejercicios, realización e interpretación de gráficos con
conocimientos referente a las medidas de regresión y correlación lineal simple con
variable cualitativas que están relacionadas con el caso estudio de base de datos 400
pacientes con covid en los diferentes municipios de Colombia.
Medidas de regresión- En estadística, el análisis de la regresión es un proceso estadístico
para estimar las relaciones entre variables. Incluye muchas técnicas para el modelado y
análisis de diversas variables, cuando la atención se centra en la relación entre una
variable dependiente y una o más variables independientes
Correlación lineal simple- Relación entre dos variables cuantitativas y además una de ellas
puede considerarse como variable dependiente o “respuesta” podemos considerar el uso
de la regresión lineal simple. Con la regresión, aparte de medir el grado de asociación
entre las dos variables, podremos realizar predicciones de la variable dependiente.
JUSTIFICACIÓN
En la actualidad la gran mayoría de trabajos e investigaciones se valen de datos
estadísticos para emitir conceptos, realizar estudios y tomar decisiones, por tanto es
importante conocer la forma en la que se realizan estos y como se dan esos análisis.
Además de la realización, es de tener en cuenta también la forma en la que la información
llega al público o en efecto a los usuarios finales que puede ser una nación, un
departamento, una empresa o un simple grupo de personas que necesitan información
sobre algunas variables. Es así que en el presente informe se realizan algunos ejercicios
donde se aplican diferentes elementos estadísticos como la creación de gráficas y análisis,
mediante el uso de una herramienta informática amigable con el usuario y que permite
trabajar con una alta cantidad de datos, que a pesar de su antigüedad sigue siendo muy
usada en todos los niveles académicos y profesionales, es por tanto que la herramienta
Excel de la Suite de Microsoft es útil para estos análisis y nos permite entender de una
forma diferente una gran cantidad de números y datos.
OBJETIVOS
El objetivo principal de esta actividad es detallar y relacionar variables, para realizar un
buen análisis e interpretación de las posibles tendencias que tengan estas a futuro.
Afianzar la creación de graficas de dispersión con diferentes variables y entenderlas,
logrando así la observación de diferentes elementos que estas nos aportan.
Examinar por medio de la correlación la dirección y la fuerza de la asociación entre dos
variables cuantitativas.
Así conoceremos la intensidad de la relación entre ellas y si, al aumentar el valor de una
variable, aumenta o disminuye el valor de la otra variable.
Utilizar la regresión lineal para cuantificar la relación que puede ser observada cuando se
grafica un diagrama de puntos dispersos correspondientes a dos variables.
Buscar la correlación de dos variables para mirar tendencias para solucionar problemas.
Aplicar las diferentes medidas adimensionales, trabajar con ellas y saber cómo calcularlas
e interpretarlas.
Interpretar los resultados obtenidos y brindar una solución a los restos planteados en este
trabajo.
Describir por medio de la regresión como es la relación entre dos variables, de tal manera
que incluso se pueden hacer predicciones sobre una vs la otra.
Actividad 1_ Mapa Mental
Resumir mediante un mapa mental las medidas estadísticas Bivariantes de regresión y correlación.

Enlace: https://www.mindomo.com/es/mindmap/medidas-estadisticas-bivariantes-
9c5e7031bea44b68ade21122a14323b1#

Actividad 2_ Definición de Conceptos


Definir brevemente los conceptos básicos asociados a Regresión y Correlación como:
-Diagrama de dispersión.
-Correlación lineal simple.
-Coeficiente de determinación R2
-Correlación positiva y correlación negativa
- ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?
Socializar las respuestas en el foro de discusión - Unidad 2- paso 4. Descripción de la
Información.
Diagrama de dispersión:
Dispersión se define como el grado de distanciamiento de un conjunto de valores respecto
a su valor medio.
A partir de esta definición, se derivan las medidas de dispersión que aprendimos en la
clase de estadística del colegio: Rango, varianza, desviación, covarianza, coeficiente de
correlación, etc.
Ahora bien, el diagrama de dispersión, también conocido como gráfico de dispersión o
gráfico de correlación consiste en la representación gráfica de dos variables para un
conjunto de datos. En otras palabras, analizamos la relación entre dos variables,
conociendo qué tanto se afectan entre sí o qué tan independientes son una de la otra.
En este sentido, ambas variables se representan como un punto en el plano cartesiano y
de acuerdo con la relación que exista entre ellas, definimos su tipo de correlación.

Correlación lineal simple:


La regresión lineal es la aproximación de un modelo lineal que se utiliza para describir la
relación entre dos o más variables. En la regresión lineal simple, hay dos variables: una
variable dependiente y una variable independiente. El punto clave en la regresión lineal es
que nuestro valor dependiente debe ser continuo y no puede ser un valor discreto. Sin
embargo, las variables independientes pueden ser medidas en una escala de medida
categórica o continua.

Existen dos tipos de modelos de regresión lineal: regresión simple y regresión múltiple. La
regresión lineal simple es cuando se utiliza una variable independiente para estimar una
variable dependiente. Cuando se utiliza más de una variable independiente, el proceso se
denomina regresión lineal múltiple.

Coeficiente de determinación R2
El coeficiente de determinación es la proporción de la varianza total de la variable
explicada por la regresión. El coeficiente de determinación, también llamado R cuadrado,
refleja la bondad del ajuste de un modelo a la variable que pretender explicar.
Es importante saber que el resultado del coeficiente de determinación oscila entre 0 y 1.
Cuanto más cerca de 1 se sitúe su valor, mayor será el ajuste del modelo a la variable que
estamos intentando explicar. De forma inversa, cuanto más cerca de cero, menos ajustado
estará el modelo y, por tanto, menos fiable será.

Correlación positiva y correlación negativa:


La correlación positiva es una relación entre dos variables en la que ambas variables se
mueven en tándem, es decir, en la misma dirección. La correlación negativa o la
correlación inversa es una relación entre dos variables mediante las cuales se mueven en
direcciones opuestas
Una correlación significativa y positiva significa que los sujetos codificados con un uno
tienen en la variable continua una media mayor que los sujetos codificados con un cero; si
la correlación es negativa, la media mayor en la variable continua corresponde a los
sujetos codificados con un cero.

- ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?


La correlación, también conocida como coeficiente de correlación lineal (de Pearson), es
una medida de regresión que pretende cuantificar el grado de variación conjunta entre
dos variables.
Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos
variables, es decir, si se representan en un diagrama de dispersión los valores que toman
dos variables, el coeficiente de correlación lineal señalará lo bien o lo mal que el conjunto
de puntos representados se aproxima a una recta.
De una forma menos coloquial, la podemos definir como el número que mide el grado de
intensidad y el sentido de la relación entre dos variables.

Actividad 3. Ejercicio práctico.


En esta actividad cada estudiante deberá resolver un ejercicio de los que aparecen a
continuación; posterior a ello compartirá su elección en el foro del entorno de Aprendizaje
Foro de discusión Unidad 2- Paso 4 Descripción de la Información. En cada ejercicio
deberá responder los siguientes interrogantes:
Ejercicio
3.5 Temperatura – Enfermedad respiratoria.
En una investigación realizada durante el mes de noviembre en un hospital pediátrico
respecto a la relación de la temperatura ambiente media y los casos de enfermedad
registrados se obtuvieron los
siguientes datos

X(temperatur Y (casos de
a media ºC) enfermedad
respiratoria)
7 30
9 28
12 26
14 24
16 21
19 18
21 15
25 9
28 7

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables.
En el anterior diagrama podemos determinar que existe un tipo de asociación lineal ya
que los diferentes marcadores del grafico nos muestran la unión entre ambas
variables, también podemos ver que a medida que aumentan los valores de la x
disminuyen los valores de la y, es decir que si aumenta la temperatura disminuyen los
casos de enfermedad respiratoria y que si disminuye la temperatura aumentan los
casos de enfermada respiratorias.

b. Encuentre el coeficiente de determinación y correlación.

Después del análisis de la matriz podemos decir que existe una relación fuerte
entre la temperatura y los casos de enfermedad respiratoria ya que tenemos
como muestra 0,99 que es cercano a 1.
Coeficiente de determinación= 0,99 X 100% = 99% , nos indica la confiabilidad del
modelo

Hallamos la raíz cuadrada de 0,99 obtenemos 99% es el coeficiente de relación y


mide el tipo de relación entre la temperatura y los casos de enfermedad
respiratoria .

c. Determine el modelo matemático que permite predecir el efecto de una variable


sobre la otra. ¿Es confiable?

Regresión lineal
Es un modelo matemático para predecir el efecto de una variable sobre otra,
ambas cuantitativas. Una variable es la dependiente y otra la independiente Se
grafica con el diagrama de dispersión. Dice cómo es la relación entre las dos
variables. El análisis consiste en encontrar la “mejor” línea recta de esos puntos.
Coeficiente de determinación= 0,99 X 100% = 99% , nos indica la confiabilidad del
modelo

d. Determine el grado de relación de las dos variables

Después del análisis de la matriz podemos decir que existe una relación perfecta
entre la temperatura y los casos de enfermedad respiratoria ya que tenemos como
muestra 0,99 que es cercano a 1.

Actividad 4. Regresión y correlación Lineal.

A partir de la base de datos suministrada: Anexo 1-Evolución Covid 19 - 400 Pacientes Colombia -
2021 (16-1), cada estudiante, deberá:

-Identificar dos variables cuantitativas de la situación estudiada que puedan estar


relacionadas e identificar la variable dependiente e independiente.
EDAD ( independiente)
PESO (dependiente)
- Realizar el diagrama de dispersión de dichas variables y determinar el tipo de relación
entre las variables.

Al ver el grafico podemos determinar que en este caso las variables no son dependientes
es decir que la una no depende de la otra en este caso Nula

_Determine al coeficiente de determinación y de correlación de las dos variables.


Interprete los resultados
Después del análisis de la matriz podemos decir que existe una relación Nula entre la
Edad y el Peso ya que tenemos como muestra 0,07 que es cercano a 0,0
Es decir no existe relación como tal.

Coeficiente de determinación= 4,8 X 100% = 4,8% , nos indica la confiabilidad del modelo

Hallamos la raíz cuadrada de 4,8 obtenemos 2,1 % es el coeficiente de relación y mide el


tipo de relación entre la edad y el peso .

- Encuentre el modelo matemático que permite predecir el efecto de una variable sobre
la otra. ¿Es confiable?
Si echamos un vistazo a los resultados del coeficiente de determinación podemos deducir
que en este caso el modelo matemático usado no es confiable ya que nos da como
resultado un 4,8
- Determine el tipo de correlación de las dos variables.
El tipo de correlación es :
La correlación nula se da cuando no hay dependencia de ningún tipo entre las variables.

En este caso se dice que las variables son incorreladas y la nube de puntos tiene una
forma redondeada.

- Relacionar la información obtenida con el problema.

Atreves del desarrollo del trabajo podemos determinar que la edad de los pacientes con
covid en el mes de marzo esta entre los 22 y los 80, ademas podemos concluir que en este
caso el peso del paciente no depende de la edad ya que en mayoría todos están pesando
entre los 60 y 69 Kg
CONCLUSIONES

Las gráficas de dispersión de datos nos permiten relacionar diferentes variables entre sí,
para así poder predecir un posible resultado. Dentro del problema estudiado, variables
como el peso y la edad, no presentan mucha relación entre sí, es decir, la variación de
una no depende de la otra. La línea de tendencia ascendente, indica una relación de tipo
creciente. Los puntos en las gráficas indican el grado de dispersión que presentas las
variables que se están relacionado, por ejemplo, en el caso de peso – edad los puntos
presentan mayor dispersión a medida que se aumenta la edad. El modelo matemático nos
permite predecir el efecto de una variable sobre la otra, por ejemplo, en el caso peso –
edad. El porcentaje de variación de variables nos ayuda a determinar el tipo de
confiabilidad que se presenta, al momento de hacer una predicción. Entre mayor sea R2
mayor será la confiabilidad en una predicción.

También podría gustarte