Está en la página 1de 10

PASO 4

DESCRIPCIÓN DE LA INFORMACIÓN

PRESENTADO POR:
JORGE EDWIN AGUDELO LEÓN
GRUPO: 204040_194

PRESENTADO A:
TUTORA
DIANA CAROLINA MENDEZ

UNIVERSIDAD ABIERTA Y ADISTANCIA – UNAD


INGENIERIA DE TELECOMUNICACIONES
1 2019
INTRODUCCION

Este trabajo se realiza como evidencia del aprendizaje del Paso 4- Descripción de la
Información. Es importante aprender a calcular medidas bivariantes que permiten
determinar la dispersión de un conjunto de datos con respecto a su media y la Regresión
y Determinación, pretende facilitar herramientas para analizar la relación entre dos
variables cuantitativas a partir de la regresión lineal simple.

JUSTIFICACIÓN

Las técnicas estadísticas bivariantes permiten el análisis de dos características o


variables con el propósito de detectar posibles relaciones entre ellas. La naturaleza
(nominal, ordinal o numérica) de las características objeto de estudio determinará las
herramientas más adecuadas para su análisis. Esta técnica también permite saber si
una variable está en función de la otra.
OBJETIVOS

 Determinar la relación entre dos o más variables a partir de la regresión lineal simple y la regresión múltiple.
 Calcular e interpretar adecuadamente las medidas estadísticas bivariantes
 Determinar la relación entre dos o más variables propias del problema, asociándolas en su contexto cotidiano.
Actividades a desarrollar

Actividad 1. Mapa Mental.


Descripción de la Actividad:

Resumir mediante un mapa mental las medidas estadísticas Bivariantes de regresión,


describiendo ampliamente al menos una de ellas, regresión lineal simple o regresión
múltiple.

Actividad 2. Definición de Conceptos.


Descripción de la Actividad:

Definir brevemente los conceptos básicos asociados a Regresión y Correlación como:


Diagrama de dispersión:

El diagrama de dispersión, también conocido como gráfico de dispersión o gráfico


de correlación consiste en la representación gráfica de dos variables para un conjunto
de datos. En otras palabras, analizamos la relación entre dos variables, conociendo qué
tanto se afectan entre sí o qué tan independientes son una de la otra.

En este sentido, ambas variables se representan como un punto en el plano cartesiano


y de acuerdo a la relación que exista entre ellas, definimos su tipo de correlación.

Correlación lineal simple


El principal objetivo de la regresión simple es construir un modelo funcional 𝑦 = 𝑓(𝑥)
que explique lo mejor posible la relación entre dos variables 𝑋 (variable independiente)
e 𝑌 (variable dependiente) medidas en una misma muestra. Generalmente, el modelo
construido se utiliza para realizar inferencias predictivas de 𝑌 en función de 𝑋 en el
resto de la población.

Coeficiente de determinación R2:


El coeficiente de determinación, se define como la proporción de la varianza total de
la variable explicada por la regresión. El coeficiente de determinación, también llamado
R cuadrado, refleja la bondad del ajuste de un modelo a la variable que pretender
explicar.

Es importante saber que el resultado del coeficiente de determinación oscila entre 0 y


1. Cuanto más cerca de 1 se sitúe su valor, mayor será el ajuste del modelo a la
variable que estamos intentando explicar. De forma inversa, cuanto más cerca de cero,
menos ajustado estará el modelo y, por tanto, menos fiable será.

Correlación positiva
Se presenta cuando una variable aumenta o disminuye y la otra también,
respectivamente. Hay una relación proporcional. Por ejemplo, para un vendedor de
carros, si él vende más carros (variable 1), va a ganar más dinero (variable 2).

Correlación negativa
Se presenta cuando una variable se comporta de forma contraria o a la otra, es decir
que, si una variable aumenta, la otra disminuye. Hay una relación inversa proporcional.
Por ejemplo, para la construcción de un edificio, entre más trabajadores estén
construyendo un edificio (variable 1), menos tiempo se necesitará para tenerlo listo
(variable 2)

¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?

La finalidad de la correlación es examinar la dirección y la fuerza de la asociación entre


dos variables cuantitativas. Así conoceremos la intensidad de la relación entre ellas y
si, al aumentar el valor de una variable, aumenta o disminuye el valor de la otra
variable. Para valorar la asociación entre dos variables, la primera aproximación suele
hacerse mediante un diagrama de dispersión.
En el diagrama de dispersión de la figura 4.3 parece existir una relación lineal entre el
peso y el índice de masa corporal de los pacientes. Además, si nos fijamos parece que
existe un dato atípico que se aleja de la nube de puntos.

Con la nube de puntos podemos apreciar si existe o no una tendencia entre las dos
variables, pero si queremos cuantificar esta asociación debemos calcular un coeficiente
de correlación.

Hay dos coeficientes de correlación que se usan frecuentemente: el de Pearson


(paramétrico) y el de Spearman (no paramétrico, se utiliza en aquellos casos donde
las variables examinadas no cumplen criterios de normalidad o cuando las variables
son ordinales).
El coeficiente de correlación de Pearson evalúa específicamente la adecuación a la
recta lineal que defina la relación entre dos variables cuantitativas. El coeficiente no
paramétrico de Spearman mide cualquier tipo de asociación, no necesariamente lineal.

Coeficiente de Correlación lineal de Pearson:

El estimador muestral más utilizado para evaluar la asociación lineal entre dos
variables X e Y es el coeficiente de correlación de Pearson (r). Se trata de un
índice que mide si los puntos tienen tendencia a disponerse en una línea recta. Puede
tomar valores entre -1 y +1.
Es un método estadístico paramétrico, ya que utiliza la media, la varianza, y por tanto,
requiere criterios de normalidad para las variables analizadas. Se define como la
covarianza muestral entre X e Y dividida por el producto de las desviaciones típicas de
cada variable:
𝑺𝒙𝒚
𝑺=
𝑺𝒙 𝑺𝒚
La expresión matemática para el coeficiente de correlación de Pearson parece
compleja, pero esconde un planteamiento que, en el fondo, es sencillo: “r” estará
próximo a 1 (en valor absoluto) cuando las dos variables X e Y estén intensamente
relacionadas, es decir, al aumentar una aumenta otra y viceversa. A este concepto de
variación al unísono se le llama covarianza.

Socializar las respuestas en el foro paso 4. Descripción de la Información.

Actividad 3. Realizar el laboratorio de regresión y correlación lineal


Descripción de la Actividad:

A partir de la base de datos “Indicadores socioeconómicos 125 municipios (2019)


16-1”, desarrollar el Laboratorio denominado Regresión y correlación, el cual se
encuentra en el Entorno de aprendizaje práctico, en la carpeta Guía para el uso de
recursos educativos. El laboratorio lo puede desarrollar con el programa Infostat o
Excel. Donde el estudiante deberá realizar lo siguiente:

a. Identificar dos variables cuantitativas de la situación estudiada que puedan


estar relacionadas.
b. Realizar el diagrama de dispersión de dichas variables y determinar el tipo de
relación entre las variables.
c. Encuentre el modelo matemático que permite predecir el efecto de una variable
sobre la otra. ¿Es confiable?
d. Determine el grado de correlación de las dos variables.
e. Relacionar la información obtenida con el problema.
f. Establezca al menos 3 nuevos valores independientes para ser hallados a través
del modelo matemático calculado.
Socializar las respuestas en el foro paso 4. Descripción de la Información.
Actividad 4. Regresión y correlación múltiple.
Descripción de la Actividad:

A partir de la base de datos suministrada “Indicadores socioeconómicos 125


municipios (2019) 16-1”, cada estudiante, deberá:

a. Identificar una variable cuantitativa dependiente y varias variables cuantitativas


independientes del estudio de investigación.
b. Realizar el diagrama de dispersión de dichas variables.
c. Calcular la recta de regresión y el coeficiente de correlación para probar
estadísticamente su relación.
d. Relacionar la información obtenida con el problema.
BIBLIOGRAFIA

También podría gustarte