Está en la página 1de 14

Paso 4 – Descripción de la información

Estudiante
xxxxxxx
Código: xxxxxxx

Código curso 202107095- Estadística


Grupo - XXX

Presentado a
Nombre del tutor de grupo

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


XX de XXX de 2022
INTRODUCCIÓN
El siguiente trabajo trata de un análisis sobre Regresión y Correlación lineal con la finalidad de buscar o encontrar la relación que existe entre dos
variables cuantitativas seleccionadas, Así mismo, se describen los conceptos relacionados con la temática trabajada: por ejemplo: ¿Qué es el
coeficiente lineal y que nos ayuda a medir? O ¿qué es el Coeficiente de determinación R2? Entre otros conceptos importantes que nos permitieron
apropiarnos de la temática, desarrollo de los ejercicios, la comprensión y el análisis de los mismos.

JUSTIFICACIÓN
El trabajo realizado se elaboró con el fin de detallar y relacionar las variables de una determinada problemática, en la cual se utilizaron Medidas
Bivariantes. Esta actividad tiene como objetivo principal, determinar los conceptos de regresión y correlación lineal simple y múltiple. La aplicación
de estos conceptos, son de gran importancia en el campo de investigación, facilita la conceptualización y las posibles decisiones que podemos tomar
frente a las variables que estemos analizando.

OBJETIVO GENERAL

Objetivo general
• Entender los conceptos básicos de Regresión y Correlación lineal.

Objetivos específicos

• Presentar el cálculo de las Medidas Bivariantes de regresión lineal simple.


• Determinar el grado de relación de las variables.
• Identificar el modelo matemático que tiene una variable sobre la otra.

Actividad 1. Mapa mental o conceptual.


BIVARIATE STATISTICAL MEASURES
OF REGRESSION AND CORRELATION.
2
1 CORRELATION

REGRESSION

Correlation means that there is a link between various events.


One of the tools that allows us infer whether there is such a
link is precisely the correlation analysis
In regression analysis it is a tool of frequent use in
statistics that allows to investigate the relationships
between different quantitative variables dependent,
regression analysis is a process or model that analyzes
the link between a variable dependent and one or OBJECTIVE
more independent variables.

The correlation can say something about the relationship between the
variables. It is used to understand if the relationship is positive or negative
OBJECTIVE the strength of the relationship.

• regression analysis is to build a function that allows


estimating the future value of the study variable.

• regression allows to calculate a conditional (average)


expectation.

Actividad 2. Definición de Conceptos

DIAGRAMA DE DISPERSIÓN: Dispersión se define como el grado de distanciamiento de un conjunto de valores respecto a su valor medio. A
partir de esta definición, se derivan las medidas de dispersión que aprendimos en la clase de estadística del colegio: Rango, varianza, desviación,
covarianza, coeficiente de correlación, etc. El diagrama de dispersión, también conocido como gráfico de dispersión o gráfico de correlación consiste
en la representación gráfica de dos variables para un conjunto de datos. En otras palabras, analizamos la relación entre dos variables, conociendo qué
tanto se afectan entre sí o qué tan independientes son una de la otra. En este sentido, ambas variables se representan como un punto en el plano
cartesiano y de acuerdo a la relación que exista entre ellas, definimos su tipo de correlación.

CORRELACIÓN LINEAL SIMPLE: El concepto de relación o correlación se refiere al grado de variación conjunto existente entre dos o más
variables. En este apartado nos vamos a centrar en el estudio de un tipo particular de relación llamada lineal y nos vamos limitar a considerar
únicamente dos variables (simple).

COEFICIENTE DE DETERMINACIÓN R2: Nos indica cuanto de la variación total en Y se debe a la variación en X, Su principal propósito es
predecir futuros resultados o probar una hipótesis, es importante tener en cuenta que el resultado del coeficiente de terminación R2 oscila entre O y 1.
Cuanto más cerca de 1 se sitúe su valor, mayor será el ajuste del modelo a la variable que estamos intentando explicar. Por el contrario, si su
resultado se encuentra más cerca de cero, menos ajustado estará al modelo y menos confiable será.

CORRELACIÓN POSITIVA Y CORRELACIÓN NEGATIVA.

CORRELACIÓN POSITIVA: Se habla de una correlación positiva cuando una relación entre una variable y otra es lineal y directa, de manera que
un cambio en una variable predice el cambio en la otra variable. En ese caso, se dice que la correlación es positiva perfecta, es decir, ambas variables
varían al mismo tiempo. Este tipo de correlación es directamente proporcional. Hay correlación positiva cuando las dos variables se correlacionan en
sentido directo. Por lo que, a valores altos de una le corresponden valores altos de la otra e igualmente con los valores bajos.
CORRELACIÓN NEGATIVA: Se habla de una correlación negativa cuando la relación entre una variable y otra es opuesta o inversa, es decir,
cuando una variable cambia, la otra se modifica hacia lo contrario. Entonces, cuando una posee variable valores altos, la otra posee valores bajos y
mientras este valor esté más cerca de -1, más evidente será esta covariación. Se dice que hay correlación negativa perfecta cuando r = -1. Este tipo de
correlación es inversamente proporcional. Entonces, hay correlación negativa cuando las dos variables se correlacionan en sentido inverso.

¿QUÉ ES EL COEFICIENTE DE CORRELACIÓN LINEAL Y QUE NOS AYUDA A MEDIR?

En estadística, el coeficiente de correlación es una medida lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la
correlación de Pearson es independiente de la escala de medida de las variables. De manera menos formal, podemos definir el coeficiente de
correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean
cuantitativas y continuas.

Actividad 3. Ejercicio práctico.

3. Peso-Altura. Un colegio del distrito de Bogotá desea realizar un estudio de crecimiento dentro de su población femenina, para lo que se ha
construido desde una muestra la siguiente de información del peso (en kg.) y la altura (en cm.) de 15 jóvenes:

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.


70

60 f(x) = 0.721458773784355 x − 52.3083157152924


50 R² = 0.397627682186667

40
VARIABLE X VARIABLE Y

PESO
ALTURA (CM) PESO (KG) 30
150 48 20
143 53 10
146 48
0
160 66 140 145 150 155 160 165
143 48 ESTATURA
145 53
149 54
158 65
150 65
150 55
153 54
151 52
151 55
147 58
142 56

b. Encuentre el coeficiente de determinación y correlación.

Coeficiente de determinación: R² = 0,3976


Coeficiente de correlación: R= 0, 63

c. Determine el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable?

y = 0,7215x - 52,308

Según la table de correlación lineal nuestro dato (0, 63) dice que es: CORRELACIÓN REGULAR

d. Determine el grado de relación de las dos variables.

La relación lineal es positiva puesto que es ascendente, a mayor estatura mayor peso.

Actividad 4. Regresión y correlación Lineal Simple.

a. Identificar dos variables cuantitativas de la situación estudiada que puedan estar relacionadas e identificar la variable dependiente e
independiente.

Las variables que escogí según “Anexo 1-Indicadores de accidentalidad - 230 Municipios 2021.” Fue:
INDEPENDIENTE: PEATONES FALLECIDOS
DEPENDIENTE: PROMEDIO DE EDAD DE FALLECIDOS

Tomé 200 datos para poder realizar el análisis.

b. Realizar el diagrama de dispersión de dichas variables y determinar el tipo de relación entre las variables.

EDAD EN FUNCIÓN DE LOS PEATONES FALLE-


CIDOS
70

60
PROMEDIO DE EDAD

50

40
f(x) = 0.170472440944882 x + 36.9094881889764
30
R² = 0.00131079883482421
20

10

0
0 2 4 6 8 10 12 14 16 18 20

PEATON

c. Determine el coeficiente de determinación y de correlación de las dos variables. Interprete los resultados.

Coeficiente de determinación: R² = 0,0013


Coeficiente de correlación: R= 0,036

d. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable?
y = 0,1705x + 36,909

Según la table de correlación lineal nuestro dato (0, 036) dice que es: NO HAY RELACIÓN
NO ES CONFIABLE

e. Determine el tipo de correlación de las dos variables.

La relación lineal es positiva puesto que es ascendente.

f. Relacionar la información obtenida con el problema.

La edad promedio de fallecidos y los peatones fallecidos, debido a que su coeficiente de correlación nos dio 0,036 podemos determinar que no hay
correlación entre estos dos factores y por lo tanto el modelo matemático y = 0,1705x + 36,909 no es confinable por lo que no se podrá hacer
predicciones a future con estas dos variables.

Actividad 5. Regresión y Correlación Múltiple.

A. Identificar una variable cuantitativa dependiente y varias variables cuantitativas independientes del estudio de investigación.

Las variables que escogí según “Anexo 1-Indicadores de accidentalidad - 230 Municipios 2021.” Fue:
INDEPENDIENTE: USUARIOS DE MOTO FALLECIDOS
INDEPENDIENTE: PEATONES FALLECIDOS
DEPENDIENTE: PROMEDIO DE EDAD DE FALLECIDOS

Tomé 200 datos para poder realizar el análisis.

B. Realizar el diagrama de dispersión de dichas variables.

Gráfi co de probabilidad normal


70
60
50
40
30
Y

20
10
0
0 20 40 60 80 100 120
Muestra percentil

C. Calcular la recta de regresión y el coeficiente de correlación para probar estadísticamente su relación.

LA RECTA DE REGRESIÓN ES:

Y= -0,1950*X1+0,4853*X2+37,106

COEFICIENTE DE CORRELACIÓN ES: 0,208022949 y al llevar el valor a la tabla de grade de correlación lineal nos dice que -> NO HAY CORRELACIÓN por
lo tanto no es confiable.
D. Relacionar la información obtenida con el problema.

Encontramos que la variable USUARIOS DE MOTO FALLECIDOS y PEATONES FALLECIDOS son las variables independientes y estas
variables no se encuentran asociadas con el PROMEDIO DE EDAD DE FALLECIDOS, así que podemos inferir que no podremos predecir el
promedio de fallecidos en consideración de los usuarios de moto fallecidos y peatones fallecidos.

CONCLUSIONES

A través del desarrollo del presente trabajo puedo concluir que se logró aprender e identificar conceptos importantes como diagrama de dispersión,
correlación lineal, coeficiente de determinación, correlación positiva y correlación negativa, los cuales son de suma importancia al momento de
clasificar, elegir y manipular información, que nos permiten simplificar la interpretación de los datos recolectados de una forma rápida y eficiente.
La metodología usada para llevar a cabo los ejercicios de la unidad tres, nos ayudaron a practicar los conceptos anteriormente mencionados,
dándonos claridad sobre el manejo de la información a través de Excel. Con este trabajo pudimos aprender a comprobar la relación que existe entre
una o más variables estadísticamente, ya que intuitivamente podemos deducir que una variable depende de otra, pero al realizarlo estadísticamente
podremos darnos cuenta que tan confiable y que tanta relación existe entre ambas.

También podría gustarte