Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estudiante
xxxxxxx
Código: xxxxxxx
Presentado a
Nombre del tutor de grupo
JUSTIFICACIÓN
El trabajo realizado se elaboró con el fin de detallar y relacionar las variables de una determinada problemática, en la cual se utilizaron Medidas
Bivariantes. Esta actividad tiene como objetivo principal, determinar los conceptos de regresión y correlación lineal simple y múltiple. La aplicación
de estos conceptos, son de gran importancia en el campo de investigación, facilita la conceptualización y las posibles decisiones que podemos tomar
frente a las variables que estemos analizando.
OBJETIVO GENERAL
Objetivo general
• Entender los conceptos básicos de Regresión y Correlación lineal.
Objetivos específicos
REGRESSION
The correlation can say something about the relationship between the
variables. It is used to understand if the relationship is positive or negative
OBJECTIVE the strength of the relationship.
DIAGRAMA DE DISPERSIÓN: Dispersión se define como el grado de distanciamiento de un conjunto de valores respecto a su valor medio. A
partir de esta definición, se derivan las medidas de dispersión que aprendimos en la clase de estadística del colegio: Rango, varianza, desviación,
covarianza, coeficiente de correlación, etc. El diagrama de dispersión, también conocido como gráfico de dispersión o gráfico de correlación consiste
en la representación gráfica de dos variables para un conjunto de datos. En otras palabras, analizamos la relación entre dos variables, conociendo qué
tanto se afectan entre sí o qué tan independientes son una de la otra. En este sentido, ambas variables se representan como un punto en el plano
cartesiano y de acuerdo a la relación que exista entre ellas, definimos su tipo de correlación.
CORRELACIÓN LINEAL SIMPLE: El concepto de relación o correlación se refiere al grado de variación conjunto existente entre dos o más
variables. En este apartado nos vamos a centrar en el estudio de un tipo particular de relación llamada lineal y nos vamos limitar a considerar
únicamente dos variables (simple).
COEFICIENTE DE DETERMINACIÓN R2: Nos indica cuanto de la variación total en Y se debe a la variación en X, Su principal propósito es
predecir futuros resultados o probar una hipótesis, es importante tener en cuenta que el resultado del coeficiente de terminación R2 oscila entre O y 1.
Cuanto más cerca de 1 se sitúe su valor, mayor será el ajuste del modelo a la variable que estamos intentando explicar. Por el contrario, si su
resultado se encuentra más cerca de cero, menos ajustado estará al modelo y menos confiable será.
CORRELACIÓN POSITIVA: Se habla de una correlación positiva cuando una relación entre una variable y otra es lineal y directa, de manera que
un cambio en una variable predice el cambio en la otra variable. En ese caso, se dice que la correlación es positiva perfecta, es decir, ambas variables
varían al mismo tiempo. Este tipo de correlación es directamente proporcional. Hay correlación positiva cuando las dos variables se correlacionan en
sentido directo. Por lo que, a valores altos de una le corresponden valores altos de la otra e igualmente con los valores bajos.
CORRELACIÓN NEGATIVA: Se habla de una correlación negativa cuando la relación entre una variable y otra es opuesta o inversa, es decir,
cuando una variable cambia, la otra se modifica hacia lo contrario. Entonces, cuando una posee variable valores altos, la otra posee valores bajos y
mientras este valor esté más cerca de -1, más evidente será esta covariación. Se dice que hay correlación negativa perfecta cuando r = -1. Este tipo de
correlación es inversamente proporcional. Entonces, hay correlación negativa cuando las dos variables se correlacionan en sentido inverso.
En estadística, el coeficiente de correlación es una medida lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la
correlación de Pearson es independiente de la escala de medida de las variables. De manera menos formal, podemos definir el coeficiente de
correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean
cuantitativas y continuas.
3. Peso-Altura. Un colegio del distrito de Bogotá desea realizar un estudio de crecimiento dentro de su población femenina, para lo que se ha
construido desde una muestra la siguiente de información del peso (en kg.) y la altura (en cm.) de 15 jóvenes:
40
VARIABLE X VARIABLE Y
PESO
ALTURA (CM) PESO (KG) 30
150 48 20
143 53 10
146 48
0
160 66 140 145 150 155 160 165
143 48 ESTATURA
145 53
149 54
158 65
150 65
150 55
153 54
151 52
151 55
147 58
142 56
c. Determine el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable?
y = 0,7215x - 52,308
Según la table de correlación lineal nuestro dato (0, 63) dice que es: CORRELACIÓN REGULAR
La relación lineal es positiva puesto que es ascendente, a mayor estatura mayor peso.
a. Identificar dos variables cuantitativas de la situación estudiada que puedan estar relacionadas e identificar la variable dependiente e
independiente.
Las variables que escogí según “Anexo 1-Indicadores de accidentalidad - 230 Municipios 2021.” Fue:
INDEPENDIENTE: PEATONES FALLECIDOS
DEPENDIENTE: PROMEDIO DE EDAD DE FALLECIDOS
b. Realizar el diagrama de dispersión de dichas variables y determinar el tipo de relación entre las variables.
60
PROMEDIO DE EDAD
50
40
f(x) = 0.170472440944882 x + 36.9094881889764
30
R² = 0.00131079883482421
20
10
0
0 2 4 6 8 10 12 14 16 18 20
PEATON
c. Determine el coeficiente de determinación y de correlación de las dos variables. Interprete los resultados.
d. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable?
y = 0,1705x + 36,909
Según la table de correlación lineal nuestro dato (0, 036) dice que es: NO HAY RELACIÓN
NO ES CONFIABLE
La edad promedio de fallecidos y los peatones fallecidos, debido a que su coeficiente de correlación nos dio 0,036 podemos determinar que no hay
correlación entre estos dos factores y por lo tanto el modelo matemático y = 0,1705x + 36,909 no es confinable por lo que no se podrá hacer
predicciones a future con estas dos variables.
A. Identificar una variable cuantitativa dependiente y varias variables cuantitativas independientes del estudio de investigación.
Las variables que escogí según “Anexo 1-Indicadores de accidentalidad - 230 Municipios 2021.” Fue:
INDEPENDIENTE: USUARIOS DE MOTO FALLECIDOS
INDEPENDIENTE: PEATONES FALLECIDOS
DEPENDIENTE: PROMEDIO DE EDAD DE FALLECIDOS
20
10
0
0 20 40 60 80 100 120
Muestra percentil
Y= -0,1950*X1+0,4853*X2+37,106
COEFICIENTE DE CORRELACIÓN ES: 0,208022949 y al llevar el valor a la tabla de grade de correlación lineal nos dice que -> NO HAY CORRELACIÓN por
lo tanto no es confiable.
D. Relacionar la información obtenida con el problema.
Encontramos que la variable USUARIOS DE MOTO FALLECIDOS y PEATONES FALLECIDOS son las variables independientes y estas
variables no se encuentran asociadas con el PROMEDIO DE EDAD DE FALLECIDOS, así que podemos inferir que no podremos predecir el
promedio de fallecidos en consideración de los usuarios de moto fallecidos y peatones fallecidos.
CONCLUSIONES
A través del desarrollo del presente trabajo puedo concluir que se logró aprender e identificar conceptos importantes como diagrama de dispersión,
correlación lineal, coeficiente de determinación, correlación positiva y correlación negativa, los cuales son de suma importancia al momento de
clasificar, elegir y manipular información, que nos permiten simplificar la interpretación de los datos recolectados de una forma rápida y eficiente.
La metodología usada para llevar a cabo los ejercicios de la unidad tres, nos ayudaron a practicar los conceptos anteriormente mencionados,
dándonos claridad sobre el manejo de la información a través de Excel. Con este trabajo pudimos aprender a comprobar la relación que existe entre
una o más variables estadísticamente, ya que intuitivamente podemos deducir que una variable depende de otra, pero al realizarlo estadísticamente
podremos darnos cuenta que tan confiable y que tanta relación existe entre ambas.