Está en la página 1de 6

Actividad 2. Definición de Conceptos.

Definir brevemente los conceptos básicos asociados a Regresión y


Correlación como:

 Diagrama de dispersión
Un diagrama de dispersión o gráfica de dispersión o gráfico de burbujas es un tipo
de diagrama matemático que utiliza las coordenadas cartesianas para mostrar los
valores de dos variables para un conjunto de datos.

 Correlación lineal simple


La correlación, también conocida como coeficiente de correlación lineal (de
Pearson), es una medida de regresión que pretende cuantificar el grado de
variación conjunta entre dos variables.
Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos
variables, es decir, si se representan en un diagrama de dispersión los valores que
toman dos variables, el coeficiente de correlación lineal señalará lo bien o lo mal
que el conjunto de puntos representados se aproxima a una recta.
De una forma menos coloquial, la podemos definir como el número que mide el
grado de intensidad y el sentido de la relación entre dos variables.

 Coeficiente de determinación R2
El coeficiente de determinación, se define como la proporción de la varianza total
de la variable explicada por la regresión. El coeficiente de determinación, también
llamado R cuadrado, refleja la bondad del ajuste de un modelo a la variable que
pretender explicar.
Es importante saber que el resultado del coeficiente de determinación oscila entre
0 y 1. Cuanto más cerca de 1 se sitúe su valor, mayor será el ajuste del modelo a
la variable que estamos intentando explicar. De forma inversa, cuanto más cerca
de cero, menos ajustado estará el modelo y, por tanto, menos fiable será.
 Correlación positiva y correlación negativa
**Si r < 0 Hay correlación negativa: las dos variables se correlacionan en sentido
inverso. A valores altos de una de ellas le suelen corresponder valor bajos de la
otra y viceversa. Cuánto más próximo a -1 esté el coeficiente de correlación más
patente será esta comparación extrema. Si r= -1 hablaremos de correlación
negativa perfecta lo que supone una determinación absoluta entre las dos
variables (en sentido inverso): Existe una relación funcional perfecta entre ambas
(una relación lineal de pendiente negativa).
** Si r > 0 Hay correlación positiva: las dos variables se correlacionan en sentido
directo. A valores altos de una le corresponden valores altos de la otra e
igualmente con los valores bajos. Cuánto más próximo a +1 esté el coeficiente de
correlación más patente será esta comparación. Si r = 1 hablaremos
de correlación positiva perfecta lo que supone una determinación absoluta entre
las dos variables (en sentido directo): Existe una relación lineal perfecta (con
pendiente positiva).
** Si r = 0 se dice que las variables están incorrelacionadas: no puede
establecerse ningún sentido de comparación.

 ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?


El Coeficiente de correlación es una medida que permite conocer el grado de
asociación lineal entre dos variables cuantitativas (X, Y).
En los siguientes Diagramas de dispersión se puede observar que existe una
relación lineal entre la variable X y la variable Y.
Actividad 3. Ejercicio práctico
En esta actividad cada estudiante deberá resolver un ejercicio de los que
aparecen a continuación; posterior a ello compartirá su elección en el foro del
entorno de Aprendizaje Foro de discusión Unidad 2- Paso 4 Descripción de la
Información. En cada ejercicio deberá responder los siguientes interrogantes:

 Montaje – Horas de trabajo

3.3 Montaje – Horas de trabajo.

En una empresa se desea verificar si la calidad de los computadores con


defectos de montaje tiene relación con las horas trabajadas por día. Los
siguientes datos representan dicha situación:

a. Realice el diagrama de dispersión y determine el tipo de asociación


entre las variables.

DIAGRAMA DE DISPERSIÓN
16
Computadores con defectos

14
f(x) = 1.43 x − 0.31
12 R² = 0.95
10
8
6
4
2
0
4 5 6 7 8 9 10 11
Horas de trabajo (x)
b. Encuentre el coeficiente de determinación y correlación.
El modelo matemático que permite predecir el efecto de una variable sobre la
otra es:

Y =1,4337 x−0,3133

R2=0,9461
Se puede asegurar que la ecuación de la recta es confiable porque el R² está
cercano a 1 y tiene un grado alto de confiabilidad.

c. Determine el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?
Para determinar o pronosticar la relación de una variable sobre otra es
necesario hallar la función de ajuste: Y =a x −b
Y =1,4337 x −0,3133
Esta es una herramienta muy confiable ya que permite determinar el comportamiento de
las variables si se halla de manera adecuada.

d. Determine el grado de relación de las dos variables.


El R² afirma además que el modelo explica el 94,6% de la información y el
valor de r coeficiente de correlación lineal es excelente porque el 0.946 está
muy cercano al extremo 1 positivo que es la correlación perfecta positiva.
ACTIVIDAD 4. REGRESIÓN Y CORRELACIÓN LINEAL.

Descripción de la Actividad Individual:

A partir de la base de datos suministrada: Anexo 1- Indicadores de


accidentalidad -230 municipios 2020 (16-4), cada estudiante, deberá:

 Identificar dos variables cuantitativas de la situación estudiada que


puedan estar relacionadas e identificar la variable dependiente e
independiente.
Las variables cuantitativas para la situación a estudiar serán Motocicleta – Peatón.

 Realizar el diagrama de dispersión de dichas variables y determinar el


tipo de relación entre las variables.

DIAGRAMA DE DISPERSIÓN
25

20 f(x) = 0.09 x + 0
R² = 1
MOTOCICLISTA

15

10

0
0 50 100 150 200 250 300
PEATON

 Determine al coeficiente de determinación y de correlación de las dos


variables. Interprete los resultados

 Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?
El modelo matemático el cual nos permite predecir una variable sobre la otra es la
ecuación de la tendencia de la línea, la cual corresponde a:
Y =0,0923 X −1 E−1 4 . Según su coeficiente de determinación; R2=1, se afirma que
el modelo matemático obtenido el cual relaciona las variables de porcentaje de
RTA: motociclistas y peatón es confiable.

 Determine el tipo de correlación de las dos variables.


Teniendo en cuenta los resultados obtenidos en Excel se determina el
siguiente modelo matemático el cual tiene un porcentaje de confiabilidad de
R2=1 . De esta manera y teniendo en cuenta ese valor numérico el estudio y los
datos obtenidos son confiables.

 Relacionar la información obtenida con el problema.


La relación obtenida en el problema es que el número de fallecimientos de
motociclistas es mucho mayor que el de peatón, eso es lo que reflejan las
estadísticas tomadas de la base de datos de accidentalidad en el año 2019.

Estos valores se analizaron en el año 2019, verificando de esta forma cual es


el problema existente, esta información es útil para el país ya que permite
verificar si estamos disminuyendo las estadísticas de años anteriores.

También podría gustarte