Está en la página 1de 14

Introducción

En el presente trabajo se pretende aplicar las distintas medidas bivariantes, por medio del
uso de Excel o el software estadístico Infostat en función del a problemática de estudio que
fue la recopilación histórica de una base de datos de los actores viales afectados por
accidentes de tránsito en el año 2021.

En ese orden, se elaboró un mapa mental en inglés recapitulando todas las medidas
bivariantes de dispersión, luego, se buscaron algunos conceptos útiles para el ejercicio, y
por último se aplicaron los conocimientos adquiridos en tres ejercicios escogidos por el
estudiante, identificando las variables dependientes e independientes de la base de datos y a
partir de ello se sacaron algunas conclusiones.
Justificación

El desarrollo del trabajo se hizo con el fin de llevar a cabo la fase 4 del curso de estadística

para ello se utilizó una base de datos donde se registra los fallecidos por actor vial en

accidentes de tránsito del año 2021,” Anexo 1-Indicadores de accidentalidad - 230

Municipios 2021.”; Con ello se aplicó el proceso de regresión lineal simple para dos

variables, luego, se revisó la relación de una variable independiente con varias dependientes

para el proceso de regresión múltiple, hallando la ecuación de regresión.


Objetivos

 Resumir mediante un mapa mental las medidas estadísticas Bivariantes de regresión


y correlación, la información que repose en el mapa conceptual sea en lengua
extranjera inglés.
 Definir brevemente algunos conceptos básicos asociados a Regresión y Correlación.
 Resolver un ejercicio con las variables peso-altura, encontrando sus medidas de
dispersión.
 Escoger del Anexo 1-Indicadores de accidentalidad - 230 Municipios 2021.”dos
variables cuantitativas y aplicar las medidas de dispersión
 Revisar del Anexo 1-Indicadores de accidentalidad - 230 Municipios 2021.” una
variable cuantitativa dependiente y varias variables cuantitativas independientes del
estudio de investigación, y realizar todas las operaciones correspondientes.
Mapa Mental
Diagrama de dispersión: Es una representación gráfica de la relación que hay sobre dos
variables cuantitativas sobre un mismo grupo de individuos, puede ser expresada mediante
un plano cartesiano.

Correlación lineal simple: trata de establecer la relación o dependencia que existe entre
dos variables que intervienen en relación bidimensional, la forma más simple para ver si
esas variables se relacionan o no, es ver si covarían.

Coeficiente de determinación R2: Es una medida en los modelos de regresión, el cual


determina la proporción de variabilidad de la variable dependiente (y) considerada o
explicada por la variable independiente (x), se encuentra definido en un intervalo de 0 a 1:
0 ≤r 2 ≤1.

Correlación positiva y correlación negativa: se dice que una correlación es positiva


cuando la relación entre una variable y otra es lineal y directa, de manera que un cambio en
una variable predice el cambio en la otra variable, en contraste con la correlación negativa
que se presenta cuando la relación entre una variable y la otra es opuesta o inversa, es decir,
cuando una variable cambia, la otra se modifica hacia lo contrario.

¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?

El coeficiente de correlación lineal es un tipo de medida de regresión que se emplea para


conocer el grado de variación entre dos variables determinadas, permite cuantificar la
dependencia entre dos variables, y en este caso establecer una correlación lineal entre ellas.

En ese orden, nos ayuda a medir la fuerza y el sentido de la relación lineal entre dos
variables cuantitativas.
Actividad 3. Ejercicio práctico.
En esta actividad cada estudiante deberá resolver un ejercicio de los que aparecen a
continuación; posterior a ello compartirá su elección en el foro del entorno de Aprendizaje
Foro de discusión Unidad 3- Paso 4 Descripción de la Información. En cada ejercicio
deberá responder los siguientes interrogantes:

a) Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables.

Altura vrs peso


161
159
157
155
153
151
Altura (cm)

149
147
145
143
141
139
137
135
133
45 50 55 60 65 70
Peso (Kg)

Si se toma como referencia el valor mínimo y máximo de altura con respecto al peso, se
puede decir que tiene una relación DIRECTA, puesto que si aumenta una aumenta también
la otra.
b) Encuentre el coeficiente de determinación y correlación.
El coeficiente de determinación es R² = 0,3976
El coeficiente de correlación es R= 0,63055

c) Determine el modelo matemático que permite predecir el efecto de una variable


sobre la otra. ¿Es confiable?
y = 0,5511x + 118,7
Para determinar la confiabilidad del modelo se multiplica el R² por el 100% lo que da:
39,76% lo que indica que el modelo matemático encontrado es poco probable.
d) Determine el grado de relación de las dos variables.
El grado de correlación es regular puesto que el coeficiente de correlación r está:

0,60<r < 0,80


Actividad 4. Regresión y correlación Lineal Simple.

Descripción de la Actividad Individual:

A partir de la base de datos suministrada “Anexo 1-Indicadores de accidentalidad - 230


Municipios 2021.”, cada estudiante, deberá:

Identificar dos variables cuantitativas de la situación estudiada que puedan estar


relacionadas e identificar la variable dependiente e independiente.

Variable independiente: Usuario de moto


Variable dependiente: Fallecidos ene-feb 2019

- Realizar el diagrama de dispersión de dichas variables y determinar el tipo de relación


entre las variables.
Usuario de moto Vrs Fallcidos ene-feb 2019
400

350

300
fallecidos ene-feb 2019

250

200

150

100

50

0
0 20 40 60 80 100 120 140 160 180 200 220
Usuario moto

- Determine el coeficiente de determinación y de correlación de las dos variables. Interprete


los resultados

El coeficiente de determinación es R² = 0,8247

El coeficiente de correlación es r: 0,9077

Como el coeficiente de correlación es mayor a cero (0), quiere decir que las dos variables
tienen una correlación positiva.

- Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la
otra. ¿Es confiable?

y = 1,8763x + 22,519

si es confiable puesto que al multiplicar el coeficiente de determinación por 100% el valor


da el 82,47% de confiabilidad
- Determine el tipo de correlación de las dos variables.

El tipo de correlación o grado de correlación de las variables es EXCELENTE, puesto que


el valor de r, se encuentra entre 0.9 y 1.
Las variables están asociadas directamente y como el valor de r es cercano a 1, su
asociación es alta, y tienen una correlación fuerte.

- Relacionar la información obtenida con el problema.

Con el modelo matemático obtenido se puede encontrar como al cambiar el valor de x, que
para este caso son los usuarios de motos, aumenta la variable (y), que son los fallecidos en
el 2019, lo que se ajusta mucho a la realidad puesto que la mayor parte de fallecidos son
usuarios de motos.

Una vez revisados los datos, se puede inferir que existe una fuerte relación en las variables,
lo que se confirma con el valor de r encontrado.

Actividad 5. Regresión y Correlación Múltiple.

Descripción de la Actividad:
A partir de la base de datos suministrada “Anexo 1-Indicadores de accidentalidad - 230
Municipios 2021.”, cada estudiante deberá:
a. Identificar una variable cuantitativa dependiente y varias variables cuantitativas
independientes del estudio de investigación.
variable cuantitativa dependiente: Fallecidos ene- feb 2019

variables cuantitativas independientes del estudio de investigación:


x1: Usuario T.Carga
x2: Peatón
x3: Usuario T.Pasajeros
b. Realizar el diagrama de dispersión de dichas variables.

Gráfico de probabilidad normal


400
300
200
Y

100
0
0 20 40 60 80 100 120
Muestra percentil

Variable X 1 Curva de regresión


ajustada
400
Y
200 Pronóstico para Y
Y

0
0 20 40 60 80 100 120 140
Variable X 1

Variable X 2 Curva de regresión


ajustada
400
Y
200 Pronóstico para Y
Y

0
0 2 4 6 8 10 12 14 16 18 20
Variable X 2
Variable X 3 Curva de regresión
ajustada
400
Y
200 Pronóstico para Y
Y

0
4 6 8 10 12 14 16 18 20 22 24
Variable X 3

c. Calcular la recta de regresión y el coeficiente de correlación para probar


estadísticamente su relación.

Coeficiente Estadístico
  s Error típico t
- -
Intercepción 12,2743363 1,4444E-14 8,4978E+14
Variable X 1 2,72566372 6,5208E-16 4,18E+15
Variable X 2 0 0 65535
Variable X 3 3,27433628 1,9331E-15 1,6938E+15

y=2,7256 x 1+ 0 x 2+3,27 x 3−12,2743

Estadísticas de la regresión
Coeficiente de correlación múltiple 1
Coeficiente de determinación R^2 1

d. Relacionar la información obtenida con el problema.


La base de datos habla de los fallecidos por actor vial, y cada una de las variables
cuantitativas tipifican una cantidad de fallecidos según el actor vial investigado la variable
dependiente escogida fue Fallecidos ene- feb 2019, lo que corresponde a la suma de la
cantidad de muertos discriminada en actores viales, por eso el grado de correlación en
PERFECTA, puesto que a medida que aumenta la cantidad de fallecidos por Usuario
T.Carga y Usuario T.Pasajeros, aumenta el total de la variable Fallecidos ene- feb 2019.

Sin embargo, con el modelo matemático se puede inferir que la influencia de la cantidad de
peatones fallecidos es nula, puesto que así reemplace la variable por diferentes valores, no
afecta en nada la variable dependiente.
Además de los resultados se puede inferir que el mayor porcentaje de muertes vienen de los
actores viales como T.Carga y Usuario T.Pasajeros, y no de los peatones.
Conclusiones

 A partir del ejercicio se pudo identificar cuáles son las medidas bivariantes de
dispersión y como aplicarlas en una problemática real identificada.
 Con la obtención de la ecuación de la recta de regresión lineal, podemos identificar
que a medida que aumentan las variables x1: Usuario T.Carga x2: Peatónx3:
Usuario T.Pasajeros, que son las independientes, aumenta la variable Fallecidos
ene- feb 2019, que es la dependiente, lo que quiere decir que tienen una correlación
positiva.
 A grandes rasgos, se pudo entender cómo se obtienen los modelos matemáticos
utilizados para describir algunas problemáticas reales, y como se estudia el
comportamiento de las variables que se encuentran presentes en cada uno de los
fenómenos.
Referencias bibliográficas

Martínez, C. (2011). Capítulo 2. Distribuciones de frecuencia. En: Estadística y muestreo,


13a ed. [Online]. Ecoe Ediciones. (pp 590 – 677).
Martínez, E. (2020) Estadística. ed. Santiago de los Caballeros: Universidad Abierta para
Adultos (UAPA). (pp 106-138).

También podría gustarte