Está en la página 1de 20

Unidad 1: Paso 4 Descripción de la información

Presentado por:
Katerine Buenañoz Córdoba

Presentado a:
Yersson David Mosquera
Tutor

Universidad Nacional Abierta y a Distancia UNAD


Programa: Psicología
Estadística Descriptiva – 204040A 761
Ciudad- Quibdó, Mayo de 2020
Introducción

En el presente trabajo se va abordar las diferentes medidas bivariantes,


las cuales se usan para explicar y resumir las localizaciones de los datos.
Estas medidas están conformada por unas series de técnicas, cuyo
objetivo es clasificar, describir, resumir y analizar datos relativos a una
o más características; la regresión lineal permite hallar el valor esperado
de una variable en cambio las correlación se calcula con los coeficientes
y el diagrama de dispersión ayuda a la distribución bidimensional o
bivariantes; las cuales sirven como indicador de la variabilidad de los
datos.

Justificación

Esta actividad fue desarrollada con la finalidad de entender, analizar y


aplicar los conceptos básicos de la estadística como la regresión, la
correlación y el diagrama de dispersión.
Hoy en día la estadística es una disciplina que es aplicada en todos los
momento de la actividad humana; la cual se ha convertido en una
herramienta fundamental en cada una de las disciplinas, por los
diferentes avances que se van presentando. Las personas en sus
actividades cotidianas, se dedican a transcurrir, experimentar
sensaciones y en una u otra medida analizar mucho el significado de
sus experiencias, con lo cual han llevado al hombre a cuantificar, medir,
cualificar, estos acontecimientos que lo rodea.
La estadística es considerada de gran importancia porque proporciona
los mejores instrumentos de investigación, no sólo para observar y
recopilar información del entorno o fuera de ello, sino también en el
control de ciertas labores o acciones desarrolladas como son:
producción, ventas, organización, proyecciones o estimaciones a corto
plazo, mediano y largo plazo, procesos encaminados a facilitar la
conceptualización y toma de decisiones de unos datos plasmados en
tablas y gráficos.
Objetivos

Analizar, calcular e interpretar las medidas bivariantes que se


presentan en la problemática ¿Cuáles son los factores que influyen
en la accidentalidad de vehículos y en el grado de muertes
asociados a los accidentes de tránsito en Colombia?

Estudiar, distinguir y reconocer las diferentes clasificaciones y


conceptos de las medidas bivariantes regresión como la regresión,
la correlación y el diagrama de dispersión.

Aplicar y calcular desde las diferentes medidas bivariantes la


relación que existen entre las variables.
Mapa mental
https://mm.tt/1475055763?t=UM8J9coyVX

Definición de conceptos

Diagrama de dispersión. El diagrama de dispersión permite


estudiar las relaciones entre dos
conjuntos asociados de datos que
aparecen en pares (por ejemplo,
(x, y), uno de cada conjunto).

El diagrama muestra estos pares


como una nube de puntos.
Las relaciones entre los conjuntos
asociados de datos se infieren a
partir de la forma de las nubes.

Es una distribución bidimensional


o Bivariantes, puede
representarse gráficamente en un
plano cartesiano, ubicado en el
eje horizontal o abscisa los
valores de la variable X y en el eje
vertical u ordenada los valores de
la variable Y.
Correlación lineal simple. Es la relación entre dos variables,
buscando determinar el grado de
conexión que existe entre ellas
dos.
Se calcula con los coeficientes de
correlación, el cual son los
números que equivalen entre +1
y -1 donde su magnitud indica el
grado de asociación entre las
variables

Coeficiente de determinación El coeficiente de determinación,


R2 se define como la proporción de la
varianza total de la variable
explicada por la regresión. El
coeficiente de determinación,
también llamado R cuadrado,
refleja la bondad del ajuste de un
modelo a la variable que
pretender explicar.

Es importante saber que el


resultado del coeficiente de
determinación oscila entre 0 y 1.
Cuanto más cerca de 1 se sitúe su
valor, mayor será el ajuste del
modelo a la variable que estamos
intentando explicar. De forma
inversa, cuanto más cerca de
cero, menos ajustado estará el
modelo y, por tanto, menos fiable
será.

Correlación positiva y Correlación positiva: se dice


correlación negativa que hay una correlación lineal
positiva cuando al aumentar o
disminuir los valores de la variable
independiente aumenta o
disminuye los valores de la
variable dependiente.

En la representación de un gráfico
de dispersión, la nube de puntos
tiene forma ascendente y por lo
tanto la recta que se ajusta tendrá
una pendiente positiva.

Correlación negativa: se dice


que hay una correlación lineal
negativa cuando al aumentar los
valores de la variable
independiente, disminuye los
valores de la variable dependiente
o viceversa.
La nube de puntos descenderá de
izquierda a derecha y la pendiente
de la recta ajustada será
negativa.
¿Qué es el coeficiente de El Coeficiente de correlación es
correlación lineal y qué nos una medida que permite conocer
ayuda a medir? el grado de asociación lineal entre
dos variables cuantitativas (X, Y).

La correlación, también conocida


como coeficiente de correlación
lineal (de Pearson), es una
medida de regresión que pretende
cuantificar el grado de variación
conjunta entre dos variables.

Por tanto, es una medida


estadística que cuantifica la
dependencia lineal entre dos
variables, es decir, si se
representan en un diagrama de
dispersión los valores que toman
dos variables, el coeficiente de
correlación lineal señalará lo bien
o lo mal que el conjunto de
puntos representados se aproxima
a una recta.

De una forma menos coloquial, la


podemos definir como el número
que mide el grado de intensidad y
el sentido de la relación entre dos
variables.

Para ayudar a medir el coeficiente


de correlación lineal nos sirve la
siguiente formula.
Regresión y Correlación lineal Simple
A partir de la base de datos suministrada “Indicadores de
accidentalidad -220 municipios 2020 (16-1)”, deberá:
a. Identificar dos variables cuantitativas de la situación estudiada
que puedan estar relacionadas.
R/ Peatones Objeto de choque vs Peatones fallecidos.
b. Realizar el diagrama de dispersión de dichas variables y
determinar el tipo de asociación entre las variables.

peatón
peatón
objeto de
fallecido
choque
22 8
2 3
2 4
2 3
2 2
1 1
2 2
4 8
1 0
1 0
2 4
2 2
3 6
2 4
1 1
2 2
1 0
2 2
2 2
2 3
2 4
2 2
3 5
2 2
2 4
2 2
1 0
2 2
1 1
1 1
2 3
2 4
4 9
1 0
2 3
6 15
2 2
2 2
1 0
1 1
1 1
2 2
4 8
1 0
1 0
2 4
2 2
3 6
2 4
1 1
2 2
1 0
2 2
2 2
2 3
2 4
2 2
3 5
2 2
2 4
2 2
1 0
2 2
1 1
2 3
2 4
4 9
1 0
2 3
6 15
2 2
2 2
1 0
1 1
1 0
2 2
1 0
2 4
2 2
2 3
1 0
2 2
2 4
1 1
3 5
2 3
3 6
5 11
2 2
2 3
2 2
1 1
2 4
2 4
2 2
3 6
2 4
1 1
1 1
1 1
2 4
1 1
2 2
2 2
1 0
1 1
3 6
2 3
2 2
1 0
1 0
2 2
2 4
7 18
4 9
2 2
2 2
2 2
1 1
2 3
2 4
1 1
1 1
1 1
2 4
1 1
2 2
2 2
1 0
1 1
3 6
2 3
2 2
1 0
1 0
2 2
2 4
7 18
4 9
2 2
2 2
2 2
1 1
2 3
2 2
2 2
1 1
2 2
4 8
1 0
1 0
2 2
2 3
2 4
2 2
3 5
2 2
2 4
2 2
2 2
2 3
2 2
1 0
1 1
2 4
2 3
2 2
1 1
2 2
4 8
1 0
1 0
2 4
2 2
3 6
2 4
1 1
2 2
1 0
2 2
2 2
2 3
2 4
2 2
3 5
2 2
2 4
2 2
1 0
2 2
1 1
1 1
2 3
2 4
4 9
1 0
2 3
6 15
2 2
2 2

R/ El tipo de asociación del diagrama de dispersión es lineal.

Peatones Objeto de choque vs Peatones fallecidos.


20
f(x) = 1.16 x + 0.54
18 R² = 0.48
16
14
12
10
8
6
4
2
0
0 5 10 15 20 25

c. Encuentre el modelo matemático que permite predecir el efecto de


una variable sobre la otra. ¿Es confiable?

R/ Modelo matemático: Y=a + bx.

Y= 1,1587x + 0,5404

La ecuacion, es debilmente confiable, porque R² = 0,4777, esta


lejos de 1.
d. Determine el grado de relación de las dos variables.

R/ El grado de relación r entre la variable Y que corresponde a


Peatones fallecidos vs variable X que corresponde a Peatones
Objeto de choque es de 69,1%.

e. Relacionar la información obtenida con el problema.


R/ Solo es posible predecir, cuantos peatones fallecerán en un
69,1%.

f. Establezca al menos 3 nuevos valores independientes para ser


hallados a través del modelo matemático calculado.
R/ X=30; X=35 y X=40.

Y= 1,1587(30) + 0,5404=35,30.

Y= 1,1587(35) + 0,5404=41,09.

Y= 1,1587(40) + 0,5404=46,88.

Actividad 4. Regresión y correlación múltiple


A partir de la base de datos suministrada “Indicadores de
accidentalidad -220 municipios 2020 (16-1)”, cada estudiante,
deberá:

a. Identificar una variable cuantitativa dependiente y varias variables


cuantitativas independientes del estudio de investigación.

Fallecidos fallecidos
peatón
ene- feb usuario en
fallecido
2019 bicicleta
371 8 9
33 3 4
39 4 5
33 3 4
27 2 3
21 1 2
27 2 3
63 8 9
15 0 1
15 0 1
39 4 5
27 2 3
51 6 7
39 4 5
21 1 2
27 2 3
15 0 1
27 2 3
27 2 3
33 3 4
39 4 5
27 2 3
45 5 6
27 2 3
39 4 5
27 2 3
15 0 1
27 2 3
21 1 2
21 1 2
33 3 4
39 4 5
69 9 10
15 0 1
33 3 4
105 15 16
27 2 3
27 2 3
15 0 1
21 1 2
21 1 2
27 2 3
63 8 9
15 0 1
15 0 1
39 4 5
27 2 3
51 6 7
39 4 5
21 1 2
27 2 3
15 0 1
27 2 3
27 2 3
33 3 4
39 4 5
27 2 3
45 5 6
27 2 3
39 4 5
27 2 3
15 0 1
27 2 3
21 1 2
33 3 4
39 4 5
69 9 10
15 0 1
33 3 4
105 15 16
27 2 3
27 2 3
15 0 1
21 1 2
15 0 1
27 2 3
15 0 1
39 4 5
27 2 3
33 3 4
15 0 1
27 2 3
39 4 5
21 1 2
45 5 6
33 3 4
51 6 7
81 11 12
27 2 3
33 3 4
27 2 3
21 1 2
39 4 5
39 4 5
27 2 3
51 6 7
39 4 5
21 1 2
21 1 2
21 1 2
39 4 5
21 1 2
27 2 3
27 2 3
15 0 1
21 1 2
51 6 7
33 3 4
27 2 3
15 0 1
15 0 1
27 2 3
39 4 5
123 18 19
69 9 10
27 2 3
27 2 3
27 2 3
21 1 2
33 3 4
39 4 5
21 1 2
21 1 2
21 1 2
39 4 5
21 1 2
27 2 3
27 2 3
15 0 1
21 1 2
51 6 7
33 3 4
27 2 3
15 0 1
15 0 1
27 2 3
39 4 5
123 18 19
69 9 10
27 2 3
27 2 3
27 2 3
21 1 2
33 3 4
27 2 3
27 2 3
21 1 2
27 2 3
63 8 9
15 0 1
15 0 1
27 2 3
33 3 4
39 4 5
27 2 3
45 5 6
27 2 3
39 4 5
27 2 3
27 2 3
33 3 4
27 2 3
15 0 1
21 1 2
39 4 5
33 3 4
27 2 3
21 1 2
27 2 3
63 8 9
15 0 1
15 0 1
39 4 5
27 2 3
51 6 7
39 4 5
21 1 2
27 2 3
15 0 1
27 2 3
27 2 3
33 3 4
39 4 5
27 2 3
45 5 6
27 2 3
39 4 5
27 2 3
15 0 1
27 2 3
21 1 2
21 1 2
33 3 4
39 4 5
69 9 10
15 0 1
33 3 4
105 15 16
27 2 3
27 2 3

b. Realizar el diagrama de dispersión de dichas variables.

400
350
300
250
fallecidos

200
150
100
50
0
0 20 40 60 80 100 120
Muestra percentil

c. Calcular la recta de regresión y el coeficiente de correlación para


probar estadísticamente su relación.
Gráfico de probabilidad normal
400
350
300
250
fallecidos

200
150
100
50 f(x) = 0.59 x + 4.58
0 R² = 0.32
0 20 40 60 80 100 120
Muestra percentil

r=0,691

d. Relacionar la información obtenida con el problema.


Solo es posible predecir, cuantos peatones fallecerán en un 69,1%
Análisis y conclusiones, a partir de los resultados obtenidos y
aplicados al problema o situación estudiada.
Resumen

Estadísticas de la
regresión
Coeficient
e de
correlació 0,69118
n múltiple 73
Coeficient
e de
determina 0,47773
ción R^2 989
R^2 0,47005
ajustado 171
Error 21,6748
típico 722
Observaci
ones 200

ANÁLISIS DE
VARIANZA
  Grados Suma Promedi F Valor
de o de los
de cuadrad cuadrad crítico
libertad os os de F
85090,8 42545,4 181,121 2,3242E
Regresión 2 634 317 431 -45
93020,4 469,800
Residuos 198 166 084
178111,
Total 200 28      

Coeficie Error Estadís Probabili Inferior Superior Inferior Superior


  ntes típico tico t dad 95% 95% 95,0% 95,0%
Intercepci 7,14037 2,51284 2,84154 0,00495 2,18499 12,0957 2,18499 12,0957
ón 736 801 765 934 716 576 716 576
(peaton
fallecido) 0 0 65535 #¡NUM! 0 0 0 0
falleicidos
usuario en 6,87169 0,51059 13,4581 5,86478 7,87860 5,86478 7,87860
bicileta 811 805 362 #¡NUM! 983 639 983 639

Conclusiones

Como resultado de lo expuesto anteriormente se puedo analizar,


identificar y comprender los factores que influyen en la accidentalidad
de vehículos asociada a los accidentes de tránsito en nuestro país. En el
hallazgo se encontró que la mayoría de los accidentes de tránsitos se
producen por una combinación de causas o agentes relacionados con
las víctimas, la imprudencia, la infraestructura vial, el día y la hora etc.
La estadística es una herramienta fundamental para interpretar
información obtenida de los diferentes instrumentos de recolección de
datos.
Las medidas bivariantes de regresión son datos que se organizan de
forma eficaz, por medio de diagramas de dispersión ya que es una
manera de resumir y leer una información de forma fácil.