Está en la página 1de 20

Paso 4 - Descripción de la Información

Presentado por:

Yaqueline Trujillo Murcia

Código:1079175126

Presentado a:

Victoria Gutiérrez

Código del Curso

204040_380

Universidad Nacional Abierta y a Distancia - UNAD


Escuela de Ciencias Sociales Artes y Humanidades (ECSAH)
Estadística descriptiva
Carrera Profesional de Psicología
Florencia Caquetá
Mayo– 2020

1
Paso 4 - Descripción de la Información

Tabla de contenido

pg.

 Introducción………………………………………………………………………3

 Justificación…………………………………………………...………………….4

 Objetivos generales y específicos, ………..…………….…………………..……5

 Mapa Mental…………………………………………………………...…………6

 Definición de conceptos……………………………………………………..…7-11

 Análisis de correlación lineal simple de las dos variables cuantitativas

seleccionadas. (Laboratorio)…………………………………….……………12-14

 Análisis de correlación múltiple de las variables cuantitativas seleccionadas.15-17

 Análisis y conclusiones, a partir de los resultados obtenidos y aplicados al


problema o situación estudiada…………………………………………………18
 Conclusiones…………………………………………………………………….19

 Referencias Bibliográficas……………………………………………………….20

2
Paso 4 - Descripción de la Información

Introducción

La Estadística es una ciencia que proporciona un conjunto de métodos que se utilizan para

recolectar, resumir, clasificar, analizar e interpretar el comportamiento de los datos con respecto a

una característica materia de estudio o investigación ,Este trabajo nos pretende enseñar a manejar

medidas estadísticas Bivariantes de regresión, donde nos permite describir ampliamente al

menos una de ellas, regresión lineal simple o regresión múltiple, y poder realizar ejercicios con

variables cuantitativas, de la base de datos denominada: “Indicadores de accidentalidad -220

municipios 2020 (16-1)”. Para realizar el laboratorio Denominado Regresión y Correlación dado

en este trabajo, permitiéndonos así tener mejores conceptos y buena práctica de los temas tratados

en función de la problemática de estudio. .

3
Paso 4 - Descripción de la Información

Justificación

Con el estudio que estamos realizando en este curso de estadística descriptiva nos

permite proporcionar un medio para investigar un caso y poder proporcionar nuestros

conocimientos y poder evaluar cada información que se nos recomienda recolectar a través de

los medios estadísticos; de esta manera se informara basándonos en los datos recopilados, y a su

vez se verá reflejada la eficacia con que se pueda realizar tal proceso de información dependiendo

de la presentación de dichos datos, ya que la información obtenida a través de instrumentos de

recolección de datos es muy tediosa para analizar, por tal razón es necesario procesar esa

información para poderla interpretar claramente. La estadística es una rama de las matemáticas

que permite exponer esta información mediante tablas de frecuencias, graficas, entre otras cosas,

para que la persona que vaya a estudiar la información reunida lo pueda hacer de la mejor manera

los datos que nos han expuesto obtener en este caso.

4
Paso 4 - Descripción de la Información

Objetivos generales

 Identificar, calculará e interpretará las medidas bivariantes, en función de la

descripción de la problemática, a partir del trabajo realizado con variables

cuantitativas, de la base de datos denominada: “Indicadores de accidentalidad -220

municipios 2020 (16-1)”.

Objetivos específicos

 Analizar los diferentes conceptos e interpretará las medidas bivariantes, en función

de la descripción de la problemática, a partir de variables cuantitativas, de la base

de datos denominada: “Indicadores de accidentalidad -220 municipios 2020 (16-

1)”..explicando los conceptos en un mapa mental.

 Definir brevemente los conceptos básicos asociados a Regresión y Correlación.

 Desarrollar el Laboratorio denominado Regresión y correlación.

 Identificar una variable cuantitativa dependiente y varias variables cuantitativas

independientes del estudio de investigación.

5
Paso 4 - Descripción de la Información

Actividad 1. Mapa Mental.


Link:file:///D:/Desktop/medidas%20estadisticas%20bivariables.html

6
Paso 4 - Descripción de la Información

Actividad 2. Definición de Conceptos.

Definir brevemente los conceptos básicos asociados a Regresión y Correlación como:

-Diagrama de dispersión: el diagrama de dispersión permite analizar si existe algún tipo de

relación entre dos variables. Por ejemplo, puede ocurrir que dos variables estén relacionadas de

manera que al aumentar el valor de una, se incremente el de la otra. En este caso hablaríamos de

la existencia de una correlación positiva.

También puede ocurrir que al producirse una en un sentido, la otra derive en el sentido

contrario; por ejemplo, al aumentar el valor de la variable x, se reduzca el de la variable y.

Entonces, se estaría ante una correlación negativa. Si los valores de ambas variable se revelan

independientes entre sí, se afirmaría que no existe correlación.

Ventajas

Representa la relación entre dos variables de forma gráfica, lo que hace más fácil visualizar e

interpretar los datos.

Calculando la correlación de dos variables, permite cuantificar el grado de relación entre

ambas, asó como su signo.

Utilidades

Obtener información para determinar si dos variables están relacionadas.

Comprobar cómo afecta a una variable los cambios producidos en otra.

Probar las posibles relaciones causa / efecto.

7
Paso 4 - Descripción de la Información

El diagrama de dispersión es una herramienta que ayuda a identificar la posible relación entre

dos variables. Representa la relación entre dos variables de forma gráfica, lo que hace más fácil

visualizar e interpretar los datos.

-Correlación lineal simple: La correlación, también conocida como coeficiente de correlación

lineal (de Pearson), es una medida de regresión que pretende cuantificar el grado de variación

conjunta entre dos variables.

Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos variables, es

decir, si se representan en un diagrama de dispersión los valores que toman dos variables, el

coeficiente de correlación lineal señalará lo bien o lo mal que el conjunto de puntos

representados se aproxima a una recta.

De una forma menos coloquial, la podemos definir como el número que mide el grado de

intensidad y el sentido de la relación entre dos variables. Citado de

https://economipedia.com/definiciones/coeficiente-de-correlacion-lineal.html visitado el día 30-

04-2020- a las 02-12 pm

-Coeficiente de determinación R2: Es el cuadrado de correlación que mide que parte viene

explicada en una determinada variante como parte de una variación, esto quiere decir cual se

puede predecir a través de la variación de la otra. Los modelos estadísticos tienen como

finalidad probar o explicar alguna variable aleatoria, esto se realiza a través de otras variables

8
Paso 4 - Descripción de la Información

aleatorias que son conocidas como factores. Ya que se puede predecir una variable considerada

aleatoria a través de su medida y que para este caso la varianza será el mismo error cuadrático

medio, el máximo error cuadrático medio que se puede aceptar es la varianza.

El resultado puede variar entre 0 y 1, esto significa que mientras más cerca esté del uno estará

más ajustada a la variable que intentas probar, mientras que en el caso contrario, es decir,

cuanto más se acerca a 0 menos fiable será ya que estará menos ajustado el modelo.

Lo que ocurre con R cuadrada y la razón por la cual se da la R cuadrada ajustada tiene que ver

con que no penaliza la inclusión respecto a las variables de tipo explicativas no significativas,

esto quiere decir que, si se le agrega al modelo por ejemplo 5 variables explicativas que no

tengan mucha relación con el puntaje que este determinado jugador ha anotado, el R cuadrado

será mayor o aumentará.

R cuadrado ajustado

Es una medida que establece el porcentaje explicado por la varianza de regresión con respecto a

la varianza de la variable explicada. Puedes ver que es lo mismo que con el R cuadrado sin

embargo con la pequeña diferencia de que penaliza la inclusión de variables.

La R cuadrada siempre aumenta a pesar de que las variables incluidas en el mencionado modelo

no sean realmente relevantes. Para resolver dicho problema se aplica que:

9
Paso 4 - Descripción de la Información

En esta ecuación se refiere a N como el tamaño de la muestra y K corresponde a las variables

explicativas. Desde el punto de vista de la deducción matemática a valores por encima de k,

estará más lejos el R cuadrado ajustado, del R cuadrado común.

Otras funciones del coeficiente de determinación

No tan solo es útil para explicar o mejor dicho, medir la capacidad explicativa de un modelo

sino que al mismo tiempo permite elegir cual entre varios modelos es el más adecuado. Esto

quiere decir que los modelos tienen las mismas variables dependientes y el mismo número con

respecto a las variables que se conocen como explicativas, el más adecuado será aquel que

tenga un coeficiente mayor de determinación.

Claramente esto puede variar según el modelo elegido ya que no será lo mismo en el caso por

ejemplo de un modelo anidado. Lo más importante con respecto a este coeficiente es su

capacidad para predecir la efectividad de los modelos o teorías propuestas, esto puede aplicarse

no tan solo a números, esto es vital para saber si las predicciones son buenas o malas.

-Correlación positiva y correlación negativa: Correlación positiva: ocurre cuando una

variable aumenta y la otra también. Por ejemplo, la altura de una persona y el tamaño de su pie;

mientras aumenta la altura, el pie también. Correlación negativa: es cuando una variable

aumenta y la otra disminuye.

10
Paso 4 - Descripción de la Información

-¿ Qué es el coeficiente de correlación lineal y qué nos ayuda a medir’

El Coeficiente de correlación es una medida que permite conocer el grado de asociación lineal

entre dos variables cuantitativas (X, Y). ... Recordar entonces que el coeficiente de relación

lineal, y nos ayuda a medir la fuerza y el sentido de la relación lineal entre 2 variables

cuantitativas.

11
Paso 4 - Descripción de la Información

Actividad 3. Realizar el laboratorio de regresión y correlación lineal

Actividad 3 de este paso 4

a) Identificar dos variables cuantitativas de la situación estudiada que puedan estar

relacionadas.

Respuesta: Tasa de fallecido 2019 y tasa de lesionado 2019

b) Realizar el diagrama de dispersión de dichas variables y determinar el tipo de relación entre

las variables.

Respuesta: El tipo de relación es negativa

c) Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la

otra. ¿Es confiable?

12
Paso 4 - Descripción de la Información

Respuesta:

Modelo matemático: y = a + bx y = 265,87x

R2 = -0,175 x 100% = -17,5% El modelo matemático es muy débil, es decir que tiene un -17,5%

de confiabilidad.

d) Determine el grado de correlación de las dos variables.

Respuesta:

Grado de correlación R = 0,4183 x 100% = 41,83%

La correlación de las variables es débil, dado que su valor de coeficiente es 0,41

e) Relacionar la información obtenida con el problema.

Respuesta: El resultado de las variables de tasa de fallecido 2019 y de tasa de lesionado 2019 de

los 200 municipios de la base de datos “Indicadores de accidentalidad -220 municipios 2020 (16-

1)”, se encuentra relacionados en un modelo matemático de regresión lineal es y = 265,87x que

explica el -17,5% de confiabilidad, esto debido a que las variables bajo la correlación débil de

41,83%

f) Establezca al menos 3 nuevos valores independientes para ser hallados a través del modelo

matemático calculado.

Respuesta:

Y = 265,87x

X1 = 1,0026 F (1,0026) = 265,87 (1,0026) = 266.5=266

13
Paso 4 - Descripción de la Información

X2 = 3,0158 F (3,0158) = 265,87 (3,0158) = 801.8=802

X3 = 2,9851 F (2,9851) = 265,87 (2,9851) = 793.6=793

14
Paso 4 - Descripción de la Información

Actividad 4

a. Identificar una variable cuantitativa dependiente y varias variables cuantitativas independientes

del estudio de investigación.

Respuesta: En la variable cuantitativa dependiente tenemos Velocidad Aprox. Para las variables

cuantitativa independiente tenemos la tasa de lesionados 2019 y la tasa de fallecidos 2019

b. Realizar el diagrama de dispersión de dichas variables.

15
Paso 4 - Descripción de la Información

c. Calcular la recta de regresión y el coeficiente de correlación para probar estadísticamente su

relación.

Respuesta:

Modelo matemático: y = a + b1 X1 + b2X2

Se trata de identificar los parámetros a, b1, b2 para ello se procede de la siguiente

manera: Análisis de datos

16
Paso 4 - Descripción de la Información

Y = 98,840 + (-1014,847)X1 + 0,0014X2

R2 = 0,02 el modelo matemático obtenido es nula en su confiabilidad.

R = 0,1729 x 100% = 17,29% la correlación entre las variables es muy débil, dado que su valor

coeficiente es de 0,1729

d. Relacionar la información obtenida con el problema.

Los resultados anteriores indican que las variables de Velocidad aprox. (km), Tasa de fallecidos

2019 y Tasa de lesionados 2019 se encuentran relacionado a través de un modelo matemático de

regresión múltiple y = 98,840 + (-1014,847) X1 + 0,0014X2 que explica el 0,02% de

confiabilidad. Esto debido a que dichas variables se encuentran bajo correlación muy débil de

17,29%.

17
Paso 4 - Descripción de la Información

Conclusiones

 Aprendí sobre los factores que influyen la accidentalidad y el grado de muertes


asociadas a los accidentes de Colombia, los marcos referenciales para dar solución
a los anunciados dándonos a conocer que los factores que influyen en la
accidentalidad de vehículos y en el grado de muertes asociadas a los accidentes de
tránsito en Colombia se ha ido en aumento tanto en las muerte de peatones,
accidentes en moto, por alicoramiento son las mayor tasa de mortalidad que se
presenta.
 Analice los diferentes conceptos sobre conceptos básicos asociados a Regresión y
Correlación expuesto.

18
Paso 4 - Descripción de la Información

Referencias Bibliográficas

Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. (pp 151 –

158). Recuperado

de http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=

GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 .

Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City:

Cengage Learning. (pp 675 – 686). Recuperado

de http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900232&v=2.1&u=unad&it=r&p=

GVRL&sw=w&asid=e558184ed89e57d11ede116134cfce41.

Churchill, G.A. (2009). "Análisis de Regresión Múltiple." Investigación de mercados.

México City: Cengage Learning.(pp 686 – 695).Recuperado de Ortegón Pava, M.

(03,10,2018). Regresión y Correlación lineal. [Archivo de video]. Recuperado de

http://hdl.handle.net/10596/20621.

Matus, R., Hernández, Martha, and García, E (2010). Estadística. México, D.F., MX:

Instituto Politécnico Nacional, (2010). ProQuest ebrary. (pp 95-109). Recuperado de

http://site.ebrary.com/lib/unadsp/reader.action?ppg=12&docID=10365616&tm=1471981556

569

19
Paso 4 - Descripción de la Información

Sánchez, S. E. A., Inzunza, C. S., & Ávila, A. R. (2015). Probabilidad y estadística 1. Distrito

Federal, MÉXICO: Grupo Editorial Patria. (pp 99-109). Recuperado de

http://site.ebrary.com/lib/unadsp/reader.action?ppg=6&docID=11230886&tm=14719820221

68

20

También podría gustarte