Está en la página 1de 20

DESCRIPCIÓN DE LA INFORMACIÓN.

Estudiante: JOSE LISANDRO CUMBE BRAND


Código: 80121994
Grupo: 204040_132

Docente: NORBEY ROMERO GONZALEZ

Universidad Nacional Abierta y a Distancia UNAD


Escuela de Ciencias Basicas, Tecnologia e Ingenieria
Ingenieria en Telecomunicaciones
Estadística Descriptiva - 204040_132
Barrancabermeja 2020
TABLA DE CONTENIDO

JUSTIFICACION .................................................................................................................. 3
OBJETIVOS ......................................................................................................................... 4
Actividad 1. Mapa Mental ..................................................................................................... 5
Actividad 2. Definición de Conceptos. .................................................................................. 5
Actividad 3. Realizar el laboratorio de regresión y correlación lineal .................................... 7
Diagrama de dispersión. ...................................................................................................7
Modelo matemático. ..........................................................................................................8
Grado de correlación. ...................................................................................................... 10
Uso del modelo matemático. ........................................................................................... 10
Actividad 4. Regresión y correlación múltiple. .................................................................... 11
CONCLUSIONES. .............................................................................................................. 19
REFERENCIAS BIBLIOGRÁFICAS. .................................................................................. 20

2
JUSTIFICACION

Aplicando las medidas estadísticas bivariantes en función de la problemática de


estudio.

 Regresión lineal
 coeficiente de determinación lineal.
 Análisis de correlación.
 Regresión simple.
 Diagramas de dispersión.
 Análisis de correlación múltiple.
 coeficiente de determinación.
 coeficiente de correlación

3
OBJETIVOS.

El Laboratorio de regresión y correlación tiene como principal objetivo identificar las medidas
bivariantes y graficar los diagramas de dispersión.

OBJETIVOS ESPECIFICOS.

 Resumir mediante un mapa mental las medidas estadísticas Bivariantes


de regresión, describiendo ampliamente al menos una de ellas, regresión
lineal simple o regresión múltiple.

 Definir brevemente los conceptos básicos asociados a regresión y correlación como:


diagrama de dispersión, correlación lineal simple, coeficiente de determinación r²,
correlación positiva, correlación negativa, coeficiente de correlación lineal y qué nos
ayuda a medir.

 Realizar el laboratorio de regresión y correlación lineal.

 Realizar ejercicio de regresión y correlación múltiple.

4
Actividad 1. Mapa Mental

Resumir mediante un mapa mental las medidas estadísticas Bivariantes de regresión,


describiendo ampliamente al menos una de ellas, regresión lineal simple o regresión
múltiple.

Actividad 2. Definición de Conceptos.

Definir brevemente los conceptos básicos asociados a Regresión y Correlación como:

a) Diagrama de dispersión:

5
Es la forma más sencilla de definir si existe o no una relación causa efecto entre dos
variables y que tan firme es esta relación, es de gran utilidad para la solución de problemas
de la calidad en un proceso y producto, ya que nos sirve para comprobar que causas
(factores) están influyendo o perturbando la dispersión de una característica de calidad o
variable del proceso a controlar.

b) Correlación lineal simple:

Es la herramienta estadística que podemos usar para describir el grado o fuerza en el que
una variable esta linealmente relacionada con otra. Dependiendo del tamaño de esta medida
cuantitativa se puede decir, que tan cercanamente se mueven dos variables, y por lo tanto,
con cuanta confiabilidad se puede estimar una variable con ayuda de la otra.

c) Coeficiente de determinación R2:

Este es igual a la proporción de la variación total de los valores de la variable dependiente,


“Y”, que puede explicarse por medio de la asociación de Y con X medida por la línea de
regresión estimada. El coeficiente de determinación es la manera primaria de medir el grado,
o fuerza, de la relación que existe entre dos variables, X y Y.

𝑟² = 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑎 / 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑡𝑜𝑡𝑎𝑙

0< r < 1

d) Correlación positiva:

Relación entre dos variables que muestra que ambas aumentan o disminuyen
simultáneamente.

6
e) Correlación negativa:

Relación entre dos variables que muestra que una variable disminuye conforme otra
aumenta.
f) ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?:

Es una medida que permite conocer el grado de asociación lineal entre dos variables
cuantitativas (X, Y) midiendo la fuerza y el sentido de la relación lineal entre 2 variables
cuantitativas.

Actividad 3. Realizar el laboratorio de regresión y correlación lineal

A partir de la base de datos “Indicadores de accidentalidad -220 municipios 2020 (16-


1)”, desarrollar el Laboratorio denominado Regresión y correlación.

a. Identificar dos variables cuantitativas de la situación estudiada que puedan


estar relacionadas.

Variable 1. Objeto de choque.


Variable 2. Fallecidos ene-feb 2019.

Diagrama de dispersión.

b. Realizar el diagrama de dispersión de dichas variables y determinar el tipo


de relación entre las variables.

EXCEL

7
Fallecidos ene -feb 2019 según objeto de choque
400

350
y = 1.5385x - 6E-14
Fallecidos ene -feb 2019

300 R² = 1

250

200

150

100

50

0
0 50 100 150 200 250 300
Motocicleta

INFOSTAT

Existe una relación directa entre las dos variables que conlleva a que, si la primera
cambia, la segunda lo hará también.

Modelo matemático.

8
Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra.
¿Es confiable?

EXCEL

INFOSTAT

9
𝟐

Como podemos observar en los dos programas R² = 1 por lo cual se puede asegurar que la
información es 100% confiable.

Grado de correlación.

Determine el grado de correlación de las dos variables.

𝑟= 𝑅 =1

Según la tabla de grado de correlación al ser r = 1, la correlación es perfecta.

Relacionar la información obtenida con el problema.

Se puede decir que la relación entre las dos variables es directamente proporcional, ya que al
aumentar el número de choques con motocicleta, también aumenta el número de fallecidos de
enero y febrero de 2019.

Uso del modelo matemático.

Establezca al menos 3 nuevos valores independientes para ser hallados a través del modelo
matemático calculado.

EXCEL.

1. En Bello Antioquia reportan 2 fallecidos más en el mes de enero de 2019.

𝒀 = 𝟏. 𝟓𝟑𝟖𝟓(𝟐) − 𝟔𝑬 − 𝟏𝟒 = 𝟑

2. En Córdoba Bolívar reportan 53 fallecidos más en el mes de enero de 2019.


𝒀 = 𝟏. 𝟓𝟑𝟖𝟓(𝟓𝟑) − 𝟔𝑬 − 𝟏𝟒 = 𝟖𝟐

10
3. En Manizales Caldas reportan 19 fallecidos más en el mes de febrero de 2019.
𝒀 = 𝟏. 𝟓𝟑𝟖𝟓(𝟏𝟗) − 𝟔𝑬 − 𝟏𝟒 = 𝟐𝟗

INFOSTAT

1. En Bello Antioquia reportan 2 fallecidos más en el mes de enero de 2019.

𝒀 = 𝟏. 𝟓𝟑𝟖𝟓(𝟐) − 𝟏𝟑. 𝟓𝑬 − 𝟏𝟑 = 𝟑

2. En Córdoba Bolívar reportan 53 fallecidos más en el mes de enero de 2019.


𝒀 = 𝟏. 𝟓𝟑𝟖𝟓(𝟓𝟑) − 𝟏𝟑. 𝟓𝑬 − 𝟏𝟑 = 𝟖𝟐

3. En Manizales Caldas reportan 19 fallecidos más en el mes de febrero de 2019.


𝒀 = 𝟏. 𝟓𝟑𝟖𝟓(𝟏𝟗) − 𝟏𝟑. 𝟓𝑬 − 𝟏𝟑 = 𝟐𝟗
Actividad 4. Regresión y correlación múltiple.

A partir de la base de datos suministrada “Indicadores de accidentalidad -220 municipios


2020 (16-1)”.

a. Identificar una variable cuantitativa dependiente y varias variables


cuantitativas independientes del estudio de investigación.

Variable 1. Fallecidos ene-feb 2019.


Variable 2. Objeto de choque.
Variable 3. Bicicleta.
Variable 4. Peatón.
Variable 5. Otras motos.

b. Realizar el diagrama de dispersión de dichas variables.

INFOSTAT

11
12
EXCEL

13
FALLECIDOS ENE.FEB 2019 SEGÚN OBJETO DE CHOQUE
400

350

300
Fallecidos ene- feb 2019

250

200

150

100

50

0
0.00 50.00 100.00 150.00 200.00 250.00 300.00
Objeto de choque

Bicicleta Motocicleta Peaton Otras motos

c. Calcular la recta de regresión y el coeficiente de correlación para probar


estadísticamente su relación.

INFOSTAT

14
𝑌 = 1.63 − 0.89 − 0.27

15
𝑌 = 4.10 − 0.62 − 0.30

16
EXCEL

Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 1
Coeficiente de determinación R^2 1
R^2 ajustado 0.99494949
Error típico 2.4875E-13
Observaciones 200

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 2 178111.28 89055.64 2.8784E+30 0
Residuos 198 1.2252E-23 6.1879E-26
Total 200 178111.28

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95.0%Superior 95.0%
Intercepción -4.1922E-13 2.6638E-14 -15.7375676 9.916E-37 -4.7175E-13 -3.6669E-13 -4.7175E-13 -3.6669E-13
Variable X 1 1.53846154 9.068E-16 1.6966E+15 0 1.53846154 1.53846154 1.53846154 1.53846154
Variable X 2 0 0 65535 #¡NUM! 0 0 0 0

𝑌 = 1.53 + 0 − 4.19E − 13

Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 1
Coeficiente de determinación R^2 1
R^2 ajustado 0.99494949
Error típico 0
Observaciones 200

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 2 178111.28 89055.64 #¡NUM! #¡NUM!
Residuos 198 0 0
Total 200 178111.28

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 99.0%Superior 99.0%
Intercepción 0 0 65535 #¡NUM! 0 0 0 0
Variable X 1 0 0 65535 #¡NUM! 0 0 0 0
Variable X 2 4 0 65535 #¡NUM! 4 4 4 4

𝑌= 0 + 4 +0

17
R²= 1, lo cual indica que el modelo matemático encontrado es confiable, explicando 100% de
la información.

r= 1 indicando que el grado de confiabilidad es perfecta según la siguiente tabla.

d. Relacionar la información obtenida con el problema.

Los resultados dados en el análisis de esta actividad indican que la variable dependiente
fallecidos de enero a febrero de 2019, depende de las variables independientes, como lo son el
objeto de choque (motocicleta, bicicleta, peatón o otros motos).

𝑌 = 1.53 + 0 − 4.19E − 13

𝑌= 0 + 4 +0

Explicando así el 100%, ya que estas variables se encuentran correlacionadas perfectamente.

18
CONCLUSIONES.

Se evidencia que para analizar las diferentes variables se requiere del diagrama de
dispersión y con ayuda de las fórmulas de relación y correlación que permiten el despeje de
las ecuaciones y datos para obtener un resultado.
Los ejercicios practicados se pueden graficar de forma lineal y la correlación es confiable
de acuerdo a sus resultados.
Se logra establecer el comportamiento lineal de los datos y se determina el grado de
correlación entre las variables, según la tabla de grado de correlación lineal.

19
REFERENCIAS BIBLIOGRÁFICAS.

Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo.


Paginas. 151 – 158

Churchill, G.A. (2009). "Análisis de Regresión Múltiple." Investigación de


mercados. México City: Cengage Learning. Páginas 675 – 695

20

También podría gustarte