Está en la página 1de 14

Paso 4.

Descripción de la información

Presentado a:
Jesús Antonio Peña Rueda

Entregado por:
Leidy Viviana Perez Soto
Código: 1.113.674.079
Grupo: 204040_184

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD


ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
Ingeniería de Telecomunicaciones
Estadística Descriptiva
01
06 de mayo de 2020
Introducción

La palabra regresión la utilizamos para significar la estimación de


una variable en función de otro valor conocido, correspondiente a la
otra variable. Decimos que la mejor línea que se ajusta a un
conjunto de puntos es aquella en donde la suma de los cuadrados de
las diferencias entre los valores reales y los estimados es mínima.
Para determinar el grado de correlación entre las variables, no basta
con calcular la varianza explicada, pues existe el coeficiente de
determinación o coeficiente de correlación al cuadrado; sin embargo,
frecuentemente se utiliza un coeficiente de correlación rectilíneo El
termino regresión fue introducido por Galton refiriéndose a la ley de
la regresión Universal, en el siguiente trabajo realizamos un mapa
mental sobre medidas estadísticas bivariantes de regresión con
énfasis en modelo en regresión múltiple, se realizaron variables de
regresión y correlación y variables de Regresión y correlación
múltiple, con su respectivos diagramas y relacionando el problema.
Justificación

La correlación y regresión son conceptos estadísticos fundamentales,


pues extienden la idea de dependencia funcional, y se relacionan con
muchos otros como como los de variación, distribución,
centralización o dispersión.

Aplicando la temática vista en la unidad se lograrán determinar la


relación entre una variable dependiente y variables independientes,
calcular recta de regresión y el coeficiente de correlación para probar
estadísticamente su relación, cada uno de los participantes realizara
el diagrama de dispersión para cada variable tratada según el
documento Indicadores de accidentalidad -220 municipios
2020 (16-1)”

Objetivos

 Realizar diagrama de dispersión de cada variable

 Identificar una variable dependiente e independiente acerca del


estudio de investigación

 Determinar la relación entre la variable dependiente y la variable


independiente
Definición de conceptos

 Diagrama de dispersión.

Diagrama de dispersión, también conocido como gráfico de dispersión o gráfico de


correlación consiste en la representación gráfica de dos variables para un conjunto de
datos. En otras palabras, analizamos la relación entre dos variables, conociendo qué tanto se
afectan entre sí o qué tan independientes son una de la otra.
En este sentido, ambas variables se representan como un punto en el plano cartesiano y de
acuerdo a la relación que exista entre ellas, definimos su tipo de correlación.

 Correlación lineal simple.


El modelo estadístico de correlación lineal simple se puede escribir de dos formas como
se muestra a continuación.

1. En esta forma la variable respuesta y se expresa como una suma


de β0+β1xiβ0+β1xi y un error aleatorio eje el cual tiene distribución N(0,σ2)N(0,σ2). El
modelo en esta forma se puede expresar como sigue.

Yi=β0+β1Xi+ei,ei∼N(0,σ2)Yi=β0+β1Xi+ei,ei∼N(0,σ2)

2. En esta forma la variable respuesta y tiene distribución normal con media que


cambia en función de la variable xx pero con varianza constante. El modelo en esta
forma se puede expresar como sigue.

Yi∼N(μi,σ2),μi=β0+β1Xi,σ2=constanteYi∼N(μi,σ2),μi=β0+β1Xi,σ2=constante
En cualquiera de las dos formas el vector de parámetros del modelo
es θ=(β0,β1,σ)⊤θ=(β0,β1,σ)⊤. Para estimar este vector de parámetros se suelen utilizar
dos métodos
 Coeficiente de determinación R2

El coeficiente de determinación, se define como la proporción de la varianza total de la


variable explicada por la regresión. El coeficiente de determinación, también llamado R
cuadrado, refleja la bondad del ajuste de un modelo a la variable que pretender explicar.

-Correlación positiva y correlación negativa

Si r < 0 Hay correlación negativa : las dos variables se correlacionan en sentido inverso.A


valores altos de una de ellas le suelen corresponder valor bajos de la otra y
viceversa.Cuánto más próximo a -1 esté el coeficiente de correlación más patente será esta
covariación extrema.Si r= -1 hablaremos de correlación negativa perfecta lo que supone
una determinación absoluta entre las dos variables ( en sentido inverso): Existe una relación
funcional perfecta entre ambas(una relación lineal de pendiente negativa).

** Si r > 0 Hay correlación positiva: las dos variables se correlacionan en sentido


directo.A valores altos de una le corresponden valores altos de la otra e igualmente con los
valores bajos.Cuánto más próximo a +1 esté el coeficiente de correlación más patente será
esta covariación.Si r = 1 hablaremos de correlación positiva perfecta lo que supone una
determinación absoluta entre las dos variables (en sentido directo):Existe una relación
lineal perfecta ( con pendiente positiva).

 ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a


medir?

En definitiva, el coeficiente de correlación lineal es una medida de la asociación lineal que


existe entre dos variables y nos ayuda a medir si ella es positiva, negativa o nula.
Actividad 3. Realizar el laboratorio de regresión y correlación
lineal
Descripción de la Actividad:

A partir de la base de datos “Indicadores de accidentalidad -220


municipios 2020 (16-1)”, desarrollar el Laboratorio denominado
Regresión y correlación, el cual se encuentra en el Entorno de
aprendizaje práctico, en la carpeta Guía para el uso de recursos
educativos. El laboratorio lo puede desarrollar con el programa Infostat
o Excel. Donde el estudiante deberá realizar lo siguiente:

 Identificar dos variables cuantitativas de la situación estudiada


que puedan estar relacionadas.

 Realizar el diagrama de dispersión de dichas variables y


determinar el tipo de relación entre las variables.
 Encuentre el modelo matemático que permite predecir el efecto de
una variable sobre la otra. ¿Es confiable?

Y = 0.2834 x- 2.1524
R = 0.9133
ES CONFIABLE ya que al hacer su fórmula Y = 0.2834 x- 2.1524 su nivel
de confiabilidad es de 91 % con respeto a los datos presentados
representado la validez de la información

 Determine el grado de correlación de las dos variables.

column
  columna 1 a 2
Column
a1 1  
column 0,955652
a2 72 1
Las variables relacionadas tienen un grado
de correlación del 95% podemos decir que la relación de las dos
variables es buena ya que cumple con los parámetros

 Relacionar la información obtenida con el problema

Los resultados anteriores de las variables fallecidos en febrero Vs


Usuarios T. Carga obtuvo una confiabilidad del 91% y un grado de
correlación del 95%, sin duda se puede decir que hay algún grado de
fallecidos en febrero puede implicar a los usuarios T. Carga obtuvo.

Establezca al menos 3 nuevos valores independientes para ser hallados


a través del modelo matemático calculado.
Nuevos valores

32 5
42 6
23 8
45 12
68 10
78 2
89 14
100 23

Actividad 4. Regresión y correlación múltiple.

Descripción de la Actividad:

A partir de la base de datos suministrada “Indicadores de


accidentalidad -220 municipios 2020 (16-1)”, cada estudiante,
deberá:
 Identificar una variable cuantitativa dependiente y varias variables
cuantitativas independientes del estudio de investigación.

La Variable cuantitativa según Los Indicadores de accidentalidad -220


Municipios 2020 son Fallecidos de ener-feb2019

Y las variables cuantitativas independientes son usuario motos y


usuarios de bicicletas
 Realizar el diagrama de dispersión de dichas variables

Fallecidos ene- feb 2019


Fallecidos ene- feb 2019& Usuario Moto
12
400
10
350

300 8

250 6
200
4
150
2
100

50 0
0 2 4 6 8 10 12
0
0 50 100 150 200 250
Fallecidos ene- feb 2019& Usuario de bicicleta
20
18
16
14
12
10
8
6
4
2
0
0 50 100 150 200 250 300 350 400

Calcular la recta de regresión y el coeficiente de correlación para probar


estadísticamente su relación.

Y= 1,18 X1 + 2,14

X= 1,03 X2
Coeficiente de Determinación

r 2=0,61× 100=61 %

r =√ 0.61=0.78

Relacionar la información obtenida con el problema.

Los resultados anteriores de las variables fallecidos en febrero Vs


Usuarios de motos y usuarios de bicicletas tienen una confiabilidad del
61% Se tiene en cuenta el coeficiente de correlación hallado
evidenciamos una correlación regular.

Conclusiones

Este trabajo dio a entender muy bien los conceptos de regresión y


correlación y aprendí a implementarlos. Aparte aprendimos a manejar
de una manera diferente Word y Excel lo cual es satisfactorio. Observe
también la gran relación que pueden tener dos variables cuantitativas y
el porcentaje de estas.
Referencias Bibliográficas

Montero, J.M. (2007). Regresión y Correlación Simple. Madrid:


Paraninfo. (pp 151 – 158). Recuperado
de http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82
c81e98fcc1361e1929abe203c8219 

Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple.


México City: Cengage Learning. (pp 675 – 686). Recuperado
de http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4058900232&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=e55
8184ed89e57d11ede116134cfce41
Churchill, G.A. (2009). "Análisis de Regresión Múltiple." Investigación
de mercados. México City: Cengage Learning.(pp 686 –
695).Recuperado de http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4058900234&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=49
575112db86a0eb46dae86bbaf74cb9 

También podría gustarte