Está en la página 1de 13

ESTADÍSTICA DESCRIPTIVA

PASO 4- DESCRIPCIÓN DE LA INFORMACION

PRESENTADO POR,
DIANA PATRICIA OROZCO – cód.: 38553429

PRESENTADO A:
JEISSON DANILO ESPAÑA FERNANDEZ

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


ESTADÍSTICA DESCRIPTIVA
NOVIEMBRE 2020
INTRODUCCIÓN

La investigación estadística es una actividad que apela a diversas técnicas con el propósito
de llegar a la esencia de la realidad. La regresión lineal simple y la regresión lineal múltiple
son técnicas de análisis de las variables de una investigación estadística, en este caso desde
la encuesta realizada. Si bien es cierto estas técnicas mencionadas se pueden utilizar para
solucionar problemas comunes en los negocios o para evaluar el comportamiento de su
economía y en general se utiliza con mayor frecuencia en las ciencias económicas, también
es cierto que en muchos casos se requiere conocer más que el comportamiento de una sola
variable para entender una investigación cualquiera sea su especia. Entonces, sin importar
la situación presentada se hace necesario que practiquemos estas técnicas de regresión por
medio de ejercicios salientes de la cotidianidad, a continuación, veremos pues los
resultados de dicha práctica.

La realización de este trabajo es dar a conocer y poner en práctica la regresión y correlación


y medias de dispersión y estadísticas bivariantes, además de los comportamientos que se
dan en el plano cartesiano tanto en las variables, como los grados y resultados que se
manejan para los ejemplos que se plantean en el laboratorio propuesto, que es de vital
importancia reconocer y manejar las fórmulas que se obtienen de la herramienta de Excel.
ACTIVIDAD 1. MAPA MENTAL
ACTIVIDAD 2. DEFINICION DE CONCEPTOS

- Diagrama de dispersión.

Un diagrama de dispersión es una gráfica que permite estudiar la relación entre conjunto
de datos. Se usa para confirmar relaciones anticipadas de dos conjuntos asociados a los
datos. Para la elaboración de un diagrama de dispersión se necesitan dos datos X, Y; estas
corresponden a las variables independientes y variables dependientes

- Correlación lineal simple.

Para estudiar la relación lineal existente entre dos variables continuas es necesario
disponer de parámetros que permitan cuantificar dicha relación. Uno de estos parámetros
es la covarianza, que indica el grado de variación conjunta de dos variables aleatorias.
La covarianza depende de las escalas en que se miden las variables estudiadas, por lo
tanto, no es comparable entre distintos pares de variables. Para poder hacer
comparaciones se estandariza la covarianza, generando lo que se conoce como
coeficientes de correlación. Existen diferentes tipos, de entre los que destacan el
coeficiente de Pearson, Rho de Spearman y Tau de Kendall.

- Coeficiente de determinación R2.

su determinación en la coeficiente explica la regresión y el resultado de la


determinación oscila entre 0 y 1. Cuanto más cerca de 1 se sitúe su valor, mayor será el
ajuste del modelo a la variable y entre mas se situe su valor mayor es de la variables

- Correlación positiva y correlación negativa


Si r < 0 Hay correlación negativa : las dos variables se correlacionan en sentido inverso.A
valores altos de una de ellas le suelen corresponder valor bajos de la otra y
viceversa.Cuánto más próximo a -1 esté el coeficiente de correlación más patente será esta
covariación extrema.Si r= -1 hablaremos de correlación negativa perfecta lo que supone
una determinación absoluta entre las dos variables ( en sentido inverso): Existe una relación
funcional perfecta entre ambas(una relación lineal de pendiente negativa).

 Si r > 0 Hay correlación positiva: las dos variables se correlacionan en sentido directo.A
valores altos de una le corresponden valores altos de la otra e igualmente con los valores
bajos.Cuánto más próximo a +1 esté el coeficiente de correlación más patente será esta
covariación.Si r = 1 hablaremos de correlación positiva perfecta lo que supone una
determinación absoluta entre las dos variables (en sentido directo):Existe una relación
lineal perfecta ( con pendiente positiva).

- ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?

La correlación, también conocida como coeficiente de correlación lineal de Pearson es una


medida de regresión que pretende cuantificar el grado de variación conjunta entre dos
variables Nos indica que no hay asociación y más si es el valor 0 entre las dos variables. Un
valor mayor que 0 indica una asociación positiva.

ACTIVIDAD 3. EJERCICIO PRÁCTICO.

En esta actividad cada estudiante deberá resolver un ejercicio de los que aparecen a
continuación; posterior a ello compartirá su elección en el foro del entorno de Aprendizaje
Foro de discusión Unidad 2- Paso 4 Descripción de la Información. En cada ejercicio
deberá responder los siguientes interrogantes:

Una nutricionista desea estudiar la relación entre la edad y la masa muscular de las
personas, y para realizar el estudio selecciono un grupo de mujeres con características
semejantes, con edades diferentes y midió su masa muscular. La nutricionista registro los
datos de edad y masa muscular en las siguientes tablas

1. Edad 2. Masa
muscular
57 98
75 83
70 90
62 98
41 67
44 90
66 80
55 69
72 74
67 79
53 100
57 60
75 84
64 110

A. Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables.

Masa muscular vs Edad


120
110
100

80
masa muscular

60

40

20

0
35 40 45 50 55 60 65 70 75 80
edad
De la gráfica podemos concluir que existe la relación entre la masa muscular y la edad no
es muy fuerte, ya que vemos personas con edades inferiores a los 60 y con masa de 60 de
igual modo otra con misma edad y masa de 100 esto puede ser a causa de los malos hábitos
alimenticios y la poca actividad física.

B. Encuentre el coeficiente de determinación y correlación.

n n

n ∑ X∑ Y
∑ XY − i=1 n
i=1

r = i=1
√¿ ¿ ¿

R 2=0,01134318

C. Determine el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?

Modelo matemático = y=0,1416 x +75,749


Confiabilidad: R ²=0 , 0113

Masa muscular vs Edad


120

100

80 f(x) = 0.14 x + 75.75


masa muscular

R² = 0.01
60

40

20

0
35 40 45 50 55 60 65 70 75 80
edad
D. Determine el grado de relación de las dos variables
n 2

2
R=
n
( ∑ XY
i=1
n
− X́ Ý

n
)
( ∑ X2
i=1
n
− X́ 2 )( ∑Y2
i=1
n
−Ý 2 )
R ²=0 , 0113

Podemos indicar que con R ² el grado de relación Baja

ACTIVIDAD 4. REGRESIÓN Y CORRELACIÓN LINEAL.

A partir de la base de datos suministrada: Anexo 1- Indicadores de accidentalidad -230


municipios 2020 (16-4), cada estudiante, deberá:

 Identificar dos variables cuantitativas de la situación estudiada que puedan estar


relacionadas e identificar la variable dependiente e independiente.

Variable independiente Variable dependiente


Fallecidos ene - feb 2019 Peatones fallecidos

 Realizar el diagrama de dispersión de dichas variables y determinar el tipo de


relación entre las variables.
Según el diagrama de dispersión el tipo de asociación entre las variables corresponde a una
relación parabólica o cuadrática.

 Determine al coeficiente de determinación y de correlación de las dos variables.


Interprete los resultados

Coeficiente de correlación.

n n

n ∑ X∑ Y
∑ XY − i=1 i=1
n
r = i=1
√¿ ¿ ¿

Reemplazamos los variables:

7583 ∙640
33496−
229
r= =0,69
75832 640 2
√( 428989−
229
3572− )(
229 )
Por lo tanto, existe una media correlación positiva directa entre las variables de los
fallecidos ene - feb 2019 y los peatones fallecidos.
Coeficiente de determinación.

n 2

2
R=
n
( ∑ XY
i=1
n
− X́ Ý

n
)
( )( )
2
∑X ∑Y2
i=1
− X́ 2 i=1
−Ý 2
n n

Reemplazamos los variables:

2
33496 7583 640
2
R=
( 229
− ∙
229 229 ( )) =0,48
428989 7583 2 3572 640 2
( 229

229

229 229 )( )
Por lo tanto, el 48% de la variabilidad de los peatones fallecidos es explicado por los
fallecidos ene - feb 2019.

 Encuentre el modelo matemático que permite predecir el efecto de una variable


sobre la otra. ¿Es confiable?

Tenemos en cuenta la siguiente ecuación lineal de la correlación entre la variable Y y la


variable X .

y=a+bx +c x 2

Por lo tanto, obtenemos la siguiente ecuación:

y=−3,49+ 0,22 x +0,005 x 2

 Determine el tipo de correlación de las dos variables.

 
Columna 1 1
Columna 2 0,69076376 1
Por lo tanto, existe una media correlación positiva directa entre las variables de los
fallecidos ene - feb 2019 y los peatones fallecidos.

 Relacionar la información obtenida con el problema.

Podemos determinar con los resultados expuestos que durante los meses de Enero y
Febrero del año 2019 se presentó una variabilidad del 48% de los eventos presentados en
siniestralidad en 229 municipios de Colombia, donde los peatones se han visto
involucrados. Además, a medida que se incrementan los fallecidos en accidente de tránsito
se incrementa la participación de los peatones como actor vial en dichos eventos.

Conclusiones

 Este trabajo permitió la aprehensión de conceptos básicos a través de las diferentes


lecturas de la Unidad 3 y el desarrollo de competencias estadísticas por medio de las
prácticas sugeridas para la verificación de los conocimientos.
 Extraer las medidas bivariantes demuestra que se realizó un análisis detallado y se
adquirieron competencias a través de los conceptos aprendidos como de la
explicación en línea de los diferentes tutores.

 La variante dependiente “fallecidos enero- febrero 2019” tiene una alta correlación
y una alta confiabilidad según la información extraída en el momento de
relacionarla con las variables independientes.

Bibliografía

 Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. (pp 130
– 158). Recuperado  de https://link.gale.com/apps/doc/CX4052100011/GVRL?
u=unad&sid=GVRL&xid=696103db
 Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México
City: Cengage Learning. (pp-675–686). Recuperado
de https://link.gale.com/apps/doc/CX4058900232/GVRL?
u=unad&sid=GVRL&xid=a2479593

 Monroy, S. S. (2005). Estadística descriptiva. México, D.F., MX: Instituto


Politécnico Nacional. (pp 21-29).  Recuperado de https://elibro-
net.bibliotecavirtual.unad.edu.co/es/ereader/unad/74722

También podría gustarte