Está en la página 1de 10

Estadística Descriptiva

Código: 100105

Paso 4
Descripción de la Información.

Presentado por:

Juan Davis Cusba - 1002480469

Presentado a:
MILENA DIAZ

Universidad Nacional Abierta y a Distancia UNAD

30 de noviembre del 2020


INTRODUCCION

Con la realización de este trabajo se busca, la descripción de la información y análisis para


una posterior toma de decisiones, es muy importante en el campo financiero ya que nos
brinda los medios para identificar cuáles son los puntos clave a tener en cuenta a través de
indicadores que nos muestran resultados de cada uno de las variables.

Para este trabajo se definirá brevemente los conceptos básicos asociados a Regresión y
Correlación, además se resolverá un ejercicio donde se deberá responder unas
interrogantes.

OBJETIVOS

Con esta actividad se espera conseguir los siguientes resultados de aprendizaje:


Resultado de aprendizaje 4: El estudiante aplica las medidas estadísticas bivariantes, por
medio del cálculo e interpretación del software estadístico, en función de la problemática
objeto de estudio.
Actividad 1. Mapa Mental

Echo con CmapTools

Actividad 2. Definición de Conceptos.

Definir brevemente los conceptos básicos asociados a Regresión y


Correlación como:
-Diagrama de dispersión.
Rta: El Diagrama de Dispersión tiene el propósito de controlar mejor el proceso, pues es
indispensable conocer cómo se comportan algunas variables o características de calidad
entre sí, esto es, descubrir si el comportamiento de unas depende del comportamiento de
otras, o no, y en qué grado.
El Diagrama de dispersión es una herramienta utilizada cuando se desea realizar un análisis
gráfico de datos bivariados, es decir, los que se refieren a dos conjuntos de datos. El
resultado del análisis puede mostrar que existe una relación entre una variable y la otra.
Este nos Indica si dos variables (o factores o características de calidad) están relacionados.
Ayudándonos a Proporcionar la posibilidad de reconocer fácilmente relaciones Causa /
efecto.
-Correlación lineal simple.
Rta: La correlación lineal y la regresión lineal simple son métodos estadísticos que estudian
la relación lineal existente entre dos variables.
la correlación se suele emplear cuando ninguna de las variables se ha controlado,
simplemente se han medido ambas y se desea saber si están relacionadas. En el caso de
estudios de regresión lineal, es más común que una de las variables se controle (tiempo,
concentración de reactivo, temperatura…) y se mida la otra.

-Coeficiente de determinación R2
Rta: El coeficiente de determinación es la proporción de la varianza total de la variable
explicada por la regresión. El coeficiente de determinación, también llamado R cuadrado,
refleja la bondad del ajuste de un modelo a la variable que pretender explicar.
El resultado del coeficiente de determinación oscila entre 0 y 1. Cuanto más cerca de 1 se
sitúe su valor, mayor será el ajuste del modelo a la variable que estamos intentando
explicar. De forma inversa, cuanto más cerca de cero, menos ajustado estará el modelo y,
por tanto, menos fiable será.
-Correlación positiva y correlación negativa
Rta: Si r < 0 Hay correlación negativa: las dos variables se correlacionan en sentido
inverso.
A valores altos de una de ellas le suelen corresponder valores bajos de la otra y viceversa.
Cuánto más próximo a -1 esté el coeficiente de correlación más patente será esta
covariación extrema. Si r= -1 hablaremos de correlación negativa perfecta lo que supone
una determinación absoluta entre las dos variables (en sentido inverso): Existe una relación
funcional perfecta entre ambas (una relación lineal de pendiente negativa).

Si r > 0 Hay correlación positiva: las dos variables se correlacionan en sentido directo. A
valores altos de una le corresponden valores altos de la otra e igualmente con los valores
bajos. Cuánto más próximo a +1 esté el coeficiente de correlación más patente será esta
covariación. Si r = 1 hablaremos de correlación positiva perfecta lo que supone una
determinación absoluta entre las dos variables (en sentido directo): Existe una relación
lineal perfecta (con pendiente positiva).

Si r = 0 se dice que las variables no están relacionadas: no puede establecerse ningún


sentido de covariación.
- ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?
Es una medida de regresión que pretende cuantificar el grado de variación conjunta entre
dos variables. Por tanto, es una medida estadística que cuantifica la dependencia lineal
entre dos variables, es decir, si se representan en un diagrama de dispersión los valores que
toman dos variables, el coeficiente de correlación lineal señalará lo bien o lo mal que el
conjunto de puntos representados se aproxima a una recta.

Actividad 3. Ejercicio práctico.


En esta actividad cada estudiante deberá resolver un ejercicio de los que aparecen a
continuación; posterior a ello compartirá su elección en el foro del entorno de Aprendizaje
Foro de discusión Unidad 2- Paso 4 Descripción de la Información. En cada ejercicio
deberá responder los siguientes interrogantes:
a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.
b. Encuentre el coeficiente de determinación y correlación.
c. Determine el modelo matemático que permite predecir el efecto de una variable sobre la
otra. ¿Es confiable?
d. Determine el grado de relación de las dos variables.

3.2 Edad – Masa Muscular.


Una nutricionista desea estudiar la relación entre la edad y la masa muscular de las
personas, y para realizar el estudio seleccionó un 5 grupo de mujeres con características
semejantes, con edades diferentes y midió su masa muscular. La nutricionista registró los
datos de edad y masa muscular en las siguientes tablas:

Datos diagrama de dispersión


Inde-x Depen-y
Edad Masa muscular
57 98
75 83
70 90
62 98
41 67
44 90
66 80
55 69
72 74
67 79
53 100
57 60
75 84
64 110
Interpretación: = Y= 0,14(x-edad) +75,75 =?
Ecuación lineal
y= m(x)+b eje= 0,14(20 años) + 75,75= 78,55 kl
Donde m= pendiente
b= ordenada al origen La masa muscular para una edad de 20 años es de
. 78,55

-Confiabilidad del modelo es de: 0,01x100= 1%


-Coeficiente de correlación entre masa muscular y la edad. = 0,01/2= 0,005
valor de r esta entre 0 y 0.30 esto quiere decir q estadísticamente
no hay correlación entre la masa muscular y la edad
(CORRELACION NULA), además de que
el modelo no es confiable.

Actividad 4.
A partir de la base de datos suministrada: Anexo 1- Indicadores de accidentalidad -230
municipios 2020 (16-4), cada estudiante, deberá:
-Identificar dos variables cuantitativas de la situación estudiada que puedan estar
relacionadas e identificar la variable dependiente e independiente.
- Realizar el diagrama de dispersión de dichas variables y determinar el tipo de relación
entre las variables.
_Determine al coeficiente de determinación y de correlación de las dos variables. Interprete
los resultados
- Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la
otra. ¿Es confiable?
- Determine el tipo de correlación de las dos variables.
- Relacionar la información obtenida con el problema.

Se escogió la variable Objeto de choque Bicicleta-229 datos (Independiente X) y la


variable Lesionados ene-feb 2019-229 datos (Dependiente Y).
interpretación: = Y= 1,49(x-#Choques) +(-9,52) =?
Ecuación lineal
y= m(x)+b eje= 1,49(9) + 8-9,52) = 3,89
Donde m= Bicicleta/ o la pendiente
b= Constante/ordenada al origen Los lesionados para un numero de 9 choques
en. . bicicleta es de 3,89.
r2=0,41

-Confiabilidad del modelo es de: 0,41x100= 41%


-Coeficiente de correlación entre masa muscular y la edad. = Raíz cuadrada de 0,41= 0.64

valor de r esta entre 0,60 y 0.80 esto quiere decir que estadísticamente hay correlación
REGULAR entre el número de lesionados y los choques en bicicleta, además de que el
modelo es poco confiable debido a que tiene una taza de fiabilidad por debajo del 50%.

- Relacionar la información obtenida con el problema.


La información nos dice que por cada 100 choques en bicicleta hay
139,48 lesionados esto en los meses de enero y febrero del 2019, se evidencia
que por cada choche en bicicleta un 39,48% de las ocasiones hay más de un
lesionado, sin embargo, la confiabilidad del modelo nos indica que el número de lesionados
depende un 41% de los choques en bicicleta que ocurran, esto quiere decir que el otro 59%
de las veces el número de lesionados depende de otras variables no incluidas en este
estudio, como: la hora del choque, el municipio, el tráfico, etc.

Conclusiones.

Al elaborar este trabajo, se desarrolla la capacidad de realizar estudios estadísticos el cual


tiene como fin asimilar el conocimiento en cuanto a cómo se realiza un estudio de variables
e identificar la información que los resultados arrojan así poder determinar cuáles son las
variables claves para una empresa,

Referencias Bibliográficas.
https://campus125.unad.edu.co/ecbti79/mod/forum/discuss.php?d=17968

También podría gustarte