Está en la página 1de 17

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD.

ACTIVIDAD 4, DESCRIPCIÓN DE LA INFORMACIÓN.

LUZ KATERINE CASTILLEJO GARCIA

TUTOR:
VANESSA JULIETT LINARES

GRUPO:
178

ESCUELA DE CIENCIAS ADMINISTRATIVAS, CONTABLES, ECONÓMICAS, Y


DE NEGOCIOS.
ADMINISTRACIÓN DE EMPRESAS.
CEAD, VALLEDUPAR
LA LOMA, CESAR
2020
INTRODUCCION.

En este trabajo se aplican las medidas estadísticas bivariantes, con el estudio de caso,
indicadores de accidentalidad 2020 en el que se hace análisis a 230 municipios de
Colombia. a través del cálculo e interpretación del software estadístico, InfoStat en función
de la problemática de estudio. Así mismo con el apoyo de las referencias bibliográficas
disponibles en la unidad.
OBJETIVOS.

OBJETIVOS.

Objetivo general:

Analizar el estudio del caso, para extraer la base de dato necesaria para el desarrollo de los
ejercicios

Objetivos específicos

 Analizar y Comprender las medidas estadísticas Bivariantes.


 Realizar gráficos por medio del software estadístico InfoStat
JUSTIFIACION.

Es importante realizar este trabajo gracias a su amplio análisis de comprensión que nos
permite determinar detalladamente la información que necesitamos en el momento justo
dando cabida a la toma de decisiones y realidad de los casos.
Mapa mental.

https://docs.google.com/drawings/d/12jTaC_X4tEhJDlgJmUmcnQNMPZ0fhgRAnjx7
VmKSb9c/edit
El Diagrama de Dispersión, tiene el propósito de controlar mejor el proceso, resulta
indispensable conocer cómo se comportan algunas variables o características de calidad
entre si, esto es, descubrir si el comportamiento de unas depende del comportamiento de
otras, o no, y en qué grado. El Diagrama de dispersión es una herramienta utilizada cuando
se desea realizar un análisis gráfico de datos bivariados, es decir, los que se refieren a dos
conjuntos de datos. El resultado del análisis puede mostrar que existe una relación entre una
variable y la otra. El estudio puede ampliarse para incluir una medida cuantitativa de tal
relación. Las dos variables pueden estar relacionadas de la siguiente manera:

• Una característica de calidad y un factor que incide sobre ella.


• Dos características de calidad relacionadas.
• Dos factores relacionados con una misma característica de calidad.

¿Para qué sirve el Diagrama de Dispersión?

Indica si dos variables (o factores o características de calidad) están relacionados.

Proporciona la posibilidad de reconocer fácilmente relaciones Causa / efecto.

¿Cómo se construye el Diagrama de Dispersión?

• Paso 1.- Recolectar en parejas de datos de la forma (Xi, Yi), con i = 1, 2, 3,…n
donde Xi y Yi representan los valores respectivos de las dos variables. Los datos se suelen
representar en una tabla.

• Paso 2.- Diseñar las escalas apropiadas para los ejes X y Y.

• Paso 3.- Graficar las parejas de datos. Si hay puntos repetidos, se mostrarán como
círculos concéntricos.

• Paso 4.- Documentar el diagrama.

CORRELACION LINEAL SIMPLE:

Para estudiar la relación lineal existente entre dos variables continuas es necesario disponer
de parámetros que permitan cuantificar dicha relación. Uno de estos parámetros es la
covarianza, que indica el grado de variación conjunta de dos variables aleatorias.
Covarianza muestral=Cov(X,Y)=∑ni=1(xi−x¯¯¯)(yi−y¯¯¯)N−1

siendo x¯¯¯ e y¯¯¯ la media de cada variable y xi e yi el valor de las variables para la
observación i.

La covarianza depende de las escalas en que se miden las variables estudiadas, por lo tanto,
no es comparable entre distintos pares de variables. Para poder hacer comparaciones se
estandariza la covarianza, generando lo que se conoce como coeficientes de correlación.
Existen diferentes tipos, de entre los que destacan el coeficiente de Pearson, Rho de
Spearman y Tau de Kendall.

Todos ellos varían entre +1 y -1. Siendo +1 una correlación positiva perfecta y -1 una
correlación negativa perfecta.

Se emplean como medida de fuerza de asociación (tamaño del efecto):

• 0: asociación nula.
• 0.1: asociación pequeña.
• 0.3: asociación mediana.
• 0.5: asociación moderada.
• 0.7: asociación alta.
• 0.9: asociación muy alta.

El coeficiente de determinación R2, es la proporción de la varianza total de la variable


explicada por la regresión. El coeficiente de determinación, también llamado R cuadrado,
refleja la bondad del ajuste de un modelo a la variable que pretender explicar.

Es importante saber que el resultado del coeficiente de determinación oscila entre 0 y 1.


Cuanto más cerca de 1 se sitúe su valor, mayor será el ajuste del modelo a la variable que
estamos intentando explicar. De forma inversa, cuanto más cerca de cero, menos ajustado
estará el modelo y, por tanto, menos fiable será. En la expresión anterior tenemos una
fracción. Así pues, vayamos por partes. En primer lugar, analizaremos el numerador, es
decir, la parte de arriba. Para aquellos que no conozcan la expresión de la varianza, les
recomiendo que lean el artículo sobre la misma. Para aquellos que sí la conozcan, podrán
caer en la cuenta de que es la expresión de la varianza, pero con dos diferencias
fundamentales. La primera diferencia es que la Y lleva un circunflejo o lo que los
profesores llaman de forma didáctica “sombrerito”. Ese sombrerito lo que detalla es que esa
Y es la estimación de un modelo sobre lo que según las variables explicativas vale Y, pero
no es el valor real de Y, sino una estimación de Y.

En segundo lugar, faltaría dividir entre T. Que, en otros casos, se nota como N o número de
observaciones. Sin embargo, dado que la fórmula del denominador también la llevaría,
eliminamos los denominadores (parte de abajo) de ambas fórmulas para simplificar la
expresión. De esta manera es más fácil trabajar con ella.

A continuación, vamos a realizar el mismo análisis con la parte del denominador (parte de
abajo). En este caso, la única diferencia existente respecto a la fórmula original de la
varianza es la ausencia de su denominador. Es decir, no dividimos entre T o N. De esta
manera, una vez explicadas las dos partes de la expresión genérica del R cuadrado o
coeficiente de determinación, vamos a ver un ejemplo

Una correlación positiva, cuando el coeficiente de correlación es mayor que 0, significa


que ambas variables se mueven en la misma dirección o están correlacionadas. cuando ρ es
+1, significa que las dos variables que se comparan tienen una relación positiva perfecta;
cuando una variable se mueve hacia arriba o hacia abajo, la otra variable se mueve en la
misma dirección con la misma magnitud. Cuanto más se acerca el valor de ρ a +1, más
fuerte es la relación lineal. por ejemplo, suponga que el valor de los precios del petróleo
está directamente relacionado con los precios de los boletos de avión, con un coeficiente de
correlación de +0.8. La relación entre los precios del petróleo y las tarifas aéreas tiene una
correlación positiva muy fuerte ya que el valor es cercano a +1. así que, si el precio del
petróleo disminuye, las tarifas aéreas siguen en conjunto. Si el precio del petróleo aumenta,
también lo hacen los precios de los billetes de avión

Se produce una correlación negativa (inversa) cuando el coeficiente de correlación es


inferior a 0 e indica que ambas variables se mueven en la dirección opuesta. en resumen,
cualquier lectura entre 0 y -1 significa que los dos valores se mueven en direcciones
opuestas. cuando ρ es -1, se dice que la relación está perfectamente correlacionada
negativamente; en resumen, si una variable aumenta, la otra variable disminuye con la
misma magnitud, y viceversa. sin embargo, el grado en que dos valores están
correlacionados negativamente puede variar con el tiempo y casi nunca están exactamente
correlacionados, todo el tiempo.

Por ejemplo, supongamos que se realiza un estudio para evaluar la relación entre la
temperatura exterior y las facturas de calefacción. El estudio concluye que existe una
correlación negativa entre los precios de las facturas de calefacción y la temperatura
exterior. El coeficiente de correlación se calcula en -0.96. Esta fuerte correlación negativa
significa que a medida que la temperatura disminuye en el exterior, los precios de las
facturas de calefacción aumentan y viceversa.

Cuando se trata de invertir, la correlación negativa no significa necesariamente que se


deben evitar los valores. El coeficiente de correlación puede ayudar a los inversores a
diversificar su cartera al incluir una combinación de inversiones que tengan una correlación
negativa o baja con el mercado de valores. en resumen, cuando se reduce el riesgo de
volatilidad en una cartera, a veces los opuestos se atraen.

¿QUÉ ES EL COEFICIENTE DE CORRELACIÓN LINEAL Y QUÉ NOS AYUDA


A MEDIR?

La correlación, también conocida como coeficiente de correlación lineal (de Pearson), es


una medida de regresión que pretende cuantificar el grado de variación conjunta entre dos
variables.

Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos
variables, es decir, si se representan en un diagrama de dispersión los valores que toman
dos variables, el coeficiente de correlación lineal señalará lo bien o lo mal que el conjunto
de puntos representados se aproxima a una recta.

De una forma menos coloquial, la podemos definir como el número que mide el grado de
intensidad y el sentido de la relación entre dos variables.
Donde;

Cov (x;y): la covarianza entre el valor «x» e «y».

σ(x): desviación típica de «x».

σ(y): desviación típica de «y».

Valores que puede tomar la correlación

ρ = -1          Correlación perfecta negativa

ρ = 0           No existe correlación

ρ = +1         Correlación perfecta positiva

Hablamos de correlación positiva si siempre que el valor «x» sube, el valor «y» sube, y
además con la misma intensidad (+1).

En el caso opuesto, si siempre que el valor «x» sube, y el valor «y» baja, y además con la
misma intensidad, entonces estamos hablando de correlación negativa (-1).

Es importante saber que esto no quiere decir que lo hagan en la misma proporción (salvo
que tengan la misma desviación típica).
Ejercicio.

Temperatura – Enfermedad respiratoria.

En una investigación realizada durante el mes de agosto en un hospital pediátrico respecto a


la relación de la temperatura ambiente media y los casos de enfermedad registrados se
obtuvieron los siguientes datos;

1. Realice el diagrama de dispersión y determine el tipo de asociación

entre las variables.


Análisis;

el tipo de asociación es negativa, porque el valor de x disminuye cuando aumenta el valor


de y

a. Encuentre el coeficiente de determinación y correlación.


Determine el modelo matemático que permite predecir el efecto de una variable sobre
la otra. ¿Es confiable?

El modelo matemático que permite predecir el efecto de una variable sobre la otra es

Y= a+ b x para este caso se tiene que; y = -1,73x + 46,09 = 0,89 Esto nos permite
determinar el efecto de una variable sobre la otra, teniendo en cuenta que R2 es cercano a 1
se puede determinar que es confiable.

Determine el grado de relación de las dos variables.


El coeficiente de terminación R2 refleja un porcentaje de explicación del 84 % de la
información y el coeficiente de correlación lo obtenemos sacando raíz cuadrada al
coeficiente de determinación, es decir;

√ 0,89=0,94
De los cuales se cree que existe un grado de relación muy bueno entre las dos variables.

ACTIVIDAD 4. REGRESIÓN Y CORRELACIÓN LINEAL.


Descripción de la Actividad Individual:

A partir de la base de datos suministrada: Anexo 1- Indicadores de


accidentalidad -230 municipios 2020 (16-4), cada estudiante,
deberá:

-Identificar dos variables cuantitativas de la situación estudiada que puedan estar


relacionadas e identificar la variable dependiente e independiente

 Otras motos
 Peatón.
Realizar el diagrama de dispersión de dichas variables y determinar el
tipo de relación entre las variables.
Tipo de relación; relación directa

Determine al coeficiente de determinación y de correlación de las dos variables.


Interprete los resultados.

Análisis; el coeficiente de determinación es de 0,89 la correlación entre las dos variables


esta entre 0,94 y 1.

Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?

Modelo matemático y=0,10+0,65, existe una confiabilidad del 75% concluyendo así que
tiene una relación buena.

Determine el tipo de correlación de las dos variables.


Con el diagrama de dispersión podemos ver cómo se relacionan ambas variables entre sí.
Es por eso que se cree que existe una Correlación positiva, ocurre cuando la variable de
otras motos aumenta, también aumenta la variable de peatón.
Relacionar la información obtenida con el problema.
Con la información obtenida del ejercicio, tomando como referencia la base de datos
Indicadores de accidentalidad -230 municipios 2020, se evidencia la relación que existe al
escoger dos variables cuantitativas, y como estas tiene comportamientos entre sí.
CONCLUSION.

Gracias a la elaboración de este trabajo se concluye que es base fundamental manejar e


interpretar cada uno de los temas antes vistos para de esa manera desarrollar
satisfactoriamente cada uno de los ejercicios propuestos en la actividad de la misma manera
que será de gran utilidad para el campo laboral y profesional.

También podría gustarte