Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TUTOR:
VANESSA JULIETT LINARES
GRUPO:
178
En este trabajo se aplican las medidas estadísticas bivariantes, con el estudio de caso,
indicadores de accidentalidad 2020 en el que se hace análisis a 230 municipios de
Colombia. a través del cálculo e interpretación del software estadístico, InfoStat en función
de la problemática de estudio. Así mismo con el apoyo de las referencias bibliográficas
disponibles en la unidad.
OBJETIVOS.
OBJETIVOS.
Objetivo general:
Analizar el estudio del caso, para extraer la base de dato necesaria para el desarrollo de los
ejercicios
Objetivos específicos
Es importante realizar este trabajo gracias a su amplio análisis de comprensión que nos
permite determinar detalladamente la información que necesitamos en el momento justo
dando cabida a la toma de decisiones y realidad de los casos.
Mapa mental.
https://docs.google.com/drawings/d/12jTaC_X4tEhJDlgJmUmcnQNMPZ0fhgRAnjx7
VmKSb9c/edit
El Diagrama de Dispersión, tiene el propósito de controlar mejor el proceso, resulta
indispensable conocer cómo se comportan algunas variables o características de calidad
entre si, esto es, descubrir si el comportamiento de unas depende del comportamiento de
otras, o no, y en qué grado. El Diagrama de dispersión es una herramienta utilizada cuando
se desea realizar un análisis gráfico de datos bivariados, es decir, los que se refieren a dos
conjuntos de datos. El resultado del análisis puede mostrar que existe una relación entre una
variable y la otra. El estudio puede ampliarse para incluir una medida cuantitativa de tal
relación. Las dos variables pueden estar relacionadas de la siguiente manera:
• Paso 1.- Recolectar en parejas de datos de la forma (Xi, Yi), con i = 1, 2, 3,…n
donde Xi y Yi representan los valores respectivos de las dos variables. Los datos se suelen
representar en una tabla.
• Paso 3.- Graficar las parejas de datos. Si hay puntos repetidos, se mostrarán como
círculos concéntricos.
Para estudiar la relación lineal existente entre dos variables continuas es necesario disponer
de parámetros que permitan cuantificar dicha relación. Uno de estos parámetros es la
covarianza, que indica el grado de variación conjunta de dos variables aleatorias.
Covarianza muestral=Cov(X,Y)=∑ni=1(xi−x¯¯¯)(yi−y¯¯¯)N−1
siendo x¯¯¯ e y¯¯¯ la media de cada variable y xi e yi el valor de las variables para la
observación i.
La covarianza depende de las escalas en que se miden las variables estudiadas, por lo tanto,
no es comparable entre distintos pares de variables. Para poder hacer comparaciones se
estandariza la covarianza, generando lo que se conoce como coeficientes de correlación.
Existen diferentes tipos, de entre los que destacan el coeficiente de Pearson, Rho de
Spearman y Tau de Kendall.
Todos ellos varían entre +1 y -1. Siendo +1 una correlación positiva perfecta y -1 una
correlación negativa perfecta.
• 0: asociación nula.
• 0.1: asociación pequeña.
• 0.3: asociación mediana.
• 0.5: asociación moderada.
• 0.7: asociación alta.
• 0.9: asociación muy alta.
En segundo lugar, faltaría dividir entre T. Que, en otros casos, se nota como N o número de
observaciones. Sin embargo, dado que la fórmula del denominador también la llevaría,
eliminamos los denominadores (parte de abajo) de ambas fórmulas para simplificar la
expresión. De esta manera es más fácil trabajar con ella.
A continuación, vamos a realizar el mismo análisis con la parte del denominador (parte de
abajo). En este caso, la única diferencia existente respecto a la fórmula original de la
varianza es la ausencia de su denominador. Es decir, no dividimos entre T o N. De esta
manera, una vez explicadas las dos partes de la expresión genérica del R cuadrado o
coeficiente de determinación, vamos a ver un ejemplo
Por ejemplo, supongamos que se realiza un estudio para evaluar la relación entre la
temperatura exterior y las facturas de calefacción. El estudio concluye que existe una
correlación negativa entre los precios de las facturas de calefacción y la temperatura
exterior. El coeficiente de correlación se calcula en -0.96. Esta fuerte correlación negativa
significa que a medida que la temperatura disminuye en el exterior, los precios de las
facturas de calefacción aumentan y viceversa.
Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos
variables, es decir, si se representan en un diagrama de dispersión los valores que toman
dos variables, el coeficiente de correlación lineal señalará lo bien o lo mal que el conjunto
de puntos representados se aproxima a una recta.
De una forma menos coloquial, la podemos definir como el número que mide el grado de
intensidad y el sentido de la relación entre dos variables.
Donde;
ρ = 0 No existe correlación
Hablamos de correlación positiva si siempre que el valor «x» sube, el valor «y» sube, y
además con la misma intensidad (+1).
En el caso opuesto, si siempre que el valor «x» sube, y el valor «y» baja, y además con la
misma intensidad, entonces estamos hablando de correlación negativa (-1).
Es importante saber que esto no quiere decir que lo hagan en la misma proporción (salvo
que tengan la misma desviación típica).
Ejercicio.
El modelo matemático que permite predecir el efecto de una variable sobre la otra es
Y= a+ b x para este caso se tiene que; y = -1,73x + 46,09 = 0,89 Esto nos permite
determinar el efecto de una variable sobre la otra, teniendo en cuenta que R2 es cercano a 1
se puede determinar que es confiable.
√ 0,89=0,94
De los cuales se cree que existe un grado de relación muy bueno entre las dos variables.
Otras motos
Peatón.
Realizar el diagrama de dispersión de dichas variables y determinar el
tipo de relación entre las variables.
Tipo de relación; relación directa
Modelo matemático y=0,10+0,65, existe una confiabilidad del 75% concluyendo así que
tiene una relación buena.