Está en la página 1de 20

Analizando datos bivariados

Prof. Josette Zúñiga Morales


Matemáticas BI
¿Qué son datos bivariados?
Los grupos de datos bivariados son aquellos en los que su análisis relaciona dos
variables; los datos univariados analizamos datos de una sola variable. Hasta
ahora solamente hemos estudiado y analizado grupos de datos univariados.

Con los datos bivariados, se recopilan datos sobre dos variables diferentes, de
un mismo grupo de individuos.

En los análisis bivariables la idea es comparar los datos tomados, para verificar
si existe alguna correlación entre las dos variables que expliquen el
comportamiento de la población analizada.
Algunos ejemplos sencillos:
1) De un grupo de personas, recopilar su edad y la cantidad de café que beben al
día, para analizar si el consumo del café está asociado a la edad de la persona.

2) Recopilar el género de un grupo de personas y el salario que recibe, para


analizar si el salario depende del género de la persona.

3) De un grupo de estudiantes, consultar su promedio ponderado y el número de


horas que utiliza redes sociales, para determinar si existe una relación entre las
horas que utiliza redes sociales y su promedio.
Datos bivariados
Al analizar datos bivariados, buscamos determinar las características de la
relación que existe entre las variables involucradas.

Por eso para trabajar con información bivariada es indispensable identificar cuál
es la variable dependiente (su representación se realiza sobre el eje Y) y cuál
es la variable independiente (su representación se realiza respecto al Eje X).

Es decir, determinar si una se relaciona con la otra, y en caso de hacerlo, poder


caracterizar de qué manera lo hace. Para el análisis de datos bivariados existe
una amplia gama de herramientas, que combinan probabilidad y estadística.
Análisis simple para datos bivariados
Los datos bivariados se pueden interpretar como pares ordenados, que se representan
en un plano cartesiano. A este tipo de representación gráfica se le llama: Gráfico de
Dispersión.

El patrón que sigan o formen todos los puntos o pares ordenados, se puede
interpretar y analizar el tipo de relación que existe entre las variables y además se
puede interpretar qué tan fuerte sea esa relación.

***Al usar excel o numbers, se acostumbra a realizar los gráficos de dispersión usando
pequeños círculos o “cruces” para indicar la posición de cada par ordenado***
Ejemplo A
Monica y sus amigas se están entrenando para una carrera benéfica. Le interesa
saber si la altura de los corredores tiene algún efecto sobre el tiempo necesario
para completar la carrera.

Identifique la variable dependiente e independiente, en el caso anterior.


Ejemplo B
El profesor Price estaba interesado en averiguar si el número de pruebas de años anteriores
que completaron sus alumnos como práctica, tuvo un efecto en la calificación que obtuvieron
en su examen final. Los datos que recopiló se muestran a continuación.

1) Identifique las variables y grafique en un plano cartesiano la información.

2) Conteste: ¿Cree que las dos variables están relacionadas? ¿Qué tan cercanos cree
que están relacionados? ¿Qué consejo le daría a los estudiantes que tienen que
presentarse a exámenes?
Analizando datos bivariados
utilizando la Correlación
Correlación
La correlación es un tipo de asociación entre dos variables numéricas,
específicamente evalúa la tendencia (creciente o decreciente) en los datos.

Dos variables están asociadas cuando una variable nos da información acerca de la
otra, es decir, existe un patrón constante entre las variables (ambas aumentan al
mismo tiempo, o si una aumenta, el otro siempre disminuye).

Por el contrario, cuando no existe asociación, el aumento o disminución de una


variable no nos dice nada sobre el comportamiento de la otra variable. No existe un
patrón que describa el comportamiento.

Dos variables se correlacionan cuando muestran una tendencia creciente o


decreciente.
Correlación
Generalmente para identificar si un grupo de datos siguen un tipo de
correlación, esperamos que los datos se comporten de manera lineal.

Pues un modelo lineal es la representación ideal de una relación entre dos


variables, es decir que todos los datos independientes, se afectan de la misma
manera para obtener como resultado la variable dependiente.

Sin embargo, es importante entender que no todos los grupos de datos se


relacionaran de manera lineal (existen diferentes tipos de correlación).
Ejemplo C: Correlacion Lineal
Ejemplo D: Correlación no lineal
Ejemplo E
Para comprender mejor, la idea de una correlación lineal: Considere la función lineal
f(x) = 2x + 1.

Para obtener los resultados en y (dependiente), tomamos valores de x (independiente) y les


realizamos las mismas modificaciones o alteraciones sin importar el valor de x tomado, así
los valores de y siguen un patrón específico.

Están relacionados mediante una condición o característica (el criterio) y siguen un mismo
comportamiento.

Y
Tipos de Correlación
Una correlación puede ser positiva (cuando se nota una tendencia creciente en el
comportamiento de los datos), negativa (se aprecia una tendencia decreciente) o no
existir correlación (no existe un orden en los pares ordenados, no se observa ningún
comportamiento regular).
Tipos de Correlación
También se puede clasificar como fuerte (una tendencia muy marcada de los datos hacia un mismo
comportamiento, menor dispersión o variabilidad entre datos), moderada (se aprecia un
comportamiento o tendencia, sin embargo, hay también mayor variabilidad o dispersión), o débil
(se observa una ligera tendencia, pero los datos son muy dispersos).
Ejemplo F
Ejemplo G
Ejemplo H
Ejemplo I
Ejercitación

•Ejercitación 3H: Pág.137

También podría gustarte