Descripción De Datos Bivariados

Descripción De Datos Bivariados
P2(7) Cuando se miden dos variables en una sola unidad experimental; los datos resultantes se llaman Datos Bivariados. Los métodos para graficar datos bivariados, si las variables son cualitativas o cuantitativas, permiten estudiar las dos variables.

GRÁFICAS PARA VARIABLES CUALITATIVAS

P3(8) Cuando por lo menos una de las dos variables es cualitativa puede usar gráficas de sectores o de pastel simples.

Ejemplo 3.1 ¿Los profesores de universidades privadas reciben mejor remuneración que los profesores de universidades públicas? Los datos de la tabla 3.1 se tomaron de un muestra de 400 profesores cuya categoría, tipo de universidad y salario se registraron. El número de da cada celda es el salario promedio (en miles de dólares) para los profesores que caen en esa categoría. Use una gráfica para contestar la pregunta planteada para esta muestra.

Tabla 3.1 Salarios de profesores por categoría y tipo de universidad

Profesor de Tiempo completo

Profesor asociado

Profesor asistente

Pública Privada

55.8 61.6

42.2 43.3

35.2 35.5

Solución – Para mostrar los salarios promedio de estos 400 profesores, ósea un grafica de barras lado con lado, como se ilustra en la figura 3.1.La altura de las barras es el salario promedio, donde cada par de barras a lo largo del eje horizontal representa una categoría académica diferente. Los salarios son mucho mayores para los profesores de tiempo completo de universidades privadas, pero hay muy poca diferencia en las dos categorías inferiores.

DIAGRAMAS DE DISPERSIÓN PARA DOS VARIABLES CUANTITATIVAS

P7(7) Cuando dos variables en una grafica son cuantitativas una se llama x y la otra y. Cada para de valores de...

[editar] Descripción Un diagrama de dispersión se emplea cuando existe una variable que está bajo el control del experimentador. y que es más fácil ver la relación en un diagrama de dispersión que en una simple tabla de números Diagrama de dispersión De Wikipedia. EE. la enciclopedia libre Saltar a: navegación. Si existe un parámetro que se incrementa o disminuye de forma . que las relaciones de causa-efecto casi siempre muestran variaciones. muy utilizada en las fases de Comprobación de teorías e identificación de causas raíz y en el Diseño de soluciones y mantenimiento de los resultados obtenidos. Wyoming. cada uno con el valor de una variable que determina la posición en el eje horizontal y el valor de la otra variable determinado por la posición en el eje vertical. Tres conceptos especialmente destacables son que el descubrimiento de las verdaderas relaciones de causaefecto es la clave de la resolución eficaz de un problema.UU. Un diagrama de dispersión es un tipo de diagrama matemático que utiliza las coordenadas cartesianas para mostrar los valores de dos variables para un conjunto de datos. búsqueda El tiempo de espera entre las erupciones y la duración de la erupción del géiser Old Faithful en el Parque Nacional Yellowstone. Este gráfico sugiere que por lo general hay dos "tipos" de erupciones: uno de corta espera y corta duración y otro de larga espera y larga duración. Los datos se muestran como un conjunto de puntos.Un diagrama de dispersión es una representación gráfica de la relación entre dos variables.1 Un diagrama de dispersión se llama también gráfico de dispersión.

El diagrama de dispersión es una de las herramientas básicas de control de calidad. . si los datos son representados por un modelo de mezcla de relaciones simples. Además. Se puede dibujar una línea de ajuste (llamada también "línea de tendencia") con el fin de estudiar la correlación entre las variables. búsqueda En estadística la covarianza es una medida de dispersión conjunta de dos variables estadísticas. Si no existe una variable dependiente. se le denomina parámetro de control o variable independiente = eje de x y habitualmente se representa a lo largo del eje horizontal. Covarianza De Wikipedia. cualquier variable se puede representar en cada eje y el diagrama de dispersión mostrará el grado de correlación (no causalidad) entre las dos variables. La variable medida o dependiente = eje de y usualmente se representa a lo largo del eje vertical. la hoja de verificación. La correlación puede ser positiva (aumento). que incluyen además el histograma. Un diagrama de dispersión puede sugerir varios tipos de correlaciones entre las variables con un intervalo de confianza determinado. Uno de los aspectos más poderosos de un gráfico de dispersión. Una ecuación para la correlación entre las variables puede ser determinada por procedimientos de ajuste. los gráficos de control. estas relaciones son visualmente evidentes como patrones superpuestos. el procedimiento de ajuste es conocido como regresión lineal y garantiza una solución correcta en un tiempo finito. negativa (descenso).sistemática por el experimentador. o nula (las variables no están correlacionadas). el diagrama de Ishikawa y el ((diagrama de flujo)). sin embargo. la enciclopedia libre Saltar a: navegación. el diagrama de Pareto. es su capacidad para mostrar las relaciones no lineales entre las variables. Para una correlación lineal.

c. a grandes valores de x corresponden pequeños valores de y. b. Y. Cuando las variables aleatorias X e Y son n-dimensionales. W. e . es decir. [editar] Propiedades Si X. Para distribuciones discretas la fórmula anterior se concreta en .Contenido        1 Definición 2 Interpretación de la covarianza 3 Propiedades 4 No correlación e independencia 5 Relación con el producto escalar 6 Enlaces Externos 7 Véase también [editar] Definición La covarianza SXY (a veces también denotada Cov(X. su matriz de covarianzas ΣXY es: [editar] Interpretación de la covarianza    Si Sxy > 0 hay dependencia directa (positiva). es decir. se cumple que: . d son constantes ("constante" en este contexto significa no aleatorio). y V son variables aleatorias y a. Si Sxy < 0 hay dependencia inversa o negativa.Y) ) de dos variables aleatorias X e Y es: donde es el operador esperanza. a grandes valores de x corresponden grandes valores de y. es decir. Si Sxy = 0 Una covarianza 0 se interpreta como la no existencia de una relación lineal entre las dos variables estudiadas.

Cov(aX + bY. U) 2. Bajo algunas hipótesis adicionales. la covarianza de valor cero implica independencia. entonces su covarianza es cero. que tanto se mueve una cuando la otra se mueve otro tanto. Ejemplo. U) + b Cov(Y. supongamos que la variable Y se mueve 2. fórmula que suele emplearse en la práctica para calcular la covarianza. X) = 0 entonces X es una variable aleatoria constante. De hecho. y U. X) 3. si Cov(X. la varianza de X . Esto ocurre por la propiedad de independencia. [editar] Relación con el producto escalar La mayoría de las propiedades de la covarianza se deducen de las del producto escalar: 1. Estas propiedades se deducen de manera casi directa de la definición de la covarianza. U) = a Cov(X. En otras palabras la covarianza trata de explicar que tan relacionadas se encuentran dos variables entre sí. [editar] No correlación e independencia Si X e Y son independientes. generalmente no es cierto: algunos pares de variables aleatorias tienen covarianza cero pese a que no son independientes. además. Y) = Cov(Y. X) ≥ 0. Lo opuesto. Y. Es un operador positivo definido: Var(X) = Cov(X. si la variable X se mueve 1. la covarianza es un producto interior sobre el espacio cociente de las variables aleatorias de momentos finitos iguales salvo constante. y las variables aleatorias X. Bilinealidad: para las constantes a y b. como por ejemplo en el caso de la distribución normal multivariante. entonces podemos decir que la variable Y se mueve positivamente el doble de lo que se movería la variable X. sin embargo. [editar] Enlaces Externos  Simulación de la covarianza de una variable bidimensional continua [1] y discreta [2] con R (lenguaje de programación) .       . Simetría: Cov(X.

pero es más débil que la anterior. más fuerte es la correlación. pero solo a grandes rasgos. Lógicamente. Se aprecia una relación entre las dos variables: a mejor nota en Matemáticas mejor nota en Física. Y viceversa. . Una jugadora de baloncesto lanza a canasta. Filosofía. También se puede expresar como . La tendencia a variar conjuntamente las dos variables en una distribución bidimensional se marca mediante la recta de regresión. Si tomamos esos dos valores como las coordenadas de un punto. apreciamos que también hay correlación entre estas dos variables. pues al aumentar una variable tiende a disminuir la otra. Relacionemos ahora las notas de Matemáticas de los mismos alumnos con las de otra asignatura. Cuanto más próximos estén los puntos a la recta. que se lee: La covarianza es igual al promedio de los productos cruzados menos el producto de las medias NUBES DE PUNTOS. encesta más cuanto más cerca está. 10 balones cada vez. grosso modo. CORRELACIÓN Éstas son las notas de 12 estudiantes en Matemáticas y en Física: Alumno Matemáticas a 2 b 3 c 4 Física d 4 e 5 f 6 1 g 6 3 h 7 2 i 7 4 j 8 4 k 10 4 l 10 6 4 6 7 9 10 Es una distribución bidimensional porque a cada individuo le corresponden los valores de dos variables. Alumno Filosofía a b c d e f g h i j k 2 5 2 7 5 4 6 6 7 5 5 l 9 Matemáticas 2 3 4 4 5 6 6 7 7 8 10 10 Tanto si nos fijamos en la tabla de datos como en la nube de puntos. la distribución puede ser representada mediante 12 puntos: nube de puntos.[editar] Véase también            Regresión lineal Correlación ANOVA Varianza DISTRIBUCIONES BIDIMENSIONALES Las frecuencias se representarán por Fij y fij Recibe el nombre de distribución marginal de X la distribución que tiene la variable X ignorando la variable Y. Distancia(m) 1 2 3 4 5 6 7 8 Encestes 9 10 6 4 2 0 1 0 En este caso hay correlación fuerte y negativa. desde distintas distancias. Se dice que existe correlación entre esas dos variables. Distribuciones condicionadas: covarianza Es una medida de la intensidad de cierta asociación estadística entre dos variables.

| r | es próximo a 0. | r | es próximo a 1. El valor de r está comprendido entre -1 y 1. si se realiza un cambio de unidades. nota en Física. Centro de gravedad de una distribución bidimensional MEDIA DE LA VARIABLE MEDIA DE LA VARIABLE El punto se llama centro de gravedad de la distribución. r = 1 ó r = -1. el valor de r no varía. x. r.    Si la correlación es perfecta (puntos de la nube alineados). EJERCICIOS RESUELTOS 2 3 4 4 5 6 6 7 7 8 10 10 72 1 3 2 4 4 4 6 4 6 7 9 4 9 16 16 25 36 36 49 49 64 100 1 9 4 16 16 16 36 16 36 49 81 2 9 8 16 20 24 36 28 42 56 90 100 431 10 100 100 60 504 380 Utilizando la fórmula anterior. no depende de las unidades en las que se expresan los valores de las dos variables. Si la correlación es fuerte. Si la correlación es débil. Para ello. calcular la correlación entre las variables nota en Matemáticas. y. Vamos a confeccionar una fórmula que sirva para obtener su valor de forma numérica e inequívoca. Es decir. Por tanto. entonces | r | = 1.MEDIDA DE LA CORRELACIÓN Hemos visto que la correlación entre dos variables (más o menos fuerte. calcular previamente . positiva o negativa) se aprecia mediante el grado de “apertura” de los puntos de la nube. es decir. Covarianza Correlación El coeficiente de correlación. tiene las siguientes propiedades: No tiene dimensiones.

5). . Por tanto. De ese modo se llega (utilizando métodos matemáticos superiores a este curso) a lo siguiente:   La recta buscada pasa por el centro de gravedad de la distribución.El centro de gravedad es el punto (6. sin embargo . Su pendiente es El signo del coeficiente de correlación y el del coeficiente de regresión coinciden. sumen lo menos posible: mínimo. ¿Qué criterio seguimos para ese “mejor ajuste”? Consideramos todas las posibles rectas y =A+Bx y nos quedaremos con aquella para la cual los cuadrados de las distancias. pero aquí termina la coincidencia: puede ser que la recta de regresión tenga pendiente alta y. Observamos que este punto no tiene por que ser de le distribución. Es una correlación muy alta. Método de los mínimos cuadrados Partimos de la nube de puntos . Hemos de encontrar la recta que “mejor se ajuste” a la nube.