Descripción De Datos Bivariados

Descripción De Datos Bivariados
P2(7) Cuando se miden dos variables en una sola unidad experimental; los datos resultantes se llaman Datos Bivariados. Los métodos para graficar datos bivariados, si las variables son cualitativas o cuantitativas, permiten estudiar las dos variables.

GRÁFICAS PARA VARIABLES CUALITATIVAS

P3(8) Cuando por lo menos una de las dos variables es cualitativa puede usar gráficas de sectores o de pastel simples.

Ejemplo 3.1 ¿Los profesores de universidades privadas reciben mejor remuneración que los profesores de universidades públicas? Los datos de la tabla 3.1 se tomaron de un muestra de 400 profesores cuya categoría, tipo de universidad y salario se registraron. El número de da cada celda es el salario promedio (en miles de dólares) para los profesores que caen en esa categoría. Use una gráfica para contestar la pregunta planteada para esta muestra.

Tabla 3.1 Salarios de profesores por categoría y tipo de universidad

Profesor de Tiempo completo

Profesor asociado

Profesor asistente

Pública Privada

55.8 61.6

42.2 43.3

35.2 35.5

Solución – Para mostrar los salarios promedio de estos 400 profesores, ósea un grafica de barras lado con lado, como se ilustra en la figura 3.1.La altura de las barras es el salario promedio, donde cada par de barras a lo largo del eje horizontal representa una categoría académica diferente. Los salarios son mucho mayores para los profesores de tiempo completo de universidades privadas, pero hay muy poca diferencia en las dos categorías inferiores.

DIAGRAMAS DE DISPERSIÓN PARA DOS VARIABLES CUANTITATIVAS

P7(7) Cuando dos variables en una grafica son cuantitativas una se llama x y la otra y. Cada para de valores de...

cada uno con el valor de una variable que determina la posición en el eje horizontal y el valor de la otra variable determinado por la posición en el eje vertical. Un diagrama de dispersión es un tipo de diagrama matemático que utiliza las coordenadas cartesianas para mostrar los valores de dos variables para un conjunto de datos.Un diagrama de dispersión es una representación gráfica de la relación entre dos variables. la enciclopedia libre Saltar a: navegación.UU. [editar] Descripción Un diagrama de dispersión se emplea cuando existe una variable que está bajo el control del experimentador. Este gráfico sugiere que por lo general hay dos "tipos" de erupciones: uno de corta espera y corta duración y otro de larga espera y larga duración. búsqueda El tiempo de espera entre las erupciones y la duración de la erupción del géiser Old Faithful en el Parque Nacional Yellowstone. EE. Tres conceptos especialmente destacables son que el descubrimiento de las verdaderas relaciones de causaefecto es la clave de la resolución eficaz de un problema. Los datos se muestran como un conjunto de puntos. y que es más fácil ver la relación en un diagrama de dispersión que en una simple tabla de números Diagrama de dispersión De Wikipedia. que las relaciones de causa-efecto casi siempre muestran variaciones. Wyoming. muy utilizada en las fases de Comprobación de teorías e identificación de causas raíz y en el Diseño de soluciones y mantenimiento de los resultados obtenidos. Si existe un parámetro que se incrementa o disminuye de forma .1 Un diagrama de dispersión se llama también gráfico de dispersión.

negativa (descenso). sin embargo. si los datos son representados por un modelo de mezcla de relaciones simples. la enciclopedia libre Saltar a: navegación. Una ecuación para la correlación entre las variables puede ser determinada por procedimientos de ajuste. se le denomina parámetro de control o variable independiente = eje de x y habitualmente se representa a lo largo del eje horizontal. La correlación puede ser positiva (aumento). la hoja de verificación. el procedimiento de ajuste es conocido como regresión lineal y garantiza una solución correcta en un tiempo finito. El diagrama de dispersión es una de las herramientas básicas de control de calidad. cualquier variable se puede representar en cada eje y el diagrama de dispersión mostrará el grado de correlación (no causalidad) entre las dos variables. que incluyen además el histograma. Para una correlación lineal. Uno de los aspectos más poderosos de un gráfico de dispersión. es su capacidad para mostrar las relaciones no lineales entre las variables. Se puede dibujar una línea de ajuste (llamada también "línea de tendencia") con el fin de estudiar la correlación entre las variables. o nula (las variables no están correlacionadas). Si no existe una variable dependiente. el diagrama de Pareto. búsqueda En estadística la covarianza es una medida de dispersión conjunta de dos variables estadísticas. el diagrama de Ishikawa y el ((diagrama de flujo)). los gráficos de control. La variable medida o dependiente = eje de y usualmente se representa a lo largo del eje vertical. Un diagrama de dispersión puede sugerir varios tipos de correlaciones entre las variables con un intervalo de confianza determinado. .sistemática por el experimentador. Además. Covarianza De Wikipedia. estas relaciones son visualmente evidentes como patrones superpuestos.

es decir. Si Sxy = 0 Una covarianza 0 se interpreta como la no existencia de una relación lineal entre las dos variables estudiadas. b. a grandes valores de x corresponden pequeños valores de y. su matriz de covarianzas ΣXY es: [editar] Interpretación de la covarianza    Si Sxy > 0 hay dependencia directa (positiva). y V son variables aleatorias y a. [editar] Propiedades Si X. Cuando las variables aleatorias X e Y son n-dimensionales. Si Sxy < 0 hay dependencia inversa o negativa. c. d son constantes ("constante" en este contexto significa no aleatorio). es decir. es decir. Para distribuciones discretas la fórmula anterior se concreta en . a grandes valores de x corresponden grandes valores de y.Y) ) de dos variables aleatorias X e Y es: donde es el operador esperanza. e . se cumple que: . Y.Contenido        1 Definición 2 Interpretación de la covarianza 3 Propiedades 4 No correlación e independencia 5 Relación con el producto escalar 6 Enlaces Externos 7 Véase también [editar] Definición La covarianza SXY (a veces también denotada Cov(X. W.

Bajo algunas hipótesis adicionales. además. U) + b Cov(Y. Ejemplo. De hecho. entonces podemos decir que la variable Y se mueve positivamente el doble de lo que se movería la variable X. la covarianza de valor cero implica independencia. X) = 0 entonces X es una variable aleatoria constante. Estas propiedades se deducen de manera casi directa de la definición de la covarianza. si Cov(X. Lo opuesto. Cov(aX + bY. sin embargo. En otras palabras la covarianza trata de explicar que tan relacionadas se encuentran dos variables entre sí. la covarianza es un producto interior sobre el espacio cociente de las variables aleatorias de momentos finitos iguales salvo constante. [editar] Relación con el producto escalar La mayoría de las propiedades de la covarianza se deducen de las del producto escalar: 1. X) ≥ 0.       . [editar] No correlación e independencia Si X e Y son independientes. U) = a Cov(X. Simetría: Cov(X. entonces su covarianza es cero. que tanto se mueve una cuando la otra se mueve otro tanto. si la variable X se mueve 1. Esto ocurre por la propiedad de independencia. la varianza de X . [editar] Enlaces Externos  Simulación de la covarianza de una variable bidimensional continua [1] y discreta [2] con R (lenguaje de programación) . Es un operador positivo definido: Var(X) = Cov(X. y U. y las variables aleatorias X. generalmente no es cierto: algunos pares de variables aleatorias tienen covarianza cero pese a que no son independientes. Y) = Cov(Y. X) 3. como por ejemplo en el caso de la distribución normal multivariante. supongamos que la variable Y se mueve 2. Bilinealidad: para las constantes a y b. Y. fórmula que suele emplearse en la práctica para calcular la covarianza. U) 2.

pero solo a grandes rasgos. La tendencia a variar conjuntamente las dos variables en una distribución bidimensional se marca mediante la recta de regresión. Cuanto más próximos estén los puntos a la recta. grosso modo. pues al aumentar una variable tiende a disminuir la otra. Una jugadora de baloncesto lanza a canasta. Distribuciones condicionadas: covarianza Es una medida de la intensidad de cierta asociación estadística entre dos variables. Se dice que existe correlación entre esas dos variables. desde distintas distancias. que se lee: La covarianza es igual al promedio de los productos cruzados menos el producto de las medias NUBES DE PUNTOS. pero es más débil que la anterior. También se puede expresar como . Alumno Filosofía a b c d e f g h i j k 2 5 2 7 5 4 6 6 7 5 5 l 9 Matemáticas 2 3 4 4 5 6 6 7 7 8 10 10 Tanto si nos fijamos en la tabla de datos como en la nube de puntos. más fuerte es la correlación. Relacionemos ahora las notas de Matemáticas de los mismos alumnos con las de otra asignatura. Lógicamente. Y viceversa. apreciamos que también hay correlación entre estas dos variables. Filosofía. Si tomamos esos dos valores como las coordenadas de un punto. la distribución puede ser representada mediante 12 puntos: nube de puntos. Se aprecia una relación entre las dos variables: a mejor nota en Matemáticas mejor nota en Física.[editar] Véase también            Regresión lineal Correlación ANOVA Varianza DISTRIBUCIONES BIDIMENSIONALES Las frecuencias se representarán por Fij y fij Recibe el nombre de distribución marginal de X la distribución que tiene la variable X ignorando la variable Y. Distancia(m) 1 2 3 4 5 6 7 8 Encestes 9 10 6 4 2 0 1 0 En este caso hay correlación fuerte y negativa. 10 balones cada vez. CORRELACIÓN Éstas son las notas de 12 estudiantes en Matemáticas y en Física: Alumno Matemáticas a 2 b 3 c 4 Física d 4 e 5 f 6 1 g 6 3 h 7 2 i 7 4 j 8 4 k 10 4 l 10 6 4 6 7 9 10 Es una distribución bidimensional porque a cada individuo le corresponden los valores de dos variables. encesta más cuanto más cerca está. .

x. Si la correlación es fuerte. nota en Física. EJERCICIOS RESUELTOS 2 3 4 4 5 6 6 7 7 8 10 10 72 1 3 2 4 4 4 6 4 6 7 9 4 9 16 16 25 36 36 49 49 64 100 1 9 4 16 16 16 36 16 36 49 81 2 9 8 16 20 24 36 28 42 56 90 100 431 10 100 100 60 504 380 Utilizando la fórmula anterior. Por tanto. | r | es próximo a 1. no depende de las unidades en las que se expresan los valores de las dos variables.MEDIDA DE LA CORRELACIÓN Hemos visto que la correlación entre dos variables (más o menos fuerte.    Si la correlación es perfecta (puntos de la nube alineados). Si la correlación es débil. Para ello. entonces | r | = 1. Covarianza Correlación El coeficiente de correlación. si se realiza un cambio de unidades. Es decir. Vamos a confeccionar una fórmula que sirva para obtener su valor de forma numérica e inequívoca. positiva o negativa) se aprecia mediante el grado de “apertura” de los puntos de la nube. El valor de r está comprendido entre -1 y 1. y. calcular la correlación entre las variables nota en Matemáticas. r. | r | es próximo a 0. calcular previamente . Centro de gravedad de una distribución bidimensional MEDIA DE LA VARIABLE MEDIA DE LA VARIABLE El punto se llama centro de gravedad de la distribución. r = 1 ó r = -1. es decir. tiene las siguientes propiedades: No tiene dimensiones. el valor de r no varía.

sumen lo menos posible: mínimo. Es una correlación muy alta. De ese modo se llega (utilizando métodos matemáticos superiores a este curso) a lo siguiente:   La recta buscada pasa por el centro de gravedad de la distribución. Método de los mínimos cuadrados Partimos de la nube de puntos . sin embargo .El centro de gravedad es el punto (6. . Por tanto. Hemos de encontrar la recta que “mejor se ajuste” a la nube. Observamos que este punto no tiene por que ser de le distribución. Su pendiente es El signo del coeficiente de correlación y el del coeficiente de regresión coinciden. ¿Qué criterio seguimos para ese “mejor ajuste”? Consideramos todas las posibles rectas y =A+Bx y nos quedaremos con aquella para la cual los cuadrados de las distancias. pero aquí termina la coincidencia: puede ser que la recta de regresión tenga pendiente alta y.5).

Sign up to vote on this title
UsefulNot useful