Descripción De Datos Bivariados

Descripción De Datos Bivariados
P2(7) Cuando se miden dos variables en una sola unidad experimental; los datos resultantes se llaman Datos Bivariados. Los métodos para graficar datos bivariados, si las variables son cualitativas o cuantitativas, permiten estudiar las dos variables.

GRÁFICAS PARA VARIABLES CUALITATIVAS

P3(8) Cuando por lo menos una de las dos variables es cualitativa puede usar gráficas de sectores o de pastel simples.

Ejemplo 3.1 ¿Los profesores de universidades privadas reciben mejor remuneración que los profesores de universidades públicas? Los datos de la tabla 3.1 se tomaron de un muestra de 400 profesores cuya categoría, tipo de universidad y salario se registraron. El número de da cada celda es el salario promedio (en miles de dólares) para los profesores que caen en esa categoría. Use una gráfica para contestar la pregunta planteada para esta muestra.

Tabla 3.1 Salarios de profesores por categoría y tipo de universidad

Profesor de Tiempo completo

Profesor asociado

Profesor asistente

Pública Privada

55.8 61.6

42.2 43.3

35.2 35.5

Solución – Para mostrar los salarios promedio de estos 400 profesores, ósea un grafica de barras lado con lado, como se ilustra en la figura 3.1.La altura de las barras es el salario promedio, donde cada par de barras a lo largo del eje horizontal representa una categoría académica diferente. Los salarios son mucho mayores para los profesores de tiempo completo de universidades privadas, pero hay muy poca diferencia en las dos categorías inferiores.

DIAGRAMAS DE DISPERSIÓN PARA DOS VARIABLES CUANTITATIVAS

P7(7) Cuando dos variables en una grafica son cuantitativas una se llama x y la otra y. Cada para de valores de...

[editar] Descripción Un diagrama de dispersión se emplea cuando existe una variable que está bajo el control del experimentador. Los datos se muestran como un conjunto de puntos. Este gráfico sugiere que por lo general hay dos "tipos" de erupciones: uno de corta espera y corta duración y otro de larga espera y larga duración.UU. EE. Un diagrama de dispersión es un tipo de diagrama matemático que utiliza las coordenadas cartesianas para mostrar los valores de dos variables para un conjunto de datos. y que es más fácil ver la relación en un diagrama de dispersión que en una simple tabla de números Diagrama de dispersión De Wikipedia. cada uno con el valor de una variable que determina la posición en el eje horizontal y el valor de la otra variable determinado por la posición en el eje vertical. que las relaciones de causa-efecto casi siempre muestran variaciones. la enciclopedia libre Saltar a: navegación. Tres conceptos especialmente destacables son que el descubrimiento de las verdaderas relaciones de causaefecto es la clave de la resolución eficaz de un problema. Wyoming.Un diagrama de dispersión es una representación gráfica de la relación entre dos variables. muy utilizada en las fases de Comprobación de teorías e identificación de causas raíz y en el Diseño de soluciones y mantenimiento de los resultados obtenidos. búsqueda El tiempo de espera entre las erupciones y la duración de la erupción del géiser Old Faithful en el Parque Nacional Yellowstone.1 Un diagrama de dispersión se llama también gráfico de dispersión. Si existe un parámetro que se incrementa o disminuye de forma .

sin embargo. Además. La correlación puede ser positiva (aumento). o nula (las variables no están correlacionadas). Covarianza De Wikipedia. Un diagrama de dispersión puede sugerir varios tipos de correlaciones entre las variables con un intervalo de confianza determinado. si los datos son representados por un modelo de mezcla de relaciones simples. el procedimiento de ajuste es conocido como regresión lineal y garantiza una solución correcta en un tiempo finito. Si no existe una variable dependiente.sistemática por el experimentador. La variable medida o dependiente = eje de y usualmente se representa a lo largo del eje vertical. Una ecuación para la correlación entre las variables puede ser determinada por procedimientos de ajuste. . el diagrama de Pareto. estas relaciones son visualmente evidentes como patrones superpuestos. negativa (descenso). la enciclopedia libre Saltar a: navegación. que incluyen además el histograma. El diagrama de dispersión es una de las herramientas básicas de control de calidad. cualquier variable se puede representar en cada eje y el diagrama de dispersión mostrará el grado de correlación (no causalidad) entre las dos variables. el diagrama de Ishikawa y el ((diagrama de flujo)). es su capacidad para mostrar las relaciones no lineales entre las variables. Uno de los aspectos más poderosos de un gráfico de dispersión. búsqueda En estadística la covarianza es una medida de dispersión conjunta de dos variables estadísticas. Se puede dibujar una línea de ajuste (llamada también "línea de tendencia") con el fin de estudiar la correlación entre las variables. se le denomina parámetro de control o variable independiente = eje de x y habitualmente se representa a lo largo del eje horizontal. la hoja de verificación. los gráficos de control. Para una correlación lineal.

se cumple que: . a grandes valores de x corresponden grandes valores de y. e . a grandes valores de x corresponden pequeños valores de y. es decir. W. es decir. b. d son constantes ("constante" en este contexto significa no aleatorio). Para distribuciones discretas la fórmula anterior se concreta en . es decir. [editar] Propiedades Si X. su matriz de covarianzas ΣXY es: [editar] Interpretación de la covarianza    Si Sxy > 0 hay dependencia directa (positiva).Y) ) de dos variables aleatorias X e Y es: donde es el operador esperanza. Cuando las variables aleatorias X e Y son n-dimensionales. Y. y V son variables aleatorias y a. Si Sxy = 0 Una covarianza 0 se interpreta como la no existencia de una relación lineal entre las dos variables estudiadas. Si Sxy < 0 hay dependencia inversa o negativa.Contenido        1 Definición 2 Interpretación de la covarianza 3 Propiedades 4 No correlación e independencia 5 Relación con el producto escalar 6 Enlaces Externos 7 Véase también [editar] Definición La covarianza SXY (a veces también denotada Cov(X. c.

la covarianza de valor cero implica independencia. X) 3. entonces su covarianza es cero. entonces podemos decir que la variable Y se mueve positivamente el doble de lo que se movería la variable X. X) = 0 entonces X es una variable aleatoria constante. que tanto se mueve una cuando la otra se mueve otro tanto. como por ejemplo en el caso de la distribución normal multivariante. Esto ocurre por la propiedad de independencia. Es un operador positivo definido: Var(X) = Cov(X. Y. y las variables aleatorias X. U) + b Cov(Y. Bilinealidad: para las constantes a y b. supongamos que la variable Y se mueve 2. la covarianza es un producto interior sobre el espacio cociente de las variables aleatorias de momentos finitos iguales salvo constante. Bajo algunas hipótesis adicionales. U) = a Cov(X. U) 2. y U. [editar] Enlaces Externos  Simulación de la covarianza de una variable bidimensional continua [1] y discreta [2] con R (lenguaje de programación) . Simetría: Cov(X. [editar] Relación con el producto escalar La mayoría de las propiedades de la covarianza se deducen de las del producto escalar: 1. si Cov(X. generalmente no es cierto: algunos pares de variables aleatorias tienen covarianza cero pese a que no son independientes. sin embargo. además. [editar] No correlación e independencia Si X e Y son independientes. De hecho. Lo opuesto. Ejemplo. X) ≥ 0. En otras palabras la covarianza trata de explicar que tan relacionadas se encuentran dos variables entre sí. la varianza de X . Estas propiedades se deducen de manera casi directa de la definición de la covarianza. Cov(aX + bY. Y) = Cov(Y. si la variable X se mueve 1. fórmula que suele emplearse en la práctica para calcular la covarianza.       .

encesta más cuanto más cerca está. Si tomamos esos dos valores como las coordenadas de un punto. pero solo a grandes rasgos. Filosofía. También se puede expresar como . Y viceversa. más fuerte es la correlación. Se aprecia una relación entre las dos variables: a mejor nota en Matemáticas mejor nota en Física. Una jugadora de baloncesto lanza a canasta. La tendencia a variar conjuntamente las dos variables en una distribución bidimensional se marca mediante la recta de regresión. CORRELACIÓN Éstas son las notas de 12 estudiantes en Matemáticas y en Física: Alumno Matemáticas a 2 b 3 c 4 Física d 4 e 5 f 6 1 g 6 3 h 7 2 i 7 4 j 8 4 k 10 4 l 10 6 4 6 7 9 10 Es una distribución bidimensional porque a cada individuo le corresponden los valores de dos variables. Cuanto más próximos estén los puntos a la recta. pues al aumentar una variable tiende a disminuir la otra.[editar] Véase también            Regresión lineal Correlación ANOVA Varianza DISTRIBUCIONES BIDIMENSIONALES Las frecuencias se representarán por Fij y fij Recibe el nombre de distribución marginal de X la distribución que tiene la variable X ignorando la variable Y. apreciamos que también hay correlación entre estas dos variables. Distancia(m) 1 2 3 4 5 6 7 8 Encestes 9 10 6 4 2 0 1 0 En este caso hay correlación fuerte y negativa. la distribución puede ser representada mediante 12 puntos: nube de puntos. desde distintas distancias. pero es más débil que la anterior. Alumno Filosofía a b c d e f g h i j k 2 5 2 7 5 4 6 6 7 5 5 l 9 Matemáticas 2 3 4 4 5 6 6 7 7 8 10 10 Tanto si nos fijamos en la tabla de datos como en la nube de puntos. . Relacionemos ahora las notas de Matemáticas de los mismos alumnos con las de otra asignatura. 10 balones cada vez. Se dice que existe correlación entre esas dos variables. que se lee: La covarianza es igual al promedio de los productos cruzados menos el producto de las medias NUBES DE PUNTOS. Lógicamente. Distribuciones condicionadas: covarianza Es una medida de la intensidad de cierta asociación estadística entre dos variables. grosso modo.

x. y. Es decir. tiene las siguientes propiedades: No tiene dimensiones. | r | es próximo a 0. r = 1 ó r = -1. es decir. el valor de r no varía. Para ello. Si la correlación es débil. calcular previamente . Si la correlación es fuerte. Centro de gravedad de una distribución bidimensional MEDIA DE LA VARIABLE MEDIA DE LA VARIABLE El punto se llama centro de gravedad de la distribución. positiva o negativa) se aprecia mediante el grado de “apertura” de los puntos de la nube.    Si la correlación es perfecta (puntos de la nube alineados). EJERCICIOS RESUELTOS 2 3 4 4 5 6 6 7 7 8 10 10 72 1 3 2 4 4 4 6 4 6 7 9 4 9 16 16 25 36 36 49 49 64 100 1 9 4 16 16 16 36 16 36 49 81 2 9 8 16 20 24 36 28 42 56 90 100 431 10 100 100 60 504 380 Utilizando la fórmula anterior. entonces | r | = 1. calcular la correlación entre las variables nota en Matemáticas.MEDIDA DE LA CORRELACIÓN Hemos visto que la correlación entre dos variables (más o menos fuerte. r. Covarianza Correlación El coeficiente de correlación. nota en Física. Vamos a confeccionar una fórmula que sirva para obtener su valor de forma numérica e inequívoca. Por tanto. no depende de las unidades en las que se expresan los valores de las dos variables. si se realiza un cambio de unidades. | r | es próximo a 1. El valor de r está comprendido entre -1 y 1.

Su pendiente es El signo del coeficiente de correlación y el del coeficiente de regresión coinciden. Por tanto.El centro de gravedad es el punto (6. Hemos de encontrar la recta que “mejor se ajuste” a la nube. pero aquí termina la coincidencia: puede ser que la recta de regresión tenga pendiente alta y. sumen lo menos posible: mínimo. Es una correlación muy alta. Método de los mínimos cuadrados Partimos de la nube de puntos . Observamos que este punto no tiene por que ser de le distribución. sin embargo . De ese modo se llega (utilizando métodos matemáticos superiores a este curso) a lo siguiente:   La recta buscada pasa por el centro de gravedad de la distribución.5). . ¿Qué criterio seguimos para ese “mejor ajuste”? Consideramos todas las posibles rectas y =A+Bx y nos quedaremos con aquella para la cual los cuadrados de las distancias.

Sign up to vote on this title
UsefulNot useful