P. 1
Descripción De Datos Bivariados

Descripción De Datos Bivariados

|Views: 9.049|Likes:
Publicado porAxl Dn Lara

More info:

Published by: Axl Dn Lara on Mar 28, 2012
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOCX, PDF, TXT or read online from Scribd
See more
See less

07/16/2013

pdf

text

original

Descripción De Datos Bivariados

Descripción De Datos Bivariados
P2(7) Cuando se miden dos variables en una sola unidad experimental; los datos resultantes se llaman Datos Bivariados. Los métodos para graficar datos bivariados, si las variables son cualitativas o cuantitativas, permiten estudiar las dos variables.

GRÁFICAS PARA VARIABLES CUALITATIVAS

P3(8) Cuando por lo menos una de las dos variables es cualitativa puede usar gráficas de sectores o de pastel simples.

Ejemplo 3.1 ¿Los profesores de universidades privadas reciben mejor remuneración que los profesores de universidades públicas? Los datos de la tabla 3.1 se tomaron de un muestra de 400 profesores cuya categoría, tipo de universidad y salario se registraron. El número de da cada celda es el salario promedio (en miles de dólares) para los profesores que caen en esa categoría. Use una gráfica para contestar la pregunta planteada para esta muestra.

Tabla 3.1 Salarios de profesores por categoría y tipo de universidad

Profesor de Tiempo completo

Profesor asociado

Profesor asistente

Pública Privada

55.8 61.6

42.2 43.3

35.2 35.5

Solución – Para mostrar los salarios promedio de estos 400 profesores, ósea un grafica de barras lado con lado, como se ilustra en la figura 3.1.La altura de las barras es el salario promedio, donde cada par de barras a lo largo del eje horizontal representa una categoría académica diferente. Los salarios son mucho mayores para los profesores de tiempo completo de universidades privadas, pero hay muy poca diferencia en las dos categorías inferiores.

DIAGRAMAS DE DISPERSIÓN PARA DOS VARIABLES CUANTITATIVAS

P7(7) Cuando dos variables en una grafica son cuantitativas una se llama x y la otra y. Cada para de valores de...

EE. cada uno con el valor de una variable que determina la posición en el eje horizontal y el valor de la otra variable determinado por la posición en el eje vertical. muy utilizada en las fases de Comprobación de teorías e identificación de causas raíz y en el Diseño de soluciones y mantenimiento de los resultados obtenidos.1 Un diagrama de dispersión se llama también gráfico de dispersión. Los datos se muestran como un conjunto de puntos. Si existe un parámetro que se incrementa o disminuye de forma . Wyoming.UU. y que es más fácil ver la relación en un diagrama de dispersión que en una simple tabla de números Diagrama de dispersión De Wikipedia. búsqueda El tiempo de espera entre las erupciones y la duración de la erupción del géiser Old Faithful en el Parque Nacional Yellowstone. [editar] Descripción Un diagrama de dispersión se emplea cuando existe una variable que está bajo el control del experimentador. la enciclopedia libre Saltar a: navegación. Este gráfico sugiere que por lo general hay dos "tipos" de erupciones: uno de corta espera y corta duración y otro de larga espera y larga duración. Un diagrama de dispersión es un tipo de diagrama matemático que utiliza las coordenadas cartesianas para mostrar los valores de dos variables para un conjunto de datos. que las relaciones de causa-efecto casi siempre muestran variaciones.Un diagrama de dispersión es una representación gráfica de la relación entre dos variables. Tres conceptos especialmente destacables son que el descubrimiento de las verdaderas relaciones de causaefecto es la clave de la resolución eficaz de un problema.

el diagrama de Pareto. negativa (descenso). El diagrama de dispersión es una de las herramientas básicas de control de calidad. la enciclopedia libre Saltar a: navegación. la hoja de verificación. sin embargo. el procedimiento de ajuste es conocido como regresión lineal y garantiza una solución correcta en un tiempo finito. Un diagrama de dispersión puede sugerir varios tipos de correlaciones entre las variables con un intervalo de confianza determinado. estas relaciones son visualmente evidentes como patrones superpuestos. se le denomina parámetro de control o variable independiente = eje de x y habitualmente se representa a lo largo del eje horizontal. el diagrama de Ishikawa y el ((diagrama de flujo)). . Covarianza De Wikipedia. La variable medida o dependiente = eje de y usualmente se representa a lo largo del eje vertical. o nula (las variables no están correlacionadas). Además. Si no existe una variable dependiente. cualquier variable se puede representar en cada eje y el diagrama de dispersión mostrará el grado de correlación (no causalidad) entre las dos variables. Para una correlación lineal. es su capacidad para mostrar las relaciones no lineales entre las variables. Uno de los aspectos más poderosos de un gráfico de dispersión. Una ecuación para la correlación entre las variables puede ser determinada por procedimientos de ajuste. búsqueda En estadística la covarianza es una medida de dispersión conjunta de dos variables estadísticas. los gráficos de control. La correlación puede ser positiva (aumento). que incluyen además el histograma.sistemática por el experimentador. si los datos son representados por un modelo de mezcla de relaciones simples. Se puede dibujar una línea de ajuste (llamada también "línea de tendencia") con el fin de estudiar la correlación entre las variables.

Si Sxy < 0 hay dependencia inversa o negativa. Si Sxy = 0 Una covarianza 0 se interpreta como la no existencia de una relación lineal entre las dos variables estudiadas. es decir. c. W. se cumple que: . a grandes valores de x corresponden pequeños valores de y. d son constantes ("constante" en este contexto significa no aleatorio).Contenido        1 Definición 2 Interpretación de la covarianza 3 Propiedades 4 No correlación e independencia 5 Relación con el producto escalar 6 Enlaces Externos 7 Véase también [editar] Definición La covarianza SXY (a veces también denotada Cov(X. b. e . Y. Cuando las variables aleatorias X e Y son n-dimensionales.Y) ) de dos variables aleatorias X e Y es: donde es el operador esperanza. su matriz de covarianzas ΣXY es: [editar] Interpretación de la covarianza    Si Sxy > 0 hay dependencia directa (positiva). y V son variables aleatorias y a. Para distribuciones discretas la fórmula anterior se concreta en . [editar] Propiedades Si X. es decir. a grandes valores de x corresponden grandes valores de y. es decir.

U) = a Cov(X. Cov(aX + bY. fórmula que suele emplearse en la práctica para calcular la covarianza. Es un operador positivo definido: Var(X) = Cov(X. Ejemplo. Bajo algunas hipótesis adicionales. X) ≥ 0. generalmente no es cierto: algunos pares de variables aleatorias tienen covarianza cero pese a que no son independientes. la varianza de X . Simetría: Cov(X. X) 3. la covarianza es un producto interior sobre el espacio cociente de las variables aleatorias de momentos finitos iguales salvo constante. [editar] Relación con el producto escalar La mayoría de las propiedades de la covarianza se deducen de las del producto escalar: 1. [editar] Enlaces Externos  Simulación de la covarianza de una variable bidimensional continua [1] y discreta [2] con R (lenguaje de programación) . además. Lo opuesto. Y) = Cov(Y. sin embargo. entonces podemos decir que la variable Y se mueve positivamente el doble de lo que se movería la variable X. y las variables aleatorias X. U) 2. si Cov(X. que tanto se mueve una cuando la otra se mueve otro tanto. Y. supongamos que la variable Y se mueve 2. X) = 0 entonces X es una variable aleatoria constante. Estas propiedades se deducen de manera casi directa de la definición de la covarianza.       . si la variable X se mueve 1. y U. Bilinealidad: para las constantes a y b. [editar] No correlación e independencia Si X e Y son independientes. En otras palabras la covarianza trata de explicar que tan relacionadas se encuentran dos variables entre sí. entonces su covarianza es cero. U) + b Cov(Y. De hecho. como por ejemplo en el caso de la distribución normal multivariante. la covarianza de valor cero implica independencia. Esto ocurre por la propiedad de independencia.

pero solo a grandes rasgos. . 10 balones cada vez. Distribuciones condicionadas: covarianza Es una medida de la intensidad de cierta asociación estadística entre dos variables. Alumno Filosofía a b c d e f g h i j k 2 5 2 7 5 4 6 6 7 5 5 l 9 Matemáticas 2 3 4 4 5 6 6 7 7 8 10 10 Tanto si nos fijamos en la tabla de datos como en la nube de puntos. encesta más cuanto más cerca está. Y viceversa.[editar] Véase también            Regresión lineal Correlación ANOVA Varianza DISTRIBUCIONES BIDIMENSIONALES Las frecuencias se representarán por Fij y fij Recibe el nombre de distribución marginal de X la distribución que tiene la variable X ignorando la variable Y. Distancia(m) 1 2 3 4 5 6 7 8 Encestes 9 10 6 4 2 0 1 0 En este caso hay correlación fuerte y negativa. grosso modo. apreciamos que también hay correlación entre estas dos variables. desde distintas distancias. Relacionemos ahora las notas de Matemáticas de los mismos alumnos con las de otra asignatura. que se lee: La covarianza es igual al promedio de los productos cruzados menos el producto de las medias NUBES DE PUNTOS. Si tomamos esos dos valores como las coordenadas de un punto. CORRELACIÓN Éstas son las notas de 12 estudiantes en Matemáticas y en Física: Alumno Matemáticas a 2 b 3 c 4 Física d 4 e 5 f 6 1 g 6 3 h 7 2 i 7 4 j 8 4 k 10 4 l 10 6 4 6 7 9 10 Es una distribución bidimensional porque a cada individuo le corresponden los valores de dos variables. pero es más débil que la anterior. más fuerte es la correlación. pues al aumentar una variable tiende a disminuir la otra. Se dice que existe correlación entre esas dos variables. Lógicamente. la distribución puede ser representada mediante 12 puntos: nube de puntos. La tendencia a variar conjuntamente las dos variables en una distribución bidimensional se marca mediante la recta de regresión. Una jugadora de baloncesto lanza a canasta. Se aprecia una relación entre las dos variables: a mejor nota en Matemáticas mejor nota en Física. Cuanto más próximos estén los puntos a la recta. Filosofía. También se puede expresar como .

MEDIDA DE LA CORRELACIÓN Hemos visto que la correlación entre dos variables (más o menos fuerte. Centro de gravedad de una distribución bidimensional MEDIA DE LA VARIABLE MEDIA DE LA VARIABLE El punto se llama centro de gravedad de la distribución. El valor de r está comprendido entre -1 y 1. y. Para ello. calcular la correlación entre las variables nota en Matemáticas. Si la correlación es fuerte. si se realiza un cambio de unidades. Covarianza Correlación El coeficiente de correlación. Por tanto. Vamos a confeccionar una fórmula que sirva para obtener su valor de forma numérica e inequívoca. EJERCICIOS RESUELTOS 2 3 4 4 5 6 6 7 7 8 10 10 72 1 3 2 4 4 4 6 4 6 7 9 4 9 16 16 25 36 36 49 49 64 100 1 9 4 16 16 16 36 16 36 49 81 2 9 8 16 20 24 36 28 42 56 90 100 431 10 100 100 60 504 380 Utilizando la fórmula anterior. Es decir. el valor de r no varía. Si la correlación es débil. positiva o negativa) se aprecia mediante el grado de “apertura” de los puntos de la nube.    Si la correlación es perfecta (puntos de la nube alineados). | r | es próximo a 1. r = 1 ó r = -1. | r | es próximo a 0. no depende de las unidades en las que se expresan los valores de las dos variables. nota en Física. es decir. calcular previamente . x. r. entonces | r | = 1. tiene las siguientes propiedades: No tiene dimensiones.

Por tanto. . ¿Qué criterio seguimos para ese “mejor ajuste”? Consideramos todas las posibles rectas y =A+Bx y nos quedaremos con aquella para la cual los cuadrados de las distancias. sin embargo . pero aquí termina la coincidencia: puede ser que la recta de regresión tenga pendiente alta y. Método de los mínimos cuadrados Partimos de la nube de puntos . Hemos de encontrar la recta que “mejor se ajuste” a la nube.5). sumen lo menos posible: mínimo. De ese modo se llega (utilizando métodos matemáticos superiores a este curso) a lo siguiente:   La recta buscada pasa por el centro de gravedad de la distribución. Su pendiente es El signo del coeficiente de correlación y el del coeficiente de regresión coinciden.El centro de gravedad es el punto (6. Observamos que este punto no tiene por que ser de le distribución. Es una correlación muy alta.

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->