Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Actividades
DIAGRAMA DE DISPERSIN
Dadas dos variables numricas X y Y, medidas usualmente sobre el mismo elemento de la
muestra de una poblacin o proceso, el diagrama de dispersin es una grfica del tipo X-Y,
donde cada elemento de la muestra es representado mediante un par de valores (x i, yj) y el
punto correspondiente en el plano cartesiano X-Y.
El objetivo de la grfica es analizar la forma en que dos variables se relacionan. Por ejemplo
estudiar en un grupo de estudiantes, la relacin entre su estatura (X) y su peso (Y): o poda ser
de inters investigar la relacin entre la variable de entrada (X) en un proceso con el valor de
alguna caracterstica de calidad de (Y) de un producto final. Al graficar todos los puntos, es
decir, todas las parejas de valores (xi ,yj), si se observa que los puntos siguen algn patrn
definido, esto ser evidencia de una posible relacin entre las dos variables.
Interpretacin de un diagrama de dispersin.
En las siguientes figuras se muestran los patrones ms comunes que se puede seguir un
conjunto de puntos en un diagrama de dispersin.
La primer figura (arriba a la izquierda), corresponde a una correlacin positiva, en la que cuando
X crece tambin lo hace Y, en forma lineal y proporcional; por lo tanto, se habla de una de una
correlacin lineal positiva. En la siguiente figura (arriba a la derecha), se observa el fenmeno
contrario es decir mientras X crece, Y decrece, pero tambin de una forma lineal y proporcional,
en esta caso se tiene una correlacin lineal negativa
Sin embargo en figura de abajo a la izquierda se observa que los puntos estn dispersos dentro
de una banda horizontal sin orden aparente, lo cual sugiere una no correlacin entre las dos
variables.
Actividades
en forma de parbola, de tal manera que conforme X crece, Y tambin lo hace hasta cierto
punto y despus empieza a disminuir. Tambin pueden darse puntos asilados que salen del
patrn general del resto de los puntos, en ese caso es necesario investigar a qu se debe.
Acerca de la posible relacin causa-efecto, es preciso tener en cuenta que cuando dos
variables estn relacionadas, no necesariamente implica que una causa a la otra. Lo nico que
indica el diagrama de dispersin es que tipo de relacin existe. Para verificar si efectivamente X
influye sobre Y se debe recurrir tanto al conocimiento del proceso como a la comprobacin. De
cualquier forma, quien interprete el diagrama de dispersin debe tomar en cuenta que algunas
de las razones por las que las variables X y Y aparecen relacionadas de manera significativa
son:
Y influye sobre X.
X y Y interactan entre s.
Actividades
repetidos (con los mismos valores en ambos ejes), en el momento de estar graficando se
detectar un punto que ya est graficado, y entonces se traza un crculo sobre el punto para
indicar que se est repitiendo una vez. Si se vuelve a repetir, se traza otro crculo
concntrico y as sucesivamente.
5. Documentar el diagrama. Registrar en el diagrama toda la informacin posible que sea de
utilidad para identificarlos, como ttulos, periodo que cubre los datos, unidades de cada eje,
rea o departamento y persona responsable de colectar los datos.
6. Interpretacin. Con el apoyo de las directrices indicadas anteriormente interpreta el
comportamiento de las variables, siempre apoyado con el clculo del coeficiente de
correlacin.
Coeficiente de correlacin.
El coeficiente de correlacin lineal mide el grado de intensidad de esta posible relacin entre
las variables. Este coeficiente se aplica cuando la relacin que puede existir entre las variables
es lineal (es decir, si representramos en un grfico los pares de valores de las dos variables la
nube de puntos se aproximara a una recta).
Para ver, si se puede utilizar el coeficiente de correlacin lineal, lo mejor es representar los
pares de valores en un grfico y observar que forma describe.
El coeficiente de correlacin lineal se calcula aplicando la siguiente frmula:
Los valores que puede tomar el coeficiente de correlacin "r" son: -1 < r < 1
Si "r" > 0, la correlacin lineal es positiva (si sube el valor de una variable sube el de la otra). La
correlacin es tanto ms fuerte cuanto ms se aproxime a 1.
Si "r" < 0, la correlacin lineal es negativa (si sube el valor de una variable disminuye el de la
otra). La correlacin negativa es tanto ms fuerte cuanto ms se aproxime a -1.
Si "r" se encuentra entre (-0.85 y 0.85), Se dice que la correlacin es fuerte
Si "r" se encuentra entre (-0.50 y 0.50), Se dice que la correlacin es moderada
Si "r" se encuentra entre (-0.30 y 0.30), Se dice que la correlacin es dbil.
Si "r" = 0, no existe correlacin lineal entre las variables. Aunque podra existir otro tipo de
correlacin (parablica, exponencial, etc.).
Actividades
Ejemplo:
En una fbrica de pintura se desea investigar la relacin que existe entre la velocidad de
agitacin en el proceso de mezclado y el porcentaje de impurezas en la pintura. Mediante
pruebas experimentales se obtiene datos, que se muestran en la siguiente tabla. Elaborar el
diagrama de dispersin y calcular el coeficiente de correlacin para visualizar el tipo de relacin
y su intensidad.
Velocidad (rpm)
Impurezas (%)
20
8.4
22
9.5
24
11.8
26
10.4
28
13.3
30
14.8
32
13.2
34
14.7
36
16.4
38
16.5
40
18.9
Actividades
18.5
Grafica de dispersin.
20
18
16
14
%
12
Impurezas
10
8
6
18
23
28
33
38
43
48
Velocid
ad
Interpretacin. Se observa que a medida que la velocidad crece, tambin las impurezas lo
hacen lo que significa que existe una correlacin positiva. Ahora bien al calcular el coeficiente
de correlacin, tiene un valor de 0.96, por lo tanto la relacin entre ambas variables es fuerte.
Extrado de:
Gutirrez P. Humberto. De la Vara S. Romn. Control estadstico de la calidad y seis sigma
(2013), Mc Graw Hill, Mxico
Recuperado de:
Aula fcil.com, curso de estadstica, leccin 12, http://www.aulafacil.com/CursoEstadistica/Lecc12-est.htm, recuperado el 28 de mayo del 2014
Actividades