Está en la página 1de 4

DIAGRAMAS DE DISPERSIN

El diagrama de dispersin es una tcnica estadstica utilizada para estudiar la relacin entre dos
variables. Por ejemplo, entre una caracterstica de calidad y un factor que le afecta.
La ventaja de utilizar este tipo de diagramas es que al hacerlo se tiene una comprensin ms
profunda del problema planteado.

La relacin entre dos variables se representa mediante una grfica de dos dimensiones en la que
cada relacin est dada por un par de puntos (uno para cada variable).
La variable del eje horizontal x normalmente es la variable causa, y la variable del eje vertical y es
la variable efecto.

La relacin entre dos variables puede ser: positiva o negativa. Si es positiva, significa que un
aumento en la variable causa x provocar una aumento en la variable efecto y y si es negativa
significa que una disminucin en la variable x provocar una disminucin en la variable y.

Por otro lado se puede observar que los puntos en un diagrama de dispersin pueden estar muy
cerca de la lnea recta que los atraviesa, o muy dispersos o alejados con respecto a la misma. El
ndice que se utiliza para medir ese grado de cercana de los puntos con respecto a la lnea recta
es la correlacin. En total existen cinco grados de correlacin: positiva evidente, positiva, negativa
evidente, negativa y , nula.
Accidentes laborales





Correlacin



positiva,






posible



Numero de rdenes urgentes

Pgina 1
Tipos de correlacin

Correlacin Positiva Correlacin Negativa


25
Evidente 25
Evidente
20 20

15 15

10
Y

Y
10
5
5
0
0 5 10 15 20 25 Sin Correlacin 0
0 5 10 15 20 25
X 25 X
20

15

Correlacin 10
Y

5
Correlacin
25
Positiva 0 Negativa
0 5 10 15 20 25 25
20
X 20
15
15
Y

10

Y
10
5
5
0
0 5 10 15 20 25 0
0 5 10 15 20 25
X
X

Pgina 2
Si todos los puntos estuvieran completamente sobre la recta la ecuacin lineal sera
y = a + bx. Como la correlacin no siempre es perfecta, se calculan a y b de tal forma que se
minimice la distancia total entre puntos y la recta. Los clculos son:

a
y x x xy 2

n x x 2 2

n xy x y
b
n x 2 x
2

El ndice de correlacin (r) se puede calcular estadsticamente mediante las ecuaciones que a
continuacin se presentan

SCxy
r
SCx SCy

SCxy xy
x y
n

SCx x 2

x 2

SCy y 2

y 2

n
Donde:
r = Coeficiente de correlacin lineal
SCxy = Suma de cuadrados de xy
SCx = Suma de cuadrados de x
SCy = Suma de cuadrados de y
x 2

Sumatoria de los valores de la variable x al cuadrado
y 2

Sumatoria de los valores de la variable y al cuadrado
xy
Sumatoria del producto de xy
x 2

Cuadrado de la sumatoria de la variable x
y 2

Cuadrado de la sumatoria de la variable y
n = nmero de pares ordenados (pares de datos x, y)

Pgina 3
El factor de correlacin es un nmero entre 1 (correlacin negativa evidente) y +1 (correlacin
positiva evidente), y r = 0 indicara correlacin nula.
La correlacin se utiliza para cuantificar el grado en que una variable provoca el comportamiento
de otra. Por ejemplo si se encuentra que la variable temperatura tiene una correlacin positiva con
el porcentaje de artculos defectuosos, se deben buscar soluciones al problema de los artculos

Pgina 4

También podría gustarte