Documentos de Académico
Documentos de Profesional
Documentos de Cultura
GEOLÓGICA, DE
MINAS Y METALÚRGICA”
ESCUELA PROFESIONAL DE INGENIERIA
METALÚRGICA
CONTROL Y CALIDAD DE PROCESOS
DIAGRAMA DE DISPERSION
2019-I
INTRODUCCION
La importancia del uso de gráficos en el análisis estadístico radica en que algunas veces
un conjunto de datos puede ser analizado de manera adecuada por métodos gráficos;
otras veces, unas adecuadas técnicas gráficas facilitan significativamente el análisis
numérico. Las representaciones gráficas tienen un triple objetivo: registrar y almacenar
datos de manera compacta, facilitar la comunicación de información, o bien, analizar el
conjunto de datos que representan para obtener conocimiento de su estructura
(Chambers y cols., 1983). El diagrama de dispersión es la herramienta gráfica más
usada, sencilla y potente para analizar la relación que puede existir entre dos variables.
En consecuencia, el interés desde el punto de vista didáctico es bien patente, ya que los
resúmenes numéricos de los datos no son suficientes para captar todas las características
de la relación existente entre las variables. Ahora bien, la interpretación de los
diagramas de dispersión no es tarea fácil, pues aunque solamente un diagrama de
dispersión nos da una visión completa de la naturaleza de la relación existente entre las
variables, también es verdad que una enorme diversidad de estos gráficos, con
diferentes configuraciones de la nube de puntos, tiene el mismo coeficiente de
correlación (Chambers y cols., 1983).
En este caso se dice que las variables son incorreladas y la nube de puntos tiene
una forma redondeada.
La correlación será fuerte cuanto más cerca estén los puntos de la recta.
1.1.5. Correlación Débil
La correlación será débil cuanto más separados estén los puntos de la recta.
2. ECUACIÓN DE LA RECTA
3. REGRESIÓN LINEAL
3.1. Concepto
n ( ∑ XY ) −( ∑ X)( ∑ Y ) ∑ Y −b ∑ X
b= 2 ; a=
n ( ∑ X 2 )−( ∑ X ) n n
636 4900
a= −0.05143 =48.0
8 8
Entonces:
Y'=48.0+0.05143X
∑ X i Y i ∑ (X i− X́ )(Y i−Ý )
Q xy = i=1
^ = i=1
n−1 n−1
X 4 5 6 7 8 9 10 11
Y 1.4 1.3 1.4 1.5 1.5 1.6 1.6 1.7
n n
∑ xi
60 ; ∑ y i 12
i=1
x́= = =75 ý= i=1 = =1,5
n 8 n 8
n
n
∑ x i y i=92,1 ; Q ∑ xi y i
i=1 xy = i=1 −x́∗ý=0,26
n
6. COEFICIENTE DE DETERMINACIÓN
scE i=1
∑ ( ^y i− ý )2 scR n−2 s^ R
2
2 2
R= = (6.15) o bien R =1− =1−
scG n 2 scG n−1 s^ 2Y
∑ ( y 1− ý )
i=1
2 s 2XY
R= ( 6.16 )
s2X s2Y
Dadas dos variables aleatorias cualesquiera X e Y, una medida de la relación
lineal que hay entre ambas variables es el coeficiente de correlación definido por:
Cov ( X ,Y )
ρ= (6.17)
σ ( X )σ (Y )
donde σ(X) representa la desviación típica de la variable X (análogamente para
σ(Y)). Un buen estimador de este parámetro es el coeficiente de correlación lineal
muestral (o coeficiente de correlación de Pearson), definido por:
s XY 2
r= =signo ( α^ 1 ) √ R ∗( 6.18)
sX sY
Por tanto, r ϵ [-1,1]. Este coeficiente es una buena medida de la bondad del ajuste de
la recta de regresión. Evidentemente, existe una estrecha relación entre r y α^ 1 aunque
estos estimadores proporcionan diferentes interpretaciones del modelo:
r es una medida de la relación lineal entre las variables X e Y.
α^ 1 mide el cambio producido en la variable Y al realizarse un cambio de una
unidad en la variable X.
De las definiciones anteriores se deduce que:
s XY =0 ⇔ α^ 1=0 ⇔ r=0
Si r es significativo (distinto de cero) ya que ello implica que el modelo de
regresión lineal es significativo. Desafortunadamente la distribución de r es complicada
pero para tamaños muestrales mayores que 30 su desviación típica es σ (r) ≃ 1/ √ n, y
puede utilizarse la siguiente regla:
2
|r|> ⟹res significativo(con α =0 05)
√n
En la interpretación del coeficiente de correlación se debe tener en cuenta que:
r=±1 indica una relación lineal exacta positiva (creciente) o negativa
(decreciente).
r=0 indica la no existencia de relación lineal estocástica, pero no indica
independencia de las variables ya que puede existir una relación no lineal incluso
exacta.
Valores intermedios de r (0 < r < 1 ó -1 < r < 0) indican la existencia de una
relación lineal estocástica, más fuerte cuanto más próximo a +1 (ó -1) sea el valor de r.
7.1 Usos
Relaciones causa-efecto
Relaciones entre dos efectos
Posibilidad de utilizar un efecto como sustituto de otro
Relaciones entre dos posibles causas
El diagrama de dispersión descubre relaciones en los datos. “Relación” significa que
existe alguna asociación estructurada (lineal, cuadrática, etc.) entre las dos variables.
Notemos, sin embargo, que, aunque
Los diagramas de dispersión son una herramienta de diagnóstico útil para determinar
asociaciones, pero si tal asociación existe, el gráfico puede o no sugerir una relación de
causa-efecto. Un diagrama de dispersión nunca podrá “demostrar” la causalidad entre
las variables.
Años de experiencia 13 16 30 2 8 31 19 20 1
Salario anual actual 26. 33.2 36. 16.5 26. 36.4 33. 36.5 16.9
(miles de dólares) 1 1 4 8
Años de experiencia 4 27 25 7 15 13 6 10
Salario anual actual 19. 36. 21. 31. 19.
36.5 31.4 24.6
(miles de dólares) 8 0 4 0 1
El eje horizontal estará representado por la variable Años de experiencia (X) y el salario
anual actual por el eje vertical (Y).
36
Salario anual actual
(miles de dólares)
31
26
21
16
0 5 10 15 20 25 30 35
Años de experiencia
Comparando con las gráficas de correlación, que aparecen en el punto 8, podemos ver
una correlación positiva débil.
Por lo que se puede concluir que si existe una relación entre los años de experiencia y
los salarios anuales.
CONCLUSIONES:
BIBLIOGRAFIA: