Diagrama de Dispersion

”FACULTAD DE ING.
GEOLÓGICA, DE
MINAS Y METALÚRGICA”
ESCUELA PROFESIONAL DE INGENIERIA
METALÚRGICA
CONTROL Y CALIDAD DE PROCESOS
DIAGRAMA DE DISPERSION
DOCENTE: CALLA CHOQUE DANDY

ALUMNOS:
 CHALLCO SAYCO YONY 164293
 CHUQUIHUANCA SAICO YHAN CARLOS 171107
 CUSIHUAMAN AUCCACUSI KURMY YALEXANDRA 170509
 LLALLAHUI HUAMANI VICTOR 174979
 LLANQUI CHOCATA ALAIN GILMAR 151424
 RIQUELME VILCA ALEX 171115
 VILLAVICENCIO FARFAN DIEGO ANDREE 174524
 YARIN PILARES SILVIA DAYNE 170516
2019-I
INTRODUCCION
El diagrama de dispersión es la herramienta gráfica más usada, sencilla y potente para

analizar la relación que puede existir entre dos variables. En consecuencia, el interés
desde el punto de vista didáctico es bien patente, ya que los resúmenes numéricos de los
datos no son suficientes para captar todas las características de la relación existente
entre las variables. Ahora bien, la interpretación de los diagramas de dispersión no es
tarea fácil, pues aunque solamente un diagrama de dispersión nos da una visión
completa de la naturaleza de la relación existente entre las variables, también es verdad
que una enorme diversidad de estos gráficos, con diferentes configuraciones de la nube
de puntos, tiene el mismo coeficiente de correlación (Chambers y cols., 1983).
La importancia del uso de gráficos en el análisis estadístico radica en que algunas veces
un conjunto de datos puede ser analizado de manera adecuada por métodos gráficos;
otras veces, unas adecuadas técnicas gráficas facilitan significativamente el análisis
numérico. Las representaciones gráficas tienen un triple objetivo: registrar y almacenar
datos de manera compacta, facilitar la comunicación de información, o bien, analizar el
conjunto de datos que representan para obtener conocimiento de su estructura
(Chambers y cols., 1983). El diagrama de dispersión es la herramienta gráfica más
usada, sencilla y potente para analizar la relación que puede existir entre dos variables.
En consecuencia, el interés desde el punto de vista didáctico es bien patente, ya que los
resúmenes numéricos de los datos no son suficientes para captar todas las características
de la relación existente entre las variables. Ahora bien, la interpretación de los
diagramas de dispersión no es tarea fácil, pues aunque solamente un diagrama de
dispersión nos da una visión completa de la naturaleza de la relación existente entre las
variables, también es verdad que una enorme diversidad de estos gráficos, con
diferentes configuraciones de la nube de puntos, tiene el mismo coeficiente de
correlación (Chambers y cols., 1983).
En la investigación estadística es muy frecuente encontrar variables que están

relacionadas o asociadas entre sí de alguna manera, como se estudió en el capítulo
anterior. Existen muchas variables, en especial cuantitativas, que se relacionan en algún
grado de otras, entonces es posible que una de las variables pueda expresarse
matemáticamente en función de la otra. Por ejemplo, el peso de las personas está
relacionada con la estatura; el tiempo de servicio de trabajo activo tiene relación con la
edad, un trabajador que ha acumulado por ejemplo30 años de servicio tendrá mayor
edad que otro con sólo 14años de servicios; el ingreso o salario está relacionado
frecuentemente con el nivel educativo; el ahorro familiar tiene relación con los ingresos;
la demanda de un producto dependerá de los precios, etc.
1. DIAGRAMA DE DISPERSIÓN DESDE UNA PERSPECTIVA
MATEMATICA.
1.1. Concepto
Es una representación gráfica de la relación entre dos variables, muy utilizada en

las fases de Comprobación de teorías e identificación de causas raíz y en el Diseño de
soluciones y mantenimiento de los resultados obtenidos. Tres conceptos especialmente
destacables son que el descubrimiento de las verdaderas relaciones de causa-efecto es la
clave de la resolución eficaz de un problema, que las relaciones de causa-efecto casi
siempre muestran variaciones, y que es más fácil ver la relación en un diagrama de
dispersión que en una simple tabla de números.
El análisis de un diagrama de dispersión consta de un proceso de cuatro pasos, se
elabora una teoría razonable, se obtienen los pares de valores y se dibuja el diagrama, se
identifica la pauta de correlación y se estudian las posibles explicaciones. Las pautas de
correlación más comunes son correlación fuerte positiva (Y aumenta claramente con X),
correlación fuerte negativa (Y disminuye claramente con X), correlación débil positiva
(Y aumenta algo con X), correlación débil negativa (Y disminuye algo con X),
correlación compleja (Y parece relacionarse con X pero no de un modo lineal) y
correlación nula (no hay relación entre X e Y). Errores comunes son no saber limitar el
rango de los datos y el campo de operación del proceso, perder la visión gráfica al
sintetizarlo todo en resúmenes numéricos, entre otros.
1.1.1. Correlación Directa
La recta correspondiente a la nube de puntos de la distribución es una recta

creciente.
1.1.2. Correlación Inversa
La recta correspondiente a la nube de puntos de la distribución es una recta

decreciente.
1.1.3. Correlación Nula
En este caso se dice que las variables son incorreladas y la nube de puntos tiene
una forma redondeada.
1.1.4. Correlación Fuerte
La correlación será fuerte cuanto más cerca estén los puntos de la recta.
1.1.5. Correlación Débil
La correlación será débil cuanto más separados estén los puntos de la recta.
 Ejemplo: Este es el diagrama de dispersión que expresa la cantidad de dinero

que se ganó Mateo cada semana trabajando en la tienda de su padre.
Las semanas están diagramadas en el eje x, y la cantidad de dinero que se ganó en

esa semana en el eje y. En general, la variable independiente (la variable que no está
influenciada por nada) está en el eje x y la variable dependiente (la que es modificada
por la variable independiente) está en el eje y.
En este diagrama se puede ver que en la semana 2 Mateo se ganó alrededor de
Bs.125, y en la semana 18 estuvo cerca de los Bs.165. Pero más importante aún es la
tendencia. Con estos datos se puede ver que Mateo gana cada vez más según pasan las
semanas. Quizá su padre le da más horas a la semana o más responsabilidades.
2. ECUACIÓN DE LA RECTA
La ecuación explícita de una recta tiene la forma y=mx+b donde m es la pendiente

de la recta y b el término independiente.
 Ejemplo: Hallar la ecuación de la recta que tiene pendiente m=3 e intercepto

b=10.
Se tiene que hallar la ecuación de la recta, esto es, y=mx+b.

Se usa la información que se tiene:
m=3 y b=10 y se sustituye en la ecuación
y=3x+10.
La ecuación que se pide es y=3x+10.
3. REGRESIÓN LINEAL
3.1. Concepto
Permite determinar el grado de dependencia de las series de valores X e Y,

prediciendo el valor y estimado que se obtendría para un valor x que no esté en la
distribución. El análisis de regresión es una técnica estadística para investigar la
relación funcional entre dos o más variables, ajustando algún modelo matemático. La
regresión lineal simple utiliza una sola variable de regresión y el caso más sencillo es el
modelo de línea recta.
El modelo de regresión lineal es el más utilizado a la hora de predecir los valores

de una variable cuantitativa a partir de los valores de otra variable explicativa también
cuantitativa (modelo de regresión lineal simple). Una generalización de este modelo, el
de regresión lineal múltiple, permite considerar más de una variable explicativa
cuantitativa.
4. ECUACIÓN DE UNA RECTA DE REGRESIÓN LINEAL USANDO LOS
MÍNIMOS CUADRADOS
El objetivo de un análisis de regresión es determinar la relación que existe entre

una variable dependiente y una o más variables independientes. Para poder realizar esta
relación, se debe postular una relación funcional entre las variables. Cuando se trata de
una variable independiente, la forma funcional que más se utiliza en la práctica es la
relación lineal. El análisis de regresión entonces determina la intensidad entre las
variables a través de coeficientes de correlación y determinación.
La ecuación de la regresión lineal es: Y ' =a+ bX , donde:
Y' es el valor pronosticado de la variable Y para un valor seleccionado de X.
a es la ordenada de la intersección con el eje Y cuando X = 0. Es el valor estimado
de Y cuando X=0
b es la pendiente de la recta, o el cambio promedio en Y' para cada cambio de una
unidad en X.
El principio de mínimos cuadrados se utiliza para obtener a y b. Las ecuaciones

para determinar a y b son:
n ( ∑ XY ) −( ∑ X)( ∑ Y ) ∑ Y −b ∑ X
b= 2 ; a=
n ( ∑ X 2 )−( ∑ X ) n n
 Ejemplo: Pedro Pérez, presidente de la sociedad de alumnos de la Universidad

Nacional Experimental de Guayana, se ocupa de estudiar el costo de los libros
de texto. Él cree que hay una relación entre el número de páginas en el texto y el
precio de venta del libro. Para proporcionar una prueba, selecciona una muestra
de ocho libros de texto actualmente en venta en la librería. Desarrolle una
ecuación de regresión para la información dada que se puede utilizar para
estimar el precio de venta basado en el número de páginas.
Libro Paginas Precio (Bs.)

Fundamentos de la Administración 500 84
Álgebra 700 75
Contabilidad de Costos 800 99
Contabilidad Intermedia 600 72
Mercadotecnia 400 69
Metodología de la Investigación 500 81
Finanzas Públicas 600 63
Finanzas Municipales 800 93
Libro Paginas Precio (Bs.)

X Y XY X2 Y2
Fundamentos de la 500 84 42.000 250.000 7.056
Administración
Álgebra 700 75 52.500 490.000 5.625
Contabilidad de Costos 800 99 79.200 640.000 9.801
Contabilidad Intermedia 600 72 43.200 360.000 5.184
Mercadotecnia 400 69 27.600 160.000 4.761
Metodología de la 500 81 40.500 250.000 6.561
Investigación
Finanzas Públicas 600 63 37.800 360.000 3.969
Finanzas Municipales 800 93 74.400 640.000 8.649
TOTAL 4.900 636 397.200 3.150.000 51.606
8 (397200 )−( 4900)(636)
b= =0.05143
8 ( 3150000 )−( 4900)2
636 4900
a= −0.05143 =48.0
8 8
Entonces:
Y'=48.0+0.05143X
Se puede utilizar la ecuación de regresión para estimar valores de Y.
Y ' =48.0+0.05143 X=48.0+0.05143 ( 800 ) =89.14
El precio de venta estimado de un libro de 800 páginas es de Bs.89.14.
5. COVARIANZA Y ESTIMACIÓN DE ERROR

5.1. Covarianza
Es un valor que indica el grado de variación conjunta de dos variables aleatorias.

Es el dato básico para determinar si existe una dependencia entre ambas variables y
además es el dato necesario para estimar otros parámetros básicos, como el coeficiente
de correlación lineal o la recta de regresión.
El signo de la covarianza, por lo tanto, expresa la tendencia en la relación lineal
entre las variables.
La fórmula suele aparecer expresada como:
n n
∑ X i Y i ∑ (X i− X́ )(Y i−Ý )
Q xy = i=1
^ = i=1
n−1 n−1
 Ejemplo: Calcula la covarianza de las variables estadísticas X, Y dadas por la

tabla de valores:
X 4 5 6 7 8 9 10 11
Y 1.4 1.3 1.4 1.5 1.5 1.6 1.6 1.7
Se deben calcular las medias de X y de Y, y calcular los productos Xi·Yi. Los

resultados que se obtienen son:
n n
∑ xi
60 ; ∑ y i 12
i=1
x́= = =75 ý= i=1 = =1,5
n 8 n 8
Una vez calculadas las medias se procede a realizar el cálculo de la varianza:
n
n
∑ x i y i=92,1 ; Q ∑ xi y i
i=1 xy = i=1 −x́∗ý=0,26
n
5.2. Error de Estimación
Es una medida de su precisión que se corresponde con la amplitud del intervalo de

confianza. Cuanta más precisión se desee en la estimación de un parámetro, más
estrecho deberá ser el intervalo de confianza y, si se quiere mantener o disminuir el
error, más observaciones deberán incluirse en la muestra estudiada.
Este error de estimación, cuya unidad de medida es sigma (σ), se basa en el

cálculo de la raíz cuadrada de la varianza:
σ 2x σ x
σ ԑ=
√=
n √n
 Ejemplo: De acuerdo a los datos proporcionados por el Instituto Nacional de

Estadística se tiene una varianza de 0,98 de un total de datos de 1000.
0,98 2 0,98 0,98

σ ԑ=
√ = =
1000 √ 1000 31,62
=0,03
Según los resultados manejados por el INE el error de estimación es de 0,03.
6. COEFICIENTE DE DETERMINACIÓN
Una vez ajustada la recta de regresión a la nube de observaciones es importante

disponer de una medida que mida la bondad del ajuste realizado y que permita decidir si
el ajuste lineal es suficiente o se deben buscar modelos alternativos. Como medida de
bondad del ajuste se utiliza el coeficiente de determinación, definido como sigue:
n
scE i=1
∑ ( ^y i− ý )2 scR n−2 s^ R
2
2 2
R= = (6.15) o bien R =1− =1−
scG n 2 scG n−1 s^ 2Y
∑ ( y 1− ý )
i=1
Como scE < scG, se verifica que 0 < R2 < 1.

El coeficiente de determinación mide la proporción de variabilidad total de la
variable dependiente (Y) respecto a su media que es explicada por el modelo de
regresión. Es usual expresar esta medida en tanto por ciento, multiplicándola por cien.
Por otra parte, teniendo en cuenta que ^y i− ý =^α 1 (x −x́), se obtiene
1
2 s 2XY
R= ( 6.16 )
s2X s2Y
Dadas dos variables aleatorias cualesquiera X e Y, una medida de la relación
lineal que hay entre ambas variables es el coeficiente de correlación definido por:
Cov ( X ,Y )
ρ= (6.17)
σ ( X )σ (Y )
donde σ(X) representa la desviación típica de la variable X (análogamente para
σ(Y)). Un buen estimador de este parámetro es el coeficiente de correlación lineal
muestral (o coeficiente de correlación de Pearson), definido por:
s XY 2
r= =signo ( α^ 1 ) √ R ∗( 6.18)
sX sY
Por tanto, r ϵ [-1,1]. Este coeficiente es una buena medida de la bondad del ajuste de
la recta de regresión. Evidentemente, existe una estrecha relación entre r y α^ 1 aunque
estos estimadores proporcionan diferentes interpretaciones del modelo:
r es una medida de la relación lineal entre las variables X e Y.
α^ 1 mide el cambio producido en la variable Y al realizarse un cambio de una
unidad en la variable X.
De las definiciones anteriores se deduce que:
s XY =0 ⇔ α^ 1=0 ⇔ r=0
Si r es significativo (distinto de cero) ya que ello implica que el modelo de
regresión lineal es significativo. Desafortunadamente la distribución de r es complicada
pero para tamaños muestrales mayores que 30 su desviación típica es σ (r) ≃ 1/ √ n, y
puede utilizarse la siguiente regla:
2
|r|> ⟹res significativo(con α =0 05)
√n
En la interpretación del coeficiente de correlación se debe tener en cuenta que:
r=±1 indica una relación lineal exacta positiva (creciente) o negativa
(decreciente).
r=0 indica la no existencia de relación lineal estocástica, pero no indica
independencia de las variables ya que puede existir una relación no lineal incluso
exacta.
Valores intermedios de r (0 < r < 1 ó -1 < r < 0) indican la existencia de una
relación lineal estocástica, más fuerte cuanto más próximo a +1 (ó -1) sea el valor de r.
7. CONTRUCCION, APLICACIONES Y USOS DEL DIAGRAMA DE

DISPERSION.
7.1 Usos
Los diagramas de dispersión pueden utilizarse para examinar:
 Relaciones causa-efecto
 Relaciones entre dos efectos
 Posibilidad de utilizar un efecto como sustituto de otro
 Relaciones entre dos posibles causas
El diagrama de dispersión descubre relaciones en los datos. “Relación” significa que
existe alguna asociación estructurada (lineal, cuadrática, etc.) entre las dos variables.
Notemos, sin embargo, que, aunque
Causalidad implica asociación

Asociación no implica causalidad.
Los diagramas de dispersión son una herramienta de diagnóstico útil para determinar
asociaciones, pero si tal asociación existe, el gráfico puede o no sugerir una relación de
causa-efecto. Un diagrama de dispersión nunca podrá “demostrar” la causalidad entre
las variables.
7.2 Construcción de un diagrama de dispersión
La construcción de un diagrama de dispersión consta de los siguientes pasos:
1. Colectar al menos 40 puntos de pares de datos; al mencionar pares de datos nos

referimos a las mediciones de ambos, la causa a ser probada y su supuesto efecto
en un punto en el tiempo.
2. Decidir sobre qué eje representará a cada una de las variables. Si se está
estudiando una posible relación causa-efecto, el eje horizontal representará la
supuesta causa.
3. Dibujar y rotular los ejes horizontal y vertical.
4. Determinar los valores máximos y mínimos de cada variable y numerar los ejes
de acuerdo a lo anterior.
5. Graficar los puntos de pares de datos en el diagrama. Si existen múltiples pares
con el mismo valor, se dibuja tantos círculos concéntricos al punto como pares
de datos adicionales con los mismos valores.
6. Rotular el gráfico. Se rotula el título del gráfico y toda aquella información
necesaria para su correcta comprensión. En general, es conveniente incluir una
descripción adicional del objeto de las medidas y de las condiciones en que se
han realizado, ya que esta información puede ayudar en la interpretación del
diagrama.
7. Identificar y clasificar el patrón de asociación (correlación) utilizando las
gráficas de debajo de algunas posibles formas e interpretaciones.
7.3 APLICACIONES Y EJEMPLOS:
Correlación positiva perfecta Correlación positiva fuerte

EJEMPLO:
Correlación negativa fuerte Correlación negativa débil

Se llevó a cabo un estudio para determinar la relación entre el número de años de
experiencia y el salario anual para una profesión en particular en una región geográfica
dada. Se seleccionó una muestra aleatoria de 17 personas, las cuales ejercen esta
profesión y se obtuvo la siguiente información:
Años de experiencia 13 16 30 2 8 31 19 20 1
Salario anual actual 26. 33.2 36. 16.5 26. 36.4 33. 36.5 16.9
(miles de dólares) 1 1 4 8
Años de experiencia 4 27 25 7 15 13 6 10
Salario anual actual 19. 36. 21. 31. 19.
36.5 31.4 24.6
(miles de dólares) 8 0 4 0 1
¿Existe alguna relación entre la experiencia laboral y el salario anual?
El eje horizontal estará representado por la variable Años de experiencia (X) y el salario
anual actual por el eje vertical (Y).
El valor mínimo y máximo de X es 1 y 31, respectivamente. Mientras que para Y su

valor mínimo y máximo son 16.5 y 36.5, respectivamente. Con lo anterior podemos
construir el siguiente diagrama de dispersión.
41
36
Salario anual actual
(miles de dólares)
31
26
21
16
0 5 10 15 20 25 30 35
Años de experiencia
Comparando con las gráficas de correlación, que aparecen en el punto 8, podemos ver
una correlación positiva débil.
Por lo que se puede concluir que si existe una relación entre los años de experiencia y
los salarios anuales.
CONCLUSIONES:
BIBLIOGRAFIA:
-Jarrell, Stephen B. (1994). Basic Statistics (Special pre-publication edition). Dubuque,

Iowa: Wm. C. Brown Pub. p. 492. «Cuando buscamos una relación entre dos variables,
un gráfico estándar de los pares de datos disponibles (X, Y), llamado "diagrama de
dispersión"...»
-Betancourt, D. F. (26 de julio de 2016). Cómo hacer un diagrama de dispersión:

Ejemplo en calidad. Recuperado el 31 de julio de 2019, de Ingenio Empresa:
www.ingenioempresa.com/diagrama-de-dispersion.
-BATANERO, C., ESTEPA, A. y GODINO, J.D. (1997). Students’ understanding of

Statistical association in a computer environments, en Garfield, J. y Burrill, G. (eds.).
Research on the Role of Technology in Teaching and Learning Statistics. International
Statistical Institute, pp. 191-205. Voorburg (Holanda): International Statistical Institute.
-CHAMBERS, J.M., CLEVELAND, W.S., KLEINER, B. y TUKEY, P.A. (1983).

Graphical Methods for Data Analysis. Nueva Jersey: Bell Telephone Laboratories
Incorporated.

Diagrama de Dispersion

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Diagrama de Dispersion

Cargado por

Copyright:

Formatos disponibles

”FACULTAD DE ING.

DOCENTE: CALLA CHOQUE DANDY

El diagrama de dispersión es la herramienta gráfica más usada, sencilla y potente para

En la investigación estadística es muy frecuente encontrar variables que están

Es una representación gráfica de la relación entre dos variables, muy utilizada en

1.1.1. Correlación Directa

La recta correspondiente a la nube de puntos de la distribución es una recta

La recta correspondiente a la nube de puntos de la distribución es una recta

1.1.3. Correlación Nula

1.1.4. Correlación Fuerte

 Ejemplo: Este es el diagrama de dispersión que expresa la cantidad de dinero

Las semanas están diagramadas en el eje x, y la cantidad de dinero que se ganó en

La ecuación explícita de una recta tiene la forma y=mx+b donde m es la pendiente

 Ejemplo: Hallar la ecuación de la recta que tiene pendiente m=3 e intercepto

Se tiene que hallar la ecuación de la recta, esto es, y=mx+b.

Permite determinar el grado de dependencia de las series de valores X e Y,

El modelo de regresión lineal es el más utilizado a la hora de predecir los valores

El objetivo de un análisis de regresión es determinar la relación que existe entre

El principio de mínimos cuadrados se utiliza para obtener a y b. Las ecuaciones

 Ejemplo: Pedro Pérez, presidente de la sociedad de alumnos de la Universidad

Libro Paginas Precio (Bs.)

Libro Paginas Precio (Bs.)

Se puede utilizar la ecuación de regresión para estimar valores de Y.

Y ' =48.0+0.05143 X=48.0+0.05143 ( 800 ) =89.14

El precio de venta estimado de un libro de 800 páginas es de Bs.89.14.

5. COVARIANZA Y ESTIMACIÓN DE ERROR

Es un valor que indica el grado de variación conjunta de dos variables aleatorias.

 Ejemplo: Calcula la covarianza de las variables estadísticas X, Y dadas por la

Se deben calcular las medias de X y de Y, y calcular los productos Xi·Yi. Los

Una vez calculadas las medias se procede a realizar el cálculo de la varianza:

5.2. Error de Estimación

Es una medida de su precisión que se corresponde con la amplitud del intervalo de

Este error de estimación, cuya unidad de medida es sigma (σ), se basa en el

 Ejemplo: De acuerdo a los datos proporcionados por el Instituto Nacional de

0,98 2 0,98 0,98

Según los resultados manejados por el INE el error de estimación es de 0,03.

Una vez ajustada la recta de regresión a la nube de observaciones es importante

Como scE < scG, se verifica que 0 < R2 < 1.

7. CONTRUCCION, APLICACIONES Y USOS DEL DIAGRAMA DE

Los diagramas de dispersión pueden utilizarse para examinar:

Causalidad implica asociación

7.2 Construcción de un diagrama de dispersión

La construcción de un diagrama de dispersión consta de los siguientes pasos:

1. Colectar al menos 40 puntos de pares de datos; al mencionar pares de datos nos

7.3 APLICACIONES Y EJEMPLOS:

Correlación positiva perfecta Correlación positiva fuerte

Correlación negativa fuerte Correlación negativa débil

¿Existe alguna relación entre la experiencia laboral y el salario anual?

El valor mínimo y máximo de X es 1 y 31, respectivamente. Mientras que para Y su

-Jarrell, Stephen B. (1994). Basic Statistics (Special pre-publication edition). Dubuque,

-Betancourt, D. F. (26 de julio de 2016). Cómo hacer un diagrama de dispersión:

-BATANERO, C., ESTEPA, A. y GODINO, J.D. (1997). Students’ understanding of

-CHAMBERS, J.M., CLEVELAND, W.S., KLEINER, B. y TUKEY, P.A. (1983).

También podría gustarte