Está en la página 1de 6

Diagrama de Pareto

¿Qué es el principio de Pareto y quién es Pareto?


El principio de Pareto es también conocido como la regla del 80-20, distribución
A-B-C, ley de los pocos vitales o principio de escasez del factor.
Recibe uno de sus nombres en honor a Vilfredo Pareto, quien lo enunció por
primera vez, basándose en el denominado conocimiento empírico. Estudió que la
gente en su sociedad se dividía naturalmente entre los «pocos de muchos» y los
«muchos de poco»; se establecían así dos grupos de proporciones 80-20 tales
que el grupo minoritario, formado por un 20 % de población, ostentaba el 80 % de
algo y el grupo mayoritario, formado por un 80 % de población, el 20 % de ese
mismo algo.
En concreto, Pareto estudió la propiedad de la tierra en Italia y lo que descubrió
fue que el 20 % de los propietarios poseían el 80 % de las tierras, mientras que el
restante 20 % de los terrenos pertenecía al 80 % de la población restante.
¿Cuándo utilizar un diagrama de Pareto?
 Para analizar los datos sobre la frecuencia de problemas o de causas en un
proceso.
 Cuando son muchos problemas o causas y se desea centrarse en los más
importantes.
 Cuando se desea analizar las causas de un problema enfocándose en sus
componentes específicos.
 Para comunicarse con otros a través de datos (de manera visual).
¿Cómo se hace un diagrama de Pareto?
a) Seleccionar los aspectos que se van a analizar. ¿Cuál es el problema y las
causas que se van a tratar?
b) Seleccionar la unidad de medida para el análisis: la cantidad de ocurrencias, los
costos u otra medida de influencia.
c) Seleccionar el período de tiempo para el análisis de los datos, por ejemplo: un
ciclo de trabajo, un día completo, una semana, etc.
d) Relacionar los aspectos de izquierda a derecha en el eje horizontal en el orden
de magnitud decreciente de la unidad de medida. Las categorías que contienen la
menor cantidad de aspectos pueden combinarse en «otra» categoría, la cual se
debe colocar en la extrema derecha).
e) Encima de cada aspecto, se dibuja un rectángulo cuya altura represente la
magnitud de la unidad de medida para cada aspecto.
f) Construir la línea de frecuencia acumulativa sumando las magnitudes de cada
aspecto de izquierda a derecha.
g) Utilizar el Diagrama de Pareto para identificar los aspectos más importantes
para el mejoramiento de la calidad.

Histograma
En estadística, un histograma es una representación gráfica de una variable en
forma de barras, donde la superficie de cada barra es proporcional a
la frecuencia de los valores representados. Sirven para obtener una "primera vista"
general, o panorama, de la distribución de la población, o de la muestra, respecto
a una característica, cuantitativa y continua (como la longitud o el peso). De esta
manera ofrece una visión de grupo permitiendo observar una preferencia, o
tendencia, por parte de la muestra o población por ubicarse hacia una
determinada región de valores dentro del espectro de valores posibles (sean
infinitos o no) que pueda adquirir la característica. Así pues, podemos evidenciar
comportamientos, observar el grado de homogeneidad, acuerdo o concisión entre
los valores de todas las partes que componen la población o la muestra, o, en
contraposición, poder observar el grado de variabilidad, y por ende, la dispersión
de todos los valores que toman las partes, también es posible no evidenciar
ninguna tendencia y obtener que cada miembro de la población toma por su lado y
adquiere un valor de la característica aleatoriamente sin mostrar ninguna
preferencia o tendencia, entre otras cosas.
Se utilizan para relacionar variables cuantitativas continuas. Para variables
cuantitativas discretas las barras se dibujan separadas y el gráfico se llama
diagrama de frecuencias, porque la variable representada en el eje horizontal ya
no representa un espectro continuo de valores, sino valores cuantitativos
específicos, igual que ocurre en un diagrama de barras, usado para representar
una característica cualitativa o categórica. Su utilidad se hace más evidente
cuando se cuenta con un gran número de datos cuantitativos y que se han
agrupado en intervalos de clase. Ejemplos de su uso es la representación de
edades o estaturas de una población. Por comodidad, sus valores se agrupan en
clases, es decir, en intervalos continuos. En los casos en los que los datos son
cualitativos (no numéricos), como cierto grado de acuerdo o nivel de estudios, es
preferible un diagrama de sectores.

Tipos de gráficos relacionados con el histograma


Histograma de frecuencias absolutas
Representa la frecuencia absoluta mediante la altura de las barras. Se usa mucho
en educación no universitaria por su sencillez, pero solo se puede aplicar cuando
todos los intervalos son iguales, ya que en ese caso las alturas y las superficies
son proporcionales. En esos niveles educativos se introduce una estadística
elemental y todavía no se puede profundizar en estos detalles.
Histograma de frecuencias relativas
Representa la frecuencia relativa mediante la altura de las barras. Igual que en el
caso anterior se usa mucho en educación no universitaria. La elaboración del
gráfico es más complicada pues los números ya no son enteros. Como en el caso
anterior solo se puede aplicar cuando todos los intervalos son iguales, ya que en
ese caso las alturas y las superficies son proporcionales.
Histograma
Representa la frecuencia relativa mediante la superficie de las barras. Aunque
esto sea cierto en todos los histogramas, cuando se agrupan los datos en
intervalos desiguales hay que atender a la superficie de las barras, que no se
corresponderá con la altura como ocurría en los casos anteriores. Es el que se
suele usar en educación universitaria. Para su elaboración debe introducirse el
concepto de altura de histograma, que es un concepto equivalente al de densidad
de probabilidad, y que se calcula dividiendo la frecuencia relativa de ese intervalo
(o sea la superficie que queremos darle) entre la anchura del intervalo (la base del
rectángulo). Ahora las barras tendrán siempre superficie igual a la frecuencia
relativa y la suma de todas esas superficies (de todas las barras) será 1, o sea el
100%.
Función densidad
Representa la probabilidad mediante la superficie de las barras. Es un gráfico
idéntico al histograma pero aplicado a distribuciones teóricas. El concepto de
frecuencia relativa se cambia por el de probabilidad, pero también se representa
por superficies y la suma de todas esas superficies (de todas las barras) será 1,
como en el histograma, o sea el 100% de probabilidad.
Curva acumulativa u ojiva
Es un gráfico acumulativo (véase Función_de_distribución) que representa la
frecuencia relativa acumulada hasta cada valor de la variable. Si el rango es finito
el primer valor del rango tiene frecuencia acumulada (anterior) cero y el último
tiene frecuencia acumulada 1 (100%). Así el eje vertical siempre toma valores de
cero a uno y representa frecuencias relativas (o probabilidades si se trata de
distribuciones teóricas). Se utiliza para introducir el concepto y el cálculo de la
mediana, los cuartiles, los deciles y en general los parámetros llamados de
posición. Si el rango es infinito, como suele ocurrir en las distribuciones teóricas
(Normal, student, chi-cuadrado, etc.) el cero puede no alcanzarse y será el valor
asintótico por la izquierda, si tampoco se alcanza el uno también será el valor
asintótico derecho, y en muchos casos no se alcanza ni uno ni otro, teniendo dos
asintotas. Este gráfico es la integral del histograma (cuando trabajamos con
distribuciones reales) o de la función densidad (cuando trabajamos con
distribuciones teóricas).
Curva acumulativa de frecuencias absolutas
Es un gráfico acumulativo que representa la frecuencia absoluta acumulada hasta
cada valor de la variable. Realmente no es un gráfico relacionado con el
histograma, pero es muy parecido a la curva acumulativa y a la función de
distribución. Se usa mucho en enseñanza no universitaria por su sencillez, ya que
permite trabajar con números enteros (frecuencias absolutas) y, como la anterior,
permite introducir y calcular mediana, cuartiles, etc. Esta curva no irá entre cero y
uno sino entre cero y el total de individuos de la muestra.

Diagrama de dispersión
El diagrama de dispersión permite estudiar las relaciones entre dos conjuntos
asociados de datos que aparecen en pares (por ejemplo, (x,y), uno de cada
conjunto). El diagrama muestra estos pares como una nube de puntos.
Las relaciones entre los conjuntos asociados de datos se infieren a partir de la
forma de las nubes.
Una relación positiva entre x y y significa que los valores crecientes de x están
asociados con los valores crecientes de y.
Una relación negativa significa que los valores crecientes de x están asociados
con los valores decrecientes de y.
¿Para qué se usa un diagrama de dispersión?
Entre sus usos está descubrir y mostrar las relaciones entre dos conjuntos
asociados de datos y confirmar relaciones anticipadas entre dos conjuntos
asociados de datos.
El diagrama de dispersión puede estudiar la relación entre:
 Dos factores o causas relacionadas con la calidad.
 Dos problemas de calidad.
 Un problema de calidad y su posible causa.
Procedimiento para hacer un diagrama de dispersión
 Recolectar datos pareados (x,y) a partir de dos conjuntos asociados de
datos cuya relación va a ser objeto de estudio. Es conveniente contar con
30 pares de datos aproximadamente.
 Rotular el eje x y el eje y.
 Encontrar los valores mínimo y máximo, tanto para x como para y y utilizar
estos valores para elaborar la escala de los ejes horizontal (x) y vertical (y).
Ambos deben tener aproximadamente la misma longitud.
 Plotear los datos pareados (x,y). Cuando haya dos pares de datos que
tengan los mismos valores, dibujar círculos concéntricos al punto ploteado o
plotear el segundo punto a una corta distancia.
 Examinar la forma de la nube de puntos para descubrir los tipos y las
fuerzas de las relaciones.
Cuando hablamos de la relación entre dos tipos de acciones nos referimos a una
relación de causa y efecto, a una relación entre una causa y otra, o a una relación
entre una causa y dos o más causas.
Un diagrama de dispersión relaciona las tres condicionantes antes mencionadas.

Estratificación o muestreo estratificado


Estratificación es clasificar o agrupar los datos con características coincidentes en
grupos o estratos. Sirve para facilitar el trabajo antes de usar otras herramientas
como pueden ser los histogramas o los diagramas de dispersión.
Cuando hay muchos datos, por ejemplo, en un diagrama de dispersión, su
interpretación puede hacerse bastante complicada y se pueden enmascarar los
problemas a detectar. Esta técnica separa los datos para que podamos encontrar
patrones que de otra manera no se podrían ver.
Cuándo utilizar la estratificación
Antes de recopilar datos: A veces contamos con muchísimos datos y resulta
conveniente intentar clasificarlos antes de lanzarnos a usar otro tipo de
herramienta como diagramas de Pareto o Histogramas.
Cuando tenemos datos de varias fuentes o condiciones: turnos, días de la
semana, proveedores o grupos de población.
Cuando el análisis de datos requiere la separación de diferentes fuentes o
condiciones: por ejemplo separar por diferentes equipos.
Tipos de muestreo estratificado
Dependiendo del tamaño de los estratos, podemos encontrar 3 tipos de muestreo
estratificado:
1. Muestreo estratificado proporcionado o proporcional
La muestra deberá tener estratos que guarden las mismas proporciones
observadas en la población.
Por ejemplo: Estamos analizando la cantidad de autónomos en España que
trabajan desde casa y hay 1.000.000 de personas en este segmento: 70% de
mujeres y 30% de hombres (estos son datos totalmente ficticios).
Si decidimos que la muestra sea de 1000 personas, la proporción debe ser la
siguiente:
Estrato de mujeres: 700 (70%)
Estrato de hombres: 300 (30%)
2. Muestreo estratificado uniforme
Cuando se asigna el mismo tamaño de muestra a todos los estratos definidos, sin
importar el peso que tienen en la población. Si seguimos con el ejemplo anterior,
un muestreo estratificado uniforme quedaría de la siguiente manera:
Estrato de mujeres: 500
Estrato de hombres:500
3. Muestreo estratificado óptimo (respecto a la desviación estándar)
En este caso, el tamaño de los estratos en la muestra no guarda proporcionalidad
con la población. Se define el tamaño de los estratos proporcionalmente a la
desviación estándar de las variables objeto de estudio. Es decir, se toman estratos
de mayor tamaño en los estratos con mayor variabilidad interna para representar
mejor en el total de la muestra los grupos poblacionales más difíciles de estudiar.

También podría gustarte