Está en la página 1de 59

República Bolivariana de Venezuela

Ministerio del Poder Popular Para la Educación Universitaria


Universidad Nacional Experimental
“Rafael María Baralt”
Catedra: Control Estadístico.

Prevención de Accidentes en la Industria.

Realizado por:
Sandoval
Maikel
C.I: 28.133.688.

San francisco, junio de 2021.

1
1. Diagrama de flujo de proceso.

Un diagrama de flujo, o flujograma, es una representación gráfica de un


proceso. Cada paso del proceso se representa por un símbolo diferente que
contiene una breve descripción de la etapa de proceso.

Los símbolos gráficos del flujo del proceso están unidos entre sí con flechas que
indican la dirección de flujo del proceso.

El diagrama de flujo ofrece una descripción visual de las actividades implicadas en


un proceso. Muestra la relación secuencial entre ellas, facilitando la rápida
comprensión de cada actividad y su relación con las demás.

Expresa igualmente el flujo de la información y de los materiales; así como las


derivaciones del proceso, el número de pasos del proceso y las operaciones de
interdepartamentales. Hace posible la identificación de bucles repetitivos, lo que
es esencial para las acciones de rediseño y mejora.

El flujograma también facilita la selección de indicadores de proceso,


indispensables para efectuar su control y evaluar su rendimiento y eficacia.

¿Cómo y Cuándo surge el Diagrama de Flujo?

El primer método de diagrama de flujo de proceso fue introducido, en 1921,


por Frank y Lillian Gilbreth , con el objetivo de documentar el flujo para estudiar los
procesos de trabajo.

El objetivo de los Gilbreth fue representar de forma gráfica y sintética, el estado


actual de un proceso para, así, obtener una visión que facilitara su optimización.
De esta forma se conseguía hacerlo más eficiente y, por tanto, más rentable.
Comprobaron cómo, mediante el diagrama de flujo del proceso, se conseguía la
fácil detección de errores e inconsistencias, al alcanzar una visión general del
sistema.

2
Hay que tener en cuenta que el contexto en que se desenvuelven los
Gilbreth es el del Taylorismo, a principios del siglo XX. Así, uno de los objetivos
centrales el análisis del trabajo era la ganancias de productividad en los
trabajadores mediante el análisis de las operaciones y movimientos que esto se
realizaban durante la ejecución de las tareas.

El objetivo era reducir las operaciones implicadas para, así, realizar las más
rápidamente. Para ello, identificaron los movimientos y decisiones de los
trabajadores de modo que se pudieran analizar los retrasos y sus causas con el fin
de eliminarlos.

A su vez, y para maximizar la productividad, y también reducir la fatiga, idearon


tres conjuntos de reglas básicas aplicables a la economía de movimientos,
relacionadas con:

 El cuerpo humano: por ejemplo, las manos deben iniciar y finalizar los
movimientos de forma simultánea.
 La disposición del lugar de trabajo: como fijar un sitio para material y
herramientas.
 El diseño de herramientas y equipo: combinar dos o más herramientas.

El Diagrama de Flujo y la Simplificación del Trabajo

Con el fin de documentar sus análisis, los Gilbreth idearon el diagrama de


flujo de trabajo. Este se compone de una serie de símbolos que expresan las
acciones concretas que realiza el trabajador. De este modo, es posible obtener
una visión certera y comprensible del flujo de operaciones implicadas. Esta
perspectiva se reveló como muy eficaz para el análisis del trabajo y el rediseño de
su flujo, de forma que se incrementara la productividad.
Descompusieron las posibles acciones en diecisiete movimientos básicos, que
denominaron “therbligs”. Cada movimiento puede ser efectivo o inefectivo, según
produzcan avances, uno, en el progreso del trabajo.

3
Símbolos de los Therbligs, o movimientos en los que pueden subdividirse las
tareas.

Más adelante  Mogensen, basándose en las ideas de los Gilbreth, introdujo el


concepto de simplificación del trabajo. Lo aplicó a grandes compañías, como
Kodak o Procter and Gamble, generando ahorros de millones de dólares.

En su obra  “Common Sense Applied to Motion and Time Study” (1932 [2]), ofreció


soluciones a temas que aún hoy son de actualidad. Por ejemplo, afirmó que  «… la
persona que hace el trabajo sabe mucho más que nadie sobre la mejor manera de
hacer ese trabajo y, por lo tanto, es la persona más adecuada para
mejorarlo» (Mogensen, 1932). O que un diagrama de flujo de proceso ya adoptado
es la base para operar mejoras en el futuro.
Ambas ideas muy en línea con el punto de vista de la gestión de la calidad total.

Diagrama de Flujo y Gestión de Procesos: Beneficios

Las organizaciones constituyen sistemas de procesos. Por ello, es indispensable


identificar tanto los procesos como las relaciones que existen entre ellos.
Finalmente, han de ser documentados y mejorados continuamente.

Para el análisis de los procesos, y su documentación, es necesario diagramar el


flujo de actividades. Así, los diagramas de flujo son imprescindibles para
comprender cómo actúa un proceso y determinar sus puntos de mejora.

En este sentido, son numerosos los beneficios que aporta el uso del diagrama de
flujo:

4
Ofrece una visión transparente del proceso.

En primer lugar, mejora la comprensión del proceso. El conjunto de actividades,


relaciones e incidencias de un proceso no es fácilmente discernible a priori. La
diagramación hace posible aprehender ese conjunto e ir más allá, centrándose en
aspectos específicos del mismo, apreciando las interrelaciones que forman parte
del proceso así como las que se dan con otros procesos y subprocesos.

Aprendizaje

Mediante un diagrama de flujo se hacen visibles las actividades de un proceso y


sus relaciones. Eso da oportunidad para analizar su secuencia e identificar puntos
de mejora.

 Permite definir los límites de un proceso. 


A veces estos límites no son tan evidentes, no estando definidos los distintos
proveedores y clientes (internos y externos) involucrados.
La cuestión de los límites es vital. Al estar los procesos relacionados entre sí, es
imprescindible determinar con precisión dónde se inician y dónde finalizan. Esta
información nos la dará el flujograma del proceso.

 Facilita la identificación de los clientes. 

Es más sencillo determinar sus necesidades y ajustar el proceso hacia la


satisfacción de sus necesidades y expectativas.
Estimula el pensamiento analítico. 
En el momento de estudiar un proceso, haciendo más factible generar alternativas
útiles.

 Proporciona un método de comunicación más eficaz. 

Ya que introducen un lenguaje común; si bien es cierto que para ello se hace
precisa la capacitación de quienes entrarán en contacto con la diagramación.

Ayuda a establecer el valor agregado. 

El diagrama flujo permite analizar qué valor aporta cada una de las actividades
que componen el proceso. Por lo tanto, permite identificar aquellas innecesarias,
reduciendo tiempo y costes.

5
Referencia para establecer mecanismos de control.

Igualmente, el flujograma constituye una excelente herramienta para el control


y mejora de los procesos. Al mismo tiempo, facilita establecer los objetivos para
las distintas operaciones y actividades llevadas a cabo.

Mejora tiempos y costes

Facilita el estudio y aplicación de acciones que redunden en la mejora de las


variables tiempo y costes de actividad e incidir, por consiguiente, en la mejora de
la eficacia y la eficiencia.

Finalmente, constituye el punto de comienzo indispensable para acciones de


mejora, rediseño o reingeniería.

Diagramación de Procesos

Las actividades de análisis y diagramación de procesos ayudan a la organización


a comprender cómo se están desarrollando sus procesos y actividades, al tiempo
que constituyen el primer paso para mejorar las prácticas organizacionales.

Figuras de Diagramas de Flujo

Diagramar es establecer una representación visual de los procesos y


subprocesos, lo que permite obtener una información preliminar sobre la amplitud
de los mismos, sus tiempos y los de sus actividades.
La representación gráfica mediante el flujograma, facilita el análisis, uno de cuyos
objetivos es la descomposición de los procesos de trabajo en actividades
discretas. También hace posible la distinción entre aquellas que aportan valor

6
añadido de las que no lo hacen, es decir que no proveen directamente nada al
cliente del proceso o al resultado deseado.
En este sentido, cabe hacer una precisión: no todas las actividades que no
aportan valor añadido han de ser innecesarias. Éstas pueden ser actividades de
apoyo y ser requeridas para hacer más eficaces las funciones de dirección y
control. O por razones de seguridad, motivos normativos y de legislación…

Modelo y Diagrama de Flujo

Todas estas razones apuntan hacia el diagrama de flujo de procesos como un


instrumento primordial para la correcta gestión de los procesos.
La realización de un flujograma es una actividad íntimamente ligada al hecho de
modelar un proceso, que es por sí mismo un componente esencial en la gestión
de procesos.
Frecuentemente los sistemas (conjuntos de procesos y subprocesos integrados en
una organización) son difíciles de comprender. Son amplios, complejos y
confusos; con múltiples puntos de contacto entre sí y con un buen número de
áreas funcionales, departamentos y personas implicadas.
Pero ¿qué es un modelo? Un modelo es una representación de una realidad
compleja. Modelar es desarrollar una descripción lo más exacta posible de un
sistema y de las actividades llevadas a cabo en él. De este modo se tiene la  
oportunidad de organizar y documentar la información sobre un sistema. El
diagrama de flujo de proceso constituye la primera actividad para modelar un
proceso.
Cuando un proceso es modelado, con ayuda de una representación gráfica
(diagrama de flujo de proceso, o flujograma), pueden apreciarse con facilidad las
interrelaciones existentes entre distintas actividades. Así, es posible analizar cada
actividad, definir los puntos de contacto con otros procesos, así como identificar
los subprocesos comprendidos. Al mismo tiempo, los problemas pueden ponerse
de manifiesto claramente dando la oportunidad al inicio de acciones de mejora.

¿Cómo elaborar un Diagrama de Flujo de Proceso, o Flujograma?

El diagrama de flujo debe ser realizado por un equipo de trabajo en el que las
distintas personas aporten, en conjunto, una perspectiva completa del proceso,
por lo que con frecuencia este equipo será multifuncional y multijerárquico.
Los pasos a seguir para su elaboración se exponen a continuación.

Distinguir entre Proceso y Proyecto

En primer lugar, asegúrese de que va a diagramar un proceso. Tenga en cuenta la


diferencia entre “proceso” y “proyecto”.

7
En un proyecto se desarrolla una serie de actividades para alcanzar una meta: el
objetivo del proyecto. En esto es similar al proceso. Pero hay una diferencia
importante. Mientras que un proyecto se lleva a cabo una sola vez, los procesos
se reiteran en el tiempo; son repetitivos.
Por ejemplo, la creación de un producto obedece generalmente al desarrollo de un
proyecto que supone un esfuerzo temporal, que finaliza cuando el producto ha
sido diseñado.

Por su parte, la producción de ese producto obedeces a un proceso. Esto es, al


proceso de producción que resulta en la fabricación de unidades de producto, en
un esfuerzo que ya no es temporal, sino reiterativo. Es decir, no se lleva a cabo
solo una vez, sino que se reitera en el tiempo.

Decidir el grado de detalle del flujograma

El diagrama de flujo del proceso debe presentar a grandes rasgos la información


sobre el recorrido general de actividades principales, o ser desarrollado de modo
que se incluyan todas las actividades y los puntos de decisión. Un flujograma
detallado dará la oportunidad de llevar realizar un análisis más exhaustivo del
proceso.

Denominar el Proceso

El nombre del proceso no es un asunto menor. En primer lugar, la denominación


nos indica en qué consiste el proceso, cuál es su materia. Además, nos facilita
indicios sobre su relación con otros procesos.

En este sentido, hay que procurar una denominación descriptiva, en lugar de


genérica. Por ejemplo, “Proceso de Pagos Vencidos” es más específico que
“Recobro de Pagos”.

Definir los Límites del Proceso

Antes de realizar el diagrama de flujo es imprescindible delimitar el proceso. Esto


es, definir con claridad dónde se inicia y su punto final. Si no se delimita con
precisión del alcance del proceso, nos arriesgamos a desarrollar un diagrama que
se extienda por dos o más procesos distintos sin solución de continuidad.
Tengamos en cuenta que en muchas ocasiones los procesos encadenan el final
con el principio de otros. Por lo tanto, sin definir bien los límites, el flujograma se
extenderá a lo largo de varios procesos, resultando en un modelado incorrecto y,
por supuesto, nada operativo.

8
Por otra parte, la definición de los límites ayudará a identificar el objetivo del
proceso.

Determinar el Objetivo del Proceso

Los procesos se llevan a cabo con un propósito determinado. Así, definirlo


permitirá alcanzar una visión más acertada de la serie de actividades que llevan a
su logro. En todo caso, tenga en cuenta siempre que el diagrama de flujo debe
mostrar las actividades para lograr el propósito del proceso; no se trata de definir
la secuencia para ejecutar una tarea. En esto, los procesos son distintos a los
procedimientos.

En la siguiente tabla puede encontrar las diferencias entre proceso y


procedimiento.

Diferencias entre Proceso y Procedimiento

PROCESOS:

 Los procesos transforman las entradas en salidas mediante la utilización de


recursos.
 Un proceso se comporta de forma dinámica.
 El proceso está impulsado por la consecución de un resultado.
 Los procesos se operan y gestionan.
 Están centrados en la satisfacción de los clientes y otras partes interesadas.
 Los procesos contienen actividades que pueden realizar personas de
diferentes departamentos con unos objetivos comunes.

PROCEDIMIENTOS:

 Los procedimientos definen la secuencia de los pasos para ejecutar una tarea.
 Un procedimiento existe, pero es estático.
 Los procedimientos están impulsados por la finalización de la tarea.
 El procedimiento, más que gestionarse, se implementa.
 Los procedimientos se centran en el cumplimiento de las normas.
 Reflejan actividades que pueden realizar personas de diferentes
departamentos con diferentes objetivos.

9
Desarrollar la Secuencia del Proceso

Es decir, plasmar en el diagrama de flujo las actividades que se suceden entre el


inicio del proceso y el resultado final.
No obstante, es posible que tal secuencia tenga variaciones según ciertas
decisiones. Es lo que llamamos “bifurcaciones” del proceso. En estos casos,
normales por otra parte, utilice la «figura de decisión» para representar dichas
bifurcaciones, continuando el flujograma derivado cada posible decisión.

Bifurcaci
ones en el Flujo del Proceso

Para la elaboración del diagrama de flujo se utilizan determinados símbolos.


Evidentemente, cada organización puede definir su propio grupo.
En la figura anterior se mostraba un conjunto de símbolos habitualmente
utilizados. Al respecto cabe decir que en la figura “Conector de proceso” es
frecuentemente utilizado un círculo como símbolo. Al confeccionar un flujograma,
los símbolos estándar han sido normalizados, entre otros, disponemos de los
establecidos por el American National Standars Institute (ANSI).

Finalmente, antes de construir el diagrama con alguna herramienta de software,


puede ser útil elaborar un primer borrador con lápiz y papel.

Indicadores de Proceso

A partir de la secuencia de actividades modelada en el diagrama de flujo, se


pueden determinar más fácilmente los indicadores de proceso. Es decir, aquellos
que resulten de interés para efectuar su control y evaluación. El hecho es que no
se puede gestionar un proceso sin datos.

10
Un indicador de proceso es un parámetro que permite una evaluación de la
eficacia y eficiencia de los procesos. Los indicadores de proceso pueden medir la
percepción del cliente sobre los resultados (indicadores de percepción).
También pueden referirse a variables intrínsecas del proceso (indicadores de
rendimiento). Se consigue con ello detectar las desviaciones en la ejecución del
proceso que puedan tener consecuencias negativas en su rendimiento.
Los indicadores habitualmente se relacionan con mediciones sobre tiempos de
proceso, tiempos de ciclo o porcentaje de errores.

Tiempo de Ciclo:

Es el intervalo temporal real transcurrido desde que se inicia una actividad, hasta
que se comienza la siguiente.

Tiempo de Proceso:

Es el tiempo neto empleado por cada actividad del proceso, en el caso de que no
se diesen esperas.
El flujograma facilita la selección de los puntos de control, aquellos sobres los que
se definirán indicadores. Esto permite, por ejemplo, establecer indicadores de
tiempo entre dos actividades concretas.

2. Diagrama de Causa y Efecto

¿Qué es?

Un diagrama de Causa y Efecto es la representación de varios elementos


(causas) de un sistema que pueden contribuir a un problema (efecto). Fue
desarrollado en 1943 por el Profesor Kaoru Ishikawa en Tokio. Algunas veces es
denominado Diagrama Ishikawa o Diagrama Espina de Pescado por su parecido
con el esqueleto de un pescado. Es una herramienta efectiva para estudiar
procesos y situaciones, y para desarrollar un plan de recolección de datos.

¿Cuándo se utiliza?

El Diagrama de Causa y Efecto es utilizado para identificar las posibles causas


de un problema específico. La naturaleza gráfica del Diagrama permite que los
grupos organicen grandes cantidades de información sobre el problema y
determinar exactamente las posibles causas.

Finalmente, aumenta la probabilidad de identificar las causas principales.

El Diagrama de Causa y Efecto se debe utilizar cuando se pueda contestar sí, a

11
las dos preguntas siguientes

1. ¿Es necesario identificar las causas principales de un problema?


2. ¿Existen ideas y/u opiniones sobre las causas de un problema?

Con frecuencia, las personas vinculadas de cerca al problema que es objeto de


estudio se han formado opiniones sobre cuáles son las causas del problema.

Estas opiniones pueden estar en conflicto o fallar al expresar la causa


principales. El uso de un Diagrama de Causa y Efecto hace posible reunir todas
estas ideas para su estudio desde diferentes puntos de vista.

 El desarrollo y uso de Diagramas de Causa y Efecto son más efectivos


después de que el proceso ha sido descrito y el problema esté bien definido.
Para ese momento, los miembros del equipo tendrán una idea acertada de
qué factores se deben incluir en el Diagrama.
 Los Diagramas de Causa y Efecto también pueden ser utilizados para otros
propósitos diferentes al análisis de la causa principal. El formato de la
herramienta se presta para la planeación. Por ejemplo, un grupo podría
realizar una lluvia de ideas de las “causas” de un evento exitoso, tal como un
seminario, una conferencia o una boda. Como resultado, producirían una lista
detallada agrupada en una categoría principal de cosas para hacer y para
incluir para un evento exitoso.
 El Diagrama de Causa y Efecto no ofrece una respuesta a una pregunta,
como lo hacen otras herramientas. Herramientas como el Análisis de Pareto,
Diagramas Scatter, e Histogramas, pueden ser utilizadas para analizar datos
estadísticamente. (Nota: consultar la descripción de la Gráfica de Pareto,
Diagrama Scatter, e Histograma). En el momento de generar el Diagrama de
Causa y Efecto, normalmente se ignora si estas causas son o no
responsables de los efectos. Por otra parte, un Diagrama de Causa y Efecto
bien preparado es un vehículo para ayudar a los equipos a tener una
concepción común de un problema complejo, con todos sus elementos
y relaciones claramente visibles a cualquier nivel de detalle requerido.

¿Cómo se utiliza? 1. Identificar el problema. El problema (el efecto generalmente


está en la forma de una característica de calidad) es algo que queremos mejorar
o controlar.

El problema deberá ser específico y concreto: incumplimiento con las citas para
instalación, cantidades inexacta en la facturación, errores técnicos en las
cuentas de proveedores, errores de proveedores. Esto causará que el número

12
de elementos en el Diagrama sea muy alto (consultar la ilustración).

2. Registrar la frase que resume el problema. Escribir el problema identificado en


la parte extrema derecha del papel y dejar espacio para el resto del Diagrama
hacia la izquierda. Dibujar una caja alrededor de la frase que identifica el
problema (algo que se denomina algunas veces como la cabeza del pescado).

3. Dibujar y marcar las espinas principales. Las espinas principales representan


el input principal/ categorías de recursos o factores causales. No existen reglas
sobre qué categorías o causas se deben utilizar, pero las más comunes
utilizadas por los equipos son los materiales, métodos, máquinas, personas, y/o
el medio. Dibujar una caja alrededor de cada título. El título de un grupo para su
Diagrama de Causa y Efecto puede ser diferente a los títulos tradicionales; esta
flexibilidad es apropiada y se invita a considerarla.

4. Realizar una lluvia de ideas de las causas del problema. Este es el paso más
importante en la construcción de un Diagrama de Causa y Efecto. Las ideas
generadas en este paso guiarán la selección de las causas de raíz. Es
importante que solamente causas, y no soluciones del problema sean
identificadas. Para asegurar que su equipo está al nivel apropiado de
profundidad, se deberá hacer continuamente la pregunta Por Qué para cada una
de las causas iniciales mencionadas. (ver el módulo de los Cinco Por Qués). Si
surge una idea que se ajuste mejor en otra categoría, no discuta la categoría,
simplemente escriba la idea. El propósito de la herramienta es estimular ideas,
no desarrollar una lista que esté perfectamente clasificada.

(Nota: Consultar la descripción de Lluvia de Ideas).

5. Identificar los candidatos para la “causa más probable”. Las causas


seleccionadas por el equipo son opiniones y deben ser verificadas con más
datos. Todas las causas en el Diagrama no necesariamente están relacionadas
de cerca con el problema; el equipo deberá reducir su análisis a las causas más
probables. Encerrar en un círculo la causa(s) más probable seleccionada por el
equipo o marcarla con un asterisco.

6. Cuando las ideas ya no puedan ser identificadas, se deberá analizar más a


fondo el Diagrama para identificar métodos adicionales para la recolección de
datos. Versión CEDAC – Cause & Effect Diagram Adding Cards

Después de completar el paso 5, el equipo de resolución de problemas deberá:

A. Dibujar la versión final en un tamaño más grande (aproximadamente de


3’ x 5’).

13
B. Exhibir el Diagrama en una zona de alto tráfico o en una cartelera con una
invitación para ser estudiado por otros y para que agreguen su ideas en “Post-It”
en las categorías respectivas.

C. Después de un período específico de tiempo (1 o 2 semanas) el Diagrama se


retira y se revisa para incluir la información adicional. Un Diagrama completo
más pequeño se publica nuevamente con una nota de agradecimiento.

D. En este momento, el equipo avanza al siguiente paso para un análisis más


profundo, y para reunir datos adicionales (ver paso 6). El Diagrama completo
también puede exhibirse ( o dejarse). Luego, a medida que una y otra causa es
atendida, se pueden anotar las ganancias. Una vez que las causas sean
retiradas, se deberán tachar y apuntar la fecha de su terminación. Las causas
que actualmente están siendo atendidas también pueden indicarse. De esta
manera toda el área de trabajo tiene un indicador de progreso y se puede
percibir cierta relación de lo que se está haciendo.

 Consejos para la Construcción/ Interpretación:

 Se debe recordar que los Diagramas de Causa y Efecto únicamente


identifican causas posibles. Aun cuando todos estén de acuerdo en estas
causas posibles, solamente los datos apuntarán a las causas.
 El Diagrama de Causa y Efecto es una forma gráfica de exhibir gran
información de causas en un espacio compacto. El uso del Diagrama ayuda
a los equipos a pasar de opiniones a teorías comprobables.

 Relación con otras Herramienta Un Diagrama de Causa y Efecto normalmente


se relaciona con:

 Lluvia de Ideas
 Diagrama de Interrelaciones
 Gráfica de Pareto
 Multi-votación
 Técnica de Grupo Nominal
 Diagrama de Afinidad
 Cinco Por Qué

14
3. Diagrama de Pareto

El diagrama de Pareto es una gráfica que organiza valores, los cuales están
separados por barras y organizados de mayor a menor, de izquierda a derecha
respectivamente.

Esta gráfica permite asignar un orden de prioridades para la toma de


decisiones de una organización y determinar cuáles son los problemas más
graves que se deben resolver primero.

Su finalidad, es hacer visibles los problemas reales que están afectando el


alcanzar los objetivos de la empresa y reducir las pérdidas que esta posee.

Además, permite evaluar previamente, cuáles son las necesidades del público
objetivo y cómo satisfacerlas con nuestro producto o servicio, logando también,
el objetivo del mercadotecnia.

¿Cómo surgió el diagrama de Pareto?

Fue enunciado por primera vez por el ingeniero, sociólogo, economista y filósofo
italiano Vilfredo Pareto (1848-1923).

Mediante su estudio sobre la división de la riqueza en Italia en aquella época, llegó


a la conclusión de que el 80% de la riqueza estaba en manos del 20% de la
población y el otro 20% de riqueza estaba en el 80% restante.

Al determinar esto, lo publicó por primera vez en 1896 en su «Cours d’économie


politique».

¿Cómo funciona el principio de Pareto?

Representa la regla 80/20, es decir, que, en la mayoría de las situaciones, el 80%


de las consecuencias son debido al 20% de las acciones o el 80% de los defectos
de un producto se debe al 20% de las causas.

En otras palabras, podemos decir que, aunque muchos factores contribuyan a una


causa, son pocos los responsables de dicho resultado.

A pesar de que la relación no siempre es exacta, normalmente sí se cumple el


principio de Pareto y es la base de este diagrama.

¿Cuáles son los elementos del diagrama de Pareto?

El diagrama de Pareto está conformado por una estructura dividida en tres partes:

15
El eje «Y» izquierdo es la frecuencia de la ocurrencia del problema.

El eje «Y» de la parte derecha es el porcentaje acumulado del número total de


ocurrencias.

La parte inferior del eje «X» muestra los problemas, quejas, defectos o
desperdicios que se presentaron.

¿Cuáles son las ventajas de utilizar el diagrama de Pareto?

Al permitirnos enfocar en lo que en realidad afecta a la empresa, el diagrama de


Pareto logra:

Que la empresa mejore continuamente;

El análisis y priorización de problemas;

Optimizar el esfuerzo y tiempo al centrarse en aspectos cuya mejora tendrá un


impacto directo;

Proporcionar una visión sencilla y completa de los problemas;

Hacer que la gráfica sea fácil de comprender;

Estimular al equipo de trabajo en la búsqueda de la mejora continua; de forma


anticipada, verificar cuál es la mejor herramienta de automatización se puede usar
o comprar para nuestra estrategia de marketing.

Además, el diagrama de Pareto permite comparar los diagramas de un mismo


problema en tiempos diferentes, logrando así determinar si hubo mejoras, cambios
y efectos positivos en dichos problemas.

¿En qué áreas es posible aplicarlo en una empresa?

El diagrama de Pareto se puede aplicar en todas las áreas de la empresa de


forma similar. A continuación, te mostraremos algunas de ellas:

Área de producción

El 20% de los procesos de una empresa genera el 80% de sus productos o


servicios.

Área de ventas

El 80% de las tratativas cerradas por la fuerza de ventas son generadas por el


20% de los productos y 20% de los clientes generan el 80% de los ingresos.

16
Área de gerencia

El 80% del éxito de una empresa proviene del 20% de sus empleados.

Área de reclamos y sugerencias

El 20% de los rechazos del producto representa al 80% de las quejas de


los clientes.

Gestión de almacenes

El 80% del costo del inventario representa el 20% de los productos.

Control de calidad

El 20% de los defectos afectan al 80% de los procesos.

¿Cómo hacer un diagrama de Pareto en una organización?

A continuación, te diremos los pasos y un ejemplo para que realices


adecuadamente un diagrama de Pareto, ¡continúa tu lectura!

1. Selecciona qué aspecto vas a analizar

Es primordial que determines cuál es el problema que te está causando pérdidas,


ya sea de tiempo, ventas, personal, entre otros.

2. Agrupa los datos

Debes dividir por celdas según la categoría y el número de frecuencia (u


ocurrencia).

La categoría (o problemas) son los más comunes que observas en tu sitio web.

La frecuencia es, de un determinado número de clientes, cuáles se quejaron por


cuál problema.

17
3. Ordena los datos

Organiza tu tabla de acuerdo con el orden decreciente de frecuencia y agrega la


frecuencia acumulada de los casos sumando la frecuencia anterior con la
siguiente.

4. Añadir valores porcentuales

Añadir otra columna para agregar los valores porcentuales unitarios.

El cálculo se determina mediante la fórmula: La frecuencia/total de frecuencia x


100

Ejemplo: atraso de entrega= (20/70) x 100= 29% (aproximado).

18
5. Agregar los porcentajes acumulados

Al igual que la frecuencia acumulada, se suma el porcentaje unitario anterior con


el siguiente.

19
6. Construir el diagrama de Pareto

Luego, con los datos de la tabla anterior, se delinea el diagrama, sus ejes de
ordenadas, se insertan los datos (en orden descendientes) y se agregan las
barras.

Con los datos del porcentaje acumulado, se coloca un punto céntrico en cada
barra y luego se unen con una línea.

Para ir finalizando, se analiza el gráfico.

Para concluir este diagrama, se agregan datos como la fecha, título, qué se
estudió, medidas correctivas a aplicar.

20
Para concluir

Recuerda que el diagrama de Pareto te permite asignar un orden de prioridades,


direccionando tus esfuerzos y tiempo al 20% de las causas que logran solucionar
el 80% de los problemas de la empresa.

Debido a esto, te posibilita ser más proactivo y eficaz al enfocarte en realizar las


actividades que realmente otorgan resultados.

¿Quieres conocer otras herramientas para analizar y mejorar el rendimiento de tu


empresa? Si es así, continua tu lectura y aprende sobre el análisis FODA. ¡Te será
muy útil!

4. Distribución de frecuencias y clases.

La distribución de frecuencias o tabla de frecuencias es una ordenación en forma


de tabla de los datos estadísticos, asignando a cada dato su frecuencia
correspondiente.

 Tipos de frecuencias

Frecuencia absoluta

La frecuencia absoluta es el número de veces que aparece un determinado valor


en un estudio estadístico.

21
Al tirar una moneda   veces salen   caras

Se representa por , aunque otros autores la representan como  .

La suma de las frecuencias absolutas es igual al número total de datos, que se


representa por  .

Para indicar resumidamente estas sumas se utiliza la letra griega   (sigma


mayúscula) que se lee suma o sumatoria.

Frecuencia relativa

La frecuencia relativa es el cociente entre la frecuencia absoluta de un


determinado valor y el número total de datos.

Se puede expresar en tanto por ciento y se representa por  .

La frecuencia relativa es un número comprendido entre   y  .

La suma de las frecuencias relativas es igual a  .

Frecuencia acumulada

22
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los
valores inferiores o iguales al valor considerado.

Se representa por .

Frecuencia relativa acumulada

La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de


un determinado valor y el número total de datos.

Se puede expresar en tantos por ciento.

Ejemplo:

Durante el mes de julio, en una ciudad se han registrado las siguientes


temperaturas máximas:

En la primera columna de la tabla colocamos la variable ordenada de menor a


mayor

En la segunda hacemos el recuento

En la tercera anotamos la frecuencia absoluta

En la cuarta anotamos la frecuencia acumulada:

En la primera casilla colocamos la primera frecuencia absoluta:

En la segunda casilla sumamos el valor de la frecuencia acumulada anterior más


la frecuencia absoluta correspondiente:

En la tercera casilla sumamos el valor de la frecuencia acumulada anterior más la


frecuencia absoluta correspondiente:

La última tiene que ser igual a   (sumatoria de ).

23
En la quinta columna disponemos las frecuencias relativas   que son el
resultado de dividir cada frecuencia absoluta por 

En la sexta anotamos la frecuencia relativa acumulada .

En la primera casilla colocamos la primera frecuencia relativa acumulada.

En la segunda casilla sumamos el valor de la frecuencia relativa acumulada


anterior más la frecuencia relativa correspondiente y así sucesivamente hasta la
última, que tiene que ser igual a .

Recuento

II

III

III

Este tipo de tablas de frecuencias se utiliza con variables discretas.

Distribución de frecuencias agrupadas

La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea


si las variables toman un número grande de valores o la variable es continua.

Se agrupan los valores en intervalos que tengan la misma amplitud denominados


clases. A cada clase se le asigna su frecuencia correspondiente.

Límites de la clase

Cada clase está delimitada por el límite inferior de la clase y el límite superior de la
clase.

Amplitud de la clase

24
La amplitud de la clase es la diferencia entre el límite superior e inferior de la
clase.

Marca de clase

La marca de clase es el punto medio de cada intervalo y es el valor que


representa a todo el intervalo para el cálculo de algunos parámetros.

La marca de clase se representa por   

Construcción de una tabla de datos agrupados

1º Se localizan los valores menor y mayor de la distribución. En este caso son    y
.

2º Se restan y se busca un número entero un poco mayor que la diferencia y que
sea
divisible por el número de intervalos queramos establecer.

Es conveniente que el número de intervalos oscile entre   y .

En este caso, , incrementamos el número hasta  ,   


intervalos.

Se forman los intervalos teniendo presente que el límite inferior de una clase
pertenece al intervalo, pero el límite superior no pertenece intervalo, se cuenta en
el siguiente intervalo. 

Es la marca de clase que es el punto medio de cada intervalo.

25
1

5. Variables discretas y continuas

Si las observaciones corresponden a cantidades, las variables pueden


distinguirse entre discretas y continuas. Se dice que una variable
es discreta cuando no puede tomar ningún valor entre dos consecutivos, y que
es continua cuando puede tomar cualquier valor dentro de un intervalo.

Ejemplos de variable discreta: número de empleados de una fábrica; número de


hijos; número de cuentas ocultas en Suiza.
Ejemplos de variable continua: temperaturas registradas en un observatorio;
tiempo en recorrer una distancia en una carrera; contenido de alcohol en un
cuba-libre; estatura; tiempo de discurso de un político en las cortes insultando a
los del partido contrario.
En la práctica, todas las variables son discretas debido a la limitación de los
aparatos de medida. Pensemos en el ejemplo de la estatura: quizá podría
detectarse una diferencia de una cienmilésima de metro, o de una millonésima
pero, dados dos individuos que se diferencien en una millonésima, seguramente
ya no existe otro que tenga una estatura intermedia. De la misma forma, por
insignificante que sea la diferencia entre la llegada de dos corredores olímpicos
a una meta, la limitación de la precisión en la medida siempre puede acabar
produciendo un posible (aunque improbable) empate. Obviando este tipo de
limitaciones, las variables continuas se elegirán, desde un punto de vista
teórico, con toda la precisión que deseemos (decimales), de manera que
siempre podamos escribir un valor que esté entre cualesquiera otros dos.

Por ejemplo, hasta hace unos años, cuando uno se subía a una báscula, lo
máximo solían ser dos o tres decimales: (50.35: 50 kilos y 350 gramos…).
Realmente, usar más de dos o tres decimales para el peso en kilos de una
persona no ofrece ningún interés. Sin embargo, está claro que podrían
construirse básculas de baño con mucha mayor precisión, ofreciendo un número
mayor de decimales (otra cosa es que se vendieran).

26
De manera general, consideraremos que una variable continua toma valores en un
intervalo (por ejemplo: el peso de un grupo de personas varía entre 40 y 100
kilos), y un dato podrá ser cualquier número entre esos dos.

6. Histograma de frecuencia.

Es entonces un gráfico que permite mostrar cómo se distribuyen los datos de


una muestra estadística o de una población. Esto, respecto a alguna variable
numérica.

En el histograma se suelen usar barras, cuya altura dependerá de la frecuencia de


los datos, que corresponde al eje Y. En tanto, en el eje X podemos observar
la variable de estudio.

Para esto, debemos recordar que en estadística la frecuencia es la cantidad de


veces que se repite un suceso. Por ejemplo, si queremos agrupar a un colectivo
en función de la edad, la frecuencia sería el número de individuos que tienen, por
ejemplo, entre 18 y 25 años.

Ejemplo de histograma

Veamos un ejemplo de histograma. Supongamos que tenemos los siguientes


datos de los alumnos de un salón de clase en la universidad.

Número
Estatura de
alumnos

27
menos de 1,50 cm 2

1,50-1,60 12

1,60-1,70 20

1,70-1,80 22

1,80-1,90 10

más de 1,90 2

Entonces, el histograma se podría construir de la siguiente manera:

Características de un histograma

Cabe señalar que el histograma se construye cuando la variable de estudio (la del
eje horizontal) es cuantitativa. En cambio, si fuera cualitativa, se elaboraría de
preferencia un diagrama de barras o un gráfico circular.

Debemos tomar en cuenta además que la variable de estudio u observación no


necesariamente es continua, como el peso o la altura. Así, puede ser, como en el
caso de la edad, que solo toma valores enteros (No se suele decir que alguien
tiene 1,5 años).

Otro punto a considerar es que la variable del eje X puede estar presentada en
rangos, pero también como valores fijos. Es decir, puede ser que un grupo de

28
personas estén agrupadas en función del número de comidas que llevan al día: 1,
2, 3, 4 o 5.

7. Gráfico de correlación.

Al igual que los histogramas, los diagramas de correlación son una representación


gráfica que muestra la relación de una variable con respecto a otra, aunque esta
no tiene por qué ser una relación causa-efecto.

Se relaciona el desempeño de una característica de interés con factores de causa


potenciales, el objetivo es ayudar a entender las causas potenciales de variación
como respuesta y explicar cómo cada factor contribuye a esa variación. Esto se
consigue mediante relación estadística de la variación en la variable dependiente
con una variación de la variable causa o independiente y obtener el mejor ajuste al
minimizar la desviación entre lo predictivo y la respuesta real.

Este diagrama de dispersión de usa para estudiar la posible relación entre dos
variables, y probar las posibles relaciones entre causa y efecto. No permite probar
que una variable es causa de la otra, pero si consigue aclarar si se establecen
relaciones y la intensidad que se establece entre ambas.

Los beneficios que aporta la representación de un diagrama de correlación es que


puede proveer la relación entre varios factores y la respuesta de interés, por lo que
nos va a ayudar a tomar decisiones con el proceso bajo estudio y finalmente una
mejora del proceso.

Tiene habilidad para describir comportamientos en respuesta a datos consistentes,


comparar diferentes grupos relacionados, y analizar posibles causa-efecto entre
variables. Este tipo de análisis también puede contribuir a estimar la magnitud de
relación entre variables y descubrir fuentes de influencia que no habían sido bien
medidos u omitidos anteriormente, por lo que esta información ayuda a mejorar el
sistema de medición o el proceso.

Aunque este tipo de estudios presenta limitaciones, pues para realizar dicho
estudio se requieren conocimientos especiales para especificar el análisis de
regresión adecuado. Algunas veces un problema encontrado al desarrollar los

29
modelos de regresión es la presencia de datos los cuales su validez es
cuestionable. Siempre y cuando sea posible la validez de tales datos debe ser
investigada ya que pueden influir en los parámetros del método, y por tanto en los
resultados finales del proceso. Es importante simplificar las variables explicativas o
independientes, pues omitir una variable importante puede limitar seriamente el
modelo y utilidad de los resultados.

8. La media aritmética

Es un tipo de media que otorga la misma ponderación a todos los valores. La


media aritmética es lo que se conoce como media al uso. Sumamos todos los
valores y lo dividimos entre la cantidad de observaciones. Por ejemplo,
imaginemos que queremos saber a cuantos trozos de pizza tocamos. Hay 10
trozos y somos 5 personas. Si lo repartimos a partes iguales, el resultado será de
2 trozos por persona. Sin darnos cuenta, acabamos de calcular una media
aritmética.

Lo hacemos cada día constantemente y sin ser conscientes de ello. Otro ejemplo,
tengo 2 horas para realizar tres ejercicios de estadística. Así pues, dado que en
total tengo disponibles 120 minutos, dedicaré en promedio 40 minutos a cada
ejercicio. Puede que le dediquemos 60 minutos a uno y 30 minutos a cada uno de
los otros dos, sin embargo, nuestra cabeza lo suele calcular de este modo.

Símbolo de la media aritmética

El símbolo de la media aritmética es una X con una barra encima. Por lo que
quedaría así ↓

Símbolo de la media aritmética → x̄

Fórmula de la media aritmética

La fórmula de la media aritmética es la siguiente:

Fórmula media aritmética

Si la leemos de izquierda a derecha, veremos que hay tres partes. La primera es


el nombre, la segunda una fórmula pequeña y la tercera el desarrollo. La segunda
parte de la fórmula se lee tal que así: Sumatorio desde 1 hasta N de la variable x

30
dividido entre N. Adicionalmente, podríamos añadir un comentario que indicase:
con i entre 1 y N. Vamos a ver ahora, qué significa todo esto.

 Sumatorio: El sumatorio nos indica que debemos sumar un conjunto de


valores desde el primero, hasta el N. Así si existen 30 valores, deberemos sumar
el primero, el segundo, el tercero, … , y el treintavo.
 N: Representa el número total de observaciones. Por ejemplo, si tenemos el
peso de 10 manzanas individuales, N vale 10. Ya que tenemos 10 manzanas.
 x: La variable X es sobre la que calculamos la media aritmética. En este
caso sería el peso de las manzanas.
 i: Representa la posición de cada observación. En este ejemplo, podríamos
ponerle una etiqueta a cada manzana, la manzana 1, la manzana 2, etc.

Ejemplo de la media aritmética

Supongamos que nuestras calificaciones en la escuela son:

Asignatura Nota

Matemáticas 7

Educación Física 8

Biología 5

Economía 10

N = número total de asignaturas = 4

Entonces aplicando la fórmula que acabamos de exponer, el resultado sería:

31
Nuestra nota media será de un 7,5

9. La mediana

Es un estadístico de posición central que parte la distribución en dos, es decir,


deja la misma cantidad de valores a un lado que a otro.

Para calcular la mediana es importante que los datos estén ordenados de mayor a
menor, o al contrario de menor a mayor. Esto es, que tengan un orden.

La mediana, junto con la media y la varianza es un estadístico muy ilustrativo de


una distribución. Al contrario que la media que puede estar desplazada hacia un
lado o a otro, según la distribución, la mediana siempre se sitúa en el centro de
esta. Dicho sea paso, a la forma de la distribución se le conoce como curtosis.
Con la curtosis podemos ver hacia dónde está desplaza la distribución. Ver
curtosis

Fórmula de la mediana

Una vez definida la mediana vamos a pasar a calcularla. Para ello, necesitaremos
una fórmula.

La fórmula no nos dará el valor de la mediana, lo que nos dará es la posición en la


que está dentro del conjunto de datos. Debemos tener en cuenta, en este sentido,
si el número total de datos u observaciones que tenemos (n) es par o impar. De tal
forma que la fórmula de la mediana es:

 Cuando el número de observaciones es par:

Mediana = (n+1) / 2 → Media de las observaciones

 Cuando el número de observaciones es impar:

32
Mediana = (n+1) / 2 → Valor de la observación

Es decir, que si tenemos 50 datos ordenados preferiblemente de menor a mayor,


la mediana estaría en la observación número 25,5. Esto es el resultado de aplicar
la fórmula para un conjunto de datos par (50 es número par) y dividir entre 2. El
resultado es 25,5 ya que dividimos entre 50+1. La mediana será la media entre la
observación 25 y la 26.

En el próximo epígrafe lo veremos más detenidamente, con ejemplos visuales.

Ejemplo de cálculo de la mediana

Imaginemos que tenemos los siguientes datos:

2, 4, 12, 6, 8, 14, 16, 10,18.

En primer lugar los ordenamos de menor a mayor con lo que tendríamos lo


siguiente:

2, 4, 6, 8, 10, 12, 14, 16,18.

Pues bien, el valor de la mediana, como indica la fórmula, es aquel que deje la
misma cantidad de valores tanto a un lado como a otro. ¿Cuántas observaciones
tenemos? 9 observaciones. Calculamos la posición con la fórmula de la mediana
correspondiente.

Mediana = 9+1 / 2 = 5

¿Qué quiere decir este 5? Nos dice que el valor de la mediana, se encuentra en la
observación cuya posición es la quinta.

Por lo tanto la mediana de esta sería de datos sería el número 10, ya que está en
la posición quinta. Además, podemos comprobar como tanto a la izquierda del 5
hay 4 valores (2, 4, 6 y 8) y a la derecha del 10 hay otros 4 valores (12, 14, 16 y
18).

Otro ejemplo de la mediana

Imaginemos ahora que tenemos los siguientes números:

1, 2, 4, 2, 5, 9, 8,9.

33
Si los ordenamos tendríamos lo siguiente:

1, 2, 2, 4, 6, 8, 9,9.

En este caso, la cantidad de observaciones es par. Por tanto, de tener en cuenta


las consideraciones para el número de observaciones par. La fórmula nos indica lo
siguiente:

Mediana = 8+1 / 2 = 4,5

Claro que pensaréis, ¿cuál es la posición 4,5? O está en la posición 4 o está en la


posición 5, pero la 4,5 no existe. Lo que haremos será una media de los valores
que están en la posición 4 y 5. Esos números son el 4 y el 6. La media entre estos
dos números es 5 [(4+6) / 2].

El valor de la mediana, por tanto, sería 5. El número 5 (nos lo imaginamos) dejaría


al lado izquierdo (1, 2, 2 y 4) la misma cantidad de observaciones que al lado
derecho (6, 8, 9 y 9).

10. Modo percentil

Se conoce como percentil o centil a una de las más frecuentes medidas de


posición de datos, la cual implica la división del total de aquello que se está
midiendo en 99 partes para obtener un total de 100 partes iguales. De esta
manera, la totalidad de aquello que se está midiendo está representado en algún
lugar de estas 99 partes, y el o los datos concretos ocuparán una posición entre
dichas partes. Se trata de un tipo de cuantil o fractil, valores que permiten separar
datos en grupos con el mismo número de valores.
Dicho de otro modo, los percentiles son cada una de las posiciones que ocupan
unos datos cuando se divide la totalidad de los datos existentes en cien partes,
marcando la posición que deja por debajo de sí a un tanto por ciento determinado
de la población correspondiente con el valor del percentil per se (es decir por
ejemplo el percentil 1 es el que deja por debajo al 1%). Asimismo deja por encima
de sí otro tanto por ciento relevante.
Conceptos vinculados
El concepto de percentil se encuentra íntimamente ligado al de porcentaje, pero
sin embargo se trata de conceptos diferentes: mientras que el porcentaje es un
cálculo matemática que nos permite visualizar una cantidad determinada como
fracción entre cien partes iguales, el percentil nos indica la posición que tiene que
ocupar un dato para dejar por debajo al tanto por ciento correspondiente.

34
Asimismo, el percentil es un valor que también se asocia con otras medidas de
posición, como los cuartiles o los deciles. La diferencia radica en el número de
divisiones y la escala sobre la que observamos en qué posición está nuestros
datos. De hecho, los cuartiles y deciles se corresponden con diferentes
percentiles, dado que no dejan de ser la posición que ocupan unos datos en
diferentes escalas. Los diferentes cuartiles corresponden con los percentiles 25,
50 y 75, mientras que los deciles se corresponden con los percentiles 10, 20, 30,
40, 50, 60, 70 y 90.
¿Para qué sirven?
Saber qué es y cómo calcular un percentil, aunque no lo parezca, puede ser de
gran utilidad en múltiples ámbitos. El percentil no deja de ser un valor que nos
permite realizar comparaciones y ordenaciones entre sujetos, casos o grado de
existencia de un factor o variable en un conjunto, algo que nos permite trabajar a
un nivel muy fácilmente comprensible con conjuntos de datos más o menos
amplios y establecer una posición para los que estamos obteniendo.
Esto, a nivel práctico, puede ayudarnos a determinar por ejemplo si un atributo o
variable se encuentra dentro de valores normales o si se encuentran por debajo o
por encima de la media. Ejemplos de ello los encontramos en que resultan de
ayuda para determinar si una función neuropsicológica se encuentra o no alterada,
si los niveles de inteligencia se encuentran dentro de la normalidad si comparamos
los resultados de un sujeto con los de su población de referencia o si un niño tiene
un peso y altura cercano o lejano a la media para su edad.

 Quizás te interese: "Tipos de test psicológicos: sus funciones y


características"

Calcular percentiles: ¿cómo hacerlo?

Calcular percentiles es un proceso relativamente sencillo, bastando con tener


todos los datos representados del mismo modo y llevar a cabo un cálculo simple.
Sin embargo, para ello se requiere no solo tener un dato concreto, sino tener claro
qué tipo de puntuación se va a ordenar y con respecto a qué y quiénes se va a
realizar la comparación.
De hecho, si empleamos diferentes instrumentos de evaluación veremos con
frecuencia que existen tablas de referencia para valorar entre qué valores oscila
un percentil determinado para poder asociar los datos obtenidos
experimentalmente con dicho percentil. Estas se llevan a cabo con mediciones
exhaustivas con una muestra representativa de la población de referencia.

35
Cuando tenemos que calcular un percentil es necesario tener en cuenta en primer
lugar si estamos trabajando con datos ordenados o no ordenados. Cuando los
datos no están agrupados u ordenados, la posición en la que se halla el percentil
podrá calcularse dividiendo el producto del percentil por el número de elementos
de la muestra de la que partimos entre cien. La fórmula sería P= (k*n)/100.
Cuando estamos ante un conjunto de datos ordenado, podemos seguir la fórmula
Px=Lri+ ((kn/100 - Fa)/f) (Ac). Así, bastará con sumar el límite inferior de la clase
donde está el percentil a producto entre la amplitud de la clase y el cociente entre
la resta de la posición menos la frecuencia acumulada anterior y la frecuencia
total.
Asimismo, encontrar un percentil determinado de un conjunto de datos (por
ejemplo buscar el percentil 25 de un conjunto o base de datos) únicamente
requiere dividir el número de valores menores que el que tenemos por en número
total de valores y multiplicar este resultado por cien.

11. Parámetros de dispersión

Estudia la distribución de los valores de la serie, analizando si estos se encuentran


más o menos concentrados, o más o menos dispersos.

Existen diversas medidas de dispersión, entre las más utilizadas podemos


destacar las siguientes:

Rango o recorrido

Varianza

36
Desviación típica

Coeficiente de variación.

 Rango o recorrido: mide la amplitud de los valores de la muestra y se calcula por


diferencia entre el valor más elevado y el más bajo. Se representa por R

          R=xmax-xmin

   En nuestros ejemplos: ejemplo 1à R=3-0=3, ejemplo 2 à R=91-60=31

Varianza: es la media aritmética de los cuadrados de las desviaciones de todos los


datos o marcas de clase respecto a la media. Se representa por σ 2 o Var(x):

La varianza no tiene las mismas unidades que x (si x es metros s 2 será metros
cuadrados). Es por eso que se utiliza más la desviación típica.

37
12. Desviación estándar o típica

 Es la raíz cuadrada de la varianza. Tiene mismas dimensiones que la variable


estadística en estudio. Se denota por s

En la medida en que los parámetros de dispersión tomen valores más o menos


grandes esto nos indicara el grado de dispersión o alejamiento de los datos
respecto de la media. En el caso trivial que todos los datos centrados en un mismo
valor todos estos parámetros valdrían cero.

Coeficiente de variación: las medidas de dispersión estudiadas hasta ahora se


expresan en la misma medida que la variable estadística, designando medidas de
dispersión absolutas respecto de la media. Esto presenta los siguientes
problemas:

No podemos comparar distribuciones de distinta naturaleza (peso y altura) o


incluso de la misma naturaleza expresadas en distintas unidades.

No es relativa al valor de la media: la variación de 100€ respecto de 1.000€ es


mucho más significativa que la de los mismos 100€ respecto a 1.000.000€.

Estos problemas se resuelven con el coeficiente de variación, que es el cociente


entre la desviación típica y la media, siendo por tanto adimensional.

38
La desviación típica es la raíz cuadrada de la varianza.

Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de


desviación.

La desviación típica se representa por  .

Ejemplo

Calcular la desviación típica de la distribución:

39
 

Calculamos la media aritmética

Sustituimos en la fórmula de la desviación típica

Desviación típica para datos agrupados

Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son
equivalentes a las anteriores.

40
 

Ejemplo

Calcular la desviación típica de la distribución de la tabla:

41
 

Hemos añadido la columna   porque queremos hallar su sumatoria ,


que después dividiremos por   para obtener la media

Hemos añadido la columna   porque queremos hallar su sumatoria


, que después dividiremos por   y al resultado le restaremos la

media aritmética al cuadrado  , y por último haremos la raíz cuadrada del


resultado obtenido

13. Rango de distribución normal

a distribución normal adapta una variable aleatoria a una función que depende de
la media y la desviación típica. Es decir, la función y la variable aleatoria tendrán la
misma representación pero con ligeras diferencias.

Una variable aleatoria continua puede tomar cualquier número real. Por ejemplo,
las rentabilidades de las acciones, los resultados de un examen, el coeficiente de
inteligencia IQ y los errores estándar son variables aleatorias continuas.

Una variable aleatoria discreta toma valores naturales. Por ejemplo, el número de
estudiantes en una universidad.

La distribución normal es la base de otras distribuciones como la distribución t de


Student, distribución ji-cuadrada, distribución F de Fisher y otras distribuciones. 

Fórmula de la distribución normal

42
Dada una variable aleatoria X, decimos que la frecuencia de sus observaciones
puede aproximarse satisfactoriamente a una distribución normal tal que: 

Variable aleatoria X aproximada a una distribución normal.

Donde los parámetros de la distribución son la media o valor central y la


desviación típica: 

Parámetros de una distribución normal.

En otras palabras, estamos diciendo que la frecuencia de una variable aleatoria X


puede representarse mediante una distribución normal.   

Representación

Función de densidad de probabilidad de una variable aleatoria que sigue una


distribución normal.

Función de densidad de una distribución normal.

14. Propiedades de la curva normal.

Es una distribución simétrica. El valor de la media, la mediana y la moda


coinciden. Matemáticamente, 

43
Media = Mediana = Moda

Distribución unimodal. Los valores que son más frecuentes o que tienen más
probabilidad de aparecer están alrededor de la media. En otras palabras, cuando
nos alejamos de la media, la probabilidad de aparición de los valores y su
frecuencia descienden. 

¿Qué necesitamos para representar una distribución normal?

Una variable aleatoria. 

Calcular la media. 

Calcular la desviación típica. 

Decidir la función que queremos representar: función de densidad de probabilidad


o función de distribución. 

Ejemplo teórico

Suponemos que queremos saber si los resultados de un examen pueden


aproximarse satisfactoriamente a una distribución normal. 

Sabemos que en este examen participan 476 estudiantes y que los resultados
podrán oscilar entre 0 y 10. Calculamos la media y la desviación típica a partir de
las observaciones (resultados del examen).

Entonces, definimos la variable aleatoria X como los resultados del examen que
depende de cada resultado individual. Matemáticamente, 

La variable
aleatoria X representa la variable resultados del examen y puede aproximarse a
una distribución normal de media 4,8 y desviación típica de 3,09.

El resultado de cada estudiante se anota en una tabla. De esta forma,


obtendremos una visión global de los resultados y de su frecuencia.

Resultad Frecuenci
os a

0 20

44
1 31

2 44

3 56

4 64

5 66

6 62

7 51

8 39

9 26

10 16

TOTAL 476

Una vez hecha la tabla, representamos los resultados del examen y las
frecuencias. Si el gráfico se parece a la imagen anterior y cumple con las
propiedades, entonces, la variable resultados del examen puede aproximarse
satisfactoriamente a una distribución normal de media 4,8 y desviación típica de
3,09.

45
Histograma de frecuencias sobre la variable resultados del examen.

¿Los resultados del examen pueden aproximarse a una distribución normal?

Razones para considerar que la variable resultados del examen sigue una
distribución normal: 

Distribución simétrica. Es decir, existe el mismo número de observaciones tanto a


la derecha como a la izquierda del valor central. También, que la media, la
mediana y la moda tienen el mismo valor. 

Media = Mediana = Moda = 5

Las observaciones con más frecuencia o probabilidad están alrededor del valor
central. En otras palabras, las observaciones con menos frecuencia o probabilidad
se encuentran lejos del valor central. 

La variable resultados del examen sigue una distribución normal.

46
La variable resultados del examen sigue una distribución normal.

La distribución normal describe la variable aleatoria mediante una aproximación


que produce errores estándar (las barras encima de cada columna). Estos errores
son la diferencia entre las observaciones reales (resultados) y la función de
densidad (distribución normal). 

47
Como ya vimos, la curva normal tiene forma de campana y es simétrica. Por
ende, las tres medidas de centralización la media, la mediana y la moda
coinciden en el punto superior de la curva

Curva normal

Ciertas propiedades importantes de esta curva se relacionan con la manera en


que el área debajo de la curva de puede seccionar con líneas verticales con
origen en distintos puntos del eje horizontal. Para explorar estas vamos a
considerar algunos histogramas, el tipo de visualización que vimos en la
sección 2.3. El alto de cada barra es proporcional a la frecuencia de
observaciones y como el ancho de las barras es el mismo en todos los casos el
área de cada barra también es proporcional a la frecuencia de observaciones. El
ancho puede representar una sola unidad, o varias si agrupamos, por ejemplo
por rango etario como lo vemos en la figura 4.2, en el que hemos sacado una
muestra aleatoria de mil observaciones de un test de matemáticas a nivel
nacional. Los hemos agrupado por rangos de diez, es decir de 0 a 10, de 10 a
20 y así sucesivamente. Hemos sobrepuesto una curva normal teórica para
apreciar hasta qué punto se asemeja la distribución observada a la teórica.

48
: Muestra de notas de un test de matemática (N=1000)

Ahora, bien, si en lugar de agrupar las notas en grupos de diez  los podemos
también agregar en grupos de cinco.

49
Muestra de notas de un test de matemática (N=1000)

Podemos seguir achicando el ancho de las barras, y vemos que si bien el


histograma es puntudo mientras menos anchas son las barras más se aproxima
a la curva. En la figura 4.4 hemos achicado las barras para que cada una
represente tan solo un valor entero, es decir tan solo una de las cien notas
posibles. Se entiende que es posible seguir con más precisión si, por ejemplo, el
examen fue calificado con la posibilidad de asignar notas con decimales.

50
Muestra de notas de un test de matemática (N=1000)

La curva normal de define por dos propiedades: La media y la desviación


estándar. Si conocemos estos dos valores es posible construir la curva
aplicando una fórmula 14 un tanto compleja y con poca importancia fuera del
ámbito plenamente teórico.

De más importancia son algunas propiedades que tiene la curva. Si graficamos


la curva normal y expresamos los valores en el eje horizontal en desviaciones
estándares (también se dice «sigmas» por su letra griega σσ), el área que está
de cada lado de la línea es constante y conocido. Si trazamos una linea justo en
el medio (σ=0σ=0), sabemos que un 50% de las observaciones están a la
derecha y la izquierda de esa linea. Lo mismo aplica a una distribución
expresado en un histograma. En la figura 4.5 vemos cuales son los cortes para
desviaciones estándares de menos 3 a 3.

51
Área debajo de la curva normal

Esta propiedad es de bastante utilidad y se puede aprovechar de varias


maneras. Si tenemos una muestra de datos cuya distribución presumimos
normal (en la sección 7.2 vamos a desarrollar cómo lo podemos determinar) ya
sabemos que más o menos el 68% de las observaciones va estar dentro de ±
una desviación estándar de la media y más del 95% se encontrará dentro de
dos desviaciones. Por último el 99% de las observaciones de encuentran dentro
de tres desviaciones estándares de la media. A veces se refiere a esta
propiedad como la regla empírica o la regla de  68-95-99,7.

Variables normalizadas

En textos de estadística frecuentemente se habla de variable normalizada,


también se conoce como unidad tipificada, variable centrada reducida o variable
estandarizada. Normalizar una variable es simplemente expresar su magnitud
en unidades de desviación estándar. Para lograr ello tomamos la variable,
restamos la media y dividimos por la desviación estándar. En literatura en inglés

52
es de uso frecuente el término «z-score», por lo que su definición formal
(véase 4.1) lleva esta letra.

Definición (Variable normalizada) La variable normalizada z de un conjunto de


datos X se obtiene por la fórmula siguiente:

z=x−¯xσz=x−x¯σdonde:

z: la variable normalizada

x: una observación de X

¯xx¯: la media de las observaciones

σσ o s: la desviación estándar de la población o muestra respectivamente.

Es importante entender que normalizar una variable no cambia su valor, solo su


unidad de cuenta: Es lo mismo comprar medio kilo de queso que comprar
quinientos gramos.

Normalizar las variables nos permite comparar su distribución


independientemente de su unidad de cuenta y amplitud, también nos permite
sacar conclusiones sobre probabilidades y proporciones. Vamos a desarrollar
esta idea por medio de un ejemplo.

En el 2007 el Ministerio de Salud de Argentina realizó un


estudio (ENNyS 2007) que entre otras recopiló datos sobre la estatura de las
argentinas entre 19 y 49 años. La media fue de 161,01 centímetros con una
desviación estándar de 6,99. Con estos datos podemos construir nuestra curva.

53
Estatura de argentinas entre 19 y 49 años

Ahora, sabiendo que esta variable tiene una distribución normal podemos saber
que casi el 70% de las argentinas miden entre 154,04 y 168 centímetros.
También podemos encontrar respuesta a una pregunta como: ¿qué proporción
de la población femenina mide más que 175 centímetros? Para ello tenemos
que normalizar el dato así:

z=175−161,016.99=13,996.99=2,001z=175−161,016.99=13,996.99=2,001

Con este número podemos volver a la figura 4.5 y fijarnos que con por arriba de
2 desviaciones estándar (o 2σσ) está el 2,2% de la población.

54
Proporción de argentinas que miden más de 175 centímetros

En este caso tuvimos un poco de suerte ya que la variable normalizada resultó


un número redondo que era fácil encontrar en la figura 4.5. Ahora digamos que
queremos conocer la proporción de la población que mide menos de 150
centímetros, ¿cómo hacemos? Primero normalizamos:

z=150−161,016.99=11,016.99=−1,575z=150−161,016.99=11,016.99=−1,575

Con este número podemos sacar la proporción por ejemplo calculando el área
debajo del segmento de la curva con cálculos integrales, lo podemos buscar en
una tabla de probabilidades o podemos recurrir a la función pnorm (p:
probabilidad, norm: normal) de R así:

pnorm(-1.575)

## [1] 0.05762822

55
Entonces el 5,76% de la población de argentinas entre 19 y 49 años miden
menos de un metro con cincuenta.

También podemos expresar esto en términos de probabilidades: Si medimos


una mujer argentina de entre 19 y 49 años seleccionada aleatoriamente de la
población, la probabilidad de que mida menos de 150 centímetros es de 5,76%
(p=0,0576).

15. Gráfica de corrida

Una gráfica de corridas del sistema de medición es una gráfica de todas las
observaciones por operador y número de parte. La gráfica de corridas del sistema
de medición es una de las gráficas más útiles que puede utilizar para evaluar las
diferencias de las mediciones entre operadores diferentes y partes diferentes.

La gráfica permite ver patrones obvios en los datos. Por ejemplo, usted podría
observar que las mediciones de un operador son consistentemente más altas que
las de los demás o que las mediciones de ciertas partes varían más cuando se
comparan con otras partes.

La gráfica de corridas contiene los siguientes elementos:

Puntos graficados

Los valores de medición individuales. Las diferentes combinaciones de


color/símbolo representan a cada operador.

Línea de referencia horizontal (media)


La media general de las mediciones o un valor ingresado con base en el
conocimiento histórico del proceso.

Líneas verticales
Divisores que separan las mediciones por parte.

Ejemplo de una gráfica de corridas del sistema de medición


Por ejemplo, usted tiene tres operadores que miden 10 partes, tres veces
cada una:

56
Se dibuja una línea de referencia horizontal en la media, que se puede
calcular a partir de los datos o de un valor que usted ingrese con base en
su conocimiento previo del proceso. En esta gráfica, usted puede ver las
diferencias en las mediciones entre los diferentes operadores y partes, tales
como:

 Mientras los operadores A y C tienden a medir sus tres réplicas de una


manera relativamente consistente, el operador B no es consistente en los
diferentes ensayos con varias partes.
 Las mediciones de la parte 9 son mucho más altas que la media y las
mediciones de la parte 10 son mucho más bajas que la media.
 En promedio, el operador C tiende a realizar mediciones levemente más
bajas que las de los otros operadores.
16. Capacidad del proceso.

 Generalmente se usan dos índices para evaluar la capacidad del proceso


para producir dentro de especificaciones:
 Cp.: índice de capacidad potencial del proceso. No toma en cuenta la media
observada del proceso.
 Cpk: índice de capacidad o habilidad real del proceso. Si toma en cuenta la
media observada en el proceso.
 Los índices de capacidad del proceso intentan resumir en un solo número si
un proceso puede cumplir consistentemente con los requerimientos
impuestos sobre un proceso por los clientes. Como estos índices no tienen
unidades, permiten comparar dos procesos completamente diferentes. La

57
limitante principal de estos índices es que no tienen significado si los datos
analizados provienen de un proceso fuera de control dado que la capacidad
del proceso es una predicción y esto sólo se puede hacer si hay estabilidad.
Por tanto para estimar la capacidad de un proceso, es necesario que el
proceso esté bajo control y que la variable siga una distribución normal.
 Se define el  LSTN – límite superior de tolerancia natural y el LITN – límite
inferior de tolerancia natural como el valor de la media + 3 y
-3 respectivamente. 6 se puede considerar como la dispersión real del
proceso y entonces entre ambos límites se encontrará el 99.73% de las
observaciones. La diferencia entre el LSE (límite superior de especificación)
y el LIE (límite inferior de especificación), se puede considerar como la
dispersión permitida del proceso.
 El índice de capacidad del proceso se determina por la fórmula:


 Si se cumple que el proceso está bajo control podemos interpretar Cp. de la
siguiente manera:
 Cp. > 1; el proceso es potencialmente capaz de producir dentro de los
límites de especificación y genera un porcentaje de defectuosos menor del .
27%
 Cp. = 1; el proceso es apenas capaz, la proporción de defectuosos es .
27%. Los límites de especificación son iguales a los límites de tolerancia
natural.
 Cp. < 1; el proceso no es potencialmente capaz, la proporción de
defectuosos es mayor a 27 en 10000.
 Cpk se determina por la fórmula:

 Cpk es un índice o medida del desempeño real del proceso que toma en
cuenta la media del mismo. Un proceso con su media en el centro de los
límites de especificaciones puede tener un Cp. de 1, mientras que otro
proceso con su media más cercana a uno de los límites de especificación
también puede tener un Cp. de 1, considerando que su dispersión sea la
misma. Si se compara el desempeño de ambos procesos con base en Cpk,
los resultados son diferentes.

 Un índice Cpk de 1 indica que la variación del proceso está centrada dentro
de los límites superior e inferior de especificaciones. Cuando el índice
supera a 1 el proceso se orienta más al objetivo y tiene menos unidades

58
defectuosas. Si el Cpk es inferior a 1, el proceso no cumplirá con las
especificaciones.
 En la siguiente figura se muestran tres procesos. El proceso marcado en
rojo está centrado y tiene un Cp. > 1. El proceso marcado en verde está
centrado pero Cp. < 1 y evidentemente habrá una producción defectuosa
superior al 0.27%. El proceso marcado en azul no está centrado y tiene una
dispersión grande por lo que habrá una producción significativa que no
cumplirá con el LIE.
 

59

También podría gustarte