Está en la página 1de 21

Estadística descriptiva: La calidad y la variabilidad

Obtención de datos

Cuando se desea tomar una decisión importante, como


resolver un problema de raíz, es necesario contar con una
información que permita identificar cuándo, dónde y en qué
condiciones se da tal o cuál problema; es decir se debe de
contar con su regularidad estadística y sus fuentes de
variabilidad.

Una vez localizado el problema, definidos los objetivos e


identificado el tipo de información que se necesita, surgen
entre otros, las siguientes interrogantes: Cómo obtener tal
información, en qué cantidad y cómo analizarla. Para estas
tres cuestiones la respuesta la proporciona esencialmente la
estadística.
La variabilidad y el pensamiento estadístico

La variación es parte de nuestra vida diaria: el tiempo que


tardamos de nuestra casa a nuestro trabajo o escuela es
diferente de un día a otro; la temperatura del ambiente es
diferente de una hora a otra, etc. Esta variación que ocurre en
nuestras vidas también ocurre en los resultados de los
procesos, ya que son generados por la interacción de
Materiales, máquinas, mano o mente de obra (gente),
mediciones, medio ambiente y métodos. Estos elementos, las
6M, determinan de manera global todo proceso, y cada uno
aporta parte de la variabilidad (y de la calidad) de los
resultados de un proceso.
Tipos de variables

En función de los valores que pueden tomar:

Son aquellas cuyos valores repre-


sentan categorías o atributos que
Cualitativas o de atributos
no tienen como base una escala
numérica

Variables discretas son variables


Cuantitativas que con frecuencia
proceden de conteos y solo
pueden tomar valores dentro de
un conjunto numerable
Cuantitativas
Variables continuas son variables
cuantitativas que pueden tomar
cualquier valor en un intervalo de
números reales
Por su función en un proceso:

• Variables de entrada.- Son variables que reflejan las condiciones de operación


de un proceso o sus insumos, también llamadas variables independientes (las X)

• Variables de salida.- Son aquellas que reflejan los resultados de un proceso


como pueden ser las características de calidad del producto, también llamadas
variables dependientes o de respuesta (las Y).

Existen tres tipos de variables de salida o características de calidad, de acuerdo con


el tipo de especificación que deben cumplir:

• Cuanto más pequeño mejor, es decir no deben de exceder cierto valor máximo
como por ejemplo, el porcentaje de impurezas en una sustancia.

• Cuanto más grande mejor. Son variables a las que se les exige sean mayores a un
valor mínimo o cierta especificación inferior, ejemplo: la resistencia de una pieza
de plástico inyectado, etc.

• El valor nominal es mejor. Variables que deben tener un valor específico y que
por lo tanto deben estar entre una especificación inferior y una mayor, ejemplo:
el diámetro interior de una tuerca o la longitud de una pieza de ensamble.
Una tarea primordial del control de calidad es conocer que tanto los valores
de una variable de salida de un proceso son satisfactorios, y saber de esa
manera si el proceso es capaz de cumplir las especificaciones de esa variable.
Por ello es necesario tomar datos de esa variable y analizarlos
adecuadamente.
Análisis Gráfico

Minitab nos da la posibilidad de generar un análisis gráfico dependiendo de lo


que necesitemos
ESTADISTICA

Distribuciones estadísticas

Se puede describir el comportamiento de cualquier proceso o sistema graficando


múltiples datos de la misma variable:

• Por tiempo
• Por producto
• Por máquina, etc.

La acumulación de esos datos puede ser vista como una distribución de valores
Representada por:

• Puntos
• Histogramas
• Una curva normal u otras distribuciones «suavisadas»
ESTADISTICA

Distribución de puntos (Dot Plot)

Imagine un proceso de lavado de autos el cual es medido en minutos. El


proceso es medido para 150 autos y registrado en una gráfica. Cada punto
representa un evento. Al ir acumulándose los puntos se puede ver el
desempeño del proceso como una distribución de valores.
ESTADISTICA

Histograma

Ahora imagine los mismos datos agrupados en intervalos con el número de veces
que los datos caen en un intervalo dado, determinando la altura de la barra de
intervalo.
ESTADISTICA

Distribución normal

Finalmente, podemos ver los datos como una distribución suavisada (línea), así se
provee una aproximación de como se verían los datos si recopilaramos un
número infinito de valores.
ESTADISTICA

Medidas de tendencia central

Media: Promedio aritmético de todos los datos

Media poblacional

• Refleja la influencia de todos los valores


• Es influenciado fuertemente por los valores extremos

Ejem. Los siguientes datos representan el sueldo semanal de 7 trabajadores de


cierta área de una empresa:
$1100; $1300; $1000; $1500; $800; $1600; $1100
entonces la media es : $1200
ESTADISTICA

Mediana: Medida de tendencia central que es igual al valor central que divide los
datos a la mitad cuando son ordenados de menor a mayor.

Cuando el número de datos es par, entonces la mediana se calcula dividiendo entre


dos la suma de los números que están en el centro del ordenamiento.

• No necesariamente se incluyen todos los valores en su calculo


• Es menos sensible a los valores extremos

En el caso del sueldo de los trabajadores, para calcular la mediana se ordenan los
datos:

$800; $1000; $1100; $1100; $1300; $1500; $1600

Entonces, como el número de datos es impar (n=7), la mediana es $1100


ESTADISTICA

Moda: Medida de tendencia central de un conjunto de datos que es igual al dato


que se repite más veces.

En el caso del sueldo de los trabajadores, para calcular la moda hay que buscar cuál
es el valor que más se repite

$800; $1000; $1100; $1100; $1300; $1500; $1600

Entonces, la moda es igual a $1100


Medidas de dispersión
Se refiere a las diferencias que se hallan entre los datos de un conjunto

Desviación estándar muestral.- Medida de la variabilidad que indica que tan


esparcidos están los datos de la muestra respecto a la media (S)

Desviación estándar poblacional o del proceso.- Medida de variación de un


proceso, para su cálculo se debe utilizar un número grande de datos que
hayan sido obtenidos en el transcurso de un lapso de tiempo, se denota con
la letra griega sigma (σ)
Varianza muestral.- Medida de variación que es igual al cuadrado de la desviación
estándar (S2) y es importante para propósitos de inferencia estadística. Y en
forma equivalente, σ2 es la varianza poblacional.

Rango o recorrido.- Medición de la variabilidad de un conjunto de datos que es el


resultado de la diferencia entre el dato mayor y el dato menor de tal conjunto.
Distribución Normal
La distribución normal es una distribución de datos que tiene ciertas
propiedades consistentes

• Una distribución normal puede ser descrita completamente conociendo


su media y su desviación estándar.

• El área bajo secciones de la curva puede ser usada para estimar la


probabilidad acumulativa de que cierto evento ocurra.

Estas propiedades pueden ser muy útiles para entender las características
del proceso del que fueron obtenidos los datos.

La mayoría de los fenómenos naturales y los procesos hechos por el


hombre tienen una distribución normal o pueden ser representados por
una distribución normal a través de una transformación.
Propiedad #1

Una distribución Normal puede ser descrita completamente conociendo:


La media y la desviación estándar

¿Cuál es la diferencia entre estas tres distribuciones?


Propiedad #2

El área bajo secciones de la curva puede ser usada para estimar la probabilidad
acumulativa de que cierto evento ocurra.
Regla empírica para la desviación estándar

Las reglas previas de la probabilidad acumulativa aplican aún cuando el grupo de


datos no es perfectamente Normal.

Comparemos los valores para una distribución teóricamente (perfecta) Normal


con una del mundo real (empírica).
De la regla empírica anterior se da origen a lo que se conoce como
límites naturales o reales de un proceso. Sea µ la media y σ la
desviación estándar del proceso, entonces los límites reales o
naturales del proceso están dados por:

Límite real inferior (LRI) = µ - 3 σ


Límite real superior (LRS) = µ + 3 σ

Dentro de esos límites se ubicarán los valores de la variable de salida


correspondiente.

También podría gustarte