Está en la página 1de 6

La estadística descriptiva es una ciencia que analiza una serie de datos en específico, y

trata de extraer conclusiones sobre como se comportan estas variables a partir de gráficos
o imágenes. La estadística descriptiva es la que se basa en los datos, lo contrario de la
estadística inferencial que trata de hacer suposiciones a partir de una muestra de datos.
La estadística descriptiva es de suma importancia en el mundo actual y en las empresas,
sobre todo en los negocios, ya que con ésta se pueden alcanzar aproximaciones muy
precisas de lo que está pasando en el entorno, lo que facilita la visualización de los datos
de un proceso.
Las variables de salida o respuesta de un proceso deben cumplir con ciertas metas y/o
especificaciones. Una tarea primordial del control de calidad es conocer la capacidad o
habilidad de un proceso. Esto permitirá saber en qué medida tal característica de calidad
es satisfactoria. En este resumen se presentan las principales técnicas de estadística
descriptiva para el análisis de una variable, como representarlas y como dar un control de
calidad y de capacidad de las empresas al ver los datos dados.

MEDIDAS DE TENDENCIA CENTRAL


La tendencia central es el valor en torno al cual los datos o mediciones de una variable
tienden a aglomerarse o concentrarse. Esto permitirá saber si el proceso está centrado; es
decir, si la tendencia central de la variable de salida es igual o está muy próxima a un
valor nominal deseado. Las tres medidas de la tendencia central son: media, mediana y
moda.

 MEDIA MUESTRAL
Medida de tendencia central que es igual al promedio aritmético de un conjunto de datos,
que se obtiene al sumarlos y el resultado se divide entre el número de datos. La media
muestral se obtiene sumando todos los datos y el resultado de la suma se divide entre el
número de datos (n).

 MEDIA POBLACIONAL O DEL PROCESO


La media del proceso, denotada por la letra griega μ (mu), se obtiene calculando el
promedio utilizando todos los elementos de la población a disposición. Es importante notar
que la media del proceso μ es igual en todo valor, aunque este no siempre se conoce. El
valor de x̄, por otro lado, se obtiene en cada muestra y es diferente para cada una de ellas,
ya que su valor depende del fragmento seleccionado.
 MEDIANA
La mediana es una medida de tendencia central que es igual al valor que divide a la mitad a
los datos cuando son ordenados de menor a mayor. Para calcular la mediana cuando el
número de datos es impar, éstos se ordenan de manera creciente y el que quede en medio de
dicho ordenamiento será la mediana. Pero si el número de datos es par, entonces la mediana
se calcula dividiendo entre dos la suma de los números que están en el centro del
ordenamiento.

 MODA
La moda es la medida de tendencia central de un conjunto de datos que es igual al dato que
se repite más veces. Si varios datos se repiten el mismo número de veces, entonces cada
uno de ellos es una moda, y se dice que el conjunto de datos es multimodal.

 LAS MEDIDAS DE TENDENCIA CENTRAL SON INSUFICIENTES COMO


CRITERIO DE CALIDAD
Para describir la tendencia central de los datos, es imprescindible apoyarse tanto en la
media como en la mediana y la moda. Cuando la media es muy diferente a la mediana es
señal de que existen datos atípicos o hay un sesgo importante. En resumen, las medidas
de tendencia central son insuficientes como criterio de calidad, ya que no toman en cuenta
qué tan dispersos están los datos, un hecho vital para la calidad.

MEDIDAS DE DISPERSIÓN O VARIABILIDAD


Existen cuatro formas de medir la variabilidad.

 DESVIACIÓN ESTÁNDAR MUESTRAL


La desviación estándar muestral es la medida más usual de variabilidad e indica qué tan
esparcidos están los datos con respecto a la media. Esto es un elemento vital en el estudio
de capacidad de un proceso.
 DESVIACIÓN ESTÁNDAR POBLACIONAL
Al calcular la desviación estándar se emplean todos los elementos de la población o
proceso, por lo que se obtiene la desviación estándar poblacional y se denota con la letra
griega sigma (σ ).
El cuadrado de la desviación estándar, S2, conocido como varianza muestral, es muy
importante para propósitos de inferencia estadística. Y en forma equivalente σ2 es la
varianza poblacional.
Otra medida de dispersión es el rango o recorrido, R, que es igual a la diferencia entre el
dato mayor y el dato menor de un conjunto de datos. El rango mide la amplitud de la
variación de un grupo de datos, y también es independiente de la magnitud de los datos.
El coeficiente de variación, CV, es una medida de variación que es relativa a la magnitud
de los datos, ya que es igual a la magnitud relativa de la desviación estándar en
comparación con la media de los datos. El CV es útil para comparar la variación de dos o
más variables que están medidas en diferentes escalas o unidades de medición.
La interpretación de la desviación estándar se hace en combinación con la media. Es
necesario tomar en cuenta, en caso de hacer estas comparaciones, que lo que se observa
en una muestra es variable, y por lo general pequeñas diferencias muestrales no implican
diferencias entre procesos o lotes.

RELACIÓN ENTRE x̄ Y S
Una forma de apreciar claramente el significado de la desviación estándar como medida de
dispersión en torno a la media, es a través de la relación entre ambos estadísticos, la cual
está dada por la desigualdad de Chebyshev y la regla empírica.
La desigualdad de Chebyshev afirma que al menos (1 − 1/k2) × 100 de los datos están entre
x̄ − kS y x̄ + kS; es decir, ese porcentaje de datos estará dentro de k desviaciones estándar a
partir de la media, donde k es cualquier número más grande que 1.
La regla empírica es el resultado práctico que relaciona a x̄ y S, y establece el porcentaje de
datos de la muestra que cae dentro del intervalo (x̄ − kS, x̄ + kS) con k = 1, 2, 3.
El teorema de Chebyshev se aplica para cualquier tipo de datos, independientemente de su
comportamiento o distribución. Mientras que la regla empírica es válida para muchos de los
casos que se dan en la práctica, sobre todo si los datos tienen un comportamiento con cierto
grado de similitud a una campana o a la distribución normal.

LIMITES REALES Y NATURALES


Los límites reales o naturales de un proceso indican los valores entre los cuales varía la
salida de un proceso. Estos límites reales se comparan con las especificaciones o tolerancias
para una variable.
Límite real inferior (LRI) = μ − 3σ y Límite real superior (LRS) = μ + 3σ

HISTOGRAMA Y TABLA DE FRECUENCIAS


El histograma es una representación gráfica de la distribución de un conjunto de datos o
variable, donde los datos se dividen en un número específico de contenedores en función de
su magnitud. Permite visualizar la tendencia central, la varianza y la forma de la
distribución. El histograma se obtiene de la tabla de frecuencias.
La tabla de frecuencia es una representación tabular de la distribución de datos, dividida en
un número específico de contenedores según su tamaño.
La tabla se obtiene dividiendo primero el rango de variación de los datos en un número de
intervalos que cubren todo el rango y luego determinando cuántos datos caen en cada
intervalo.
Para determinar un valor entre este rango, existen varios criterios; Uno de ellos dice que el
número de clases debe ser aproximadamente igual a la raíz cuadrada del número de datos.
Otro criterio, conocido como regla de Sturges, establece que el número de clases es igual a
1 + 3,3 * log10 (número de datos).

 INTERPRETACIÓN DEL HISTOGRAMA


Interpretación del histograma
- Observar la tendencia central de los datos: Localizar en el eje horizontal o escala de
medición las barras con mayores frecuencias.
- Estudiar el centrado del proceso: Observar la posición central del cuerpo del histograma
con respecto a la calidad óptima y a las especificaciones
- Examinar la variabilidad del proceso: Comparar la amplitud de las especificaciones con el
ancho del histograma. Para considerar que la dispersión no es demasiada, el ancho del
histograma debe caber de forma holgada en las especificaciones.
- Analizar la forma del histograma: Considerar que la forma de distribución de campana es
la que más se da en salidas de proceso y tiene características similares a la distribución
normal
 TIPOS DE DISTRIBUCIÓN EN EL HISTOGRAMA
- Distribución sesgada: Desplazamiento izquierdo o derecho de un proceso debido a
desgastes o desajustes o por un desempeño especial del proceso. Incluso hay características
de calidad como el tiempo de vida y la resistencia a la fatiga con sesgo natural.
- Distribución multimodal: Cuando hay 2 o más modas, lo que refleja la presencia de 2 o
más realidades o condiciones diferentes. Algunas situaciones que lo propician son
diferencias importantes de lote a lote en materia prima, intervención de varios operadores
con distintos métodos de trabajo, el proceso fue operado en condiciones desiguales, etc.
- Distribución muy plana: Las situaciones que pueden causar esto son las mismas que las de
la distribución multimodal, pero con la particularidad de que las diferencias son menos
fuertes.
- Distribución con acantilados: Es una suspensión o corte muy brusco en la caída de la
distribución, se puede ocasionar por problemas con equipo de medición, errores de
medicino o inspección, una exhaustiva depuración del lote debido a productos fuera de los
parámetros establecidos, etc.

MEDIDAS DE FORMA
Las medidas de forma son las que nos permiten ver si una distribución de frecuencia tiene
características como la simetría, asimetría, nivel de concentración de datos y nivel de
apuntamiento que la clasifiquen en un tipo particular de distribución, todas características
de forma como su nombre lo indica.
Una medida numérica del sesgo o asimetría en la distribución de un conjunto de datos se
obtiene a través del sesgo y del sesgo estandarizado

DIAGRAMA DE CAJA
Es una representación gráfica de la distribución de un conjunto de datos que se basa en
cuartiles. Sirve para análisis comparativos de procesos, tratamientos y de estratos en
general

RANGO INTERCUARTÍLCO
Determina el rango en el que se ubican 50% de los datos que están en el centro de la
distribución. Es igual a la distancia entre el cuartil inferior (1) y el superior (3).

También podría gustarte