Está en la página 1de 90

Control Estadístico de Procesos

Aplicado a la Industria Alimentaria

Bucay agosto 30-31, 2023

Óscar Aguirre Santana


oas
Contenido

1 Conceptos básicos • Estadística


• Población / Muestra
• Variables

2 Agrupamiento de datos • Datos


• Tablas de frecuencia
• Histogramas

3 Medidas descriptivas • Medidas de tendencia central


• Medidas de dispersión
• Relación entre la media y la desviación
estándar
• Estimación de los parámetros m y s
• Medidas de forma
• Medias de posición
• Estudio de capacidad

oas
Contenido

4 Distribuciones de probabilidad • Binomial


• Poisson
• Normal

5 Capacidad de procesos • Doble especificación


• Una especificación
• Largo plazo
• Métrica seis sigma
• Estudio integral de capacidad

6 Cartas de control • Variación


• Cartas de control para variables
• Interpretación de las cartas de control
• Cartas de control para atributos
• Estudio integral de capacidad
• Estudio de capacidad

oas
Prólogo:

• El control estadístico ha demostrado su utilidad tanto en las


empresas de manufactura como de servicio, ya que con las
exigencias de mejora a la que se ven expuestas las
organizaciones debido a la alta competitividad de los mercados
globalizados, se ha hecho más evidente la necesidad de ampliar
la comprensión y utilización del pensamiento estadístico, y
aplicar conceptos y técnicas estadísticas para una diversidad de
tareas y propósitos.

• La influencia de la Estadística se ha extendido ahora a la


agricultura, biología, negocios, química, comunicaciones,
economía, educación, electrónica, medicina, física, ciencias
políticas, psicología, sociología y otros muchos campos de la
ciencia y la ingeniería.

oas
Objetivos:

• El propósito de este curso es abordar los principales conceptos y


métodos del control estadístico de procesos, que serán de
utilidad con independencia del campo de interés específico del
participante.

1. Conocer las diversas medidas de tendencia central,


dispersión, forma y posición; así como su interrelación.
2. Conocer las características y definiciones de las principales
distribuciones de probabilidad: binomial, poisson y normal.
3. Identificar los índices de capacidad para variables con doble
especificación y una especificación.
4. Realizar amplios estudios de capacidad de un proceso.
5. Identificar las comunes y especiales de variación.
6. Conocer la función práctica de las cartas de control.
oas
¿Es importante estudiar Estadística?

¿Por qué razón?

oas
“Los datos por si solos son
entes inertes, sin ninguna
utilidad; adquieren valor
únicamente cuando son
procesados, modelados,
analizados e interpretados,
y se convierten en
información útil para la
toma de decisiones”.
oas
Algunos paquetes estadísticos:

oas
Excel:

“19 herramientas para análisis


de datos”
“98 funciones estadísticas”

oas
TEMA I

Conceptos básicos

Estadística / Población / Muestra / Variables

oas
Conceptos básicos

• Estudio estadístico:

Situación Recolección Técnicas


inicial de datos de muestreo

Datos
brutos

Estadística
Descriptiva

Informaciones

Estadística
Inferencial

Conclusiones y Toma
previsiones de decisión

Figura 1.1 Estudio estadístico.


oas
Conceptos básicos

Estadística:
• Ciencia que recoge, organiza, presenta, analiza e interpreta
datos con el fin de propiciar la toma de decisiones más eficaz.

Estadística Descriptiva (Deductiva):


• Se ocupa de datos experimentales, más específicamente de la
recopilación, organización y análisis de datos sobre alguna
característica de ciertos individuos pertenecientes a la población
o universo.

Estadística Inferencial (Inductiva):


• Permite realizar conclusiones o inferencias, basándose en los
datos simplificados y analizados de una muestra hacia la
población o universo.

oas
Conceptos básicos

Población y muestra, parámetros y estadísticos:


• Una población o universo es una colección o totalidad de
posibles individuo, especímenes, objetos o medidas de interés
sobre los que se hace un estudio.

• Las poblaciones pueden ser finitas o infinitas.

• Si es finita y pequeña se pueden medir todos los individuos para


tener un conocimiento “exacto” de las características
(parámetros) es esa población.

• Si la población es infinita o grande es imposible e incosteable


medir a todos los individuos, en este caso se tendrá que sacar
una muestra representativa de dicha población, y con base en
las características medidas en la muestra (estadísticos) se
podrán hacer afirmaciones acerca de los parámetros de la
población (figura 1.2).
oas
Conceptos básicos
Población Muestra
“N” “n”

Aleatoriamente

Inferencia

Parámetros Estadísticos
(desconocidos) (conocidos)

𝜇 =? 𝜎 =? 𝑥ҧ =? 𝑠 =?

Figura 1.2 Relación entre población y muestra, parámetros y estadísticos. oas


Conceptos básicos

Variable
• Una variable es una característica de interés que posee cada
elemento de una población y que podemos medir.

Variables

Cuantitativas Cualitativas
Pueden expresarse de manera numérica Se mide de manera no numérica

Continuas Discretas Nominales Ordinales

Está limitada a
Si sus valores no Si sus valores se
Puede tomar ciertos valores,
se pueden pueden ordenar.
cualquier valor generalmente
ordenar. Género, Escolaridad,
dentro de un números
Grupo Grado de
rango dado. enteros. Número
Sanguíneo, satisfacción,
Altura, edad, de alumnos,
Religión, Lugar Intensidad de
peso. Número de
de nacimiento. dolor.
grupos.

Figura 1.3 Tipos de variables. oas


Conceptos básicos
Ejercicio 1.1:
• Clasifiqué las siguientes variables en cualitativas (CL) o
cuantitativas (CT), en caso de ser cuantitativas diga además si son
discretas o continuas:
•Peso promedio en pie de 10,000 pollos.
•Ganancia diaria de peso.
•Mortalidad (%).
•Estado civil de una persona.
•Consumo de alimento diario (kg alimento/animal/día).
•Índice de conversión alimenticia (kg alimento/kg peso vivo).
•Inversión por unidad de producto ($/kg peso vivo producido).
•Causa de muerte de un pollo.
•Edad de destete en días.
•Número de pollos nacidos vivos.
•Porcentaje de pollos nacidos vivos.
•Estado de salud de un pollo.
•Número de pollos con defectos.
•Nivel socioeconómico. oas
TEMA II

Agrupamiento de datos

Datos / Tablas de frecuencia / Histogramas

oas
Datos

• En cualquier empresa se recogen numerosos datos, cuyo análisis


ordenado a través de sencillas técnicas estadísticas nos van a
permitir estudiar y comprender la forma como se está trabajando
y tomar decisiones para mejorar nuestros procesos o servicios.

• Producción • Calidad de procesos


• Calidad • Calidad de materiales
• Microbiología • Condiciones de operación
• Costos Para • Cantidad producida
• Seguridad • Rentabilidad
• Etc. • Etc.

“A veces se tienen datos pero no se sabe que hacer con


ellos, o lo contrario; hay muchos datos que sería
interesante tener, pero que no son recopilados”.
oas
Datos

• Pueden utilizarse varias herramientas básicas para describir y


resumir un conjunto grande de datos.

• La manera más simple, pero quizás la más significativa, es la


serie ordenada.

Ejemplo 2.1:
El peso (kg) de cinco personas es 75, 73, 91, 83 y 80.

Ascendente Descendente

• Extremos en • Valor medio


73 y 91 kg aprox. 80 kg

Figura 2.1 Serie ordenada: ascendente/descendente.


oas
Distribución de frecuencias

• La distribución de frecuencias es una herramienta que se emplea


para resumir, mediante una tabla, numerosos datos de manera
que se ponga de manifiesto la localización y la dispersión de las
observaciones.

Valor de la Frecuencia Frecuencia absoluta Frecuencia Frecuencia relativa


variable absoluta (f) acumulada (F) relativa (fr) acumulada (Fr)

𝑥1 𝑛1 𝑁1 = 𝑛1 𝑓1 𝐹1 = 𝑓1
𝑥2 𝑛2 𝑁2 = 𝑁1 + 𝑛2 𝑓2 𝐹2 = 𝐹1+𝑓2
⋮ ⋮ ⋮ ⋮ ⋮
𝑥𝑘 𝑛𝑘 𝑁𝑘 = 𝑁𝑘−1 + 𝑛𝑘 𝑓𝑘 𝐹𝑘 = 𝐹𝑘−1 + 𝑓𝑘
𝑛 1
Tabla 2.1 Tabla de distribución de frecuencias.

oas
Distribución de frecuencias

• Con una tabla de frecuencias se pueden resumir datos


cualitativos y cuantitativos.

Tabla 2.2 Variable cualitativa.

Tabla 2.3 Variable cuantitativa sin intervalo.

Tabla 2.4 Variable cuantitativa con intervalo. oas


Distribución de frecuencias

Ejercicio 2.1:
• Se valora la calidad del curso de “Control Estadístico de
Procesos” catalogándolo como: Superior ( S: ≥ 90), Excelente
( E: 80 − 90) , Muy bueno ( MB: 70 − 80) , Bueno ( B: 60 − 70) ,
Menos bueno ( MB: 50 − 60) , Malo ( M: < 50). Los resultados
obtenidos son:

Tabla 2.5 Datos calidad curso CEP.

a) Elabore una tabla de frecuencia que permita resumir los datos.


oas
Distribución de frecuencias

Variables cuantitativas:

Ejercicio 2.2:
Una especificación (característica) de calidad de un filete chilis
es su peso, que debe ser de 170 g con una tolerancia de ± 15 g.

Figura 2.2 Filete chilis.

oas
Distribución de frecuencias

Variables cuantitativas:

Para considerar que el proceso de obtención del filete chilis fue


satisfactorio, el peso debe estar dentro de la especificación
inferior, EI = 155 y la superior, ES = 185.

En un estudio de capacidad para este proceso es necesario


contestar las siguientes interrogantes:

• ¿Qué tipo de filetes en cuanto a su peso se están


produciendo?

• ¿El peso es adecuado?

• ¿La variabilidad del peso es mucha o poca?

• ¿El proceso es satisfactorio?


oas
Distribución de frecuencias

Ejercicio 2.2:

Tabla 2.6 Datos pesos filete chilis.

oas
Distribución de frecuencias

Variables cuantitativas:

• Construir una tabla de frecuencias sin y con intervalo,


comparar las dos tablas.
• Contestar las siguientes preguntas:

1. ¿Qué porcentaje de filetes tienen un peso hasta 170 g y cuantas


unidades son?

2. ¿Qué porcentaje de filetes tienen un peso de 170 g y cuantas


unidades son?

3. ¿El 82.0% de filetes, hasta que peso se encuentran y cuantas


unidades son?

4. ¿Qué porcentaje de filetes están dentro de especificación inferior


y superior? oas
Distribución de frecuencias

Con intervalos:

¿Cuántos intervalos decidir?

• Recomendable entre 5 a 20 intervalos.


• Usar las siguientes guías:
a) 𝑛
b) 2𝑐 ≥ 𝑛
c) 1 + 3,22 log 𝑛
d) Tablas:

Tabla 2.7 Número de intervalos en base al tamaño de muestra. oas


Distribución de frecuencias

Ejercicio 2.3:
• Se toma una muestra de 200 mediciones en carcasas de pollo
sobre el largo (cm) de corbata, los datos se muestran en la tabla
2.8.

Tabla 2.8 Datos largo corbata. oas


Distribución de frecuencias

Ejercicio 2.3:
Elabore una tabla de frecuencia sin intervalos que permita resumir
los datos y conteste las siguientes preguntas:

a) ¿Cuál es el largo que más se repite?. ¿Cuál es su porcentaje?

b) Suponiendo que se acepta carcasas hasta con un largo máximo


de 6.5 cm, ¿Qué porcentaje de carcasas cumplen?. ¿Cuántas
carcasas son?

c) El 90% de mediciones entre qué largo se encuentra y cuantas


carcasas son:

d) ¿Qué porcentaje de carcasas tienen un largo menor a 5 cm?

e) Realizar un histograma de frecuencias.


oas
Distribución de frecuencias

Ejercicio 2.4:
• La tabla 2.9 presenta 500 datos del largo de cuellos de carcasas
de pollo.

Tabla 2.9 Datos largo cuellos. oas


Distribución de frecuencias

Ejercicio 2.3:
• Elabore una tabla de frecuencia con 6 intervalos que permita
resumir los datos y conteste las siguientes preguntas:

a) ¿Entre que intervalo se encuentra la mayor frecuencia del largo y


cuál es su valor?
b) Suponiendo que se acepta un valor de largo menor a 5.1 cm;
que porcentaje no cumpliría con lo requerido y cuál es su
frecuencia?
c) El 98% de datos entre qué largo se encuentra y cuantos son.
d) ¿Qué porcentaje de datos obtuvo un largo entre 6.7 – 7.5 cm?
e) Realizar un histograma de frecuencias.
oas
TEMA III

Estadísticos descriptivos

Tendencia central / Dispersión / Forma / Posición

oas
Estadísticos descriptivos

• Las características de un conjunto de datos se pueden analizar


por medio de la Estadística Descriptiva. Las medidas
estadísticas tienen como objetivo resumir o representar en uno,
o varios números, la información de un conjunto de datos,
principalmente numéricos.

• De acuerdo a las características del conjunto de datos que


pueden ser estudiadas o agrupadas en: medidas de tendencia
central o localización, medidas de dispersión o variabilidad,
medidas de forma y medidas de posición.

• Las medidas de tendencia central indican un valor central que


represente a los datos, la concentración de los datos se refleja
en las medidas de dispersión, el estudio de la distribución de los
datos en las medidas de forma y finalmente las medidas de
posición permiten estudiar la posición relativa de los datos dentro
de su conjunto.
oas
Estadísticos descriptivos

• Representación gráfica de los estadísticos descriptivos:

Figura 3.1 Estadísticos descriptivos.


oas
Estadísticos descriptivos

Medidas de tendencia central:


• Tienen como objetivo buscar un valor central que represente a
los datos. Esta es la razón por la cual a estas cantidades se les
llama medidas de tendencia central o medidas de localización.
Revisaremos la media, moda y mediana.

Media:
• La media o media aritmética es simplemente el promedio de los
números 𝑥1 , … , 𝑥𝑛 , esto es, se suman todos estos datos y se
divide entre n. A la cantidad resultante se le denota por 𝑥ҧ y se lee
x barra.
𝑛
𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛 1
𝑥lj = = ෍ 𝑥𝑖 3.1
𝑛 𝑛
𝑖=1

• La media es la medida de tendencia central más utilizada.


oas
Estadísticos descriptivos

Ejemplo 3.1:
• Se tiene el siguiente conjunto 𝑛 = 6 datos que representan
estaturas de personas medidas en metros:

Estaturas en metros
𝑥1 = 1.65 𝑥2 = 1.70 𝑥3 = 1.71
𝑥4 = 1.70 𝑥5 = 1.85 𝑥6 = 1.80

• La media es el promedio de estos valores:

1.65 + 1.70 + 1.71 + 1.70 + 1.85 + 1.80


𝑥lj = = 1.735
6

• El valor 𝑥ҧ = 1.735 es la estatura promedio del conjunto de


personas considerado. Se observa que ninguna de estas
personas tiene esta estatura.
oas
Estadísticos descriptivos

La moda:
• La moda es el valor que aparece con mayor frecuencia en el
conjunto de datos, si lo hubiera.

• A diferencia de la media, la moda se puede calcular tanto para


valores numéricos como no numéricos.

• No existe una notación estándar para la moda. Se puede usar,


por ejemplo, la expresión 𝑀𝑜𝑑𝑎(𝑥) o 𝑀𝑜.

• La moda puede no existir, es decir, puede no haber un dato con


frecuencia mayor al resto de los datos. Esta situación se
presenta, por ejemplo, si todos los datos son diferentes. En este
caso se dice que el conjunto de datos no tiene moda.

• La moda puede existir y ser única, es este caso se dice que el


conjunto de datos es unimodal.
oas
Estadísticos descriptivos

• Pueden existir dos o más modas, es decir, pueden existir dos o


más valores que aparecen con la misma frecuencia máxima en el
conjunto de datos. En este caso se dice que el conjunto de datos
es bimodal o multimodal, según sea el caso.

• La moda puede permanecer sin cambio cuando se añaden u


omiten datos cuya frecuencia es baja dentro del conjunto de
datos.

Unimodal Bimodal

Figura 3.2 Ejemplo de modas.


oas
Estadísticos descriptivos

Ejemplo 3.2:
• Considere el siguiente conjunto de edades de 6 personas.

Edades en años
𝑥1 = 15 𝑥4 = 20
𝑥2 = 20 𝑥5 = 25
𝑥3 = 15 𝑥6 = 15

15, 15, 15, 20, 20, 25

La moda es el dato 15 pues éste aparece con más frecuencia (3


veces) que los otros datos.

oas
Estadísticos descriptivos

Ejemplo 3.3:
• Una variable cualitativa mide las condiciones de un producto y
que tiene como posibles valores: Malo, Regular, Bueno. Suponga
que tenemos el siguiente conjunto de 6 observaciones:

Condiciones de un producto
𝑥1 = 𝑀𝑎𝑙𝑜 𝑥4 = 𝑅𝑒𝑔𝑢𝑙𝑎𝑟
𝑥2 = 𝐵𝑢𝑒𝑛𝑜 𝑥5 = 𝑀𝑎𝑙𝑜
𝑥3 = 𝐵𝑢𝑒𝑛𝑜 𝑥6 = 𝐵𝑢𝑒𝑛𝑜

𝑀𝑎𝑙𝑜, 𝑀𝑎𝑙𝑜, 𝑅𝑒𝑔𝑢𝑙𝑎𝑟, 𝐵𝑢𝑒𝑛𝑜, 𝐵𝑢𝑒𝑛𝑜, 𝐵𝑢𝑒𝑛𝑜

• Es claro que la moda es el valor "𝐵𝑢𝑒𝑛𝑜“.

oas
Estadísticos descriptivos

La mediana:
• La mediana de un conjunto de datos 𝑥1 , 𝑥2 , … , 𝑥𝑛 es el valor que
se encuentra en el punto medio, cuando se ordena los valores
de menor a mayor.
• Se denota como Q2 y tiene la propiedad de que a cada lado del
valor se encuentra el 50% de las observaciones.
2+3
𝑄2 = = 2,5
𝑄2 = 3 2

1 2 3 4 5 1 2 3 4
a) Serie impar b) Serie par

Figura 3.3 Cálculo de la mediana.


oas
Estadísticos descriptivos

Ejemplo 3.4:
• Se tiene el registro de las siguientes estaturas (en centímetros)
de 6 personas, calcular la mediana.

Estatura en centímetros
165, 172, 170, 165, 174, 182

Ordenando estos números de menor a mayor, incluyendo


repeticiones, se obtiene el siguiente arreglo:

165 165 170 172 174 182

170 + 172
𝑄2 = = 171
2
• El 50% de datos de las personas tienen una estatura menor o
igual a 171 𝑐𝑚 y el otro 50% mayor o igual a 171 𝑐𝑚.
oas
Estadísticos descriptivos

Ejemplo 3.5:
• Vamos a agregar el dato 175 𝑐𝑚 en el ejemplo anterior para así
tener 7 datos. Tenemos ahora un número impar de datos. Los
datos ordenados son:

165 165 170 172 174 175 182

50% 50%
• Como se trata de un número impar de datos, la mediana es el
dato central, esto es: 𝑄2 = 172 𝑐𝑚.

• De esta manera, la mediana es un número que separa a los


datos (ordenados de menor a mayor) en dos partes con igual
número de datos: la primera parte son los números que son
menores o iguales a la mediana, y la segunda parte corresponde
al conjunto de números que son mayores o iguales a la mediana.
oas
Estadísticos descriptivos

Comparación entre la media, la moda y la mediana:

Ejercicio 3.1:

• Del siguiente conjunto de datos calcular la media, moda y


mediana:

a) 48, 52, 50, 48, 50, 50, 50

b) 48, 52, 50, 48, 50, 50, 500

c) 48, 54, 50, 53, 52, 49, 51

oas
Estadísticos descriptivos

¿Qué medida de tendencia central es mejor?


• No existe tal cosa. La media, moda y mediana miden de manera
diferente la centralidad de un conjunto de datos numéricos. Sin
embargo, la media es la medida que con mayor frecuencia se
utiliza es los estudios estadísticos. Por otro lado, aunque el
cálculo de la mediana puede ser más complicado, ésta tiene
menor afectación ante la presencia de errores en los datos o a
valores extremos de éstos.

• A menudo se usan términos como “ingreso medio” o “tiempo


medio de vida” sin especificar (a veces por conveniencia) la
medida de tendencia central utilizada. Ésta puede ser la media,
la moda o la mediana. Para evitar confusiones y para fines de
comparación, en cualquier estudio debe especificarse
plenamente la forma de calcular el “valor medio” al que se
refieren estas expresiones.
oas
Estadísticos descriptivos

• Imagine que una especificación de calidad en el proceso de


envasado de gelatina es el peso, que debe ser de 500 gramos con
una tolerancia de ±10 gramos con lo que sus especificaciones
inferior y superior son: 𝐸𝐼 = 490 y 𝐸𝑆 = 510. Para considerar que
el proceso fue satisfactorio se tomó una muestra y se calcularon
las siguientes medidas: 𝑥ҧ = 501, 𝑀𝑜 = 500, 𝑄2 = 500.

• Estas medidas de tendencia central son muy similares y se


encuentran dentro de las especificaciones de peso, se podría
creer o asumir que el proceso está controlado o está cumpliendo
con especificaciones. Sin embargo, esto no necesariamente es
verdad, ya que en la muestra tomada podría haber datos bajo los
490 gramos y sobre los 510 gramos y su media ser 501 gramos.
Por lo tanto: Las medidas de tendencia central son insuficientes
como criterio de calidad, ya que no toman en cuenta que tan
dispersos están los datos.
oas
Estadísticos descriptivos

Medidas de dispersión:
• Permiten medir el grado de dispersión de un conjunto de datos
numéricos.

Varianza:
• Es un promedio de la distancia al cuadrado de cada uno de los
datos 𝑥𝑖 respecto de la media 𝑥ҧ y es la medida de dispersión más
comúnmente usada.
𝑛
2
1 2
𝑠 = ෍ 𝑥𝑖 − 𝑥ҧ 3.2
𝑛−1
𝑖=1

• Para especificar que se trata de la varianza de un conjunto de


datos denotado por 𝑥, a la varianza la denotaremos también por
los símbolos 𝑠𝑥2 , 𝑠 2 𝑥 o también por var(𝑥). Es claro que, para
calcular la varianza, primero es necesario encontrar la media 𝑥.ҧ
oas
Estadísticos descriptivos

Ejemplo 3.6:
• Consideremos el siguiente conjunto de pesos en kilogramos de 6
personas, calcular la varianza.

Peso en kilogramos
𝑥1 = 70 𝑥4 = 66
𝑥2 = 68 𝑥5 = 70
𝑥3 = 75 𝑥6 = 65

El promedio calculado es: 𝑥ҧ = 69

La varianza es:
6
1 64
𝑠2 = ෍ 70 − 69 2
+ ⋯ + 65 − 69 2 = = 12,8
6−1 5
𝑖=1

oas
Estadísticos descriptivos

Desviación estándar:
• A la raíz cuadrada positiva de la varianza se le llama desviación
estándar o desviación típica, y se le denota por la letra 𝑠. Así, para
su cálculo se usa la siguiente fórmula:

𝑠= 𝑠2 3.3

• Por ejemplo, para el conjunto de datos del ejemplo 3.6, tenemos


que la desviación estándar es

𝑠= 12,8 = 3,58

• A diferencia de la varianza, la desviación estándar posee la buena


calidad de estar expresada en las mismas unidades de medición
que la de los datos observados.
oas
Estadísticos descriptivos

Rango:
• El rango se denota por la letra 𝑟 y es simplemente la diferencia
entre el dato mayor y el dato menor.

𝑟 = 𝑥𝑚𝑎𝑦𝑜𝑟 − 𝑥𝑚𝑒𝑛𝑜𝑟 3.4

• En rango puede interpretarse como la longitud del intervalo más


pequeño en el que se encuentran todos los datos observados.

• El rango no cambia cuando se añaden u omiten datos, siempre y


cuando no se modifiquen el valor máximo ni el valor mínimo del
conjunto de datos original.

• Por ejemplo, para el conjunto de datos del ejemplo 3.6, tenemos


que el rango es

𝑟 = 75 − 65 = 10
oas
ഥys
Relación entre 𝒙

Coeficiente de variación:
• Sea 𝑥ҧ su media y sea 𝑠 su desviación estándar. Al cociente s/𝑥ҧ se
le llama coeficiente de variación y se denota por 𝑐𝑣.

𝑠
𝑐𝑣 = 3.5
𝑥lj

• Tanto la desviación estándar 𝑠 como la media 𝑥ҧ poseen las


mismas unidades de medición. Por lo tanto, el cociente de estas
cantidades no posee unidad de medición y, en consecuencia, el
coeficiente de variación puede servir para comprar la dispersión
de dos o más conjuntos de variables cuantitativas.

oas
ഥys
Relación entre 𝒙

Ejercicio 3.2:
• Sean los dos conjuntos de datos:

• 𝐴 = 10,12,14
• 𝐵 = 159,161,163

• Calcular, el rango, el promedio, la desviación estándar y el


coeficiente de variación:

oas
ഥys
Relación entre 𝒙

Ejercicio 3.3:
• La Conversión Alimenticia es un indicador muy importante en la
producción de pollos. La CA es la relación que se da entre el
consumo de alimento y la ganancia de peso que tiene los pollos
en un periodo de tiempo determinado. Se tomo una muestra de 5
lecturas de dos granjas de la CA:

Granja “A”: 2,261 2,259 2,303 2,260 2,253


Granja “B”: 2,232 2,279 2,286 2,350 2,342

• Calcular el coeficiente de variación de variación:

oas
ഥys
Relación entre 𝒙

Prueba de hipótesis para dos medias:


• Para una prueba bilateral con varianzas desconocidas y supuestas
iguales:

1. Hipótesis Nula. 𝐻0 : 𝜇1 = 𝜇2

2. Hipótesis Alternativa. 𝐻1 : 𝜇1 ≠ 𝜇2

3. Estadístico de Prueba.
𝑥lj 1 − 𝑥lj 2
𝑡𝑜𝑏𝑠 =
3.6
𝑛1 − 1 𝑠12 + 𝑛2 − 1 𝑠22 1 1
+
𝑛1 + 𝑛2 − 2 𝑛1 𝑛2

4. Región de Rechazo.

𝑡𝑜𝑏𝑠 < −𝑡𝛼/2 𝑛1 + 𝑛2 − 2 o 𝑡𝑜𝑏𝑠 > 𝑡𝛼/2 𝑛1 + 𝑛2 − 2


oas
ഥys
Relación entre 𝒙

Ejercicio 3.4:
• A un nivel de significación del 0.01, verificar si la conversión
alimenticia de las dos granjas del ejercicio 3.3, es el mismo?.

1. Hipótesis Nula. 𝐻0 : 𝜇1 = 𝜇2

2. Hipótesis Alternativa. 𝐻1 : 𝜇1 ≠ 𝜇2

3. Estadístico de Prueba.

2,267 − 2,298
𝑡𝑜𝑏𝑠 = = −1,30
2
5 − 1 0,020 + 5 − 1 0,049 2 1 1
+
5+5−2 5 5

4. Región de Rechazo. 𝑡0.005 (8) = 3,36

oas
ഥys
Relación entre 𝒙

𝑝 − valor 𝑝 − valor

0,1155 0,1155

-6.0 -4.0 -2.0 0.0 2.0 4.0 6.0


−3,36 −1,30 3,36

𝑡−𝛼/2 𝑡𝑜𝑏𝑠 𝑡𝛼/2

Figura 3.4 Región o intervalo de aceptación.

• Como 𝑡𝑜𝑏𝑠 < 𝑡𝛼 cae en la región de aceptación; por lo tanto, se


puede asegurar que la conversión alimenticia entre las dos granjas
estadísticamente son iguales. p-valor > 1% (0,2310).
oas
ഥys
Relación entre 𝒙

Regla empírica:
• En una muestra de n mediciones 𝑥1 , 𝑥2 , ⋯ , 𝑥𝑛
i) 68,27% de las mediciones caerá en 𝜇 ± 1𝜎
ii) 95,45% de las mediciones caerá en 𝜇 ± 2𝜎
iii) 99,73% de las mediciones caerá en 𝜇 ± 3𝜎

Figura 3.5 La regla empírica.

-7 -5
−3𝜎 -3
−2𝜎 -1
−1𝜎 𝜇 1
+1𝜎 3
+2𝜎 5
+3𝜎 7

68.27%
95.45%
99.73%
oas
ഥys
Relación entre 𝒙

Ejercicio 3.5:
• El peso promedio (pollo en pie) de un galpón que contiene 10.000
pollos, es de 2.5 kg con un coeficiente de variación del 12% .
Utilizando la regla empírica indique:

• Entre qué pesos (kg) y que cantidades se encuentra el:

1. 68,27%?
2. 95,45%?
3. 99,73%?

oas
ഥys
Relación entre 𝒙

Estimación de los parámetros m y s:

𝑁 𝑛

𝜇 𝑥lj
𝜎 𝑠

Parámetros Poblacionales Estadísticos Muestrales


Figura 3.6 Parámetros y estadísticos.

• La estimación de los parámetros del proceso están dados por:

𝑅ሜ
𝜇 ≈ 𝑥lj 3.7 𝜎ො ≈ 3.8
𝑑2

Promedio Desviación estándar

• Donde 𝑅ത es el promedio de rangos y 𝑑2 una constante critica.


oas
ഥys
Relación entre 𝒙

Ejemplo 3.7:
• De los siguientes datos estimar los parámetros m y s:

Tabla 3.1 Datos para estimar m y s.


oas
ഥys
Relación entre 𝒙

Ejemplo 3.7:

𝜇 ≈ 𝑥lj = 1,51

𝑅ሜ 0,63
𝜎ො ≈ = = 0,27
𝑑2 2,326

Promedios →

oas
ഥys
Relación entre 𝒙

Límites reales o naturales:


• Los límites reales o naturales de un proceso indican los puntos en
donde varia la salida de un proceso, y por lo general se obtienen
de la siguiente manera:

LRI = m - 3 s
3.9
LRS = m + 3 s

• Estos límites, cuyo calculo está inspirado en propiedades de la


distribución normal, que coinciden con la regla empírica, indican la
amplitud real de la variación de la salida del proceso. En un
estudio de capacidad, estos límites reales se comparan contra las
especificaciones para la característica de calidad.

oas
ഥys
Relación entre 𝒙

Ejemplo 3.8:
• Si las especificaciones para una característica de calidad son que
ésta debe tener dimensiones de 800±5; luego la especificación
inferior es EI = 795, y la superior es ES = 805. Si además se sabe
que la media y la desviación estándar de tal característica de
calidad son m = 800,6 y s = 1,2, entonces los límites reales son:

LRI = 800,6 - 3 (1,2) = 797,0

LRS = 800,6 + 3 (1,2) = 804,2

• Por lo que se espera que esta característica de calidad varié de


797,0 a 804,2, con una media de 800,6. Al comparar esto con las
especificaciones, se aprecia que los límites reales caen dentro de
las mismas, por lo que se concluye que el proceso es capaz de
cumplir con tales especificaciones.
oas
Estadísticos descriptivos

Medidas de forma:
• Las medidas de forma nos dan una idea de la manera en la que
están distribuidos los datos.

• Dentro de las medidas de forma, analizaremos: la curtosis y el


coeficiente de asimetría.

Curtosis:
• El coeficiente de curtosis analiza el grado de concentración que
presentan los valores alrededor de la zona central de la
distribución.

Su fórmula es:
𝑛
4
𝑛 𝑛+1 𝑥𝑖 − 𝑥ҧ 3 𝑛−1 2
𝐾= ෍ − 3.10
𝑛−1 𝑛−2 𝑛−3 𝑠 𝑛−2 𝑛−3
𝑖=1
oas
Estadísticos descriptivos

• Se definen tres tipos de distribuciones según su grado de


curtosis:

• Si 𝐾 > 0, la distribución de probabilidades presenta pico alto, y se


la llama leptocúrtica;
• Si 𝐾 = 0, la distribución no presenta ningún pico ni es plana, se la
llama mesocúrtica;
• Si 𝐾 < 0, la distribución es plana, y se la llama platicúrtica.

Leptocúrtica Mesocúrtica Platicúrtica

Figura 3.7 Tipos de curtosis. oas


Estadísticos descriptivos

Ejercicio 3.6:
• Se tiene ocho lecturas de la acidez del tomate de árbol como
porcentaje de ácido cítrico, calcular la curtosis.

n 1 2 3 4 5 6 7 8
% acidez 0,400 0,392 0,315 0,360 0,467 0,390 0,392 0,369

𝑥ҧ = 0.386

𝑠 = 0.043

𝐾 = 0,343 ∗ 20,560 − 4,900 = 2,149

• Como 𝐾 > 0 nos indica que la curtosis es de tipo leptocúrtica, es


decir la distribución de datos presenta pico alto.
oas
Estadísticos descriptivos

Coeficiente de asimetría:
• El coeficiente de asimetría analiza si la curva que forman los
datos presenta la misma forma a izquierda y a derecha de la
media aritmética. Si es así, entonces la curva es simétrica; caso
contrario, la curva es asimétrica.

Su fórmula es:

𝑛
𝑛 𝑥𝑖 − 𝑥ҧ 3
𝐴𝑠 = ෍ 3.11
𝑛−1 𝑛−2 𝑠
𝑖=1

oas
Estadísticos descriptivos

• Si 𝐴𝑠 < 0, la curva es asimétrica a la izquierda (negativa), la cola a


la izquierda es más larga que la cola a la derecha.

• Si 𝐴𝑠 = 0 , la curva es simétrica (ambas colas son iguales y


largas).

• Si 𝐴𝑠 > 0, la curva es asimétrica a la derecha (positiva), la cola a


la derecha es más larga que la cola a la izquierda.

Asimétrica izquierda Simétrica Asimétrica derecha

Figura 3.8 Tipos de curvas. oas


Estadísticos descriptivos

Ejercicio 3.7:
• Calcular el coeficiente de asimetría del ejercicio 3.6:

𝑛 8
= = 0,190
𝑛−1 𝑛−2 8−1 8−2

𝑛 3 3 3
𝑥𝑖 − 𝑥ҧ 0,315 − 0,386 0,467 − 0,386
෍ = + ⋯+ = 2,145
𝑠 0,043 0,043
𝑖=1

𝐴𝑠 = 0,190 ∗ 2,145 = 0,409

• Como 𝐴𝑠 > 0 nos indica que la distribución se orienta hacia la


izquierda.

oas
Estadísticos descriptivos

Medidas de posición:
• Un cuantil es un número que separa a los datos en dos partes: un
cierto porcentaje de los datos son menores o iguales al cuantil y
el porcentaje complementario corresponde a datos que son
mayores o iguales al cuantil.

• Para dar una definición más precisa de cuantil consideraremos


que p es un número cualquiera conocido tal que 0 < 𝑝 ≤ 1. Este
valor determinará los porcentajes de los que hablamos en el
párrafo anterior. Por ejemplo, podemos suponer que p=0.2.
Entonces un cuantil es un número c tal que la proporción de
valores xi que son menores o iguales a c es del 20% y, al mismo
tiempo, la proporción de valores xi que son mayores o iguales a c
es el porcentaje complementario, esto es, el 80%. En este caso,
al número c se le llama cuantil de orden p=0.2 o cuantil al 20% y
se le denota por c0.2. Véase la Figura 3.9.
oas
Estadísticos descriptivos

Cuantil
al 20%

x x x x x x x x x
20% de los datos 80% de los datos

Figura 3.9 Cuantil de orden p=0.2 o cuantil al 20%.

• En general, podemos tener cuantiles al 5%, 10%, 50%, o cualquier


otro porcentaje dado por la expresión:

100p%, 3.12
• con 0 < 𝑝 ≤ 1.
oas
Estadísticos descriptivos

Cuartiles:
• Los cuartiles son los tres valores de la variable que dividen a un
conjunto de datos ordenados en cuatro partes iguales.

• Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al


50% y al 75% de los datos.

𝑄1 𝑄2 𝑄3

0% 25% 50% 75% 100%

Figura 3.10 Representación gráfica de los cuartiles.

• Q1 coincide con el percentil 25 (P25).


• Q2 coincide con la mediana y el percentil 50 (P50).
• Q3 coincide con el percentil 75 (P75). oas
Estadísticos descriptivos

• Sin parte decimal: Para el cuartil 1 (Q1) y cuartil 3 (Q3) hallaremos


su posición mediante las siguientes ecuaciones:
𝑁+1 3
𝑄1 = 3.12 𝑄3 = (𝑁 + 1) 3.13
4 4

• N = número total de datos.

• Con parte decimal: supongamos que el elemento es un número


con parte decimal entre el sujeto i y el i+1. Sea un número de la
forma i, d donde i es la parte entera y d la decimal. El cuartil será:

𝑄𝑘 = 𝑥𝑖 + 𝑑(𝑥𝑖+1 − 𝑥𝑖 ) 3.14

• Segundo cuartil:
𝑁+1
𝑄2 = 3.15
2
oas
Estadísticos descriptivos

Ejemplo 3.9:
• Calcular los cuartiles Q1, Q2 y Q3 del siguiente conjunto de datos:
6, 9, 9, 12, 12, 12, 15 y 17.

𝑥1 𝑥2 𝑥3 𝑥4 𝑥5 𝑥6 𝑥7 𝑥8
6 9 9 12 12 12 15 17

• El primer cuartil esta la posición 2,25. Como es decimal, el cuartil


será un número entre x2=9 y x3=9.
𝑁+1 8+1
𝑄1 = = = 2,25
4 4

• El número decimal es el 2,25, por lo que i=5 y d=0,25. el cuartil 1


es:

𝑄1 = 𝑥2 + 0,25(𝑥3 − 𝑥2 ) = 9 + 0,25(9 − 9) = 9
oas
Estadísticos descriptivos

𝑥1 𝑥2 𝑥3 𝑥4 𝑥5 𝑥6 𝑥7 𝑥8
6 9 9 12 12 12 15 17

• El segundo cuartil es la mediana y se ubica en la posición 4,5. El


cuartil será el promedio entre x4=12 y x5=12.
𝑁+1 8+1 𝑥4 + 𝑥5 12 + 12
𝑄2 = = = 4,5 𝑄2 = = = 12
2 2 2 2

• El tercer cuartil esta la posición 6,75. Como es decimal, el cuartil


será un número entre x6=12 y x7=15.
3 3 27
𝑄3 = (𝑁 + 1) = (8 + 1) = = 6,75
4 4 4

• El número decimal es el 6,75, por lo que i=6 y d=0,75. el cuartil 3


es:
𝑄3 = 𝑥6 + 0,75(𝑥7 − 𝑥6 ) = 12 + 0,75(15 − 12) = 14,25
oas
Estadísticos descriptivos

Deciles
• Los deciles son los nueve valores que dividen la serie de datos
en diez partes iguales.

• Los deciles dan los valores correspondientes al 10%, al 20%... y al


90% de los datos.

• D5 coincide con la mediana.

𝐷1 𝐷2 𝐷3 𝐷4 𝐷5 𝐷6 𝐷7 𝐷8 𝐷9

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Figura 3.11 Representación gráfica de los deciles.

oas
Estadísticos descriptivos

• El decil Di se calcula mediante la fórmula siguiente:

3.16
𝐷𝑖 = 𝑋((𝑁+1)𝑖)/10

• N = número de elementos del conjunto y 0 ≤ 𝑖 ≤ 9.

• Con parte decimal: supongamos que el elemento es un número


con parte decimal entre el sujeto t y el t+1. Sea un número de la
forma t, d donde t es la parte entera y d la decimal. El decil será:

𝐷𝑖 = 𝑥𝑡 + 𝑑(𝑥𝑡+1 − 𝑥𝑡 ) 3.17

oas
Estadísticos descriptivos

Ejemplo 3.10:
• Calcular el quinto decil del siguiente conjunto de datos: 6, 9, 9,
12, 12, 12, 15 y 17.

𝑥1 𝑥2 𝑥3 𝑥4 𝑥5 𝑥6 𝑥7 𝑥8
6 9 9 12 12 12 15 17

• El quinto decil D5 esta la posición 4,50. Como es decimal, el decil


será un número entre x4=12 y x5=12.

𝑁+1 8+1
𝐷5 = 𝑖= 5 = 4,50
10 10

• El número decimal es el 4,50, por lo que t=4 y d=0,50. el decil D5


es:
𝐷5 = 𝑥4 + 0,50(𝑥5 − 𝑥4 ) = 12 + 0,50(12 − 12) = 12
oas
Estadísticos descriptivos

Percentiles
• Los percentiles son los 99 valores que dividen la serie de datos
en 100 partes iguales.

• Los percentiles dan los valores correspondientes al 1%, al 2%... y


al 99% de los datos.

• P25 es el cuartil Q1.


• P50 es la mediana y el cuartil Q2.
• P75 es el cuartil Q3.

𝑃1 ... 𝑃10 ... 𝑃20 ... 𝑃30 ... 𝑃40 ... 𝑃50 ... 𝑃60 ... 𝑃70 ... 𝑃80 ... 𝑃90 ... 𝑃99

0% 1% 10% 20% 30% 40% 50% 60% 70% 80% 90% 99%100%

Figura 3.12 Representación gráfica de los percentiles. oas


Estadísticos descriptivos

• El percentil Pi se calcula mediante la fórmula siguiente:

3.18
𝑃𝑖 = 𝑋((𝑁+1)𝑖)/100

• N = número de elementos del conjunto y 0 ≤ 𝑖 ≤ 99.

• Con parte decimal: supongamos que el elemento es un número


con parte decimal entre el sujeto t y el t+1. Sea un número de la
forma t, d donde t es la parte entera y d la decimal. El percentil
será:

𝑃𝑖 = 𝑥𝑡 + 𝑑(𝑥𝑡+1 − 𝑥𝑡 ) 3.19

• Los percentiles están pensados para conjuntos de elementos de


más de cien elementos.
oas
Estadísticos descriptivos

Ejemplo 3.11:
• Calcular el percentil de orden P20 del peso de diez personas (kg):
80, 78, 65, 73, 65, 67, 72, 68, 70 y 72.

𝑥1 𝑥2 𝑥3 𝑥4 𝑥5 𝑥6 𝑥7 𝑥8 𝑥9 𝑥10
65 65 67 68 70 72 72 73 78 80

• El percentil de orden P20 esta la posición 2,25. Como es decimal,


el percentil será un número entre x2=65 y x3=67.

𝑁+1 10 + 1
𝑃20 = 𝑖= 20 = 2,20
100 100

• El número decimal es el 2,20, por lo que t=2 y d=0,20. el percentil


P20 es:
𝑃20 = 𝑥2 + 0,20(𝑥3 − 𝑥2 ) = 65 + 0,25(67 − 65) = 65,40
oas
Diagrama de cajas

• Es un gráfico representativo de las distribuciones de un conjunto


de datos en cuya construcción se usan cinco medidas
descriptivas de los mismos, a saber: mediana (𝑄2 ), primer cuartil
(𝑄1 ), tercer cuartil (𝑄3 ), valor máximo (𝑀á𝑥) y valor mínimo (𝑀í𝑛).
0.500

𝑀á𝑥

0.400 𝑄3
0.386
𝑄2
𝑥ҧ
𝑄1

𝑀í𝑛
0.300
Figura 3.13 Diagrama de caja ejercicio 3.6.
oas
Estadísticos descriptivos

Ejercicio 3.8:
• Utilizando las funciones del excel. Calcular las medidas de
tendencia central (media, mediana, moda), de dispersión (mín,
máx, rango, varianza, desviación estándar), relación entre la
media y la desviación estándar (coeficiente de variación), de
forma (curtosis, coeficiente de asimetría) y posición (Q1, Q2, Q3)
para los datos del ejercicio 2.3.

oas
Estadísticos descriptivos

Estadístico Símbolo Resultado


Promedio 𝑥ҧ
Mediana 𝑀𝑒
Moda 𝑀𝑜
Primer cuartil 𝑄1
Segundo cuartil 𝑄2
Tercer cuartil 𝑄3
Mín 𝑀í𝑛
Máx 𝑀á𝑥
Rango 𝑅
Varianza 𝑠2
Desviación 𝑠
Coeficiente de variación 𝐶𝑉
Curtosis 𝐾
Coeficiente de Asimetría 𝐴𝑠
oas
Estadísticos descriptivos

Ejercicio 3.9:
• Tenemos información sobre el peso (kg) por sexo de pollos en pie
de tres granjas ubicadas en diferentes localidades del país:

• Granja: UIO, STO, GYE


• Sexo: Macho / Hembra
• Peso: kg de pollo en pie

• La administración quiere saber:

oas
Estadísticos descriptivos

Ejercicio 3.9:
• ¿Cuál es el peso promedio total?

• ¿Cuál es el peso promedio total eliminando los 5 valores más


altos y bajos?

• ¿Cuál es el peso promedio por sexo?

• ¿Cuál es el peso promedio por granja?

• ¿Cuál es el peso promedio por sexo y granja?

• ¿Cuál es la proporción de machos y hembras total?

• ¿Cuál es la proporción de cerdos por granja?

• ¿Cuál es la proporción de machos y hembras por granja?


oas
Estadísticos descriptivos

Ejercicio 3.10:
• Se tiene información sobre las ventas por zona, tipo de producto,
localidad y fecha, se requiere conocer:

Centro de
Fecha Producto Zona US
Distribución
07/01/2019 Cuenca Pollo Norte $ 409
15/01/2019 Quito Cerdo Este $ 199
23/01/2019 Guayaquil Pollo Sur $ 409
31/01/2019 Cuenca Cerdo Oeste $ 199
04/02/2019 Guayaquil Pollo Norte $ 409
12/02/2019 Cuenca Pollo Norte $ 409
20/02/2019 Quito Pollo Sur $ 409
28/02/2019 Guayaquil Pollo Oeste $ 409
05/03/2019 Guayaquil Cerdo Este $ 199
14/03/2019 Quito Embutidos Oeste $ 219
22/03/2019 Cuenca Cerdo Sur $ 199
27/03/2019 Quito Embutidos Sur $ 219

oas
Estadísticos descriptivos

Ejercicio 3.10:
• ¿Cuál es el monto promedio de venta en Quito?

• ¿Cuál es el monto promedio de venta en la zona Sur de Quito?

• ¿Cuál es el monto promedio de venta en la zona Norte de Pollo?

• ¿Cuál es el monto promedio de venta en la zona Sur con un


monto mayor a $ 200,00?

• ¿Cuál es el monto promedio de venta mayor al 02 de enero del


2019?

• ¿Cuál es el monto promedio de venta mayor al 31 de enero del


2019 y menor al 01 de marzo del 2019?

• ¿Cuál es el monto promedio de venta en Quito y Cuenca?


oas
Estudio real de capacidad

Ejercicio 3.11:
• Realizar un análisis de la capacidad del proceso del ejercicio 2.2.

oas
Estadístico Análisis y comentarios
Medidas de tendencia
central:
m  𝑋ത =
Mediana =
Moda =
Medidas de dispersión:
R=
S=
Rango medio y
desviación estándar:
𝑅ത =
ത 2
𝜎ො = 𝑅/d
CV =
Medidas de forma:
Curtosis =
Asimetría =
Límites reales (m ± 3s):
LRI =
LRS =
Porcentaje fuera de
especificaciones:

Histograma:

Conclusiones finales:
Datos: oas

También podría gustarte