Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Modelos matemáticos
para la producción
Unidad 1
Estadística descriptiva
Es decir, la estadística descriptiva es usada para resumir información o datos para que
puedan ser observados y analizados de formas más sencillas y útiles.
2
1.2 Tipos de estadística.
La estadística por lo general se divide en dos: la estadística descriptiva y la estadística
inferencial. Cuando se analiza información, como por ejemplo, la dimensión de determi-
nada pieza en una línea de producción, se pueden utilizar ambos tipos de estadística para
el análisis y para obtener un mejor resultado. A continuación, se verá lo que cada una de
las estadísticas es y cuál es su diferencia.
Estadística Descriptiva
Se le conoce como estadística descriptiva al análisis de información que busca describir o
resumir datos o información de tal forma que se puedan percibir características, tenden-
cias, patrones o comportamientos. La estadística descriptiva nos permite presentar, ana-
lizar o visualizar información que sí solo se presentara de forma sencilla no sería posible
de comprender. Por lo tanto, este tipo de estadística nos permite el estudio de datos de
forma más significativa lo que facilita una interpretación más simple de la misma. Existen
2 tipos generales de medidas estadísticas usadas para describir datos.
3
Algunas de las herramientas gráficas más usadas en este tipo de estadística son:
• Gráficas de pastel
• Gráficas de barras
• Histogramas
• Distribuciones de frecuencia
• Análisis o gráficas de medias
Estadística Inferencial
La estadística descriptiva analiza y provee datos de la información con la que se está
trabajando, sin embargo, muy a menudo no se puede tener acceso a toda la población
de interés. La estadística inferencial utiliza un grupo de técnicas que nos van a permitir
usar muestras para hacer generalizaciones acerca de la población de la cual fueron ex-
traídas. Por esto es muy importante que la muestra de datos represente lo mejor posible
a la población. El método que usa este tipo de estadística se le conoce como muestreo.
La estadística inferencial parte del hecho de que el muestreo tiene naturalmente un
margen o porcentaje de error, por lo que se espera que una muestra nunca represente
perfectamente o al 100% a una población.
Algunas de las herramientas gráficas más usadas en este tipo de estadística son:
• Análisis de correlación
• Gráficas de regresión lineal
• Annova
4
Figura 2: Población y Muestra (Elaboración Propia)
La diferencia principal entre una población y una muestra radica en que la población in-
cluye TODOS los elementos de un conjunto de datos, piezas o información mientras que
la muestra solo contiene una parte de las observaciones de la población.
Trabajar sobre una población o sobre una muestra tiene algunas implicaciones, un ejem-
plo es que cuando una característica medible de una muestra como lo es una media o
una desviación estándar es denominado estadístico, pero si la característica es de una
población estamos entonces hablando de un parámetro.
5
1.4 Variables continuas y variables discretas.
Las variables discretas son aquellas que son cuantificables solo en números enteros
cerrados o en criterios específicos como por ejemplo el número de alumnos en un salón,
el color de un lápiz, el género de una persona.
Las variables continuas por su parte son aquellas cuyo valor se puede presentar en deci-
males, fracciones o partes dentro de un intervalo de valores definido. Como por ejemplo
tiempo o peso.
6
Los datos agrupados son datos organizados en grupos conocidos como clases, es decir
la información o datos agrupados han sido clasificados. Una clase o categoría es un grupo
de datos que la persona que hace dichas clases o categorías ha definido. Cada clase va
a tener un tamaño específico el cual es conocido como tamaño de la clase o intervalo.
Los intervalos se calculan con la siguiente fórmula:
Intervalo = (Valor más grande – Valor más pequeño) / número de clases que se
requieren.
Cada clase va a tener 2 límites uno superior y otro inferior. Los límites son los valores
superiores e inferiores definidos para cada intervalo
1.6 Gráficas
Gráficas de Hoja y Tallo. Este tipo de gráfico conjunta información numérica analizándola,
dividiéndola y agrupándola por cada uno de sus dígitos. Por ejemplo, supongamos que se
encuestan al azar a personas en la calle preguntándoles por su edad y esta información
se registra siendo la siguiente:
8|1
7|6
6|4
5|96
3|562
2|31
En el tallo primer columna de a izquierda se colocan los primeros dígitos o las decenas
de cada número y luego en la segunda sección o grupo de columnas de la derecha se
colocan los dígitos de las unidades.
Histograma
El histograma es un gráfico que representa gráficamente la frecuencia que tienen determi-
nados datos continuos. Para construir un histograma se recomienda seguir los siguientes
pasos:
• Obtener los datos con los que se va a trabajar.
• Determinar los intervalos en los que van a ser agrupados los datos y seleccionar
el ancho apropiado de los grupos.
• Determinar de los datos la frecuencia o el número de datos que caen dentro de
7
los intervalos establecidos.
• Graficar los resultados.
Se determina que los grupos van a ser de los 20 a los 30 años, de los 31 a los 40, de los
41 a los 50, de los 51 a los 60, de los 61 a los 70 y de los 71 a los 80 años quedando de
la siguiente forma:
Con esta información se puede generar la gráfica circular, misma que quedaría de la si-
guiente forma:
8
Figura 7: Ejemplo de Gráfica Circular. (Elaboración Propia)
Del gráfico anterior podemos observar el porcentaje que ocupan las personas de 31 a 40
años con respecto a los demás.
Existen muchas gráficas y muchas variantes de las mismas las cuales son una herra-
mienta muy poderosa para ayudar a una persona departamento o empresa a mostrar las
características o patrones de la información que se analiza y las conclusiones o resul-
tados. Analizar información es un trabajo increíble al igual que difícil, las gráficas dan la
posibilidad de hacer que las personas a las que se les enseñan los puedan comprender
de una forma más fácil, rápida y simple, lo que es de gran utilidad al momento de tomar
decisiones importantes en una empresa.
Las medidas de tendencia central son formas de presentar las características centrales de
la información, grupo de datos o los patrones de la misma. Algunas de las herramientas
de análisis de tendencia central son la media, mediana y la moda.
La Media Aritmética o promedio es una de las medidas más usadas. Esta medida puede
ser utilizada con datos continuos o discretos. La media es igual a la suma de todos los
datos dividida entre el número de datos.
9
La mediana es el valor medio de un conjunto de datos. La mediana se encuentra tomando
todos los valores del conjunto de datos, acomodándolos en orden ascendente y buscando
el valor que por orden se encuentra en medio de todos los datos, en caso de no ser un
solo dato, es decir que sean 2 datos, se toman esos 2 datos y se les saca el promedio.
Para facilitar el análisis acomodamos los datos de forma ascendente y buscamos el valor
mínimo, el valor máximo, así como la media, mediana y la moda.
Con esta información la empresa puede determinar que el promedio de los viajes es de
185.1 minutos con lo que podrá tomar decisiones de control sobre los otros tiempos mucho
más rápidos y mucho más lentos.
10
1.8 Medidas de dispersión (varianza y desviación estándar).
Las medidas de dispersión agrupan datos describiendo qué tanta dispersión hay entre los
mismos. Las medidas de dispersión usan algunas herramientas de análisis para analizar
la información como, por ejemplo, los rangos, cuartiles, varianza y desviación estándar.
El rango, es la diferencia que existe entre el valor más grande y el más pequeño, en un
grupo de datos.
Los cuartiles son grupos de información generados al dividir los datos disponibles en 4.
Grupos de tamaños iguales. Cada cuartil contiene un cuarto o el 25% de los datos del
grupo de datos total.
La varianza (S2) va a medir que tan dispersos están los datos. La varianza es el promedio
de las diferencias al cuadrado de la media.
11
Figura 15: Fórmula de la desviación estándar
de la Población (Elaboración Propia)
Para comprender mejor estos conceptos utilizaremos un ejemplo utilizando los datos del
ejemplo de la empresa de logística del tema anterior.
De los datos de la figura 10 vamos a obtener el rango y los cuartiles. El rango va a ser
obtenido de restar el valor máximo (280) menos el valor mínimo (71) y los cuartiles van
son los siguientes:
En el caso del ejemplo obtuvimos todas las medidas de los tiempos por lo que estamos
hablando de la población y no de una muestra. Con eso en mente se calculará la varianza
y la desviación estándar de la siguiente forma:
12
Figura 17: Ejemplo, Cálculo de la Varianza y de la Desviación estándar. (Elaboración Propia)
Con esto la empresa puede observar la desviación que tienen los tiempos y con esto
definir límites o parámetros para controlar los mismos.
13