Universo es el conjunto de personas, cosas o fenómenos sobre los cuales se
realiza una investigación. El universo de este proyecto son rotores de la línea 1 y línea 2 de la planta Motores de Regal. Una variable es una característica común entre el conjunto que se está estudiando. Existen las categóricas nominales y ordinales, y numéricas discretas y continuas. En nuestro caso, la variable es numérica continua, que es donde existe una cantidad infinita de valores, por lo que puede ser decimales, ya que se están analizando las medidas del diámetro interior de los rotores de motores, estos se encuentran en pulgadas con decimales. En estadística, una muestra es la selección de un numero de observaciones de a partir de una población objeto de investigación; una muestra aleatoria es cuando la elección sigue un método impredecible. El muestreo aleatorio puede referirse también a tomar una serie de observaciones independientes de la misma distribución de probabilidad. Las muestras nos permiten mediante la inferencia estadística representar los resultados de la población de donde se haya extraído, pero existiendo una potencial variación al azar en los resultados que se denomina error de muestreo. En el caso de muestras aleatorias, la estadística dispone de medidas para evaluar el error de muestreo. Por lo tanto, las estimaciones obtenidas a partir de muestras aleatorias pueden ir acompañadas de medidas de la incertidumbre asociada a la estimación. Esto puede tomar la forma de un error estándar, o si la muestra es lo suficientemente grande y mediante el teorema central del límite, podrán calcularse intervalos de confianza. Existen diferentes tipos de muestra aleatoria, muestra aleatoria simple, muestreo por conglomerados, muestro sistemático y muestreo estratificado, el último es nuestro caso ya que el muestreo estratificado implica seleccionar muestras independientes de un número de subpoblaciones, grupo o estratos dentro de la población. En nuestro caso, realizamos las mediciones a 2 grupos de rotores, línea 1 y línea 2, cada línea con 53 rotores. Se les conoce como estadísticos a las medidas descriptivas de una muestra, es decir a los valores que se obtienen al medir los datos de una muestra, por lo tanto, los siguientes conceptos serán visos como estadísticos. Estos estadísticos que se verán en este proyecto serán resultados de Minitab, el cual es un programa de computadora diseñado para ejecutar funciones estadísticas básicas y avanzadas, ayuda a las empresas e instituciones a detectar tendencias, resolver problemas y descubrir información valiosa en los datos al ofrecer el mejor conjunto integral de herramientas de aprendizaje de máquina, análisis estadístico y mejora de procesos. Gracias a su facilidad de uso incomparable, Minitab simplifica como nunca la obtención de conocimientos profundos a partir de los datos. La media aritmética, comúnmente conocida como media o promedio. Es aquella medida que se obtiene al dividir la suma de todos los valores de una variable por la frecuencia total. En palabras más simples, corresponde a la suma de un conjunto de datos dividida por el número total de dichos datos. La mediana es el dato que se ubica en el centro de una distribución La moda es aquel dato que se presenta con mayor frecuencia en una distribución. La varianza mide qué tan dispersos están los datos alrededor de la media. La varianza es igual a la desviación estándar elevada al cuadrado. Este estadístico es de vital importancia en la industria, ya que con ella podemos llevar un control en la calidad de los productos, lo que se busca de la varianza es reducirla, porque con la reducción de la varianza del proceso aumenta la precisión y disminuye el número de defectos. La desviación estándar es la medida de dispersión más común, que indica qué tan dispersos están los datos con respecto a la media, como anteriormente se mencionó, esta es la raíz cuadrada de la varianza y como dato general, mientras menor sea la desviación estándar, menor será la dispersión de los datos, que se busca, reducir la dispersión de datos, en cualquier empresa de manufactura. El coeficiente de variación es una medida estadística que nos informa acerca de la dispersión relativa de un conjunto de datos. Su cálculo se obtiene de dividir la desviación típica entre el valor absoluto de la media del conjunto y por lo general se expresa en porcentaje para su mejor comprensión. esto nos ayuda a comparar la dispersión entre dos muestras distintas e incluso, comparar la variación producto de dos variables diferentes (que pueden provenir de una misma muestras). Los cuartiles son cantidades que dividen a la muestra de datos en cuatro partes iguales. Utilizando cuartiles podemos evaluar la dispersión y la tendencia central de un conjunto de datos, que son los pasos iniciales importantes para comprender sus datos. 1er cuartil (Q1): 25% de los datos es menor que o igual a este valor. 2do cuartil (Q2): La mediana. 50% de los datos es menor que o igual a este valor. 3er cuartil (Q3): 75% de los datos es menor que o igual a este valor. Al saber los 3 cuartiles podemos sacar el rango Intercuartil, el cual es la distancia entre el primer 1er cuartil y el 3er cuartil (Q3-Q1); de esta manera, abarca el 50% central de los datos. A partir de saber los cuartiles, podemos sacar un diagrama de caja, es un gráfico utilizado para representar una variable numérica, en si es una herramienta que permite visualizar, a través de los cuartiles, cómo es la distribución, su grado de asimetría, los valores extremos, la posición de la mediana, es un rectángulo (caja) delimitado por el primer y tercer cuartil, nos representa el 50% de los datos distribuidos a partir de la mediana como nuestro centro (Q2). El histograma es una gráfica de la distribución de un conjunto de datos. Es un tipo especial de gráfica de barras, en la cual una barra va pegada a la otra, es decir no hay espacio entre las barras y cada barra representa un subconjunto de los datos. muestra la acumulación ó tendencia, la variabilidad o dispersión y la forma de la distribución. En si, la superficie de cada barra es proporcional a la frecuencia de los valores representados. El mínimo se refiere al valor mas pequeño encontrado en la muestra. El máximo es el valor mas grande de entre todos los de la muestra. El rango es la diferencia entre el máximo y el mínimo, esto nos ayuda a conocer que tan dispersos se encuentran los datos, dato a considerar es que cuanto mayor sea el rango, significa que mas separados se encuentran los datos. El conteo es la cantidad total de elementos en la muestra, es en si el espacio muestral, en nuestro caso es 53 de cada línea, ya que eso fue lo que se midió en cada una.