Está en la página 1de 51

ESTADÍSTICA INFERENCIAL

II.
“PROYECTO FINAL 100%”

ELABORADO POR:

GONZALEZ VALDES JESÚS URIEL.


GARCÍA CORRALES DIEGO.
GONZALEZ LOMA LUIS EUGENIO.
GONZALEZ GONZALEZ JACQUELINE.
PERALTA CRUZ PERLA MAYTE.

PERIODO 2021-2

GRUPO: 4II11

DOCENTE: SERGIO TRUJILLO DIOSDADO


ÍNDICE.

ANTECEDENTES. ........................................................................................................... 1

OBJETIVO. ....................................................................................................................... 2

INTRODUCCIÓN ............................................................................................................. 3

ABSTRACT ...................................................................................................................... 4

MARCO TEORICO. .......................................................................................................... 5

SUAVIZACIÓN EXPONENCIAL. ................................................................................ 5

PROMEDIO MÓVIL ..................................................................................................... 8

REGRESIÓN LINEAL .................................................................................................. 9

DISEÑOS FACTORIALES CON 2 FACTORES Y 3 FACTORES. ............................. 14

ANÁLISIS DE VARIANZA ANOVA. ............................................................................ 18

BLOQUES COMPLETAMENTE ALEATORIOS. ...................................................... 23

METODOLOGÍA. ........................................................................................................... 26

SUAVIZACIÓN EXPONENCIAL: ................................................................................. 26

EJEMPLO. ............................................................................................................... 26

REGRESIÓN LINEAL: ............................................................................................... 28

EJEMPLO. ............................................................................................................... 28

PROMEDIO MÓVIL: .................................................................................................. 30

EJEMPLO. ............................................................................................................... 31

ANALISIS DE VARIANZA ANOVA: ........................................................................ 34

EJEMPLO. ............................................................................................................... 34

BLOQUES COMPLETAMENTE ALEATORIOS. ...................................................... 37

EJEMPLO. ............................................................................................................... 37

DISEÑOS FACTORIALES CON 2 FACTORES: ........................................................ 40


EJEMPLO ................................................................................................................ 40

DISEÑOS FACTORIALES CON 3 FACTOR: ............................................................ 43

EJEMPLO: ............................................................................................................... 43

CONCLUSIÓN................................................................................................................ 46

REFERENCIAS. ............................................................................................................. 47

ANEXOS. ........................................................................................................................ 48
ANTECEDENTES.

Rosticería “Jiménez” S.A de C.V.

Ubicación:

Esquina AV. Organización Popular Con Felipe Barrio Zabal Santa Elena,
Chimalhuacán, Estado De México.
La rosticería “Jiménez”, inicio hace aproximadamente 30 años en sus inicios
como todo negocio fue abriendo clientela en la zona donde se ubicó y por medio
de su buena sazón y la buena preparación de sus pollos, comenzó rápidamente
a crecer en cuestión de ventas y a jalar mas publico siempre con su lema “su
precio es lo de menos, sabor y calidad sabor y calidad es lo que cuenta”.

Y así fue creando un establecimiento base que a perdurado siempre con la


misma calidad y en cuestión de ventas buenas ganancias, dando trabajo a
muchas personas y degustando en la mesa de cada hogar de las personas de
santa elena y sus alrededores.

1
OBJETIVO.

El objetivo principal de la empresa es mantener y aumentar la rentabilidad del negocio


obteniendo una mayor productividad siempre ofreciendo un excelente servicio al cliente,
alcanzando cada vez más a personas y clientes nuevos logrando conquistar su gusto con el
sabor y calidad de su producto, manteniendo los valores fundamentales y buen servicio así
poco a poco tener un crecimiento sostenible y adecuado sobresaliendo siempre cada día
entre la competencia siendo esto lo que ha logrado que esta se mantenga a flote por muchos
años en sus zona generando una buena incrementación en el porcentaje de ventas teniendo
muy buenas ganancias, intentado siempre dar productos de buena calidad como lo dice su
lema “ “su precio es lo de menos, sabor y calidad sabor y calidad es lo que cuenta”.

2
INTRODUCCIÓN

La estadística es un área muy amplia y muy diversa de las matemáticas. Sus aplicaciones han
abarcado prácticamente todas las disciplinas del quehacer humano. La Estadística Inferencial
es la parte de la Estadística que se encarga de estudiar procedimientos para la obtención de
conclusiones, referentes al total de la población, a partir de la información proporcionada por
la muestra o muestras seleccionadas. Es de gran utilidad en todos aquellos estudios de
investigación llevados a cabo en poblaciones demasiado grandes como para poder realizar
mediciones en todos y cada uno de los individuos de dichas poblaciones.

En este trabajo se proporciona una introducción a grandes temas clásicos de la estadística


inferencial dos relativos al problema de la regresión lineal, suavización exponencial,
promedio móvil y el tema Diseño de experimentos de un factor y sus subtemas y se darán
ejemplos respectivo de cada tema expuesto en base a los datos que nos proporcionó la
rosticería “Santa Elena” . Los Modelos Lineales han sido usados durante décadas tanto
intensiva como extensivamente en aplicaciones Estadísticas. Llamamos Modelos Lineales a
aquellas situaciones que después de haber sido analizadas Matemáticamente, se representan
por medio de una función lineal, los cuales son lineales en los parámetros desconocidos e
incluyen un componente de error.

Por otro lado, el diseño de experimentos ha resultado ser una herramienta de gran impacto
para el progreso de la industria. Contribuye a conocer los procesos de una manera más
profunda, lo cual permite hacer mejoras en calidad y bajar los costos de producción por medio
de métodos científicos. El objetivo del diseño experimental es reducir al máximo la
variabilidad de los procesos, estudiando los factores que son considerados como de más alta
influencia sobre el proceso. Con el diseño de experimentos se pueden corregir defectos en
los productos, reducir consumos energéticos, analizar tipos de materiales, etc.

3
ABSTRACT

Statistics is a very large and very diverse area of mathematics. Its applications have
covered practically all disciplines of human activity. Inferential Statistics is the part
of Statistics that is responsible for studying procedures for obtaining conclusions,
referring to the total population, based on the information provided by the selected
sample or samples. It is very useful in all those research studies carried out on
populations that are too large to be able to carry out measurements on each and
every one of the individuals in said populations.

This paper provides an introduction to great classic topics of inferential statistics


related to the problem of linear regression, exponential smoothing, moving average
and the topic Design of one-factor experiments and its subtopics and respective
examples of each exposed topic will be given. based on the data provided by the
“Santa Elena” roastery. Linear Models have been used for decades both intensively
and extensively in Statistical applications. We call Linear Models to those situations
that after having been analyzed Mathematically, are represented by means of a
linear function, which are linear in the unknown parameters and include an error
component.

On the other hand, the design of experiments has turned out to be a tool of great
impact for the progress of the industry. It contributes to knowing the processes in a
deeper way, which allows making improvements in quality and lowering production
costs through scientific methods. The objective of the experimental design is to
minimize the variability of the processes, studying the factors that are considered to
have the highest influence on the process. With the design of experiments, it is
possible to correct defects in the products, reduce energy consumption, analyze
types of materials, etc.

4
MARCO TEORICO.

Suavización exponencial.

Los pronósticos de producción desarrollados con series de tiempo, hacen uso de los datos del
pasado para predecir el comportamiento de la demanda en el futuro.
Por tanto, de lo que se trata es de predecir qué va a pasar y lo que hace es suavizar la serie
temporal. El objetivo es reducir las fluctuaciones y conseguir observar una tendencia que a
veces no está clara a simple vista. Es muy utilizado, sobre todo, en previsión de ventas y ha
demostrado una eficacia más que aceptable.
Sin embargo, y a diferencia de otros métodos, el suavizado o alisamiento exponencial
funciona con muy pocos registros de periodos anteriores, destacando los hechos más
recientes sobre los más antiguos.
El método de suavización o suavizamiento exponencial simple puede considerarse como una
evolución del método de promedio móvil ponderado, en éste caso se calcula el promedio de
una serie de tiempo con un mecanismo de autocorrección que busca ajustar los pronósticos
en dirección opuesta a las desviaciones del pasado mediante una corrección que se ve
afectada por un coeficiente de suavización.
Así entonces, este modelo de pronóstico precisa tan sólo de tres tipos de datos: el pronóstico
del último período, la demanda del último período y el coeficiente de suavización.
El pronóstico de suavización exponencial simple es óptimo para patrones de demanda
aleatorios o nivelados donde se pretende eliminar el impacto de los elementos irregulares
históricos mediante un enfoque en períodos de demanda reciente, este posee una ventaja
sobre el modelo de promedio móvil ponderado ya que no requiere de una gran cantidad de
períodos y de ponderaciones para lograr óptimos resultados.
A diferencia de los métodos de promedio móvil simple y ponderado, este método no necesita
de gran volumen de datos históricos de la demanda. Por ende cada vez que se calcula el
pronóstico, se remueve la observación anterior y es reemplazada por la demanda más
reciente, y aquí es donde radica la ventaja.
Es el método de pronóstico más usado por su simpleza, tanto por pequeñas y grandes
empresas, sea en un sencillo archivo de Excel o un software como forecast pro. Sus ventajas
son:
5
Formulación es sencilla, pues solo requiere el pronóstico anterior, la demanda real del
periodo de pronóstico y la constante de suavización, como ya lo veremos más adelante.
No requiere de gran volumen de datos históricos.
Al ser un modelo exponencial, es más preciso.
Es flexible al conseguir darle más importancia a la demanda más reciente o a la antigua.
Su desventaja, al igual que los métodos de promedio móvil, es la respuesta a la tendencia.
Aun cuando un valor de alfa (α) logra responder frente a cambios en el promedio, cambios
sistemáticos de este harán más grande el error de pronóstico. Es tan así, que cuando se está
aplicando un alfa mayor a 0.5 con buenos resultados, optar por el alisado exponencial doble
suele ser mejor idea.
El método de suavización exponencial simple trabaja a través de una constante de
suavización alfa (α) que tiene un valor comprendido entre 0 y 1, aunque en la aplicación real
su valor suele variar entre 0,05 y 0,50.
La constante funciona como un factor de ponderación (si, parecido al pronóstico móvil
ponderado) y su variación se hace de acuerdo a nuestra necesidad de darle más peso a datos
recientes (alfa α más elevado) o a datos anteriores (alfa α más bajo). En este sentido, si α=1,
nuestro pronóstico de demanda del próximo periodo será exactamente igual al del periodo
actual.
En consecuencia, el alfa que elijamos estará relacionado con el índice de respuesta deseado
y la naturaleza del producto. ¿Por qué? Veamos. Por ejemplo, teniendo un producto o servicio
con demanda estable a través del año, nuestra constante de suavización tenderá a ser pequeña
(0,10 por ejemplo), debido a que, no requerimos un elevado índice de respuesta frente a los
cambios entre la demanda real y la demanda pronosticada.
Caso contrario es cuando la compañía comienza a tener un crecimiento en su demanda, lo
que va a requerir un alfa más elevado (0,30 por ejemplo) para dar mayor importancia a la
demanda reciente.
Como bien mencionamos antes, el cálculo es simple. Requerimos el pronóstico anterior, la
demanda real del periodo de pronóstico y la constante de suavización. Si es la primera vez
que usamos el método, el pronóstico anterior puede ser un estimado o el resultado de un
promedio simple, por ejemplo.
La fórmula de suavizamiento exponencial es la siguiente:

6
Fórmula de suavizamiento exponencial simple
Donde
Ft= Nuevo pronóstico
Ft-1= Pronóstico del periodo anterior
α = constante de suavización
At-1= demanda real del periodo anterior
Veamos una forma de cálculo sencilla. La fórmula, que mostramos con detalle en el ejemplo,
incluye una demanda real (Do) y un pronóstico (Po). Por otro lado, también se tiene en cuenta
el factor de suavización (alfa) expresado en tantos por uno.
Lo que hacemos, como veremos al final, es suavizar la serie. Sumamos al pronóstico del
período anterior (Po) la diferencia entre este y la demanda (Do) multiplicados por el factor
de suavización (alfa). Con esto conseguimos valores con menor variabilidad y se podrá
observar mejor la evolución de la serie temporal.
Por supuesto, existen modelos algo más complejos. Por un lado, el modelo Box-Jenkins y
por otro, el de Holt-Winter. Este último es muy útil por su sencillez y fácil utilización. No
vamos a entrar en detalles concretos, ya que nos excederíamos de nuestro objetivo de mostrar
la economía de forma sencilla.
Las ventajas de los métodos de suavización exponencial
Las ventajas son sobre todo la sencillez y la facilidad de aplicación, pero hay algunas más.
Mostramos las más relevantes a continuación:
No necesita de muchos datos históricos, a diferencia de otros métodos como el ARIMA.
Tiene una mayor precisión que otros al utilizar técnicas de modelado exponencial.
Es un método que goza de gran flexibilidad, al utilizar datos de demanda que pueden ser
elegidos por el investigador.
El llamado alisado exponencial doble permite reducir los problemas de pronóstico cuando el
factor de suavización es mayor a 0.5. Uno de sus pocos inconvenientes.

7
Promedio móvil

En estadística, una media móvil es un cálculo utilizado para analizar un conjunto de datos en
modo de puntos para crear series de promedios. Así las medias móviles son una lista de
números en la cual cada uno es el promedio de un subconjunto de los datos originales.
Por ejemplo, si se tiene un conjunto de 100 datos, el primer valor de la serie de medias
móviles podría ser el promedio de los primeros 25 términos, luego el promedio de los
términos 2 al 26, el tercer elemento de los términos 3 al 27 y así, hasta por último el promedio
de los últimos 25 números del 76 al 100.

Una serie de medias móviles puede ser calculada para cualquier serie temporal. Se usa para
demanda estable, sin tendencia ni estacionalidad; suaviza las fluctuaciones de plazos cortos,
resaltando así las tendencias o ciclos de plazos largos.

Una media móvil simple (Moving Averigüe) es la media aritmética de los datos anteriores.
En esta técnica elemental de predicción, cuanto más grande sea mayor será la influencia de
los datos antiguos. En contrapartida, si se selecciona una baja, se tendrán en cuenta datos más
recientes para nuestra predicción.

De acuerdo a lo enunciado con anterioridad, concluimos que la elección de influenciará


decisivamente nuestra predicción. Dependiendo del tipo de datos de serie temporal
analizados podremos adaptar eficazmente nuestra predicción a los mismos. Así, si se elige
un bajo, nuestra predicción tendrá una alta capacidad para responder rápidamente ante
fluctuaciones o variaciones significativas en los datos de un período a otro. Sin embargo, la
predicción en este caso estará altamente influenciada por efectos aleatorios. Por otro lado, la
elección de un muy alto provocará que, aunque se filtre la existencia de efectos aleatorios,
nuestras predicciones presenten una adaptación lenta ante fluctuaciones significativas en los
datos de períodos más recientes, pues dicha predicción estará teniendo en cuenta el valor de
datos antiguos.

8
La simplicidad de esta técnica hace que sea objeto de críticas en lo que refiere a su
consideración equitativa de datos recientes y datos antiguos, sobre todo cuando los objetos
de la predicción son variables cuya variabilidad en el corto plazo es importante para obtener
una predicción eficaz, v.gr: análisis de demanda, nº ventas, etc. Además, en presencia de una
tendencia en la serie de datos, la media movil simple causa problemas de predicción.
En lugar de utilizar solo datos anteriores, se utilizan también datos posteriores a aquel del
cual se quiere obtener la media.

La media móvil ponderado es una media multiplicada por ciertos factores, que le dan
determinado peso a determinados datos. La media móvil ponderada (Weighted Moving
Averigüe) desarrolla y mejora las aplicaciones de la media móvil simple. Se trata de la media
aritmética de los valores anteriores ponderados según diferentes criterios. De esta forma, se
superan los inconvenientes que ofrece la técnica de media móvil simple pues, en función de
las características de los datos analizados podremos decidir si darle mayor importancia a
datos más antiguos o más recientes. Esta técnica será más eficiente que la media móvil simple
a la hora de adaptar rápidamente el valor de la predicción a fluctuaciones en los datos
recientes.

La media móvil exponencial es una media móvil ponderado exponencialmente. Se trata de la


media aritmética de los anteriores con factores de ponderación que decrecen
exponencialmente. La ponderación para cada punto de datos más antiguo decrece
exponencialmente, nunca llegando a cero. El gráfico a la derecha muestra un ejemplo de la
disminución de la ponderación. Da mayor importancia a los datos más recientes. Esta técnica
será más eficiente que la media móvil simple y la media móvil ponderado a la hora de adaptar
rápidamente el valor de la predicción a fluctuaciones en los datos recientes (dándole una alta
ponderación a los valores más nuevos).

Regresión lineal

La regresión lineal es una técnica de modelado estadístico que se emplea para describir una
variable de respuesta continua como una función de una o varias variables predictoras. Puede

9
ayudar a comprender y predecir el comportamiento de sistemas complejos o a analizar datos
experimentales, financieros y biológicos.
La primera forma de regresión lineal documentada fue el método de los mínimos cuadrados
que fue publicada por Legendre en 1805, Gauss publicó un trabajo en donde desarrollaba de
manera más profunda el método de los mínimos cuadrados,1 y en dónde se incluía una
versión del teorema de Gauss-Márkov.

El término regresión se utilizó por primera vez en el estudio de variables antropométricas: al


comparar la estatura de padres e hijos, donde resultó que los hijos cuyos padres tenían una
estatura muy superior al valor medio, tendían a igualarse a este, mientras que aquellos cuyos
padres eran muy bajos tendían a reducir su diferencia respecto a la estatura media; es decir,
"regresaban" al promedio.2 La constatación empírica de esta propiedad se vio reforzada más
tarde con la justificación teórica de ese fenómeno.

El término lineal se emplea para distinguirlo del resto de técnicas de regresión, que emplean
modelos basados en cualquier clase de función matemática. Los modelos lineales son una
explicación simplificada de la realidad, mucho más ágiles y con un soporte teórico mucho
más extenso por parte de la matemática y la estadística.

Pero bien, como se ha dicho, se puede usar el término lineal para distinguir modelos basados
en cualquier clase de aplicación.

Las técnicas de regresión lineal permiten crear un modelo lineal. Este modelo describe la
relación entre una variable dependiente y (también conocida como la respuesta) como una
función de una o varias variables independientes Xi (denominadas predictores). La ecuación
general correspondiente a un modelo de regresión lineal es:
Y=β0+∑ βiXi+ϵ

donde β representa las estimaciones de parámetros lineales que se deben calcular y ϵ


representa los términos de error.

10
Hipótesis del modelo de regresión lineal clásico:

Media cero: Para cada valor de perturbación tomará distintos valores de forma aleatoria, pero
no tomará sistemáticamente valores positivos o negativos, sino que se supone tomará algunos
valores mayores que cero y otros menores que cero, de tal forma que su valor esperado sea
cero.

Homocedasticidad: Todos los términos de la perturbación tienen la misma varianza que es


desconocida. La dispersión de cada en torno a su valor esperado es siempre la misma.

Incorreción o independencia: para todo. Las covarianzas entre las distintas pertubaciones son
nulas, lo que quiere decir que no están correlacionadas. Esto implica que el valor de la
perturbación para cualquier observación muestral no viene influenciado por los valores de
las perturbaciones correspondientes a otras observaciones muestrales.
Regresores estocásticos. Los sistemas de ecuaciones simultáneas describen el
comportamiento de un vector de variables endógenas en función de un vector de variables
exógenas. Los regresores estocásticos surgen del hecho de que la variable endógena de una
ecuación puede entrar en otra como variable explicativa.

Independencia lineal. No existen relaciones lineales exactas entre los regresores.


Suponemos que no existen errores de especificación en el modelo, ni errores de medida en
las variables explicativas.

El modelo de regresión lineal simple sólo está conformado por dos variables estadísticas
llamadas Considera una única variable independiente o explicativa, y una variable
dependiente o respuesta, asumiendo que la relación entre ambas es lineal. Para la regresión
lineal simple, se asume que se relacionan mediante la relación funcional (siendo β1 y β0
estimadores) donde son constantes desconocidas llamadas coeficientes de regresión. β1: Se
trata del cociente entre la interacción obtenida entre ambas variables y la suma de cuadrados
de los valores de la variable dependiente. Este valor corresponde a la pendiente de la recta.
Por su parte, β0 es el resultado de la siguiente ecuación en la que aparecen los valores medios

11
correspondientes a ambas variables y el estimador β1 obtenido anteriormente. Este valor es
la ordenada en el origen.
Medicina
En medicina, las primeras evidencias relacionando la mortalidad con el fumar tabaco7
vinieron de estudios que utilizaban la regresión lineal. Los investigadores incluyen una gran
cantidad de variables en su análisis de regresión en un esfuerzo por eliminar factores que
pudieran producir correlaciones espurias.

En el caso del tabaquismo, los investigadores incluyeron el estado socioeconómico para


asegurarse que los efectos de mortalidad por tabaquismo no sean un efecto de su educación
o posición económica. No obstante, es imposible incluir todas las variables posibles en un
estudio de regresión.89 En el ejemplo del tabaquismo, un hipotético gen podría aumentar la
mortalidad y aumentar la propensión a adquirir enfermedades relacionadas con el consumo
de tabaco. Por esta razón, en la actualidad las pruebas controladas aleatorias son consideradas
mucho más confiables que los análisis de regresión.

Química
La concentración de un elemento es uno de los parámetros de mayor importancia en los
procesos químicos aplicados en la industria. Esta cuantificación se puede obtener mediante
un espectrofotómetro, dispositivo que requiere se calibrado. Para ello se elabora una recta de
calibración que se obtiene a partir de la correlación entre la absorbancia de un patrón y la
concentración de la sustancia a controlar.10

Mecánica
En esta rama se utiliza la Regresión Lineal entre otros para ajustar la recta de Paris, una
ecuación que sirve para estudiar elementos sometidos a fatiga en función del número de
ciclos a los que se somete un material. La bondad del ajuste se comprueba representando el
conjunto de valores discretos a-Nm obtenidos experimentalmente, frente a la curva
correspondiente a la recta de Paris definida por los valores “C” y “m”.

12
Electricidad
En electricidad se puede obtener el valor de una resistencia en un circuito y su error mediante
un ajuste de regresión lineal de pares de datos experimentales de voltaje e intensidad
obtenidos mediante un voltímetro y un amperímetro.

Sensores
Calibración de un sensor de temperatura (termopar) en función de la caída de tensión y la
temperatura. Se estudia la forma en que varía la temperatura de un líquido al calentarlo. Se
calibra el sensor y simultáneamente se mide la variación de temperaturas en un líquido para
representar los datos obtenidos posteriormente mediante Regresión Lineal.

Física
Determinación del coeficiente de rozamiento estático de forma experimental a partir de la
medición del ángulo de inclinación de una rampa. Se realiza un montaje ajustando un circuito
para medir el ángulo de inclinación, y se realizan mediciones variando dicho. Mediante la
regresión lineal de los datos obtenidos, se obtiene la ecuación y el índice de correlación a fin
de saber el error.

Fabricación
Dos de los parámetros más importantes de una soldadura es la intensidad aplicada al hilo y
la velocidad de alimentación del mismo. Mediante técnicas de regresión lineal se elaboran
las rectas que relacionan estos parámetros con la separación entre el hilo y la zona a soldar.
Diseño de experimentos

Con la metodología 2k es posible mejorar un proceso mediante la realización de


experimentos, determinando qué variables tienen un efecto significativo. A partir de esas
variables se obtiene una recta de regresión que modeliza el efecto. Por ejemplo, se podría
obtener la relación entre la temperatura y la presión en un proceso industrial.

Construcción
Mediante técnicas de regresión lineal se caracterizarán diversas cualidades del hormigón. A

13
partir del módulo de elasticidad es posible predecir la resistencia a la compresión de una
determinada composición de un hormigón. También se puede determinar la succión capilar
a partir del volumen absorbido por una muestra y el tiempo que ha durado la succión.
Aplicación de regresión lineal simple en el proceso de pigmentación de una empresa del
sector de la automoción
En la práctica, con mucha frecuencia es necesario resolver problemas que implican conjuntos
de variables, cuando se sabe que existe alguna relación inherente entre ellas. Por ejemplo, en
un caso industrial se puede saber que la pintura, para partes automotrices, está relacionada
con la cantidad de pigmentación con la que se lleva a cabo. Puede ser interesante desarrollar
un método de predicción, esto, un procedimiento para estimar el contenido de pigmentación
que deben de tener las pinturas para cumplir con las especificaciones de las armadoras como
se muestra en la siguiente imagen de tal manera que el problema consiste en lograr la mejor
estimación de la relación entre las variables.

Diseños factoriales con 2 factores y 3 factores.

Un diseño factorial con dos factores consiste en experimentar con todos los tratamientos que
se obtienen al combinar cada nivel de un factor con los niveles del otro. Se desea analizar si
el rendimiento de un determinado cultivo depende del tipo de semilla y de fertilizante
empleados.
En estadística, un experimento factorial completo es un experimento cuyo diseño consta de
dos o más factores, cada uno de los cuales, con distintos valores o niveles, cuyas unidades
experimentales cubren todas las posibles combinaciones de dichos niveles en todos los
factores. Este tipo de experimentos permiten estudiar el estudio del efecto de cada factor
sobre la variable respuesta, así como el efecto de las interacciones entre factores sobre dicha
variable.
Por ejemplo, con dos factores y dos niveles en cada factor, un experimento factorial tendría
en total cuatro combinaciones de tratamiento, y se le denominaría diseño factorial de 2×2.
Si el número de combinaciones en un diseño factorial completo es demasiado alto para su
procesamiento, puede optarse por un diseño factorial fraccional, en el que se omitan algunas
de las combinaciones posibles.

14
Los diseños factoriales fueron utilizados en el siglo XIX por Jhon Bennet Lawes y Henry J.
Gilbert de la Estación experimental de Rothamsted.

Ronald Fisher discutió en 1926 que los diseños «complejos», tales como los diseños
factoriales, eran más eficientes que estudiar un factor a la vez. Fisher escribió: «ningún
aforismo se repite tan frecuentemente respecto de las pruebas de campo, que aquel de que a
la Naturaleza debemos hacerle pocas preguntas, o, idealmente, hacérselas de a una. Quien
escribe está convencido de que este punto de vista está totalmente equivocado.

Un diseño factorial permite que el efecto de varios factores e incluso las interacciones entre
ellos sean determinados con el mismo número de ensayos que son necesarios para determinar
cualquiera de los efectos por sí solo con el mismo grado de exactitud.

Frank Yates realizó importantes contribuciones, particularmente en el análisis de diseños,


mediante el análisis de Yates.

Es posible que el término "factorial" no haya sido utilizado en forma impresa hasta 1935,
cuando Fisher la utilizó en su libro El diseño de experimentos.

Para ahorrar el espacio, los puntos en un experimento factorial de dos niveles se abrevian a
menudo con las cadenas de más y signos de menos. Las secuencias tienen tantos símbolos
como factores, y sus valores dictan el nivel de cada factor: − para el primer (o bajo) llano, y
+ para el segundo (o alto) llano. Los puntos en este experimento se pueden representar como
−−,+−,−+,y++.

Los puntos factoriales se pueden también abreviar cerca (1), a, b, y el ab, donde la presencia
de una letra indica que el factor especificado está en su alto (o en segundo lugar) nivel y la
ausencia de una letra indica que el factor especificado está en su (o primero) nivel bajo (por
ejemplo, “a” indica que el factor A está en su alto ajuste, mientras que el resto de los factores
están en su ajuste del punto bajo (o primero)). (1) se utiliza indicar que todos los factores
están en sus (o primero) valores más bajos.

15
Para poder finalmente obtener un modelo estadístico que nos indique el valor de respuesta al
modificar los factores.

Cálculo del efecto


Contraste = (suma de niveles+)-(suma de niveles-) Efecto Contraste /replica*2^k
b= efecto/2 bo= suma total/numero total
Modelo estadístico: Y= bo+ b1X1 + b2X2.

Los métodos de investigación tradicionales generalmente estudian el efecto de una variable


a la vez, ya que estadísticamente es más fácil de manipular. Sin embargo, en muchos casos
dos factores pueden ser interdependientes y es poco viable o erróneo tratar de analizarlos de
manera tradicional.

Los investigadores sociales suelen utilizar diseños factoriales para evaluar los efectos de los
métodos de enseñanza, teniendo en cuenta la influencia de los factores socio-económicos y
la experiencia.

Es común que en las ciencias agrarias se utilicen diseños factoriales por la necesidad de las
pruebas de campo para probar el efecto de las variables en los cultivos. En esos estudios a
gran escala, es difícil y poco práctico aislar y probar cada variable individualmente.
Los experimentos factoriales permiten manipulaciones sutiles de un número mayor de
variables interdependientes. Si bien el método presenta limitaciones, es útil para una
investigación más eficiente y para permitir que los métodos estadísticos fuertes expongan
todas las correlaciones.

Imagina un grupo de investigación de acuicultura tratando de probar los efectos de los


aditivos alimentarios sobre la tasa de crecimiento de la trucha.

Un experimento tradicional implicaría seleccionar aleatoriamente diferentes peceras y


alimentar a sus peces variando los niveles de aditivo en el alimento, por ejemplo, ninguno o

16
10%.
Sin embargo, como cualquier piscicultor sabe, la densidad de población también es crucial
para el crecimiento de los peces. Si no hay suficientes peces en un tanque, la capacidad
desperdiciada cuesta dinero. Si la densidad es demasiado alta, los peces crecen a un ritmo
más lento.

En lugar del experimento tradicional, los investigadores podrían utilizar un diseño factorial
y coordinar la prueba aditiva con diferentes densidades de población, tal vez eligiendo cuatro
grupos. Entonces, el experimento factorial necesitaría 4 x 2 u ocho tratamientos.

Las reglas tradicionales del método científico siguen vigentes. Por lo tanto, las estadísticas
exigen que todos los experimentos sean realizados por triplicado.

Esto implica 24 tanques de tratamiento separados. Por supuesto, los investigadores también
podrían probar, por ejemplo, 4 niveles de concentración para el aditivo y esto daría 4 x 4 o
16 tanques, es decir, 48 tanques en total.

Cada factor es una variable independiente, mientras que el nivel es la subdivisión de un


factor. Suponiendo que estamos diseñando un experimento con dos factores, un 2 x 2
significaría dos niveles para cada uno, mientras que un 2 x 4 significaría dos subdivisiones
para un factor y cuatro para el otro. Es posible probar más de dos factores, pero muy
rápidamente se hace difícil de manejar.

En el ejemplo de piscifactoría, imagina añadir otro factor, como la temperatura, con cuatro
niveles en la mezcla. Entonces sería 4 x 4 x 4 o 64 carreras. Por triplicado, serían 192 tanques,
un proyecto enorme.

Existen otros métodos, tales como los diseños factoriales fraccionados, para reducir esto,
pero no siempre son estadísticamente válidos. Éstos se encuentran firmemente en el campo
de la estadística avanzada y se trata de proyectos largos, complicados y arduos.
Los diseños factoriales son muy útiles para los psicólogos y los científicos de campo como

17
estudio preliminar, ya que les permiten juzgar si existe una conexión entre las variables y
reducen la posibilidad de un error experimental y de variables de confusión.
El diseño factorial, además de simplificar el proceso y abaratar el costo de la investigación,
permite muchos niveles de análisis. Además de resaltar las relaciones entre las variables,
permite que sean aislados y analizados por separado los efectos de la manipulación de una
sola variable.

La mayor desventaja es la dificultad de experimentar con más de dos factores o muchos


niveles. Un diseño factorial debe ser planificado cuidadosamente, ya que un error en uno de
los niveles o en la operacionalización general pondría en peligro una gran cantidad de trabajo.
Dejando de lado estas pequeñas desventajas, un diseño factorial constituye uno de los pilares
de muchas disciplinas científicas, ya que ofrece excelentes resultados en el campo.

Análisis de varianza ANOVA.

El análisis de la varianza permite contrastar la hipótesis nula de que las medias de K


poblaciones (K >2) son iguales, frente a la hipótesis alternativa de que por lo menos una de
las poblaciones difiere de las demás en cuanto a su valor esperado. Este contraste es
fundamental en el análisis de resultados experimentales, en los que interesa comparar los
resultados de K 'tratamientos' o 'factores' con respecto a la variable dependiente o de interés.

El Anova requiere el cumplimiento los siguientes supuestos:

 Las poblaciones (distribuciones de probabilidad de la variable dependiente


correspondiente a cada factor) son normales.
 Las K muestras sobre las que se aplican los tratamientos son independientes.
 Las poblaciones tienen todas igual varianza (homocedasticidad).

El ANOVA se basa en la descomposición de la variación total de los datos con respecto a la


media global (SCT), que bajo el supuesto de que H0 es cierta es una estimación de obtenida
a partir de toda la información muestral, en dos partes:

18
Variación dentro de las muestras (SCD) o Intra-grupos, cuantifica la dispersión de los valores
de cada muestra con respecto a sus correspondientes medias.
Variación entre muestras (SCE) o Inter-grupos, cuantifica la dispersión de las medias de las
muestras con respecto a la media global.

Las expresiones para el cálculo de los elementos que intervienen en el Anova son las
siguientes:

 Media Global:
 Variación Total:
 Variación Intra-grupos:
 Variación Inter-grupos:

Siendo xij el i-ésimo valor de la muestra j-ésima; nj el tamaño de dicha muestra y su media.
Cuando la hipótesis nula es cierta SCE/K-1 y SCD/n-K son dos estimadores insesgados de la
varianza poblacional y el cociente entre ambos se distribuye según una F de Snedecor con
K-1 grados de libertad en el numerador y N-K grados de libertad en el denominador. Por lo
tanto, si H0 es cierta es de esperar que el cociente entre ambas estimaciones será
aproximadamente igual a 1, de forma que se rechazará H0 si dicho cociente difiere
significativamente de 1.

La secuencia para realizar un ANOVA es:


Analizar
Comparar medias
ANOVA de un factor
Se selecciona la variable que se considera Dependiente y la variable Factor y con el botón
Opciones se activan Estadísticos Descriptivos y Homogeneidad de varianzas.
Al aceptar en el visor de resultados aparecen los siguientes cuadros:
Descriptivos. Recoge la media, la desviación típica, el intervalo de confianza del 95% (por
defecto) para la media correspondientes a la variable dependiente para cada uno de los grupos
definidos por el factor.

19
Prueba de homogeneidad de varianzas. Contiene el valor del estadístico de Levene del
contraste de la hipótesis de homocedasticidad con el nivel de significación crítico.
ANOVA. Contiene las sumas de cuadrados Inter grupos, intragrupo y total, sus
correspondientes grados de libertad y el valor del estadístico de prueba F junto con el nivel
de significación crítico.

Como complemento gráfico de este análisis, para obtener una primera aproximación acerca
de si es razonable o no la hipótesis nula, se selecciona Gráficos > Barras de error y se activa
la opción Simple. Con el botón Definir se abre el siguiente cuadro de diálogo:
Se selecciona en Variable la variable dependiente del ANOVA y en el Eje de categorías la
variable factor.
El intervalo de confianza para la media se calcula por defecto al 95% de confianza. Al aceptar
aparece en el visor de resultados los puntos que representan a la media de cada grupo junto
con los límites del correspondiente intervalo de confianza para la media poblacional. Si los
puntos que representan las medias están desigualmente distribuidos en el gráfico se tiene un
indicio de que a nivel poblacional no puede sostenerse la hipótesis de igualdad de medias; es
decir, por lo menos uno de los niveles del factor influye significativamente sobre la variable
dependiente.

Con los datos de la encuesta sobre transporte, Enctrans.sav, razonar si puede aceptarse que
el tipo de transporte utilizado, Trans, influye sobre la variable tiempo.

Con la opción de menú Gráficos > Barras de error > Simple y con el botón Definir se
selecciona como Variable Tiempo y en Eje de categorías la variable Trans; al aceptar se
obtiene la siguiente representación gráfica:

Como puede observarse, los puntos que representan a las medias de cada grupo aparecen
dispersos a diferentes niveles; sobre todo la media del grupo definido por el factor Tren. El
intervalo de confianza para la media correspondiente al grupo definido por el factor Metro
está contenido dentro del intervalo correspondiente al grupo definido por el factor Bus, así
como, el intervalo correspondiente al factor Coche está contenido dentro de los intervalos

20
correspondientes definidos por los factores Metro y Otros. El gráfico, por tanto, parece
sugerir no una única población sino tres poblaciones con distintas medias.

Para realizar el análisis de la varianza propiamente dicho la secuencia es Analizar >


Comparar medias > ANOVA de un factor. En el cuadro de diálogo se selecciona Tiempo
como variable Dependiente y Trans como Factor. Para contrastar la hipótesis de igualdad de
varianzas se abre con el botón correspondiente el cuadro de diálogo ANOVA de un factor:
Opciones y se activa Homogeneidad de varianzas. Si se desea un análisis descriptivo del
comportamiento de la variable dependiente dentro de cada grupo se activa también la opción
Descriptivos. Al aceptar se obtienen los siguientes cuadros de resultados:

Este cuadro contiene un análisis descriptivo de la variable dependiente por grupos, así como,
los límites superior e inferior para la media de cada grupo al 95% de confianza.

El estadístico de Levene toma un valor lo suficientemente pequeño para no rechazar la


hipótesis de homocedasticidad a los niveles de significación habituales.

En el cuadro de resultados del ANOVA, el valor del estadístico de prueba, F=6,450, es


significativamente distinto de 1 para cualquier nivel de significación y, por lo tanto, se
rechaza la hipótesis nula de igualdad de medias y queda confirmada la primera impresión
proporcionada por el gráfico de barras de error.

Por ejemplo, para estudiar la efectividad de diferentes medicamentos para la diabetes, los
científicos diseñan y experimentan para explorar la relación entre el tipo de medicamento y
el nivel de azúcar sanguínea resultante. La población de la muestra es un conjunto de
personas. Dividimos la población de la muestra en varios grupos y cada grupo recibe un
medicamento en particular durante un período de prueba. Al final del período de prueba, se
miden los niveles de azúcar sanguínea para cada uno de los participantes individuales. Luego,
para cada grupo, se calcula el nivel medio de azúcar sanguínea. ANOVA ayuda a comparar
las medias de estos grupos para averiguar si son estadísticamente diferentes o si son similares.

21
El resultado de ANOVA es la 'estadística F'. Esta ratio muestra la diferencia entre la varianza
dentro del grupo y la varianza entre grupos, lo que finalmente produce una cifra que permite
concluir que la hipótesis nula es respaldada o rechazada. Si hay una diferencia significativa
entre los grupos, la hipótesis nula no es compatible y la razón F será mayor.

Variable dependiente: este es el elemento que se está midiendo y que se teoriza como
afectado por las variables independientes.

Variable(s) independiente(s): estos son los elementos que se están midiendo y que pueden
tener un efecto sobre la variable dependiente.

Una hipótesis nula (H0): Sucede cuando no existe diferencia entre los grupos o medias.
Dependiendo del resultado de la prueba ANOVA, la hipótesis nula será aceptada o rechazada.
Una hipótesis alternativa (H1): Cuando se teoriza que existe una diferencia entre los grupos
y las medias.

Factores y niveles: En la terminología ANOVA, una variable independiente se denomina


factor que afecta a la variable dependiente. El nivel denota los diferentes valores de la
variable independiente que se utilizan en un experimento.

Modelo de factor fijo: algunos experimentos utilizan solo un conjunto discreto de niveles
para los factores. Por ejemplo, una prueba de factor fijo evaluaría tres dosis diferentes de un
medicamento y no buscaría ninguna otra dosis.

Modelo de factor aleatorio: este modelo extrae un valor aleatorio de nivel de todos los valores
posibles de la variable independiente El análisis de la varianza unidireccional también se
conoce como ANOVA de un solo factor o ANOVA simple. Como sugiere el nombre,
ANOVA de una vía es adecuado para experimentos con una sola variable independiente
(factor) con dos o más niveles. Por ejemplo, una variable dependiente puede ser en qué mes
del año hay más flores en el jardín. Habrá doce niveles. Un ANOVA unidireccional asume:
Independencia: el valor de la variable dependiente para una observación es independiente del

22
valor de cualquier otra observación.
Normalidad: el valor de la variable dependiente se distribuye normalmente
Varianza: la varianza es comparable en diferentes grupos de experimentos.
Continuo: la variable dependiente (cantidad de flores) es continua y se puede medir en una
escala que se puede subdividir.

Bloques completamente aleatorios.

El análisis de la varianza unidireccional también se conoce como ANOVA de un solo factor


o ANOVA simple. Como sugiere el nombre, ANOVA de una vía es adecuado para
experimentos con una sola variable independiente (factor) con dos o más niveles. Por
ejemplo, una variable dependiente puede ser en qué mes del año hay más flores en el jardín.
Habrá doce niveles. Un ANOVA unidireccional asume:

 Independencia: el valor de la variable dependiente para una observación es


independiente del valor de cualquier otra observación.
 Normalidad: el valor de la variable dependiente se distribuye normalmente
 Varianza: la varianza es comparable en diferentes grupos de experimentos.
 Continuo: la variable dependiente (cantidad de flores) es continua y se puede medir
en una escala que se puede subdividir.
 Una variable bloque no presenta interacción con los factores en estudio.

El modelo se dice que es de bloques aleatorizados completos cuando en cada bloque se


presentan todos los posibles tratamientos (o un múltiplo de ese número) y dentro de cada
bloque se asignan los tratamientos de forma aleatoria.

En ocasiones no se pueden asignar todos los tratamientos sobre cada bloque, de modo que se
tienen los diseños por bloques aleatorizados incompletos.

Suponemos que el número de unidades experimentales para cada bloque coincide con el
número de tratamientos, esto es, hay una observación para cada cruce de los niveles del factor
y del bloque. La variable respuesta Y puede depender de un primer factor de interés (A) y de

23
la variable bloque (B). El modelo es:
Yij = μ + αi + βj + εij
para i = 1,...,a y j = 1, . . . , b, siendo:
— μ el efecto medio global
— αi el efecto incremental sobre la media causado por el nivel i del factor A
— βj el efecto incremental sobre la media causado por el nivel j del bloque B
— εij el término de error.
diseño se conoce como diseño en bloques1
completos aleatorizados. La palabra completo
indica que todos los tratamientos se prueban en cada bloque.

Puede suceder, cuando se realizan diseños en bloques aleatorizados, que no puedan


realizarse los ensayos de todos los tratamientos dentro de cada bloque, debido, por ejemplo,
a la escasez de recursos del experimento o al tamaño físico de los bloques. Es decir, no
se puede aplicar cada fertilizante en cada bloque. En estos casos, es posible usar diseños
aleatorizados por bloques en los que no todos los tratamientos se encuentran representados
en cada bloque, y aquellos que sí están representados en uno en particular se ensayan en
él una sola vez. Estos diseños se conocen como diseños por bloques incompletos.

Recordemos que en el diseño completamente aleatorizado asignábamos los tratamientos al


azar a las parcelas sin restricción alguna, mientras que en el diseño en bloques aleatorizados
primero agrupamos las parcelas en bloques y a continuación asignamos los tratamientos a las
parcelas en cada bloque. Podemos decir, por tanto, que un diseño en bloque aleatorizado es
un diseño con aleatorización restringida en el cual las unidades experimentales son primero
clasificadas en grupos homogéneos, llamados bloques, y los tratamientos son entonces
asignados aleatoriamente dentro de los bloques. Esta estrategia de diseño mejora
efectivamente la precisión en las comparaciones al reducir la variabilidad residual. Dicho
diseño es quizás el diseño experimental más ampliamente utilizado. En la práctica, las
situaciones en las que este diseño se aplica son muy numerosas y pueden identificarse
fácilmente. Estudiaremos en primer lugar el diseño en bloques completos aleatorizados, y en
la Sección el diseño en bloques incompletos.

24
En cualquier experimento, la variabilidad proveniente de un factor de ruido puede afectar los
resultados. Un factor de ruido es un factor que probablemente tiene un efecto en la respuesta
pero que no nos interesa estudiar. Si el factor de ruido es desconocido y no controlable,
lasolución es la aleatorización, que tiende a distribuir los niveles y efectos de este factor entre
todas las u.e.

Si el factor de ruido es conocido y no controlable, pero porlo menos podemos medir su valor
en cada corrida del experimento, entonces podemos compensarlo usando análisis de
convarianza. Si el factor de ruido es conocido y controlable, se utilizan bloques para eliminar
su efecto en la comparación estadística de los tratamientos.

Usar bloques estratifica a las u.e. en grupos homogéneos. Una buena elección del criterio de
bloqueo resulta en menor variación entre las u.e. dentro de los bloques comparada con la
variación entre u.e.

El diseño de bloques (completos) al azar implica que en cada bloque hay una sola observación
de cada tratamiento. El orden en que se “corren” los tratamientos dentro de cada bloque es
aleatorio (restricción en la aleatorización).

25
METODOLOGÍA.

SUAVIZACIÓN EXPONENCIAL:

Para este método requerimos el pronóstico anterior, la demanda real del periodo de
pronóstico y la constante de suavización. Si es la primera vez que usamos el método, el
pronóstico anterior puede ser un estimado o el resultado de un promedio simple, por ejemplo.

Fórmula.

Donde

Ft= Nuevo pronóstico

Ft-1= Pronóstico del periodo anterior

α = constante de suavización

At-1= demanda real del periodo anterior

EJEMPLO.

La rosticería “Jiménez” desea pronosticar las ventas de pollo, para lo cual usarán como dato
inicial se usarán los anteriores.

El pronóstico de demanda del período 1 es 2869 ventas de pollo por personas, pero la
demanda para ese periodo fue de 3200. La compañía según su criterio asigna α=0,35.

La demanda del próximo periodo es:

Ft=Ft-1+a((At-1) - (Ft-1))

Ft= 2869+0.35(3200-2869) =2984.85

26
Se obtuvo la siguiente tabla comparativa entre lo realmente obtenido (demanda – segunda
columna) y lo pronosticado en ese momento (tercera columna).

Periodo Demanda Pronostico


1 3200 2869
2 3108 2984.85
3 2930 3027.95
4 2801 2993.67
5 2316 2926.23
6 2444 2712.65
7 2719 2618.62
8 3133 2653.76
9 3459 2821.49
10 2819 3044.62
11 2773 2965.65
12 2321 2898.22

3500

3000

2500

2000

1500

1000

500

0
1 2 3 4 5 6 7 8 9 10 11 12

Periodo Demanda Pronostico

27
Regresión lineal:

Este método puede ayudar a comprender y predecir el comportamiento de sistemas complejos


o a analizar datos experimentales, financieros y biológicos. De igual forma permiten crear un
modelo lineal. Este modelo describe la relación entre una variable dependiente yy (también
conocida como la respuesta) como una función de una o varias variables
independientes XiXi (denominadas predictores).

La ecuación general correspondiente a un modelo de regresión lineal es:

Y=β0+∑ βiXi+ϵiY=β0+∑ βiXi+ϵi

donde ββ representa las estimaciones de parámetros lineales que se deben calcular


y ϵϵ representa los términos de error.

EJEMPLO.

La rosticería “Jiménez” desea saber cuál es el pronóstico de incremento en unidades y en


porcentaje de ventas del año 2022 dadas las ventas desde el 2015 hasta el 2021.

Año Ventas en Miles


2015 685
2016 698
2017 710
2018 735
2019 745
2020 798
2021 821
2022 ¿?

28
Ventas en
Año
Miles
1 2015 685
2 2016 698
3 2017 710
4 2018 735
5 2019 745
6 2020 798
7 2021 821
8 2022 834
Incrementos en unidades del
año 2022
13
1.53%

VENTAS EN MILES
900
821 834
800 798
735 745
700 685 698 710

600
500
400
300
200
100
0
1 2 3 4 5 6 7 8

29
PROMEDIO MÓVIL:

El pronóstico de promedio móvil es óptimo para patrones de demanda aleatorios o nivelados


donde se pretende eliminar el impacto de los elementos irregulares históricos mediante un
enfoque en períodos de demanda reciente.

Fórmula

Promedio de ventas en unidades en el periodo t

Sumatoria de datos

Ventas reales en unidades de los periodos anteriores a t

Número de datos

30
EJEMPLO.

La rosticería “Jiménez” presenta en el siguiente tabulado el reporte de ventas correspondiente


al año 2009:

VENTAS REALES
MES
(2009)
Enero 80
Febrero 90
Marzo 85
Abril 70
Mayo 80
Junio 105
Julio 100
Agosto 105
Septiembre 100
Octubre 105
Noviembre 100

Teniendo en cuenta los datos anteriores, se debe calcular un pronóstico mediante la técnica
de Promedio Móvil utilizando:

 Un período de 3 meses (a partir de abril de 2009).


 Un período de 6 meses (a partir de julio de 2009).

El objetivo consiste en identificar con cuál de los dos períodos del pronóstico se obtiene
mayor precisión al compararse con las ventas reales del reporte.

Al ser un pronóstico con un período móvil de 3 meses, este deberá efectuarse a partir del
mes de abril, es decir que para su cálculo tendrá en cuenta tres períodos, es decir, Enero,
Febrero y Marzo.

31
Luego para efectuar la previsión del mes de Mayo, deberán tenerse en cuenta los últimos
tres períodos que anteceden al mes de Mayo, es decir Febrero, Marzo y Abril.

De esta manera se efectúan las previsiones restantes obteniendo el siguiente resultado:

Ventas Reales
Mes
(2009) Pronostico 3 Meses
Enero 80
Febrero 90
Marzo 85
Abril 70 85
Mayo 80 82
Junio 105 78
Julio 100 85
Agosto 105 95
Septiembre 100 103
Octubre 105 102
Noviembre 100 103
Diciembre 150 102

El pronóstico restante al ser un pronóstico con un período móvil de 6 meses, este deberá
efectuarse a partir del mes de Julio, es decir que para su cálculo tendrá en cuenta seis
períodos, es decir, Enero, Febrero, Marzo, Abril, Mayo y Junio.

32
De esta manera se efectúan las previsiones restantes obteniendo el siguiente resultado:

VENTAS REALES PRONOSTICO 3 PRONOSTICO 6


MES
(2009) MESES MESES
Enero 80
Febrero 90
Marzo 85
Abril 70 85
Mayo 80 82
Junio 105 78
Julio 100 85 85
Agosto 105 95 88
Septiembre 100 103 91
Octubre 105 102 93
Noviembre 100 103 99
Diciembre 150 102 103
Podemos observar como el pronóstico con un período móvil de 3 meses logra aproximarse
en una mayor medida a las ventas reales del año 2009 con relación a las previsiones obtenidas
mediante el pronóstico con un período móvil de 6 meses.

160
140
120
100
80
60
40
20
0

VENTAS REALES(2009) PRONOSTICO 3 MESES PRONOSTICO 6 MESES

33
ANALISIS DE VARIANZA ANOVA:

El ANOVA se basa en la descomposición de la variación total de los datos con respecto a la


media global (SCT), que bajo el supuesto de que H0 es cierta es una estimación

de obtenida a partir de toda la información muestral, en dos partes:

 Variación dentro de las muestras (SCD) o Intra-grupos, cuantifica la dispersión de los


valores de cada muestra con respecto a sus correspondientes medias.
 Variación entre muestras (SCE) o Inter-grupos, cuantifica la dispersión de las medias
de las muestras con respecto a la media global.

Las expresiones para el cálculo de los elementos que intervienen en el Anova son las
siguientes:

Media/Global:

Variación Total:

Variación Intra-grupos:

Variación Inter-grupos:

Siendo xij el i-ésimo valor de la muestra j-ésima; nj el tamaño de dicha muestra y su


media.

EJEMPLO.

El dueño de la rosticería está considerando un análisis de 2 máquinas para una mayor


producción, por lo que se utilizara una muestra aleatoria de 3 pruebas en cada máquina para
determinar si es apta la resistencia promedio a la tensión, varia de maquina en maquina o no
continua, esto se va a representar kg/cm2.
Se realizará el análisis de varianza a un nivel de significancia de 0.05 e indique si las
resistencias promedio a la tensión difieren o no significativamente para las 2 máquinas.

34
Maquina 1 Maquina 2
16.9 14.6
18.6 18.9
15.8 16.5
Total: 51.3 Total: 50 =101.3

Ho: m1 = m2
Hipótesis alternativa que al menos 1 es diferente
HI: M, > M2
Completar la tabla anova
1.elevar al cuadrado

Maquina 1 Maquina 2
285.61 213.16
345.96 357.21
249.64 272.25
Total: 881.21 Total: 842.62

SST= 1723.83-101.32 / (1)(2) = 68.02

FUENTE DE SUMA DE GRADOS DE CUAFROS F


VARIACION CUADROS LIBERTAD MEDIOS (CALCULADA)
TRATAMIENTOS 4.99 3 0.99
ERROR 65.4 11 3.63 0.18421
TOTAL 58.44 21

SSA= ETJ2/n – T2/nk

M-1 M-2
TOTAL 61.2 58.3
4255.3 502.3

35
ET=32566.22
SSA=32566.22/4-426.472/ (2)(1) =4.66
SSE=SST-SSA
SSE=70.44-4.66=62.4
1.K-1 6-1=5
2.K(N-1) 6(4-1) 6(3) =18
3. N.K (1) (4)(6)-1 24-1=23
S12=4.99/6-1=4.66/5=0.563
S22=65.45/6(4-1) =65045/18=2.6666
F CALCULADA= S1/S2 = 0.9625/4.5623=0.51487
F CALCULADA=0.221
F TABLAS=2.523

36
BLOQUES COMPLETAMENTE ALEATORIOS.

Un diseño de bloques aleatorizados es un diseño frecuentemente utilizado para minimizar el


efecto de la variabilidad cuando se asocia con unidades discretas (por ejemplo, ubicación,
operador, planta, lote, tiempo).

EJEMPLO.

En una rosticería se contaban con 2 sitios para almacenar (con capacidad de 500 cajas) un
aspecto importante es para que se conserve el pollo. Por lo cual existe la posibilidad de que
en uno de los sitios hay problema con esta parte, por ello durante cierto tiempo (3 días) se
decide hacer un chequeo y registrar la temperatura de cada uno de los sitios.

Sitios/días sábado domingo lunes


A 1.1 6.5 5.2
B 1.0 3.8 3.2

Prueba de hipótesis
HO: =MA=MB
HO: al menos 1 media es diferente a las demás
A= 4 B= 5
Factor de interés-factor de bloqueo

Sitios/días sábado domingo lunes Medias


A 0.2 1.2 0.4 1.21
B 1.3 3.2 .6 1.56
medias 1.2 1.63 1 1.99

Suma de Grados de Cuadrados de Valor f


cuadrados libertad medida calculada
Factor 15.6 2 3.563 23.54
Bloque 2.3 8 2.612 21.2

37
Error 1.523 4 0.2851
total 12.36 15

SSF=BE YI2-N2
SSF= 5E (1.14+1.16+1.38+3.56)2-20(1.96)2=10.04
Suma de cuadros totales
SST= E E YIJ2-H Y2
SST= E
(1.3+1.6+0.5+1.2+1.1+2.2+2.4+0.4+2.0+0.4+2.0+1.8+1.7+0.6+1.5+1.6+3.9+4.4+2.0+4.1+
1.3+4.1-20 (1.96)2=25.688
Suma de cuadrados residuales
SSE=SST-SSF-SSB= 25.688-14.526-6.2559
Grados de libertad
A 4-1=3
B 5-1= 4
(a-1)(b-1)=(3)(4)=12
n-1= 29-1= 19
MS FACTOR= SSP/GLL (FACTOR)=18.044/3=2.256
MS BLOQUE= 6.563/5=0.2656
MS ERROR= 03285/255=2.06
VALOR F= MS (FACTOR)/MS(ERROR)
F(FACTOR)=6.13685/0.2335=59.23
F=1.2654/0.0296=19.20

38
39
DISEÑOS FACTORIALES CON 2 FACTORES:

Un diseño factorial con dos factores consiste en experimentar con todos los tratamientos que
se obtienen al combinar cada nivel de un factor con los niveles del otro. Se desea analizar si
el rendimiento de un determinado cultivo depende del tipo de semilla y de fertilizante
empleados.

EJEMPLO

Dos inspectores de calidad han realizado un estudio de nuestras máquinas de rostizado, del
mismo análisis de calidad midiendo el desempeño logrado en cada una de ellas, obteniendo
una calificación por cada uno de los inspectores por su desempeño y los resultados fueron
los siguientes:
Inspector 1 Inspector 2
52 52
21 38
28 47
86 63
54 35
47 14
12 45
Total:563 Total:632
X=65.23 X=101.2

Utilizar el nivel de significancia 0.05


Inspector 1 Inspector 2

5232 5252

2125 3854

2854 4778

8621 6312

40
5445 3565

4786 1454

1272 4596

E=56321 E=52325

EYI=53407.2351+55265=13698
T2=56325+632=5632
N=12+25+36=40.5=420
ETJ2=2562+5262+63252+122=25361
Y=41+56+58=99
GRADOS LIBERTAD
K-1=3-1=2
N-K=20-1=52
SST=EYJ2-T2/N
SSA=ETJ2-T2/N
SST=199.462-25632/5236=52369
SAA=SST-SSA=13025.32-323.54=42652.51

FUENTE DE SUMA DE GRADOS CUADROS F


VARIACION CUADRADOS DE MEDIOS CALCULADA
LIBERTAD
TRATAMIENTOS 996.3 2 263.25
ERROR 4256.3 5 3.4856 0.256
TOTAL 1264266.1 54

S21=926.32/2=236.23
S22=15236.36/39=2253.365
F=239526/23696.23=0.236

41
42
DISEÑOS FACTORIALES CON 3 FACTOR:

El estudio factorial de tres factores A, B y C permite estudiar los efectos A, B, C (efectos


principales), AB, AC, BC (efectos de las interacciones de a dos factores) y ABC (la triple
interacción), donde el grado de detalle con el que se puede estudiar depende del número de
niveles usados para cada factor.

EJEMPLO:

En una rosticería se analizará para la producción de un pollo con 2 maquínalas contables para

su elaboración, se llevarán a cabo aproximadamente 4 operaciones para su elaboración, se

manejará aleatoriamente.

La operación de las maquinas requiere determinar destreza física por lo tanto se anticipa que

habrá una diferencia entre las operaciones

Operación 1 39.2 55.3

Operación 2 23.1 43.2

Operación 3 56.3 15.2

Operación 4 11.2 96.3

Fuente de Suma de Grados de Cuadros F calculada

variación cuadros libertad medios

Tratamiento Ssa k-1 S=ssa/k-1

Bloques Ssb b-1 S=ssb/b-1 S12/s2

Error Sse (k-1)(b-1) S=sse/(k-1)(b-1)

total sst Bk-1

43
Maquina operadora

1 2

1 42.5 26.3

2 26.3 45.2

3 25.2 78.2

4 12.3 58.3

E= 782.6 96.3

X= 40.23 50.365

X2=6253.12 2365.2 1452.36 14563.3 14852.3 85693.25= 120358.3

Fuente de Suma de Grados de Cuadros F calculado

variación cuadrados libertad medios

Tratamientos 23.3 3 5.3 3.36

Bloques 14.2 8 2.32

Error 52.2 45 1.2563

total 12.321 25

SST=25632.32-5236.9/ (9)(7)=51.3256

SSA=(526.2)2+(235.2)2+(218.3)2+(236.2)2-1313.2/(7)(3)=SSB=56.236

SSE=23.236-15.23-56.23=45.32

S12=34.64/5=5.90

44
S22=?46.98/6=8.52

S2=34.65/4=1.236

S12/S2=5.32/2.78=6.54

45
CONCLUSIÓN.

A partir del desarrollo de este trabajo se entendió que la estadística inferencial es una base
que se usa para poder entender si hay una buena organización del medio con el cual se está
interactuando y de igual forma se podrán hacer adecuaciones con la finalidad de entender
cómo es que debemos de entender la organización de una producción.

Se analizo el caso de la pollera Jiménez a quien tenía una problemática en la que a


organización de sus ganancias no era el adecuado y con ello le mostramos donde eran los
momentos donde ganaba más y así implementadas y cuáles eran las ocasiones donde sus
semanas con menos ventas.

Además de que le explicamos al Señor que era muy importante en otra ocasión hacer el
análisis con todos los datos posibles ya que nos daría resultados más exactos y con lo cual
nos adentraríamos más a dar una buena y correcta solución a su problemática con la finalidad
de que todas sus inversiones se adquirieran la mayor ganancia.

A modo de conclusión se han concluido con los puntos que se debían y podían analizar dentro
de este caso y que en posteriores proyectos o análisis de esta problemática se de gran ayuda
para los otros analistas este proyecto y de igual forma se espera que para la evaluación que
es para este proyecto pueda cumplir con las expectativas del evaluador y que existen
recomendaciones me las hagan saber.

46
REFERENCIAS.

 Arias, E. R. (2020, 4 noviembre). Suavización exponencial. Economipedia.


Recuperado 6 de julio de 2022, de
https://economipedia.com/definiciones/suavizacion-exponencial.htmlBetancourt

 D. (2022, 22 febrero). Suavización exponencial simple para pronosticar la demanda.


Ingenio Empresa. Recuperado 6 de julio de 2022, de
https://www.ingenioempresa.com/suavizacion-exponencial-simple/Garcia

 N. (2003, 5 noviembre). ¿Qué es un promedio móvil? - Minitab. (C) Minitab, LLC.


All rights Reserved. 2022. Recuperado 6 de julio de 2022, de
https://support.minitab.com/es-mx/minitab/18/help-and-how-to/modeling-
statistics/time-series/supporting-topics/moving-average/what-is-a-moving-
average/Pantoja.

 J. (2000, 6 abril). Diseños factoriales y factoriales fraccionados - Minitab. (C)


Minitab, LLC.

 All rights Reserved. 2022. Recuperado 6 de julio de 2022, de


https://support.minitab.com/es-mx/minitab/18/help-and-how-to/modeling-
statistics/doe/supporting-topics/factorial-and-screening-designs/factorial-and-
fractional-factorial-designs/

 ¿Qué es la regresión lineal? (s. f.). MATLAB & Simulink. Recuperado 6 de julio de
2022, de https://la.mathworks.com/discovery/linear-regression.html

47
ANEXOS.

48

También podría gustarte