SP Maril II Metodologia Documento

Metodología de análisis con Series de tiempo, Estadística inferencial y Control Estadístico
METODOLOGÍA DE ANÁLISIS
 SERIES DE TIEMPO
 ESTADÍSTICA INFERENCIAL
o Pruebas de hipótesis
o Análisis de varianza
o Tablas de contingencia
 CONTROL ESTADÍSTICO DE
PROCESOS
Página 1
METODOLOGÍA DE SERIES DE TIEMPO
1. INTRODUCCIÓN
Definición de serie de tiempo: Es una secuencia ordenada de valores de una

variable en intervalos de tiempo periódicos y consecutivos.
Aplicación: la aplicación de estos métodos tiene dos propósitos: comprender las

fuerzas de influencia en los datos y descubrir la estructura que produjo los datos
observados. Ajustar el modelo y proceder a realizar pronósticos, monitoreo,
retroalimentación y control en avance.
2. TENDENCIA Y ESTACIONALIDAD
Tendencias: Si los datos muestran una tendencia, se pueden ajustar los datos con
algún tipo de curva o recta.
Por ejemplo:
Causar o provocar escandalo en lugares publicos o privados

Quadratic Trend Model
Yt = 6166.86 - 873.060*t + 69.4405*t**2
Variable
5500 Actual
Fits
Accuracy Measures
5000 MAPE 3.9
MAD 164.9
MSD 36852.8
Clave 2
4500
4000
3500
3000
2003 2004 2005 2006 2007 2008 2009
Year
Estacionalidad: son fluctuaciones periódicas, por ejemplo cuando hay picos de

faltas en vacaciones y después declinan.
Página 2
FALTAS ADMINISTRATIVAS
Linear Trend Model
Yt = 1411.87 - 0.782418*t
1800 Variable
Actual
1700 Fits
Accuracy Measures
FALTAS ADMINISTR
1600 MAPE 8.3

MAD 115.1
MSD 20328.9
1500
1400
1300
1200
1100
Month Ene Mar May Jul Sep Nov Ene
Year 2004 2005
En la gráfica anterior se observa un comportamiento mensual, con un máximo en

Julio y un mínimo en Noviembre.
3. INDICADORES DE MODELOS DE SERIES DE TIEMPO
Estos indicadores sirven para comparar la efectividad de diferentes modelos

utilizados. Siempre se busca el valor menor en los indicadores MAPE, MAD y
MSD ya que representa un mejor ajuste del modelo, se definen como sigue:
MAPE: Porcentaje promedio absoluto de error.

MAD: Desviación media absoluta.
MSD: Desviación cuadrática media, es más sensible a errores anormales.
4. MÉTODOS DE PRONÓSTICO
Los métodos de series de tiempo incluyen métodos de pronóstico y de

suavizamiento simples, métodos de análisis de correlación y métodos de Box
Jenkins ARIMA.
4.1 MÉTODOS DE PRONÓSTICO Y SUAVIZAMIENTO SIMPLE:
Modelan componentes en una serie que normalmente son fáciles de ver en una
serie de tiempo.
Cuando hay un patrón curvilíneo de los datos, se usa un análisis de tendencias

con un modelo cuadrático.
Página 3
Las instrucciones de Minitab son las siguientes:
1 Open Worksheet FALTASADM.MTW.

2 Ejecutar Stat > Time Series > Trend Analysis.
3 En Variable, poner Clave 1.
4 En Model Type, seleccionar Quadratic.
5 Seleccionar Generate forecasts y poner 12 en Number of forecasts.
6 Seleccionar Storage .
7 Seleccionar Fits (Trend Line) , Residuals (detrended data), y Forecasts. Seleccionar OK en
cada diálogo.
Trend Analysis for Trade

Yt = 8721.43 - 2337.40*t + 191.024*t**2
Accuracy Measures
MAPE 12
MAD 340
MSD 142893
Forecasts
Period Forecast
2011 2247.71
Deambular en la via publica en estado de embriaguez o drogado

Quadratic Trend Model
Yt = 8721.43 - 2337.40*t + 191.024*t**2
Variable
7000
Actual
Fits
6000 Forecasts
Accuracy Measures
MAPE 12
5000
MAD 340
Clave 1
MSD 142893
4000
3000
2000
1000
2004 2005 2006 2007 2008 2009 2010 2011
Year
Método de Descomposición
Se usa para pronosticar cuando hay un componente de estacionalidad en la serie

de tiempo o si se quiere analizar la naturaleza de los componentes. Separa las
series de tiempo en componentes de tendencia lineal y estacionalidad así como el
error. Se puede usar componente de estacionalidad en modo aditivo o
multiplicativo con la tendencia.
Por ejemplo:
Se desea predecir la tasa de faltas administrativas durante 2006 a 2009. Como los
datos tienen una tendencia que se ajusta bien con un modelo de tendencia
cuadrática y tiene un componente estacional se utilizan los residuos del ejemplo
Página 4
del análisis de tendencias para combinar el análisis de tendencias y

descomposición para pronosticar.
Las intrucciones de Minitab son las siguientes:
1 Correr el ejemplo de Análisis de Tendencias con el archivo DELITOS.MTW

2 Stat > Time Series > Decomposition.
3 En Variable indicar FALTAS ADM
4 En Seasonal length, poner 12.
5 EnModel Type, seleccionar Additive. En Model Components, seleccionar Seasonal only.
6 Seleccionar Generate forecasts y poner 1 en Number of forecasts.
7 Seleccionar Storage . Seleccionar Forecasts y Fits.
8 Seleccionar OK en cada cuadro de diálogo
Fitted Trend Equation
Yt = 1453.46 + 0.791168*t
Accuracy Measures
MAPE 2.12
MAD 30.87
MSD 5551.93
FALTAS ADMINISTRATIVAS
Multiplicative Model
1900 Variable
Actual
1800 Fits
Trend
1700 Accuracy Measures
MAPE 2.12
FALTAS A DM
1600 MAD 30.87

MSD 5551.93
1500
1400
1300
1200
1100
Month Ene Ene Ene Ene Ene Ene
Year 2004 2005 2006 2007 2008 2009
Seasonal Analysis for FALTAS ADM

Multiplicative Model
Seasonal Indices Detrended Data, by Seasonal Period
1.2 1.2
1.0 1.0
0.8 0.8
1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12
Percent Variation, by Seasonal Period Residuals, by Seasonal Period

200
20
0
10 -200
-400
0
1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12
Página 5
Interpretación de los resultados
La descomposición genera tres tipos de gráficas:
1. Una gráfica de serie de tiempo mostrando los datos originales con la línea
de tendencia ajustada, valores estimados y pronósticos
2. Un análisis de componentes con gráficas separadas para la serie, datos sin
tendencia, datos ajustados con estacionalidad y los datos ajustados
estacionalmente y sin tendencias (los residuos).
3. Un análisis estacional, mostrando los índices estacionales y la variación
porcentual dentro de cada estación respecto a la suma de la variación por
estación y gráficas de caja de los residuos por periodo estacional.
METODO DE WINTERS
Se aplica cuando en la serie de tiempo se presentan los patrones de tendencia y

estacionalidad.
Suaviza los datos por el método exponencial de Holt – Winters. Se recomienda

este método cuando se tienen presentes los componentes de tendencia y
estacionalidad ya sea en forma aditiva o multiplicativa.
El efecto multiplicativo se presenta cuando el patrón estacional en los datos

depende del tamaño de los datos o sea cuando la magnitud del patrón estacional
se incrementa conforme los valores aumentan y se decrementa cuando los valores
de los datos disminuyen.
El efecto aditivo es mejor cuando el patrón estacional en los datos no depende del
valor de los datos, o sea que el patrón estacional no cambia conforme la serie se
incrementa o disminuye de valor.
El método de Winters calcula los estimados de de tres componentes: nivel,

tendencia y estacionalidad. Calcula estimados dinámicos con ecuaciones para los
tres componentes: nivel, tendencia y estacionalidad. Estas ecuaciones dan una
mayor ponderación a observaciones recientes y menos peso a observaciones
pasadas, las ponderaciones decrecen geométricamente a una tasa constante
La ponderación seleccionada para Nivel, tendencia y estacionalidad es de 0.2 si

se quiere hacer una correspondencia con el modelo ARIMA u otros valores entre 0
y 1 para reducir los errores de estimación.
Ejemplo de pronósticos utilizando el Método de Winters
Se desea predecir el empleo para los siguientes seis meses en la industria

alimenticia usando datos colectados sobre los últimos 60 meses, usando el
Página 6
método de Winters con el modelo multiplicativo, dado que hay componente

estacional y de tendencia aparente en los datos.
Instrucciones de Minitab
1 Open Worksheet DELITOS.MTW.

2 Ejecutar Stat > Time Series > Winters' Method.
3 En Variable, poner Lesionados por arma. In Seasonal length, 12 .
4 En Model Type, seleccionar Multiplicative.
5 Seleccionar Generate forecasts poner 4 en Number of forecasts. Seleccionar OK.
Winters' Method for Food

Multiplicative Method
Smoothing Constants
Alpha (level) 0.2

Gamma (trend) 0.2
Delta (seasonal) 0.2
Accuracy Measures
MAPE 13.8561
MAD 4.8550
MSD 44.5868
Lesionados por arma

Multiplicative Method
70 Variable
Actual
Fits
60 Forecasts
LESIONA DOS POR ARMA
95.0% PI
50 Smoothing Constants
Alpha (lev el) 0.2
Gamma (trend) 0.2
40 Delta (seasonal) 0.2
Accuracy Measures
MAPE 13.8561
30 MAD 4.8550
MSD 44.5868
20
10
Month Ene Ene Ene Ene Ene Ene Ene
Year 2004 2005 2006 2007 2008 2009 2010
Interpretación de los resultados
La gráfica muestra los valores de la serie y los valores estimados (un periodo
adelante) y los cuatro pronósticos.
Los valores de exactitud del modelo MAPE, MAD y MSD utilizando el modelo
Aditivo proporcionan un mejor ajuste en dos de los tres indicadores que con el
modelo Multiplicativo como se muestra a continuación.
Accuracy Measures
MAPE 13.5600
MAD 4.7628
MSD 43.1327
Página 7
Accuracy Measures
Multiplicative Additive
MAPE 13.8561 13.5600
MAD 4.8550 4.7628
MSD 44.5868 43.1327
4.4 ANÁLISIS DE CORRELACIÓN Y MÉTODO DE ARIMA
El análisis de correlación, análisis de diferencias, autocorrelación y autocorrelación

parcial, son utilizadas para identificar un modelo adecuado de ARIMA.
El Modelo ARIMA puede utilizarse para modelar series de tiempo con o sin
componentes de tendencia o estacionalidad y proporcionar pronósticos.
Las diferencias se calculan entre los valores de los datos de la serie de tiempo,
sirven para identificar patrones de tendencia y estacionalidad.
Los atrasos (lags), son valores anteriores con los que se determina el siguiente
valor pronosticado
La autocorrelación: es la correlación entre observaciones de una serie de tiempo

separadas por K unidades de tiempo, su gráfica se denomina función de
autocorrelación (ACF), su análisis permite seleccionar los términos a ser incluidos
en el modelo ARIMA.
Ejemplo de ARIMA:
Instrucciones de Minitab
1 Worksheet DELITOS.MTW.
2 Stat > Time Series > ARIMA.
3 En Series, poner FALTAS_ADM.
4 Seleccionar Fit seasonal model. En Period poner 12 en Nonseasonal, poner 1 en
Autoregressive. En Seasonal y en Difference poner 0.
5 Seleccionar Graphs. Seleccionar ACF of residuals y PACF of residuals .
6 En Forecasts poner 12 en Lead e indicar una columna vacía para Store los pronósticos.
7 OK en cada cuadro de diálogo.
ARIMA Model: FALTAS_ADM

ACF of Residuals for FALTAS_ADM Interpretación de resultados
(with 5% significance limits for the autocorrelations)
1.0
0.8 El modelo ARIMA converge en 10
0.6 iteraciones. El modelo AR(1) tiene un
0.4
estadístico t de 46.78, como regla si t
Autocorrelation
0.2
0.0 es mayor a 2 se puede juzgar el
-0.2
-0.4
parámetro como significativo diferente
-0.6 de cero. Los residuos no parecen
-0.8
-1.0
estar correlacionados como se
1 2 3 4 5 muestra en las gráficas (están dentro
Lag
de los intervalos de confianza,
Página 8
asumiendo que el valor 10 es aleatorio). El modelo AR(1) parece ser adecuado

para pronosticar.
Time Series Plot for FALTAS_ADM

(with forecasts and their 95% confidence limits)
2250
2000
1750
FALTAS_ADM
1500
1250
1000
3 6 9 12 15 18 21 24 27 30 33
Time
Interpretación de resultados
El modelo ARIMA proporciona pronósticos con bandas de confianza en 95%,

usando el modelo AR(1) la estacionalidad domina el perfil de pronósticos para los
próximos 12 meses con los valores pronosticados similares a los 12 meses
previos.
Página 9
METODOLOGÍA DE ESTADÍSTICA INFERENCIAL
1. INTRODUCCIÓN
La estadística inferencial sirve para hacer inferencias sobre los parámetros de la

población que pueden ser medias, varianzas y proporciones en base a los datos
obtenidos de muestras.
PRUEBA PARA LA IGUALDAD DE DOS MEDIAS
Consideraremos ahora pruebas de hipótesis respecto a la igualdad de las medias

1 y 2 de dos distribuciones normales donde no se conocen las varianzas  12 y 22 .
Tenemos dos casos en el primero las varianzas son iguales y en el segundo las
varianzas son desiguales, a continuación analizaremos cada uno de ellos.
En Minitab las instrucciones son las siguientes:
Prueba Minitab
>Stat >Basic statistics > 2- Sample t

Samples in different columns
First Escándalos 2004

Second Escándalos 2005
º! Assume equal variances
Options: Confidence level 95%
Test difference 0.0
Alternate Not equal
OK
Resultados
Two-Sample T-Test and CI: Escándalos 2004, Escándalos 2005
Two-sample T for Escandalos 2004 vs Escandalos 2005
N Mean StDev SE Mean

Escandalos 2004 3 3795 962 556
Escandalos 2005 4 2804 585 293
Difference = mu (Escandalos 2004) - mu (Escandalos 2005)

Estimate for difference: 990.417
95% CI for difference: (-499.848, 2480.681) Como el cero se encuentra en el
Intervalo de confianza, no se rechaza la Ho.
T-Test of difference = 0 (vs not =): T-Value = 1.71 P-Value = 0.148 DF = 5
Como el valor P de la prueba es mayor a 0.05 no se rechaza Ho
Página 10
ANÁLISIS DE VARIANZA (ANOVA)
El análisis de la varianza de un criterio (ANOVA) es una metodología para analizar

la variación entre muestras y la variación al interior de las mismas mediante la
determinación de varianzas. Es llamado de un criterio porque analiza un variable
independiente o Factor ej: Velocidad. Como tal, es un método estadístico útil para
comparar dos o más medias poblacionales. El ANOVA de un criterio nos permite
poner a prueba hipótesis tales como:
H 0  1   2   3  ....   k
H 1 : Al menos dos medias poblacionales son diferentes.
Ejemplo :
Se desea saber si los promedios de faltas administrativas por escándalos son estadísticamente
iguales (Ho) o diferentes (Ha), se toman los datos siguientes:
Escándalos Escándalos
2004 2005
4536 3520
2707 2992
4141 2543
2162
ANOVA en Minitab.
Seleccionar:
Stat > ANOVA > One Way (Unstacked)

Response in separate columns Escándalos 2004, Escándalos 2005
Seleccionar º! Store Residuals º! Store Fits Confidence level 95%
Graphs
Seleccionar Normal plot of residuals
Comparisons
Seleccionar Tukey’s Family error rate OK
Resultados:
La gráfica normal de residuos debe mostrar los residuos aproximados por una recta para validar el
modelo
One-way ANOVA: Escandalos 2004, Escandalos 2005
Source DF SS MS F P
Factor 1 1681586 1681586 2.92 0.148
Error 5 2880825 576165
Total 6 4562411
S = 759.1 R-Sq = 36.86% R-Sq(adj) = 24.23%
Como este valor P es mayor a 0.05 no se rechaza la hipótesis nula y no hay

diferencia significativa entre 2004 y 2005
S = 2.198 R-Sq = 28.69% R-Sq(adj) = 16.80%
Página 11
Para todos los casos,
Ho: No hay diferencia o la variable de columna NO depende de la variable de

renglón
H1: Hay diferencia la variable de columna SI depende de la variable de renglón
Ejemplo de Corrida en Minitab
Se desea saber si hay dependencia entre el tipo de delitos administrativos y la

zona donde se realizan. Se registran las faltas administrativas durante 2004 y
2005 como sigue:
Las instrucciones de Minitab son las siguientes:
1 Open Worksheet FALTASADM.MTW.
2 Seleccionar Stat > Tables > Chi-Square Test (Tabla cargada en la

Worksheet).
3 En las Columnas de la tabla poner Zona Centro, Zona Norte y Zona Sur, OK.
Los resultados se muestran a continuación:

Chi-Sq = 1951.221, DF = 8, P-Value = 0.000
Interpretación de resultados
Como el P value de 0.00 es menor a 0.05, se rechaza Ho, por tanto existe
dependencia entre el tipo de delitos y la zona donde se realizan.
Página 12
METODOLOGÍA DE CONTROL ESTADÍSTICO DE

PROCESOS
El Control Estadístico del Proceso por medio de las cartas de control son la
herramienta más poderosa para analizar la variación en los procesos. Las cartas
de control enfocan la atención hacia las causas especiales de variación cuando
aparecen y reflejan la magnitud de la variación debida a las causas comunes.
Las causas comunes o aleatorias se deben a la variación natural del proceso. Las
causas especiales o atribuibles son por ejemplo: una situación anormal en el
proceso.
Un proceso está bajo Control Estadístico cuando presenta causas comunes

únicamente. Cuando ocurre esto tenemos un proceso estable y predecible.
Cuando existen causas especiales el proceso está fuera de Control Estadístico;

las gráficas de control detectan la existencia de estas causas en el momento en
que se dan, lo cual permite que podamos tomar acciones al momento.
Cartas de control por variables

El término variable designa a cualquier característica de calidad “medible” tal
como un tiempo de respuesta, número de incidentes, etc.
Carta de Individuales (Datos variables)

 A menudo esta carta se llama “I-MR”.
 Esta Carta monitorea la tendencia de un proceso con datos variables
individuales.
 La línea central se basa en el promedio de los datos, y los límites de control se
basan en la desviación estándar (+/- 3 sigmas)
Ejemplo: Se registra el número de robo a comercios durante 2004 y 2005. Realice

la gráfica de control individual.
I-MR Chart of ROBO A COMERCIOS

U C L=54.28
50
Individual Value
40 _
X= 36.20
30
20
LC L=18.11
1 7 14 21 28 35 42 49 56 63 70
O bse r v a tio n
U C L=22.22
20
Moving Range
15
10
__
M R=6.80
5
0 LC L=0
1 7 14 21 28 35 42 49 56 63 70
O bse r v a tio n
Página 13

SP Maril II Metodologia Documento

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

SP Maril II Metodologia Documento

Cargado por

Copyright:

Formatos disponibles

Metodología de análisis con Series de tiempo, Estadística inferencial y Control Estadístico

METODOLOGÍA DE SERIES DE TIEMPO

Definición de serie de tiempo: Es una secuencia ordenada de valores de una

Aplicación: la aplicación de estos métodos tiene dos propósitos: comprender las

Causar o provocar escandalo en lugares publicos o privados

Estacionalidad: son fluctuaciones periódicas, por ejemplo cuando hay picos de

1600 MAPE 8.3

En la gráfica anterior se observa un comportamiento mensual, con un máximo en

3. INDICADORES DE MODELOS DE SERIES DE TIEMPO

Estos indicadores sirven para comparar la efectividad de diferentes modelos

MAPE: Porcentaje promedio absoluto de error.

Los métodos de series de tiempo incluyen métodos de pronóstico y de

4.1 MÉTODOS DE PRONÓSTICO Y SUAVIZAMIENTO SIMPLE:

Cuando hay un patrón curvilíneo de los datos, se usa un análisis de tendencias

Las instrucciones de Minitab son las siguientes:

1 Open Worksheet FALTASADM.MTW.

Trend Analysis for Trade

Deambular en la via publica en estado de embriaguez o drogado

Se usa para pronosticar cuando hay un componente de estacionalidad en la serie

del análisis de tendencias para combinar el análisis de tendencias y

Las intrucciones de Minitab son las siguientes:

1 Correr el ejemplo de Análisis de Tendencias con el archivo DELITOS.MTW

1600 MAD 30.87

Seasonal Analysis for FALTAS ADM

Percent Variation, by Seasonal Period Residuals, by Seasonal Period

Interpretación de los resultados

La descomposición genera tres tipos de gráficas:

Se aplica cuando en la serie de tiempo se presentan los patrones de tendencia y

Suaviza los datos por el método exponencial de Holt – Winters. Se recomienda

El efecto multiplicativo se presenta cuando el patrón estacional en los datos

El método de Winters calcula los estimados de de tres componentes: nivel,

La ponderación seleccionada para Nivel, tendencia y estacionalidad es de 0.2 si

Ejemplo de pronósticos utilizando el Método de Winters

Se desea predecir el empleo para los siguientes seis meses en la industria

método de Winters con el modelo multiplicativo, dado que hay componente

1 Open Worksheet DELITOS.MTW.

Winters' Method for Food

Alpha (level) 0.2

Lesionados por arma

Interpretación de los resultados

4.4 ANÁLISIS DE CORRELACIÓN Y MÉTODO DE ARIMA

El análisis de correlación, análisis de diferencias, autocorrelación y autocorrelación

La autocorrelación: es la correlación entre observaciones de una serie de tiempo

ARIMA Model: FALTAS_ADM

asumiendo que el valor 10 es aleatorio). El modelo AR(1) parece ser adecuado

Time Series Plot for FALTAS_ADM

El modelo ARIMA proporciona pronósticos con bandas de confianza en 95%,

METODOLOGÍA DE ESTADÍSTICA INFERENCIAL

La estadística inferencial sirve para hacer inferencias sobre los parámetros de la

PRUEBA PARA LA IGUALDAD DE DOS MEDIAS

Consideraremos ahora pruebas de hipótesis respecto a la igualdad de las medias

En Minitab las instrucciones son las siguientes:

>Stat >Basic statistics > 2- Sample t

First Escándalos 2004

Two-Sample T-Test and CI: Escándalos 2004, Escándalos 2005

Two-sample T for Escandalos 2004 vs Escandalos 2005

N Mean StDev SE Mean

Difference = mu (Escandalos 2004) - mu (Escandalos 2005)

T-Test of difference = 0 (vs not =): T-Value = 1.71 P-Value = 0.148 DF = 5

Como el valor P de la prueba es mayor a 0.05 no se rechaza Ho

ANÁLISIS DE VARIANZA (ANOVA)

El análisis de la varianza de un criterio (ANOVA) es una metodología para analizar

Stat > ANOVA > One Way (Unstacked)

One-way ANOVA: Escandalos 2004, Escandalos 2005