Está en la página 1de 13

Metodología de análisis con Series de tiempo, Estadística inferencial y Control Estadístico

METODOLOGÍA DE ANÁLISIS

 SERIES DE TIEMPO

 ESTADÍSTICA INFERENCIAL

o Pruebas de hipótesis

o Análisis de varianza

o Tablas de contingencia

 CONTROL ESTADÍSTICO DE
PROCESOS

Página 1
Metodología de análisis con Series de tiempo, Estadística inferencial y Control Estadístico

METODOLOGÍA DE SERIES DE TIEMPO

1. INTRODUCCIÓN

Definición de serie de tiempo: Es una secuencia ordenada de valores de una


variable en intervalos de tiempo periódicos y consecutivos.

Aplicación: la aplicación de estos métodos tiene dos propósitos: comprender las


fuerzas de influencia en los datos y descubrir la estructura que produjo los datos
observados. Ajustar el modelo y proceder a realizar pronósticos, monitoreo,
retroalimentación y control en avance.

2. TENDENCIA Y ESTACIONALIDAD

Tendencias: Si los datos muestran una tendencia, se pueden ajustar los datos con
algún tipo de curva o recta.

Por ejemplo:

Causar o provocar escandalo en lugares publicos o privados


Quadratic Trend Model
Yt = 6166.86 - 873.060*t + 69.4405*t**2
Variable
5500 Actual
Fits

Accuracy  Measures
5000 MAPE 3.9
MAD 164.9
MSD 36852.8
Clave 2

4500

4000

3500

3000
2003 2004 2005 2006 2007 2008 2009
Year

Estacionalidad: son fluctuaciones periódicas, por ejemplo cuando hay picos de


faltas en vacaciones y después declinan.

Página 2
Metodología de análisis con Series de tiempo, Estadística inferencial y Control Estadístico

FALTAS ADMINISTRATIVAS
Linear Trend Model
Yt = 1411.87 - 0.782418*t
1800 Variable
Actual
1700 Fits

Accuracy  Measures
FALTAS ADMINISTR

1600 MAPE 8.3


MAD 115.1
MSD 20328.9
1500

1400

1300

1200

1100
Month Ene Mar May Jul Sep Nov Ene
Year 2004 2005

En la gráfica anterior se observa un comportamiento mensual, con un máximo en


Julio y un mínimo en Noviembre.

3. INDICADORES DE MODELOS DE SERIES DE TIEMPO

Estos indicadores sirven para comparar la efectividad de diferentes modelos


utilizados. Siempre se busca el valor menor en los indicadores MAPE, MAD y
MSD ya que representa un mejor ajuste del modelo, se definen como sigue:

MAPE: Porcentaje promedio absoluto de error.


MAD: Desviación media absoluta.
MSD: Desviación cuadrática media, es más sensible a errores anormales.

4. MÉTODOS DE PRONÓSTICO

Los métodos de series de tiempo incluyen métodos de pronóstico y de


suavizamiento simples, métodos de análisis de correlación y métodos de Box
Jenkins ARIMA.

4.1 MÉTODOS DE PRONÓSTICO Y SUAVIZAMIENTO SIMPLE:

Modelan componentes en una serie que normalmente son fáciles de ver en una
serie de tiempo.

Cuando hay un patrón curvilíneo de los datos, se usa un análisis de tendencias


con un modelo cuadrático.

Página 3
Metodología de análisis con Series de tiempo, Estadística inferencial y Control Estadístico

Las instrucciones de Minitab son las siguientes:

1 Open Worksheet FALTASADM.MTW.


2 Ejecutar Stat > Time Series > Trend Analysis.
3 En Variable, poner Clave 1.
4 En Model Type, seleccionar Quadratic.
5 Seleccionar Generate forecasts y poner 12 en Number of forecasts.
6 Seleccionar Storage .
7 Seleccionar Fits (Trend Line) , Residuals (detrended data), y Forecasts. Seleccionar OK en
cada diálogo.

Trend Analysis for Trade


Yt = 8721.43 - 2337.40*t + 191.024*t**2
Accuracy Measures
MAPE 12
MAD 340
MSD 142893
Forecasts
Period Forecast
2011 2247.71

Deambular en la via publica en estado de embriaguez o drogado


Quadratic Trend Model
Yt = 8721.43 - 2337.40*t + 191.024*t**2
Variable
7000
Actual
Fits
6000 Forecasts

Accuracy  Measures
MAPE 12
5000
MAD 340
Clave 1

MSD 142893
4000

3000

2000

1000
2004 2005 2006 2007 2008 2009 2010 2011
Year

Método de Descomposición

Se usa para pronosticar cuando hay un componente de estacionalidad en la serie


de tiempo o si se quiere analizar la naturaleza de los componentes. Separa las
series de tiempo en componentes de tendencia lineal y estacionalidad así como el
error. Se puede usar componente de estacionalidad en modo aditivo o
multiplicativo con la tendencia.

Por ejemplo:
Se desea predecir la tasa de faltas administrativas durante 2006 a 2009. Como los
datos tienen una tendencia que se ajusta bien con un modelo de tendencia
cuadrática y tiene un componente estacional se utilizan los residuos del ejemplo

Página 4
Metodología de análisis con Series de tiempo, Estadística inferencial y Control Estadístico

del análisis de tendencias para combinar el análisis de tendencias y


descomposición para pronosticar.

Las intrucciones de Minitab son las siguientes:

1 Correr el ejemplo de Análisis de Tendencias con el archivo DELITOS.MTW


2 Stat > Time Series > Decomposition.
3 En Variable indicar FALTAS ADM
4 En Seasonal length, poner 12.
5 EnModel Type, seleccionar Additive. En Model Components, seleccionar Seasonal only.
6 Seleccionar Generate forecasts y poner 1 en Number of forecasts.
7 Seleccionar Storage . Seleccionar Forecasts y Fits.
8 Seleccionar OK en cada cuadro de diálogo
Fitted Trend Equation
Yt = 1453.46 + 0.791168*t
Accuracy Measures
MAPE 2.12
MAD 30.87
MSD 5551.93

FALTAS ADMINISTRATIVAS
Multiplicative Model
1900 Variable
Actual
1800 Fits
Trend
1700 Accuracy  Measures
MAPE 2.12
FALTAS A DM

1600 MAD 30.87


MSD 5551.93
1500

1400

1300

1200

1100
Month Ene Ene Ene Ene Ene Ene
Year 2004 2005 2006 2007 2008 2009

Seasonal Analysis for FALTAS ADM


Multiplicative Model
Seasonal Indices Detrended Data, by Seasonal Period
1.2 1.2

1.0 1.0

0.8 0.8

1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12

Percent Variation, by Seasonal Period Residuals, by Seasonal Period


200

20
0

10 -200

-400
0
1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12

Página 5
Metodología de análisis con Series de tiempo, Estadística inferencial y Control Estadístico

Interpretación de los resultados

La descomposición genera tres tipos de gráficas:

1. Una gráfica de serie de tiempo mostrando los datos originales con la línea
de tendencia ajustada, valores estimados y pronósticos
2. Un análisis de componentes con gráficas separadas para la serie, datos sin
tendencia, datos ajustados con estacionalidad y los datos ajustados
estacionalmente y sin tendencias (los residuos).
3. Un análisis estacional, mostrando los índices estacionales y la variación
porcentual dentro de cada estación respecto a la suma de la variación por
estación y gráficas de caja de los residuos por periodo estacional.

METODO DE WINTERS

Se aplica cuando en la serie de tiempo se presentan los patrones de tendencia y


estacionalidad.

Suaviza los datos por el método exponencial de Holt – Winters. Se recomienda


este método cuando se tienen presentes los componentes de tendencia y
estacionalidad ya sea en forma aditiva o multiplicativa.

El efecto multiplicativo se presenta cuando el patrón estacional en los datos


depende del tamaño de los datos o sea cuando la magnitud del patrón estacional
se incrementa conforme los valores aumentan y se decrementa cuando los valores
de los datos disminuyen.

El efecto aditivo es mejor cuando el patrón estacional en los datos no depende del
valor de los datos, o sea que el patrón estacional no cambia conforme la serie se
incrementa o disminuye de valor.

El método de Winters calcula los estimados de de tres componentes: nivel,


tendencia y estacionalidad. Calcula estimados dinámicos con ecuaciones para los
tres componentes: nivel, tendencia y estacionalidad. Estas ecuaciones dan una
mayor ponderación a observaciones recientes y menos peso a observaciones
pasadas, las ponderaciones decrecen geométricamente a una tasa constante

La ponderación seleccionada para Nivel, tendencia y estacionalidad es de 0.2 si


se quiere hacer una correspondencia con el modelo ARIMA u otros valores entre 0
y 1 para reducir los errores de estimación.

Ejemplo de pronósticos utilizando el Método de Winters

Se desea predecir el empleo para los siguientes seis meses en la industria


alimenticia usando datos colectados sobre los últimos 60 meses, usando el

Página 6
Metodología de análisis con Series de tiempo, Estadística inferencial y Control Estadístico

método de Winters con el modelo multiplicativo, dado que hay componente


estacional y de tendencia aparente en los datos.

Instrucciones de Minitab

1 Open Worksheet DELITOS.MTW.


2 Ejecutar Stat > Time Series > Winters' Method.
3 En Variable, poner Lesionados por arma. In Seasonal length, 12 .
4 En Model Type, seleccionar Multiplicative.
5 Seleccionar Generate forecasts poner 4 en Number of forecasts. Seleccionar OK.

Winters' Method for Food


Multiplicative Method
Smoothing Constants

Alpha (level) 0.2


Gamma (trend) 0.2
Delta (seasonal) 0.2
Accuracy Measures
MAPE 13.8561
MAD 4.8550
MSD 44.5868

Lesionados por arma


Multiplicative Method
70 Variable
Actual
Fits
60 Forecasts
LESIONA DOS POR ARMA

95.0% PI

50 Smoothing Constants
Alpha (lev el) 0.2
Gamma (trend) 0.2
40 Delta (seasonal) 0.2

Accuracy  Measures
MAPE 13.8561
30 MAD 4.8550
MSD 44.5868

20

10
Month Ene Ene Ene Ene Ene Ene Ene
Year 2004 2005 2006 2007 2008 2009 2010

Interpretación de los resultados

La gráfica muestra los valores de la serie y los valores estimados (un periodo
adelante) y los cuatro pronósticos.

Los valores de exactitud del modelo MAPE, MAD y MSD utilizando el modelo
Aditivo proporcionan un mejor ajuste en dos de los tres indicadores que con el
modelo Multiplicativo como se muestra a continuación.
Accuracy Measures

MAPE 13.5600
MAD 4.7628
MSD 43.1327

Página 7
Metodología de análisis con Series de tiempo, Estadística inferencial y Control Estadístico

Accuracy Measures
Multiplicative Additive
MAPE 13.8561 13.5600
MAD 4.8550 4.7628
MSD 44.5868 43.1327

4.4 ANÁLISIS DE CORRELACIÓN Y MÉTODO DE ARIMA

El análisis de correlación, análisis de diferencias, autocorrelación y autocorrelación


parcial, son utilizadas para identificar un modelo adecuado de ARIMA.

El Modelo ARIMA puede utilizarse para modelar series de tiempo con o sin
componentes de tendencia o estacionalidad y proporcionar pronósticos.

Las diferencias se calculan entre los valores de los datos de la serie de tiempo,
sirven para identificar patrones de tendencia y estacionalidad.

Los atrasos (lags), son valores anteriores con los que se determina el siguiente
valor pronosticado

La autocorrelación: es la correlación entre observaciones de una serie de tiempo


separadas por K unidades de tiempo, su gráfica se denomina función de
autocorrelación (ACF), su análisis permite seleccionar los términos a ser incluidos
en el modelo ARIMA.

Ejemplo de ARIMA:

Instrucciones de Minitab
1 Worksheet DELITOS.MTW.
2 Stat > Time Series > ARIMA.
3 En Series, poner FALTAS_ADM.
4 Seleccionar Fit seasonal model. En Period poner 12 en Nonseasonal, poner 1 en
Autoregressive. En Seasonal y en Difference poner 0.
5 Seleccionar Graphs. Seleccionar ACF of residuals y PACF of residuals .
6 En Forecasts poner 12 en Lead e indicar una columna vacía para Store los pronósticos.
7 OK en cada cuadro de diálogo.

ARIMA Model: FALTAS_ADM


ACF of Residuals for FALTAS_ADM Interpretación de resultados
(with 5% significance limits for the autocorrelations)

1.0
0.8 El modelo ARIMA converge en 10
0.6 iteraciones. El modelo AR(1) tiene un
0.4
estadístico t de 46.78, como regla si t
Autocorrelation

0.2
0.0 es mayor a 2 se puede juzgar el
-0.2
-0.4
parámetro como significativo diferente
-0.6 de cero. Los residuos no parecen
-0.8
-1.0
estar correlacionados como se
1 2 3 4 5 muestra en las gráficas (están dentro
Lag
de los intervalos de confianza,

Página 8
Metodología de análisis con Series de tiempo, Estadística inferencial y Control Estadístico

asumiendo que el valor 10 es aleatorio). El modelo AR(1) parece ser adecuado


para pronosticar.

Time Series Plot for FALTAS_ADM


(with forecasts and their 95% confidence limits)
2250

2000

1750
FALTAS_ADM

1500

1250

1000

3 6 9 12 15 18 21 24 27 30 33
Time

Interpretación de resultados

El modelo ARIMA proporciona pronósticos con bandas de confianza en 95%,


usando el modelo AR(1) la estacionalidad domina el perfil de pronósticos para los
próximos 12 meses con los valores pronosticados similares a los 12 meses
previos.

Página 9
Metodología de análisis con Series de tiempo, Estadística inferencial y Control Estadístico

METODOLOGÍA DE ESTADÍSTICA INFERENCIAL

1. INTRODUCCIÓN

La estadística inferencial sirve para hacer inferencias sobre los parámetros de la


población que pueden ser medias, varianzas y proporciones en base a los datos
obtenidos de muestras.

PRUEBA PARA LA IGUALDAD DE DOS MEDIAS

Consideraremos ahora pruebas de hipótesis respecto a la igualdad de las medias


1 y 2 de dos distribuciones normales donde no se conocen las varianzas  12 y 22 .
Tenemos dos casos en el primero las varianzas son iguales y en el segundo las
varianzas son desiguales, a continuación analizaremos cada uno de ellos.

En Minitab las instrucciones son las siguientes:

Prueba Minitab

>Stat >Basic statistics > 2- Sample t


Samples in different columns

First Escándalos 2004


Second Escándalos 2005
º! Assume equal variances
Options: Confidence level 95%
Test difference 0.0
Alternate Not equal
OK

Resultados

Two-Sample T-Test and CI: Escándalos 2004, Escándalos 2005

Two-sample T for Escandalos 2004 vs Escandalos 2005

N Mean StDev SE Mean


Escandalos 2004 3 3795 962 556
Escandalos 2005 4 2804 585 293

Difference = mu (Escandalos 2004) - mu (Escandalos 2005)


Estimate for difference: 990.417
95% CI for difference: (-499.848, 2480.681) Como el cero se encuentra en el
Intervalo de confianza, no se rechaza la Ho.

T-Test of difference = 0 (vs not =): T-Value = 1.71 P-Value = 0.148 DF = 5

Como el valor P de la prueba es mayor a 0.05 no se rechaza Ho

Página 10
Metodología de análisis con Series de tiempo, Estadística inferencial y Control Estadístico

ANÁLISIS DE VARIANZA (ANOVA)

El análisis de la varianza de un criterio (ANOVA) es una metodología para analizar


la variación entre muestras y la variación al interior de las mismas mediante la
determinación de varianzas. Es llamado de un criterio porque analiza un variable
independiente o Factor ej: Velocidad. Como tal, es un método estadístico útil para
comparar dos o más medias poblacionales. El ANOVA de un criterio nos permite
poner a prueba hipótesis tales como:

H 0  1   2   3  ....   k
H 1 : Al menos dos medias poblacionales son diferentes.

Ejemplo :

Se desea saber si los promedios de faltas administrativas por escándalos son estadísticamente
iguales (Ho) o diferentes (Ha), se toman los datos siguientes:

Escándalos Escándalos
2004 2005
4536 3520
2707 2992
4141 2543
2162

ANOVA en Minitab.

Seleccionar:

Stat > ANOVA > One Way (Unstacked)


Response in separate columns Escándalos 2004, Escándalos 2005
Seleccionar º! Store Residuals º! Store Fits Confidence level 95%
Graphs
Seleccionar Normal plot of residuals
Comparisons
Seleccionar Tukey’s Family error rate OK

Resultados:

La gráfica normal de residuos debe mostrar los residuos aproximados por una recta para validar el
modelo

One-way ANOVA: Escandalos 2004, Escandalos 2005

Source DF SS MS F P
Factor 1 1681586 1681586 2.92 0.148
Error 5 2880825 576165
Total 6 4562411
S = 759.1 R-Sq = 36.86% R-Sq(adj) = 24.23%

Como este valor P es mayor a 0.05 no se rechaza la hipótesis nula y no hay


diferencia significativa entre 2004 y 2005
S = 2.198 R-Sq = 28.69% R-Sq(adj) = 16.80%

Página 11
Metodología de análisis con Series de tiempo, Estadística inferencial y Control Estadístico

Para todos los casos,

Ho: No hay diferencia o la variable de columna NO depende de la variable de


renglón

H1: Hay diferencia la variable de columna SI depende de la variable de renglón

Ejemplo de Corrida en Minitab

Se desea saber si hay dependencia entre el tipo de delitos administrativos y la


zona donde se realizan. Se registran las faltas administrativas durante 2004 y
2005 como sigue:

Las instrucciones de Minitab son las siguientes:

1 Open Worksheet FALTASADM.MTW.

2 Seleccionar Stat > Tables > Chi-Square Test (Tabla cargada en la


Worksheet).

3 En las Columnas de la tabla poner Zona Centro, Zona Norte y Zona Sur, OK.

Los resultados se muestran a continuación:


Chi-Sq = 1951.221, DF = 8, P-Value = 0.000

Interpretación de resultados

Como el P value de 0.00 es menor a 0.05, se rechaza Ho, por tanto existe
dependencia entre el tipo de delitos y la zona donde se realizan.

Página 12
Metodología de análisis con Series de tiempo, Estadística inferencial y Control Estadístico

METODOLOGÍA DE CONTROL ESTADÍSTICO DE


PROCESOS
El Control Estadístico del Proceso por medio de las cartas de control son la
herramienta más poderosa para analizar la variación en los procesos. Las cartas
de control enfocan la atención hacia las causas especiales de variación cuando
aparecen y reflejan la magnitud de la variación debida a las causas comunes.

Las causas comunes o aleatorias se deben a la variación natural del proceso. Las
causas especiales o atribuibles son por ejemplo: una situación anormal en el
proceso.

Un proceso está bajo Control Estadístico cuando presenta causas comunes


únicamente. Cuando ocurre esto tenemos un proceso estable y predecible.

Cuando existen causas especiales el proceso está fuera de Control Estadístico;


las gráficas de control detectan la existencia de estas causas en el momento en
que se dan, lo cual permite que podamos tomar acciones al momento.

Cartas de control por variables


El término variable designa a cualquier característica de calidad “medible” tal
como un tiempo de respuesta, número de incidentes, etc.

Carta de Individuales (Datos variables)


 A menudo esta carta se llama “I-MR”.
 Esta Carta monitorea la tendencia de un proceso con datos variables
individuales.
 La línea central se basa en el promedio de los datos, y los límites de control se
basan en la desviación estándar (+/- 3 sigmas)

Ejemplo: Se registra el número de robo a comercios durante 2004 y 2005. Realice


la gráfica de control individual.

I-MR Chart of ROBO A COMERCIOS


U C L=54.28
50
Individual Value

40 _
X= 36.20

30

20
LC L=18.11
1 7 14 21 28 35 42 49 56 63 70
O bse r v a tio n

U C L=22.22
20
Moving Range

15

10
__
M R=6.80
5

0 LC L=0
1 7 14 21 28 35 42 49 56 63 70
O bse r v a tio n

Página 13

También podría gustarte