Está en la página 1de 14

Math. Sci. hum / Mathematics and Social Sciences (49e anne, n 196, 2011(4), p.

27-40)

LANALYSE EN COMPOSANTES PRINCIPALES DE VARIABLES NON STATIONNAIRES Philippe CASIN1, Christine STACHOWIAK1, Franois MARQUE1

RSUM Les sries chronologiques dont on dispose en conomie sont souvent non stationnaires, et il nest donc pas possible de les dcrire partir dune analyse en composantes principales : en effet, lanalyse en composantes principales est base sur lanalyse de la matrice des corrlations entre les variables, et ces corrlations sont fallacieuses. Cet article prsente une technique pour dcrire ce type de variables, en filtrant les donnes initiales par une suite danalyse en composantes principales pour obtenir des sries rsiduelles stationnaires ; lanalyse en composantes principales de ces sries est alors interprtable. Deux applications, lune base sur des donnes simules et lautre sur des donnes relles, sont fournies. MOTS-CLS Analyse en composantes principales, Cointgration, Variables non stationnaires SUMMARY Principal components analysis of non stationary variables Economical time series are often non stationary and then it is not possible to practice principal components analysis: this technique is based on analysis of the correlation matrix and correlations between original variables are spurious. The aim of this paper is to introduce a new technique which describes sets of non stationary variables. This technique is based on successive analyses of residuals which provide stationary variables. Two applications are given, the first one uses simulated data, the second one Nelson and Plossers data. KEYWORDS Cointegration, Non-stationary variables, Principal components analysis

1. INTRODUCTION Effectuer un test de Student sur le coefficient de corrlation entre deux variables chronologiques peut conduire des conclusions errones concernant lexistence dune relation linaire entre ces variables : cest le problme des rgressions fallacieuses . A fortiori, les rsultats dune analyse en composantes principales (ACP) tant bass sur la diagonalisation dune matrice de corrlations ou dune matrice de covariances sont ininterprtables lorsque certaines des variables sont non stationnaires, ce qui est souvent le cas en conomie. Lobjet de cet article est de proposer un algorithme permettant deffectuer une ACP de variables dont certaines sont non stationnaires ; pour cela, nous utilisons des rsultats tablis en conomtrie des sries temporelles et inexploits en analyse de donnes. Ces rsultats concernent lexistence de relations de cointegration entre les
1 Centre Europen de Recherche en conomie Financire et Gestion des Entreprises (CEREFIGE), UFR Droit, conomie, Administration, Universit de Lorraine, Ile du Saulcy, 57005 Metz cedex, philippe.casin@wanadoo.fr ; stachowiak@univ-metz.fr ; marque@univ-metz.fr

28

P. CASIN, C. STACHOWIAK, F. MARQUE

variables non stationnaires. Ces rsultats permettent de modliser les relations de long terme qui existe entre les sries. La suite de larticle se droule comme suit. Dans la seconde section, nous exposons le problme avec notamment un exemple dACP fallacieuse. Dans la troisime section, nous rappelons comment lACP traite les sries non stationnaires, sans parvenir mettre en vidence les ventuelles relations de cointegration entre cellesci. La quatrime section prsente la mthode dACP sur des sries non stationnaires. La cinquime section est consacre lapplication de cet algorithme deux exemples, lun partir de donnes simules, lautre partir de donnes relles, caractrisant lconomie des tats-Unis de 1909 1970. La conclusion de ce papier fait lobjet de la sixime section.

2. LE PROBLME 2.1 LA RGRESSION FALLACIEUSE (SPURIOUS REGRESSION) Considrons deux sries, notes X1 et X2 dont les valeurs linstant t sont notes respectivement X1,t et X2,t. X1,t et X2,t sont dfinies de la manire suivante : Xj,t = Xj,t-1 + uj,t pour j = 1,2, u1 et u2 tant deux bruits blancs indpendants. Pour une simulation gnrant 10 000 valeurs de ces deux marches alatoires calcules pour 5000 instants, la valeur de R2 varie de 0 0.936 avec une moyenne de 0.241 et un cart-type de 0.224. Le coefficient de rgression entre X1 et X2 nest pas donc pas gal 0 (cf. aussi [Gouriroux et Monfort, 1995], [Lardic et Mignon, 2002], [Casin, 2009] par exemple), bien que les deux variables soient dtermines indpendamment lune de lautre ; les tests habituels concernant ce coefficient de rgression ne sont pas utilisables, car ils conduisent dans le cas des variables non stationnaires des conclusions errones, cest dire conclure lexistence dune relation linaire entre les variables qui, en fait, est fallacieuse . 2.2. LACP FALLACIEUSE 2.2.1. Le problme Les rsultats de lanalyse en composantes principales dun ensemble de variables sont obtenus en diagonalisant la matrice de corrlations (ou la matrice de variancescovariances, sil sagit de variables non normes) entre les variables (cf [Bouroche, Saporta, 1980], [Casin, 1999], par exemple). Dans le cas de variables non stationnaires, le coefficient de corrlation est fallacieux et lACP effectue donne elle aussi des rsultats fallacieux . 2.2.2. Un exemple dACP fallacieuse Lorsque lon considre des sries linairement indpendantes et stationnaires, leur coefficient de corrlation est nul, lACP conduit donc diagonaliser la matrice identit et on obtient des valeurs propres gales 1. Considrons ici 10 marches alatoires Xj, j = 1,, 10 telles que Xj,t = Xj,t-1 + uj,t, les variables uj dsignant des bruits blancs deux deux indpendants. On calcule les 1000 premires valeurs de chacune des 10 variables Xj, et on effectue 5000 fois lACP

LANALYSE EN COMPOSANTES PRINCIPALES DE VARIABLES NON STATIONNAIRES

29

du tableau 1000 lignes et 10 colonnes obtenues, chacune des 5000 simulations tant obtenue pour des valeurs numriques des bruits blancs diffrentes. Les caractristiques des valeurs propres sont alors les suivantes :
Minimum tape 1 tape 2 tape 3 tape 4 tape 5 tape 6 tape 7 tape 8 tape 9 tape 10 0.270 0.078 0.039 0.019 0.010 0.007 0.005 0.003 0.001 < 0.001 Maximum 0.793 0.377 0.217 0.150 0.102 0.070 0.049 0.042 0.024 0.016 Moyenne 0.490 0.212 0.116 0.069 0.043 0.028 0.018 0.012 0.008 0.004 cart-type 0.084 0.047 0.028 0.019 0.013 0.009 0.005 0.004 0.002 0.002

TABLEAU 1.

Caractristiques des valeurs propres

Si lon considre lACP moyenne , lexamen de la colonne correspondante suggre de considrer 2 ou 3 tapes, celles-ci expliquant lessentiel de la variance du nuage de points ; de plus, les dernires valeurs propres ayant des valeurs proches de 0, certaines des 10 variables semblent lies entre elles par des relations linaires. En ralit, ces conclusions nont aucun sens, les sries de dpart ne faisant que dcrire des sommes de bruits blancs indpendants.

3. METTRE EN VIDENCE LES RELATIONS DE LONG TERME 3.2. NOTATION ET DFINITIONS On note I(0) une variable stationnaire et de faon plus gnrale I(d) une variable dont la diffrence dordre d est stationnaire ; ainsi la variable Xt est I(1) si la srie Xt - Xt-1 est stationnaire. La non stationnarit dune srie peut tre soit dorigine dterministe du fait de lexistence dun trend linaire (du type at + b, avec a diffrent de 0), soit dorigine stochastique comme dans le cas des marches alatoires. Dans cet article, nous considrons uniquement des sries I(1) dont la non stationnarit est due des causes stochastiques ; ventuellement, les sries initiales pourront tre rgresses par rapport t pour se ramener ce cas de figure en leur tant leur tendance temporelle. Les p colonnes du tableau X sont donc constitues de p variables Xj, j = 1,, p dont les valeurs aux instants t = 1, . T sont notes Xj,t ; ces variables sont soit I(1) et sans trend linaire, ou I(0). Les T lignes de ce tableau sont les p observations aux T diffrents instants. 3.2. COINTGRATION ET RELATIONS DE LONG TERME Une combinaison linaire de variables I(1) peut tre I(1), mais peut tre aussi I(0). On dit, dans ce dernier cas, quil existe une relation de cointgration entre les variables. La

30

P. CASIN, C. STACHOWIAK, F. MARQUE

mise en vidence de relations de cointgration entre des sries non stationnaires est un chapitre important de lconomtrie des sries temporelles [Engle et Granger, 1987] dans le cas univari mise en vidence dune relation de cointgration entre des variables [Johansen, 1988], dans le cas multivari mise en vidence de plusieurs relations de cointgration linairement indpendantes en utilisant lanalyse canonique. Ces relations de cointgration, qui lient entre elles des variables au cours du temps, sont appeles aussi relations de long terme, car elles lient entre elles les variables considres en niveau absolu. linverse, les relations de court-terme sont celles qui dcrivent des relations entre les variations des variables, autrement dit les variables prises en diffrence qui sont stationnaires. Ici, nous supposons quil existe r (r < p) relations de cointgration entre les variables Xj, j = 1,, p. 3.3. LE TRAITEMENT CLASSIQUE DES SRIES NON STATIONNAIRES EN ACP Comme cela a t montr dans le paragraphe 2.2.1, effectuer lACP de sries non stationnaires conduit des rsultats fallacieux, donc sans intrt. Une possibilit consiste construire partir des sries non stationnaires des sries stationnaires et traiter ensuite ces sries, obtenues partir des sries initiales en calculant leurs accroissements relatifs ou absolus. Mais en procdant ainsi, seules des relations de court terme sont mises en vidence entre les variables et non des relations de long terme. Ainsi, considrons les deux sries suivantes : X1,t = X1,t-1 + ut et X2,t = 10 X1,t-1. Ces deux sries ne sont pas stationnaires ; si lon considre leurs diffrences premires, il sagit de bruits blancs. Pourtant, il existe une relation vrifie approximativement entre les variables, puisque X1,t = 0.1 X2,t + ut, relation de long terme quil est intressant de mettre en vidence. La relation de court terme correspondante est X1,t = 0.1X2,t + ut, qui ne sera pas forcment mise en vidence par une ACP si 0.1X2,t est petit par rapport ut. A tout le moins, le coefficient de corrlation entre X1 et X2 est diffrent du coefficient de corrlation entre X1 et X2, et donc les ACP correspondantes donnent des rsultats trs diffrents. Filtrer les sries de dpart pour ne considrer que leurs diffrences premires, cest--dire pour ne soccuper que de sries stationnaires, occulte donc les relations existant entre les niveaux absolus des variables. Lobjet de cet article est de proposer une technique permettant deffectuer lACP des donnes de dpart et de mettre en vidence les relations de long terme, cest dire les relations linaires non fallacieuses entre les variables.

4. LACP DE VARIABLES NON STATIONNAIRES 4.1. UNE PRSENTATION GOMTRIQUE DU PROBLME Lorsquune variable est I(1), alors sa variance est, en utilisant la notation de Landau, Op(T), cest dire est un infiniment grand quivalent T, lorsque T tend vers linfini, lquivalence se faisant au sens dune convergence en probabilit ; dautre part, lorsquune variable est I(0), alors sa variance est Op(1). ([Harris, 1997 ; Snell, 1999 ; Chigira, 2005], par exemple).

LANALYSE EN COMPOSANTES PRINCIPALES DE VARIABLES NON STATIONNAIRES

31

Les combinaisons linaires non cointgres, cest dire I(1), ont une variance qui a pour ordre de grandeur T tandis que les combinaisons linaires cointgres, cest-dire I(0), sont Op(1). On en dduit [Engle et Granger, 1987] que sil existe r (r < p) relations de cointgration entre les variables Xj, j = 1, , p, alors lorsque T tend vers linfini, la matrice de covariances entre les variables admet pour limite une matrice finie singulire, dont le noyau est constitu par lespace des r dernires composantes principales. Ds lors, lespace des p variables Xj peut tre dcompos en deux sous-espaces orthogonaux : lun, not W0, de dimension r est engendr par les dernires composantes principales et se caractrise par des variables Op(1), cest--dire I(0) cest--dire stationnaires lautre, not W1 est gnr par des variables Op(T), cest--dire I(1), est de dimension p - r. Aussi, si on effectue lACP du tableau des p variables, les p - r premires composantes principales constituent une base de lespace W1 tandis que les r suivantes engendrent lespace W0. Ce rsultat, prsent ici de faon intuitive a t exploit par [Harris,1997 ; Snell, 1999 ; Chigira, 2005] pour mettre en vidence des relations de cointgration entre des sries I(1), cest--dire pour proposer une alternative la mthode destimation de [Johansen, 1988], base sur lanalyse canonique. Dans ce contexte, les relations les plus intressantes sont celles mises en vidence par les toutes dernires composantes principales, puisquelles dcrivent les relations de cointgration les plus fortes entre les variables, leur variance rsiduelle tant la plus faible possible. La dernire composante principale correspondant une rgression orthogonale ([Malinvaud, 1978], par exemple), la technique propose revient donc estimer par la rgression orthogonale ce qui ne peut ltre par la rgression des moindres carrs. Ainsi, Harris [1997] teste la stationnarit des composantes principales, les variables tant les logarithmes de la consommation, de linvestissement et de la production par tte, exprims en termes rels. Les donnes sont trimestrielles et concernent lconomie australienne de juin 71 septembre 1994. Le test met en vidence deux relations de cointgration et de ces deux relations de cointgration se dduit alors un systme permettant dexpliquer deux des trois variables. Les rsultats concernant la stationnarit des composantes principales nont pas t exploits en analyse des donnes, cest dire dans le cadre usuel de lACP comme technique descriptive dun grand ensemble de donnes. Dans ce cadre l, les composantes principales les plus intressantes ne sont pas les dernires, mais celles des composantes I(0) qui ont une variance maximale, autrement dit les premires composantes principales stationnaires. La mthode que nous proposons ici lACP de variables non stationnaires est pour le modle correction derreur ce quest lACP usuelle la rgression multiple ; lobjet de lACP (sur des variables non stationnaires, comme ici, ou sur dautres variables, pour lACP usuelle) est de dcrire un grand ensemble de donnes laide dun petit nombre de variables synthtiques, alors que lobjet de la rgression ou du modle correction derreur est de construire un modle explicatif, partir dune variable endogne expliquer et de variables exognes explicatives.

32

P. CASIN, C. STACHOWIAK, F. MARQUE

4.2. LALGORITHME DE CALCUL Si on effectue une ACP sur des variables I(1), les p - r premires composantes principales vont tre I(1) et donc fallacieuses, les suivantes vont tre I(0), et un test de stationnarit (cf. paragraphe 4.3) permet de dterminer la valeur de r. Mais en procdant ainsi, on se sert de rsultats asymptotiques. Considrons une variable de dpart I(0) et effectuons lACP sur lensemble des variables mixtes I(1) ou I(0) ; asymptotiquement, cette variable I(0) est orthogonale la composante principale dordre 1, puisque celle-ci est I(1). En pratique, lchantillon ayant une taille finie, elle ne lest sans doute pas exactement. La deuxime tape de lACP est quivalente une ACP des rsidus des variables du tableau dorigine par rapport la premire composante principale (il sagit dun rsultat classique). Le rsidu dune variable I(0) par la premire composante principale est donc une combinaison linaire dune variable I(0) expliquer par une variable I(1) explicative et peut donc tre I(1). Plus gnralement, la composante principale dordre r du tableau de dpart est la premire composante principale du tableau des rsidus des variables de dpart par les r - 1 premires composantes principales ; les rsidus dune variable I(0) par les r - 1 premires composantes principales peuvent tre I(1). En effectuant une ACP du tableau de dpart, on peut ainsi transformer des variables I(0) en variables I(1), ce qui est le contraire de lobjectif de lanalyse. Il est donc prfrable de procder ainsi, cest--dire prfrable deffectuer des ACP embotes : on teste le caractre I(0) ou I(1) de chacune des variables, et on effectue lACP des seules variables I(1), les composantes principales fallacieuses tant dans lespace engendr par ces variables I(1) ; on considre les rsidus des variables I(1) par la premire composante principale de cette ACP ; on effectue lACP des seuls rsidus qui sont I(1) ; etc., jusquau moment o tous les rsidus sont I(0) ; les rsultats de lACP sont alors tous I(0) et interprtables ; il ne reste alors plus qu effectuer une ACP (norme ou non) de ces rsidus stationnaires. 4.3. LES TESTS PRATIQUES Les tests pratiqus par [Harris, 1998 ; Snell, 1999 ; ou Chigira, 2005] ont pour objet de dterminer le nombre r de relations de cointgration indpendantes existant entre les variables et testent donc le caractre I(0) ou I(1) de la composante principale dordre p - r ; cest dire que les tests dbutent par la composante principale de variance la moins leve pour se terminer lorsque le test conclut que la composante principale faisant lobjet du test est I(0).

5. DEUX EXEMPLES DAPPLICATION Dans ce paragraphe, nous allons illustrer la technique propose par deux applications, la premire sur des donnes simules, la seconde sur des donnes relles.

LANALYSE EN COMPOSANTES PRINCIPALES DE VARIABLES NON STATIONNAIRES

33

5.1. UN EXEMPLE ILLUSTRATIF PARTIR DE DONNES SIMULES Considrons les sries chronologiques xj pour j = 1, 6 ; ces 6 sries sont lies entre elles par les 2 relations de cointgration suivantes : x1,t = x1,t-1 + u1,t x2,t = x2,t-1 + u2,t x3,t = x1,t + x2,t x4,t = u4,t x5,t = x4,t + 0.2 x1,t x6,t = 2x4,t + u6,t Les variables x1, x2, x3 et x5 sont I(1), tandis que x4 et x6 sont I(0). Plus T, le nombre dobservations, est lev, plus les 4 variables I(1) ont des normes leves alors que les normes des variables x4 et x6 sont Op(1). x3 est, par construction dans le plan engendr par x1 et x2. Ds lors, lACP du tableau dcrivant les 6 variables admettra, pour T infini, comme deux premires composantes principales une base de lespace engendr par x1 et x2. Les 4 composantes principales suivantes dcriront les rsidus des variables x3, x4, x5 et x6 par les variables x1, x2. Autrement dit, les composantes dordre suprieur ou gal 3 dcrivent des relations non fallacieuses entre la partie non stochastique des variables de dpart. Pour tester la stationnarit des sries, nous optons dans ce paragraphe pour le test de [Dickey-Fuller, 1979,1981] qui est le test le plus couramment utilis en conomtrie. Pour une simulation particulire pour laquelle T = 50 000 : 1) on teste la stationnarit des sries au seuil = 5 % par un test de Dickey-Fuller, on carte x4 et x6 qui sont stationnaires ; 2) on effectue lACP non norme des sries x1, x2, x3 et x5, les valeurs propres sont gales 0.00, 0.97, 4050.47 et 53247.66 ; 3) on teste la stationnarit de la premire composante principale ; celle-ci tant non stationnaire, on continue les calculs ; 4) on teste la stationnarit des rsidus des 4 variables x1, x2, x3 et x5 par la premire composante principale ; ceux-ci tant non stationnaires, on effectue lACP des rsidus non stationnaires, les valeurs propres sont 0.00, 0.00, 0.97 et 4050.47 ; 5) on teste la stationnarit de la premire composante principale de cette ACP, qui est donc la deuxime composante de lACP des sries x1, x2, x3 et x5 ; celle-ci tant non stationnaire, on continue les calculs ; 6) on teste la stationnarit des rsidus des 4 variables x1, x2, x3 et x5 par cette composante principale ; ceux-ci sont stationnaires. Les variances de ces rsidus sont gales respectivement 0.014, 0.04, 0.04 et 0.945. On rcupre donc bien la partie stationnaire de la srie x5 ; pour x1, x2, x3, les variances rsiduelles sont quasinulles ; 7) on effectue alors lACP de x4 et x6 et des rsidus des rgressions de x1, x2, x3 et x5 par les deux composantes principales calcules en 3) et 5) ; les valeurs propres sont gales 0.00, 0.00, 0.00, 0.00, 0.299 et 6.668. Les corrlations entre les 2 premires composantes principales et les variables sont alors :

34

P. CASIN, C. STACHOWIAK, F. MARQUE

Composante 1 x6 Rsidu de x5 x4
TABLEAU 2.

Composante 2 0.01 0.33 0.33

0.99 0.94 0.94

Corrlation avec les composantes principales

Lessentiel des relations entre les trois variables stationnaires est donc dcrit par la premire composante principale. 5.2. LES DONNES DE NELSON ET PLOSSER La prcdente mthode est maintenant applique (via le logiciel EViews) sur les donnes originales de Nelson et Plosser [1982]. Ces donnes concernent les USA pour la priode 1909-1970, la frquence est annuelle. Les sries prsentant une tendance dterministe ont t mises de ct, conformment la mthode applique. Nous avons de ce fait au total 13 variables : taux de chmage, emploi, vitesse de circulation de la monnaie, PNB nominal, PNB rel, PNB rel par tte, production industrielle, stock de monnaie (mesur par M2), indice du prix du PNB, salaire nominal, salaire rel, lindice SP500, indice des prix. Ces 13 sries sont centres. Dans ce paragraphe, nous utilisons le test de Phillips et Perron [1988] qui est mieux adapt des variables macroconomiques que le test de Dickey et Fuller et permet de tenir compte dune ventuelle autocorrlation et/ou htroscdasticit des rsidus ; les rsultats de ce test sont donc plus robustes. Pour ce test, il est ncessaire de choisir un paramtre de troncature. En faisant varier ce paramtre, les rsultats restent stables, et de ce fait nous avons choisi de retenir la valeur T1/4, T tant le nombre dobservations. 1re tape. Un test de Phillips-Perron est mis en place sur chacune dentre elles. Ce test montre que toutes les sries sont non stationnaires. Afin de dterminer lordre dintgration des sries initiales, le test de racine unitaire est galement appliqu sur les sries en diffrence premire et conclut la stationnarit de celles-ci. De ce fait, nous pouvons affirmer que lensemble des variables est I(1). On effectue lACP non norme de cet ensemble de donnes. Pour ce faire, nous dterminons la matrice de variance-covariance associe aux donnes. Les 13 valeurs propres de cette matrice figurent dans le tableau suivant. Le vecteur propre associ la plus grande valeur propre est isol. On teste la stationnarit de la premire composante principale par le test de Phillips Perron. La valeur calcule de la statistique est de 2,03 ce qui nous permet de conclure en la non stationnarit de cette composante (la valeur critique au seuil de 5 % est de -1,95). De ce fait, nous rgressons prsent nos sries initiales sur la premire composante principale et nous nous intressons la stationnarit des rsidus de ces rgressions.

LANALYSE EN COMPOSANTES PRINCIPALES DE VARIABLES NON STATIONNAIRES

35

1 2 3 4 5 6 7 8 9 10 11 12 13

0,001 0,193 1,024 1,444 2,752 10,627 23,654 85,011 152,971 4 614,575 51 301,970 25 421 131,216 62 812 041 219,752

TABLEAU 3.

Valeurs propres

2nde tape. Un test de Phillips Perron est appliqu sur ces 13 rsidus (nomms res1, res2, , res13). Les rsultats figurent dans le tableau suivant :
Variable Res1 Res2 Res3 Res4 Res5 Res6 Res7 Res8 Res9 Res10 Res11 Res12 Res13
TABLEAU 4.

Stat PP -1.12 -1.51 -1.58 -1.82 -1.52 -2.27* -1.89 -2.05* -1.29 -0.927 -1.53 -2.15* -1.75

Test de Phillips Perron

Stat PP est la valeur de la statistique de Phillips Perron, * signifie que lhypothse nulle de non stationnarit est rejete au seuil de 5 %. Nous remarquons que les rsidus 6, 8 et 12 sont stationnaires, ces derniers sont mis de ct et on effectue prsent lACP des rsidus non stationnaires. 3me tape. lACP est effectue sur les 10 rsidus non stationnaires. Les valeurs propres associes figurent dans le tableau suivant :

36

P. CASIN, C. STACHOWIAK, F. MARQUE

1 2 3 4 5 6 7 8 9 10
TABLEAU 5.

1.46E-8 0.38 1.58 6.07 19.90 81.41 132.25 4605.84 51275.86 25421117

Valeurs propres

Nous tudions la stationnarit de la premire composante principale, la statistique de Phillips et Perron est gale -1,52. Nous pouvons donc en conclure que cette composante principale est non stationnaire au seuil de 5 %. Les 10 prcdents rsidus sont rgresss sur cette composante principale et nous tudions la stationnarit des rsidus (nomms res14, , res23) de ces rgressions. Le tableau 6 reprend lensemble des rsultats.
Variable Res14 Res15 Res16 Res17 Res18 Res19 Res20 Res21 Res22 Res23 Stat pp -2.08* -1.88 -3.03* -3.25* -1.55 -2.29* -1.85 -1.77 -3.20* -1.65

TABLEAU 6. Test de Phillips Perron Les rsidus stationnaires sont mis de ct. Nous effectuons lACP sur les rsidus non stationnaires. 4me tape. LACP est mise en place sur les 5 prcdents rsidus non stationnaires. Les valeurs propres figurent dans le tableau suivant :
1 2 3 4 5
TABLEAU 7.

9.89E-6 2.52 8.64 42.30 49709.35

Valeurs propres

LANALYSE EN COMPOSANTES PRINCIPALES DE VARIABLES NON STATIONNAIRES

37

Nous testons la stationnarit de la premire composante principale. La statistique de Phillips Perron est gale -1,85 ce qui signifie que la premire composante principale est non stationnaire. Nous rgressons de ce fait les 5 prcdents rsidus sur cette dernire et testons la stationnarit des rsidus (nomms res24, , res28) de ces rgressions. Les rsultats figurent dans le Tableau 8.
Variable Res24 Res25 Res26 Res27 Res28
TABLEAU 8.

Stat PP -2.60* -2.64* -2.33* -2.07* -2.36*

Test de Phillips-Perron

Nous remarquons que ces rsidus sont tous stationnaires. Ayant obtenu pour chacune des variables des rsidus stationnaires, on calcule la variance de ces rsidus :
Variable Taux de chmage Indice des prix Vitesse de circulation monnaie PNB rel PNB rel par tte Indice du prix du PNB Production industrielle Stock de monnaie PNB nominal Emploi Salaire nominal Salaire rel Indice SP500
TABLEAU

variance 29,61 56,66 0,075 139,26 6184,59 6,00 46,47 88,40 0,00 9,20 0,01 3,53 41,58

9. Variance des rsidus

puis les valeurs propres de lACP :

38

P. CASIN, C. STACHOWIAK, F. MARQUE

1 2 3 4 5 6 7 8 9 10 11 12 13

5.79E-15 5E-9 0.003 0.18 0.60 1.49 2.43 8.27 22.85 51.48 85.97 154.97 6170.61

TABLEAU 10.Valeurs

propres

Et enfin les corrlations entre les rsidus et les composantes principales et les corrlations entre les rsidus. On notera Ci la composante n i.
C1 Taux de chmage Indice des prix Vitesse de circulation monnaie PNB rel PNB rel par tte Indice du prix du PNB Production industrielle Stock de monnaie PNB nominal Emploi Salaire nominal Salaire rel Indice SP500
TABLEAU 11.

C2 .69 -.49 -.27 .81 -.01 .56 -.48 -.22 -.05 .01 -.33 .88 .64

C3 .33 -.14 -.58 .12 .00 -.08 -.08 .93 -.02 .05 .14 .14 -.33

C4 -.15 .63 -.17 .26 .00 -.09 .58 .09 -.42 -.39 -.40 .07 .21

C5 .31 .04 -.03 .09 .00 .05 .10 -.15 -.07 -.09 .13 .13 -.63

C6 -.11 .23 -.57 .03 .00 .06 -.31 .00 .16 .16 .16 -.01 -.07

.48 .54 -.44 -.50 -.99 -.58 .56 .25 .87 .88 .80 -.21 -.18

Corrlations entre composantes principales et rsidus des variables

Les variances des rsidus (cf. Tableau 9) sont trs diffrentes, do des valeurs propres trs diffrentes (cf. Tableau 10). Les tapes successives de lACP dcrivent des phnomnes linairement indpendants pour la priode considre entre les rsidus des variables : le premier axe est trs fortement li au PNB rel par tte, ce qui nest pas tonnant car cette variable a une variance trs forte ; sur cet axe, le PNB rel soppose au PNB

LANALYSE EN COMPOSANTES PRINCIPALES DE VARIABLES NON STATIONNAIRES

39

nominal, lemploi et au salaire nominal. Cette opposition est confirme par lexamen des corrlations entre les rsidus (cf. Tableau 12) ; le deuxime axe met laccent sur la relation entre salaire rel et PNB rel ; cet axe est aussi li positivement, dans une moindre mesure, au taux de chmage et lindice SP 500 ; le troisime axe oppose stock de monnaie et vitesse de circulation de la monnaie, mais la corrlation entre ces 2 variables nest pas trs leve. partir de laxe 4, les corrlations entre les variables et les axes deviennent trop faibles pour que lon puisse mettre en vidence des relations entre les variables.
Taux de chmage Indice du prix du PNB Salaire nominal Indice des prix Indice SP 500 1.00 PNB nominal PNB r. / tte

St. monnaie

Taux de chmage Indice des prix Vitesse de circulation monnaie PNB rel PNB rel par tte Indice du prix du PNB Production industrielle Stock de monnaie PNB nominal Emploi Salaire nominal Salaire rel Indice SP500

1.00 -.22 1.00

-.52 .34 -.49 .07 -.11 .22 .40 .47 .29 .57 .04

-.26 -.51 -.53 -.63 .85 .16 .27 .25 .36 -.52 -.28

1.00 -.13 .44 .14 .00 -.60 -.36 -.43 -.35 -.27 .12 1.00 .49 .72 -.52 -.18 -.59 -.53 -.73 .86 .57 1.00 .57 -.55 -.25 -.87 -.88 -.79 .20 .18 1.00 -.64 -.36 -.45 -.42 -.57 .61 .43 1.00 .21 .22 .20 .33 -.50 -.31 1.00 .19 .25 .35 -.13 -.38 1.00 .99 .92 -.31 -.24 1.00 .91 -.24 -.21 1.00 -.50 -.58 1.00 .48

TABLEAU 12.

Corrlations entre les rsidus

6. CONCLUSION Pour dterminer des relations entre des sries non stationnaires, trs courantes en macro-conomie, les conomistes procdent souvent des transformations de ces sries pour les rendre stationnaires, notamment par diffrenciation.

Salaire rel

Vitesse cir. monnaie

Production industrielle

PNB rl

Emploi

40

P. CASIN, C. STACHOWIAK, F. MARQUE

Une autre manire de procder est de rechercher des relations de cointgration, cest--dire des combinaisons linaires stationnaires de variable non stationnaires. La mthode propose ici est lapplication lACP de cette recherche de relations de cointgration, les sries tant filtres par leurs premires composantes principales de telle manire que les sries rsiduelles sont alors stationnaires. Cette stationnarit est obtenue partir des sries brutes, donc sans quil soit ncessaire de transformer les sries pralablement et fournit donc des informations sur les relations entre ces sries, considres en niveau absolu. Linterprtation des rsultats se fait alors comme classiquement en ACP.
BIBLIOGRAPHIE

BOUROCHE J.-M., SAPORTA G. (1980), L'analyse

des donnes, Paris, Presses Universitaires de France, Coll.

Que sais-je ?
CASIN PH. (1999), Analyse CASIN PH.

des donnes et des panels de donnes, Bruxelles et Paris, De Boeck.

(2009), conomtrie, mthodes et applications avec EViews, Paris, ditions Technip.

CHIGIRA H.

(2006), A test of cointegration rank based on principal component analysis, Tokyo, Hitotsubashi University, Research Unit for Statistical Analysis in Social Sciences.
DICKEY D.A., FULLER W.A. DICKEY D.A. FULLER W.A.

(1979), Distribution of the Estimators for Autoregressive Time Series with a Unit Root, Journal of the American Statistical Association 74, p. 427-431. (1981), Likelihood ratio Statistics for Autoregressive Time Series with a Unit Root, Econometrica 49, p. 1057-1072.
ENGLE R., GRANGER C.W.J.

(1987), Cointegration and error correction: representation, estimation and testing, Econometrica 55, p. 251-276.
GOURIEROUX CH., MONTFORT A.

(1995), Sries temporelles et modles dynamiques , 2e d.,

Economica.
HARRIS Y.

(1997), Principal components analysis of cointegrated time series, Econometric Theory 13, p. 529-557.
JOHANSEN S.

(1988), Statistical analysis of cointegration vectors, Journal of economic dynamics and control 12, p. 231-254.
KWIATKOWSKI D., PHILLIPS P.C.B., SCHMIDT P., SHIN Y. (1992), MALINVAUD E. (1978),

Testing the null hypothsesis of stationarity against the alternative of a unit root, Journal of Econometrics 54, p. 159-178. Mthodes statistiques de lconomtrie, 3e d., Paris, Dunod. (2002), conomtrie des sries temporelles macroconomiques et financires,
LARDIC S., MIGNON V.

Paris, Economica.
NELSON C.R., PLOSSER C.I. PHILLIPS P.C.B, PERRON P.

(1982), Trends and random walks in macroeconomic time series: some evidence and implications, Journal of Monetary Economics 10, p. 129-162. (1988), Testing for a unit root in time series regression, Biometrika 75, p. 335-346.
SNELL A. (1999),

Testing for r versus r-1 cointegrating vectors, Journal of Econometrics 88, p. 151-191.

También podría gustarte