Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Einfhrung
Nhere Informationen sind z.B. auf der Homepage der Firma STATCON zu finden (http://www.statcon.de).
1. Einfhrung
Nach dem Programmstart erscheint das EViews-Fenster, dass sich aus mehreren Bereichen
zusammensetzt. Oben eingeblendet ist die Menleiste. In das "Befehlsfenster" knnen
Befehle eingetragen und durch Drcken der Enter-Taste ausgefhrt werden. In dem
Arbeitsbereich stellt EViews die Fenster der verschiedenen Objekte dar, die erzeugt werden
knnen.
Menleiste
Befehlsfenster
Arbeitsbereich
Anschlieend erscheint ein Popup-Fenster, in dem die Art der Daten festgelegt werden muss:
Jahresdaten: Annual
Halbjahresdaten: Semi-annual
Vierteljahresdaten: Quarterly
Monatsdatem: Monthly
Wochendaten: Weekly
Tagesdaten: Entweder Fnf-Tage-Woche (5 days weeks) oder Sieben-Tage-Woche (7
days week)
Andere Daten, z. B. falls keine Zeitreihendaten vorliegen (Kuferdaten etc.): Undated or
irregulr.
Bei EViews muss neben der Art der Daten auch ein Datenbereich festgelegt werden. Falls
Prognosen zu erstellen sind, sollte das "Datenende" spter gewhlt werden als der letzte
Zeitreihenwert. Fr das Beispiel des Kraftfahrzeugbestands (Daten liegen von 1980 bis 1988
vor) whlen wir als Startwert 1980 und als Endwert 1995:
Durch einen Doppelklick lassen sich diese Objekte ffnen. Das Objekt "c" enthlt einen
Koeffizienten-Vektor, der fr eine Regressionsschtzung bentigt wird. In dem Objekt "resid"
werden die Residuen abgespeichert. Da noch kein Modell geschtzt wurde, sind keine Zahlen
vorhanden.
Wir speichern das Workfile ab, indem wir im Men "File" den Eintrag "Save AS"
auswhlen, einen Dateinamen vergeben und die Schaltflche "Speichern" auswhlen.
Variablen, Gleichungen etc. werden in EViews als Objekte aufgefasst. Somit mssen wir in
der Datei KFZ zwei Objekte anlegen. Die abhngige Variable, der KFZ-Bestand, wird zuerst
definiert. Hierfr ist das Men "Objects" und dort der Eintrag "New Object " anzuklicken:
In dem sich ffnenden Dialogfenster ist eines der Objekte auszuwhlen. Zeitreihendaten
werden als "Series"-Objekt abgespeichert. Das Objekt erhlt den Namen "Bestand", und die
OK-Schaltflche wird angeklickt:
In dem Workfile-Fenster ist ein neues Icon hinzugekommen. Es wird durch das gleiche
Symbol wie "resid" gekennzeichnet. Dieses Symbol steht fr "Series"-Objekte, also fr
Zeitreihen oder undatierte Reihen.
Durch einen Doppelklick ffnen wir das Objekt "bestand" und tragen die Zeitreihenwerte ein,
nachdem die
Das Objekt "Bestand" wird anschlieend durch Anklicken des Kreuzes an der Fensterecke
geschlossen:
Auf die gleiche Weise wird ein Objekt fr die unabhngige Variable Zeit definiert (Objekt
"t"):
Die Variablenwerte mssen nicht eingegeben werden. Stattdessen kann die EView-Funktion
"@trend" genutzt werden. Hierfr wird unter "Quick" "Generate Series" angeklickt:
Der Wert in Klammern ist ein Parameter, der der Funktion bergeben wird. Dieser Parameter
gibt den Zeitreihenwert an, der mit null kodiert wird.
10
Wird das Objekt "t" durch einen Doppelklick auf das Icon im Workfile-Fenster geffnet, dann
sieht man, dass die richtigen Werte bereits eingetragen worden sind.
bzw. alternativ:
11
12
Der Output enthlt die bereits besprochenen Gren. Die Regressionsgleichung lautet:
y t = m t = 26.033,4 + 823,2 t .
Die t-Werte (t-Statistics) sind deutlich grer als zwei, so dass sie signifikant sind. Dieses
wird durch die p-Werte besttigt. Die p-Werte (Prob.) liegen bei 0,0000, so dass die
Regressionskoeffizienten sogar bei einem Signifikanzniveau von einem Prozent eine
Signifkanz aufweisen. Der Determinationskoeffizient (R-quared) gibt den Anteil der erklrten
Varianz an. In unserem Beispiel werden 98,8 % der Varianz des Kfz-Bestands erklrt.
Jetzt wird das Fenster mit den Ergebnissen der Regressionsschtzung geschlossen, in dem das
Kreuz in der oberen rechten Ecke angeklickt wird. Im Popup-Fenster:
wird die Schaltflche "Name" angeklickt und die Gleichung gespeichert. Eine Gleichung ist
also auch ein Objekt, das nach dem Speichern im Workfile-Fenster angezeigt wird.
13
und lassen uns die geschtzten Werte der abhngigen Variablen (= Regressionswerte) ausgeben:
14
Hierfr wird ein neues Objekt mit den Namen "bestandf" (f fr forecast) erzeugt:
Das neu erzeugt Objekt enthlt fr den Sttzbereich 1990 1998 die geschtzten Werte der
abhngigen Variablen y t und fr den darber hinaus gehenden Zeitraum 1999 2005
Prognosewerte (Hinweis: neue Datierung). Um eine Grafik mit den beobachteten und den
geschtzten Werten der abhngigen Variablen zu erhalten, muss eine Gruppe der Objekte
"bestand" und "bestandf" gebildet werden. Hierfr sind beide Icons im Workfile-Fenster zu
markieren (gegebenenfalls die Steuerung-Taste verwenden). Mit der rechten Maustaste wird
der markierte Bereich angeklickt und im Kontextmen der Eintrag "Open/as Group"
ausgewhlt:
15
Mit dieser Objektgruppe lsst sich ein Liniendiagramm erzeugen, indem "View/Graph/Line"
ausgewhlt wird:
Die Trendgerade weicht also nur sehr gering von dem Polygon der Beobachtungswerte (blau)
ab. Hier wird abermals besttigt, dass die Anpassung als sehr positiv zu bewerten ist.
16
17
Fr eine bessere Anpassung im Vergleich zur linearen Trendfunktion spricht der hhere
Determinationskoeffizient (0,994 im Vergleich zu 0,988). Daneben knnen aber auch
Fehlermae zur Beurteilung der Gte der Anpassung herangezogen werden. Hierfr wird die
Regressionsgleich unter dem Namen "eq02" gespeichert (vgl. S. 12).
18
19
Die Outputs beider Prognosen werden anschlieend verglichen. Hier sieht man, dass die
Wurzel des mittleren quadratischen Fehlers (Root Mean Squared Error)2 und der mittlere
1 n
y t y t 2 .
n t =1
20
absolute Fehler (Mean Absolute Error)3 beim linearen Modell (eq02) deutlich grer als beim
exponentiellen Modell (eq01) sind. Insofern ist das exponentielle Modell vorzuziehen.
1 n
y y t .
n t =1 t
21
im Workfile-Fenster lassen sich die geschtzten Werte anzeigen. In der zweiten Zeile wird die
Berechnungsformel angegeben.
22
Als nchstes sind in ein neues Objekt (Men "Objects/New Object") die Zeitreihenwerte
einzutragen (vgl. S. 7 f.).
Dieses Objekt wird unter dem Namen "Auftrag" abgespeichert. Zur Berechnung der
gleitenden Durchschnitte ist die Funktion "@movav(x,n)" heranzuziehen, wobei "x" fr das
Series-Objekt und "n" fr die Anzahl der Perioden bei der Durchschnittsbildung steht. Zu
beachten ist, dass EViews die Durchschnitte immer nachlaufend bestimmt. So wird
beispielsweise der 3-gliedrige gleitende Durchschnitt nicht durch:
(1)
1
y3t = y t 1 + y t + y t +1
3
23
(y3t )n = 13 (yt 2 + yt 1 + yt )
(2)
berechnet.
Im Folgenden lassen wir uns die nachfolgenden 3-gliedrigen Durchschnitte berechnen. Wir
rufen dafr "Quick/Generate Series" auf. Als Parameter sind der Funktion die
Auftragswerte, die im Objekt "Auftrag" gespeichert sind, und die "3", damit 3-gliedrige
Durchschnitte berechnet werden, zu bergeben.
Die
nachfolgenden
Durchschnitte
sind
jetzt
in
dem
neu
angelegten
Objekt
"auftrag_mov_av_n" gespeichert. Die Werte des Objektes lassen wir uns durch einen
Doppelklick auf das Icon:
24
Zu beachten ist, dass die mit (2) berechneten nachfolgenden gleitenden Durchschnitten den
einfachen gleitenden Durchschnitten der Vorperiode entsprechen. Somit mssen die
nachfolgenden gleitenden Durchschnitte nur der Vorperiode zugeordnet werden, um die
einfachen gleitenden Durchschnitte zu erhalten. Indem in Klammern hinter den Namen eines
Series-Objektes eine Eins eingetragen wird, werden die Merkmalswerte um eine Periode nach
hinten verschoben:
In der Zeitreihenanalyse bezeichnet man die Verschiebung aller Werte einer Zeitreihe in die
Vergangenheit (Zukunft) als Lead (Lag)-Bildung. Hier haben wir einen Lead erster Ordnung
gebildet.
25
y 4t =
1 1
1
y t 2 + y t 1 + y t + y t +1 + y t + 2 .
4 2
2
Wir verwenden den vorbereiteten Datensatz "lohnq.wf1" und berechnen die gleitenden
Durchschnitte unter Verwendung von "Quick/Generate Series":
26
Anschlieend sind die Werte von "lohn_mov_av_n" mit ihren Werten der Vorperiode zu
mitteln, wobei eine Verschiebung um ein und zwei Perioden vorgenommen werden muss:
27
Die ursprnglichen und gegltteten Werte sollen zum Vergleich in einem Linendiagramm
dargestellt werden.
28
Dem Liniendiagramm ist zu entnehmen, dass die Quartalsausschlge geglttet sind. Das
Verfahren der gleitenden Durchschnitte hat allerdings den Nachteil, dass keine gegltteten
Werte fr die beiden ersten und letzten Quartale vorliegen. Darber hinaus ist eine Prognose
nicht unmittelbar mglich.
29
y t ,1 = y t 1,1 + e t .
Ein Problem besteht darin, dass der Parameter vorgegeben werden muss. In der Praxis
haben sich Werte zwischen 0,1 und 0,3 bewhrt. Daneben kann der Parameter auch von
EViews berechnet werden. Eviews bestimmt dann so, dass der mittlere quadratische Fehler
minimiert wird. Dadurch wird aber keineswegs gewhrleistet, dass ein sinnvoller Wert fr
geschtzt wird, wie wir im Folgenden sehen werden.
Wir rufen den Datensatz "umsatz.wf1" auf, die Jahreswerte enthlt, und ffnen das Objekt
"umsatz" durch einen Doppelklick auf das entsprechende Icon im Workfile-Fenster:
30
Als Methode ist "single" auszuwhlen. Schlielich soll eine einfache exponentielle Glttung
durchgefhrt werden. Die Schtzwerte sind in dem Objekt "umsatzsm" zu speichern. Fr die
Perioden eins bis zehn soll eine Schtzung durchgefhrt werden. Die Anzahl der Perioden pro
Jahr ist bei einer einfachen exponentiellen Glttung nicht entscheidend. Ein Alpha-Wert wird
nicht vorgegeben.
Im Output sieht man, dass EViews ein Alpha von 0,001 verwendet. An der Rekursionsformel:
(5)
y t ,1 = (1 ) y t 1,1 + y t
wird deutlich, dass bei einem derartig kleinem Alpha die aktuellen Beobachtungswerte
praktisch nicht bercksichtigt werden. Ein derart geringer Wert empfiehlt sich nicht.
31
Deshalb wird im Folgenden ein Alpha von 0.3 vorgegeben. Zu beachten ist, dass Eviews als
Startwert den Durchschnitt der Beobachtungswerte verwendet. Ein Startwert kann, zumindest
bei Verwendung dieser Prozedur, nicht vorgegeben werden.
Der Tabelle sind die Summe der quadrierten Residuen ("Sum of Squared Residuals") und die
Wurzel des mittleren quadratischen Fehlers ("Root Mean Squared Error") zu entnehmen. Hier
32
knnte man auch verschiedene Alpha vorgeben und das Modell mit den geringsten
Fehlerwerten verwenden.
Abschlieend sollen die beobachteten und die geschtzten Werte in einem Liniendiagramm
dargestellt werden (zum Aufruf vergleiche S. 27 f.). Die Ausschlge des Umsatzes werden
durch die geglttete Linie nur zum Teil wiedergegeben. Bei einer Unterschtzung steigt der
Schtzwert in der nchsten Periode an und umgekehrt.
33
Workfile
kopiert
worden.
Die
trendbereinigten
(und
konjunkturbereinigten)
Zeitreihenwerte dij knnen als Differenz zwischen den beobachteten und gegltten Werten
berechnet werden:
Da die Saisonausschlge nicht mit ber den Berichtszeitraum zunehmen, ist das additive
Modell der Zeitreihenzerlegung adquat.
34
Entsprechend knnen auch die Summen fr die vier Quartale in einem Schritt ermittelt
werden:
36,25
= 9,0625
4
s*2 =
9,5125
= 2,378
4
s*3 =
10,675
= 2,669
4
s*4 =
56,225
= 14,056 .
4
an.
Der Durchschnitt der unnomierten Saisonkomponenten:
(6)
d=
35
36
Von den Lhnen muss die jeweilige nomierte Saisonkomponente subtrahiert werden. Die
Funktion "@seas(x) liefert eine Eins zurck, wenn das x-te Quartal vorliegt und ansonsten
eine Null. Bei den Lhnen und Gehltern des ersten Quartals wird somit 9,009 subtrahiert,
bei den Lhnen und Gehltern des zweiten Quartals 2,324 etc.
37
5.2 Regressionsverfahren
Die Lhne und Gehlter sollen mit einem Trend und Dummy-Variablen fr die Quartale
erklrt werden. Mit Hilfe der geschtzten Regressionskoeffizienten knnen dann saisonbereinigten Werte berechnet werden.
Als Beispiel verwenden wir die Entwicklung der Lhne und Gehlter in der BRD von 1996
bis 2000. Bei der Definition des Workfile-Bereichs geben wir an, dass es sich um Quartalsdaten handelt.
38
In ein neues Series-Objekt ("lohnq") werden die Zeitreihenwerte der abhngigen Variablen
(Lhne und Gehlter) eingegeben.
Daneben werden vier Dummy-Variablen gebildet. Die erste Dummy-Variable "D1" erhlt
dann eine Eins zugewiesen, wenn das erste Quartal vorliegt. Ansonsten nimmt sie den Wert
39
null an. Die Funktion "@seas(x)" kann hier eingesetzt werden, wobei der Parameter x auf 1
gesetzt werden muss:
5.2.1
Wenn eine Regressionsschtzung mit absolutem Glied durchgefhrt wird, knnen nicht vier
Dummy-Variablen in das Regressionsmodell aufgenommen werden. Aufgrund einer perfekten Multikollinearitt wre eine Kleinst-Quadrate-Schtzung nicht mglich. Wir
verwenden fr das Regressionsmodell deshalb die Dummyvariablen "D2", "D3" und "D4".
40
Der Ausgabe ist zu entnehmen, dass alle Regressionskoeffizienten auf einem von 5 Prozent
signifikant von null verschieden sind. Insbesondere der Trend liefert eine hohe Determination
(hoher t-Wert). Mit dem Regressionsansatz wird 99 % der Varianz von den Lhnen und
Gehltern erklrt.
41
(8)
damit die Summe der normierten Saisonkoeffizienten null ergibt. Man erhlt somit folgende
normierten Strukturkoeffizienten:
S1 = 0 9,204 = 9,204
S2 = 6,793 9,204 = 2,411
S3 = 6,465 9,204 = 2,739
S4 = 23,558 9,204 = 14,354 .
Mit diesen lassen sich die saisonbereinigten Zeitreihenwerte bestimmen:
(9)
y*ij
Bereinige Lhne
yij s j .
Lhne
In EViews wird ein neues Series-Objekt erstellt, dessen Werte sich als Differenz zwischen
den Lhnen und Gehltern (Objekt lohn) und den jeweiligen normierten Saisonkomponenten
berechnen. Die Dummy-Variablen nehmen immer nur fr ein Quartal den Wert eins an. Fr
Werte des ersten Quartals erhlt man somit folgende Bereinigung:
(10)
=0
=0
=0
5.2.2
42
Wird kein absolutes Glied bercksichtigt, dann knnen alle Dummy-Variablen fr die Regressionsschtzung verwendet werden. Dann wird folgendes Regressionsmodell berechnet:
Auch bei diesem Modell sind alle geschtzten Regressionskoeffizienten signifikant von null
verschieden. Die Regressionskoeffizienten sind wiederum als unnormierte Saisonkomponenten zu interpretieren.
43
Unter Anwendung von Formel (8) erhlt man die normierten Saisonkomponenten:
S1 = 112,633 121,837 = 9,204
S2 = 119,425 121,837 = 2,412
S3 = 119,098 121,837 = 2,739
S4 = 136,190 121,837 = 14,353 ,
die sich (bis auf rundungsbedingte Abweichungen) nicht von den im vorigen Abschnitt
berechneten normierten Saisonkomponenten unterscheiden. Zur Berechnung der saisonbereinigten Zeitreihenwerte ist folgende Gleichung anzuwenden:
44
Im Folgenden werden die Lhne und Gehlter sowie ihre saisonbereinigten Werte in einem
Liniendiagramm dargestellt (zur Anfertigung eines Liniendiagramms vgl. S. 14 ff.). Hier sieht
man, dass die originren Werte deutliche Saisonschwankungen aufweisen. Diese sind durch
die Saisonbereinigung eliminiert worden.