Zusammenfassung
Die langfristige Geldnachfrage in Deutschland bzw. ihre Stabilität ist ein Gebiet, das von einer Vielzahl theoretischer und empirischer Arbeiten kontrovers bearbeitet wurde.1 Jüngere Ansätze konzentrieren sich auf die Mitgliedsländer der europäischen Union.2
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
Notes
Vgl. z.B. Bohl [18] (1999), S. 209 ff., Buscher [26] (1984), S. 507 ff., Buscher/SCHRÖDER [27] (1982), S. 117 ff., Hagen[72] (1984), S. 558 ff., Jarchow/MÖLLER/BERNHÖFT [96] (1988), S. 59 ff., Neumann [146] (1983), S. 415 ff. oder Schlomann [195] (1988), S. 43 ff. Ein sektoraler Ansatz stammt von Sell [201] (1997), S. 325 ff.
Auf die Europäische Union insgesamt bezogen sind dies z.B. Hayo [77] (1997), Wesche [236] (1997) und Wesche [235] (1998). Einen Überblick geben Browne/Fagan/Henry [24] (1997). Geldnachfrageschätzungen fÜr Italien finden sich z.B. bei Bagliano [7] (1996), S. 425 ff., für Großbritannien bei Thomas [214] (1997), sektorale Schätzungen für Großbritannien bei Thomas [214] (1997).
Judd/Scadding [98] (1982), S. 993. Ähnliche Definitionen finden sich bei Buscher/SCHRÖDER [27] (1982), S. 126, Neumann [146] (1983), S. 415 sowie bei Woll [244] (1981), S. 473.
Deutsche Bundesbank [33] (1994), S. 62 f.
Vgl. für eine Diskussion des Identifikations-Problems Laidler [109] (1993), S. 112 ff. sowie Sims [205] (1992), S. 975 ff.
Vgl. für eine Darstellung der Geldpolitik der Deutschen Bundesbank Rohde [174] (1995), S. 243 sowie Bofinger/Reischle/SCHÄCHTER [15] (1996), S. 169 ff.
Dieses Problem wird häufig als Schlepptau-Problematik bezeichnet, weil die Zentralbank ins Schlepptau der Geschäftsbanken gerät und zumindest kurzfristig kaum noch Spielraum hat (vgl. KÖHLER [104] (1983), S. 176 ff.).
Vgl. Baun [10] (1994), S. 153 f.
Vgl. Laidler [109] (1993), S. 91 ff.
Vgl. z.B. Sauer [186] (1992), S. S. 340 ff. sowie Siebke [202] (1987), S. 41 ff.
Die Terminologie folgt damit z.B der von Baun [10] (1994) (vgl. insbes. Abbildung 1, S. 145), der von Uhlig [226] (1995) bzw. der von Zimmermann [247] (1994).
Gleiches gilt auch für andere ökonometrische Verfahren (vgl. z.B. Brochhausen [22] (1989), S. 17 ff.).
Vgl. für die Abgrenzungen der Geldmengen M1, M2, M3 bzw. M3 erweitert Deutsche Bundesbank [34] (1995), S. 72 ff.
Vgl.für eine Diskussion der Aggregate Scharnagl [189] (1996).
Vgl. z.B. Deutsche Bundesbank [36] (1988), S. 18 ff. sowie Deutsche Bundesbank [34] (1995), S. 68 ff.
Vgl. EUROPÄISCHE Zentralbank [41] (1999), S. 52 ff.
Vgl. AMR [3] (1983), § 6, Abs. (1).
Obwohl die Daten nicht für die Veröffentlichung bestimmt sind, war die Bundesbank so freundlich, diese Daten für die hier durchzuführende Analyse bereitzustellen. Für ihr Entgegenkommen sei den betreffenden Vertretern der Deutschen Bundesbank an dieser Stelle gedankt.
Sofern ein Stichtag auf ein Wochenende oder einen Feiertag bzw. Bankfeiertag fällt, wird die Geldmenge am Ende des davorliegenden Arbeitstages erhoben (vgl. AMR [3] (1983), §6,Abs.(l)).
Lediglich in zwei Fällen während des gesamten Untersuchungszeitraumes (bei den Werten für den 24.2.1993 und denen für den 25.2.1998) war es nötig, jeweils einen Wert zu löschen.
Vgl. Pindyck/Rubinfeld [157] (1998), S. 122 ff.
Vgl. HÜBLER [89] (1989), S. 59.
Vgl. Pindyck/Rubinfeld [157] (1998), S. 122 ff.
Vgl. Laidler [109] (1993), S. 118 ff.
Vgl. Anders [4] (1997), S. 92.
Vgl. White [237] (1992).
Vgl. EUROPÄISCHES WÄHRUNGSINSTITUT [42] (1997), S. 119 ff.
Vgl. EUROPäISCHES WäHRUNGSINSTITUT [42] (1997), S. 122 f.
Lediglich kleine Zinsdifferenzen verhinderten ein perfektes Substitutionsverhältnis. Sie resultierten aus den erwähnten technischen Einflußgrößen und vereinzelt vorhandenen Erwartungen, die Währungsunion könne noch scheitern.
Zum Begriff der Stabilität vgl. Judd/Scadding [98] (1982), S. 993 f. sowie S. 141 f. dieser Arbeit.
Rehkugler [165] (1996), S. 573.
Vgl. Anders [4] (1997), S. 91, Baun [10] (1994), S. 151 f. sowie Neuneier/Zimmermann [149] (1998), S. 412 ff.
Vgl. Baun [10] (1994), S. 151 f., Neuneier/Zimmermann [149] (1998), S. 412 ff. sowie S. 56 ff. dieser Arbeit.
Vgl. Neuneier/Zimmermann [149] (1998), S. 412 ff.
Letzteres ist hier aus o.g. Gründen nicht möglich.
Vgl. SBS [203] (1998), S. 17.
Vgl. Baun/KÖHR [11] (1994), S. 56 ff.
Anders [4] (1997), S. 92.
Angenommen, es würden 10 exogene Variablen mit jeweils drei verschiedenen Lags und drei verschiedenen Transformationen berücksichtigt und es gäbe genau soviele verdeckte Neuronen wie Input-Neuronen, dann wären im resultierenden neuronalen Netz nach Gleichung (3) 8281 Parameter zu bestimmen.
Hertz/Krogh/Palmer[81] (1991), S. 157.
Vgl. Baun [10] (1994), S. 157.
Vgl. Laidler [109] (1993), S. 46 ff.
Vgl. Laidler [109] (1993), S. 62 ff. sowie im einzelnen Baumol [9] (1952), S. 545 ff., Johnson [97] (1963) oder Tobin [216] (1956), S. 241 ff.
Vgl. Laidler [109] (1993), S. 77 ff. sowie im einzelnen Friedman [57] (1956), Friedman [55] (1959), S. 327 ff. und Friedman [56] (1969) aber auch Tobin [217] (1958), S. 65 ff.
Vgl. Statistisches Bundesamt [208] (2000), ZR-Nr. 420604. Durch den Begriff Originalwerte bringt das statistische Bundesamt zum Ausdruck, daß die Werte nominal und nicht saisonbereinigt sind.
Vgl. Statistisches Bundesamt [208] (2000), Segment 3673001. Da diese Zeitreihe nur ab Beginn 1994 vorlag, wurde sie nach Angaben des Statistischen Bundesamtes von Hand für den Zeitraum 1991 bis Ende 1993 ergänzt.
Vgl. Fisher[51](1911).
Vgl. KÖHLER [103] (1977), S. 357 ff.
Um die Saisoneinflüsse mittels Dummies zu erfassen, wären bei monatlichen Dummies 11 weitere Inputs nötig (vgl. Pindyck/Rubinfeld [157] (1998), S. 122 ff.). Vierteljährliche Dummies (3 weitere Inputs) würden vermutlich nicht ausreichen, um diese Saisoneinflüsse zu erfassen.
Vgl. Statistisches Bundesamt [208] (2000), ZR-NR: 2647001.
x kennzeichnet die Wachtumsrate der Variablen x mit:.
Vgl. Bailey [8] (1956), S. 98, Cagan [28] (1967), S. 25 ff. und Friedman [57] (1956), S. 58 aber auch Bohl [17] (1997), S. 103.
Vgl. Muth [144] (1961), S. 315 ff.
Vgl. Deutsche Bundesbank [37] (1998), Reihe YUD420.
Vgl. Deutsche Bundesbank [37] (1998), Reihe ST0101.
Vgl. Deutsche Bundesbank [37] (1998), Reihe ST0295.
Die Tagesdaten für den DAX Performance Index wurden freundlicherweise von einem Kreditinstitut zur Verfügung gestellt.
Vgl. Stehle/Huber/Maier [209] (1955), S. 277.
Vgl. Deutsche Bundesbank [37] (1998), Reihe WT5044. Da in dieser Reihe einige wenige Kursangaben fehlten, wurden sie den Angaben der Bundesbank folgend von Hand ergänzt.
Vgl. Deutsche Bundesbank [37] (1998), Reihe WT5021.
Vgl. Deutsche Bundesbank [37] (1998), Reihe WT5022.
Dazu wird wie oben beim Swapsatz auf die Zeitreihe „Terminkurs am Frankfurter Markt, 3-Monats-Termine (Mittelkurse)“ (vgl. Deutsche Bundesbank [37] (1998), Reihe WT5044) zurückgegriffen.
Vgl. Rose/Sauernheimer[177] (1999), S. 187 ff.
Der Liquiditätsbedarf wird nicht nur zum Ultimo, sondern auch zur Monatsmitte besonders hoch sein, weil dann nicht nur Gehalts-sondern auch Steuerzahlungen fällig sind. So sind z.B. Umsatzsteuervorauszahlungen am 10. des Monats zuzüglich einer 5-tägigen Abgabeschonfrist fällig, (vgl. UStG [227] (1999), § 18, Abs. (1) sowie AEAO [6] (1998), § 152, Nr. 7).
Vgl. Pindyck/Rubinfeld [157] (1998), S. 122 ff.
Pindyck/Rubinfeld [157] (1998), S. 124.
Vgl. z.B. Hesse/Roth [82] (1992), Issing [93] (1994), S. 3 ff., Mishkin [138] (1990), S. 77 ff. oder Sauer/Scheide [187] (1995).
Vgl. Rose/Sauernheimer[177] (1999), S. 191 f.
Vgl. Fisher [52] (1930), S. 35 ff. sowie Duwendag/ET AL. [39] (1999), S. 148 f.
Gleiches gilt für den Zeitraum, in dem ein neuronales Netz für die Prognose praktisch eingesetzt wird.
Vgl. Zimmermann [247] (1994), S. 160.
Dieser Fall ist hier nicht relevant, weil durch die Europäische Währungsunion eine Prognose über den 1.7.98 hinaus wenig Sinn machen würde. Hier soll mit Hilfe der Generalisierungsdatenmenge lediglich das Prognosepotential des neuronalen Netzes belegt werden.
Lediglich sehr große Input-Variationen könnten dafür sorgen, daß der Sättigungsbereich des neuronalen Netzes wieder verlassen wird.
Vgl. Granger [68] (1989), S. 66.
Vgl. Granger/Newbold [70] (1974), S. 111 ff.
Durch diese Verfahren kann eine Nicht-Stationarität der Daten in der Regel ganz beseitigt werden (vgl. Granger [68] (1989), S. 39 ff und 71 ff.).
Einschränkend muß fest gestellt werden, daß hier ökonometrisch lediglich die erste Differenz der Daten Verwendung findet und damit nicht sichergestellt ist, daß die Zeitreihen stationär sind.
Vgl. Haykin [76] (1999), S. 22 sowie Moody [139] (1998), S. 358.
Vgl. Haykin [76] (1999), S. 12 ff. sowie Uhlig [226] (1995), S. 90 f.
Blien/Lindner [14] (1993), S. 503.
Nach Abschluß der Optimierung werden von den 18 anfanglichen nur 7 verdeckte Neuronen im neuronalen Netz verbleiben (vgl. Abbildung 52, S. 228).
Vgl. für die Definition der Inputs in der Spezifikationsdatei Abschnitt 5.2.3, S. 162.
Besonders interessant ist in diesem Zusammenhang die Verwendung von radialen Basisfunktionen, die im Gegensatz zur hier verwendeten logistischen Funktion keine Treppenform, sondern eine Glockenformfunktion aufweisen. Sie können allein, aber gerade auch in Kombination mit Treppenfunktionen dem Netz eine hohe Flexibilität und damit verbesserte Lerneigenschaften verleihen (vgl. Haykin [76] (1999), S. 256 ff.).
Vgl. AMR [3] (1983), § 6, Abs. (1).
Die Berechnung der jeweiligen Größen wird mit den Transformationsfunktionen von SENN im Rahmen des Preprocessing durchgeführt. Sie werden in der Spezifikationsdatei definiert (vgl. Abschnitt 5.2.3, S. 162).
Es wurde die Version Excel 97 verwendet.
Vgl. AMR [3] (1983), § 6, Abs. (1).
Die Berechnung der jeweiligen Größen wird mit den Transformationsfunktionen von SENN im Rahmen des Preprocessing durchgeführt. Sie werden in der Spezifikationsdatei definiert (vgl. Abschnitt 5.2.3, S. 162).
Vgl. SBS [203] (1998), S. 12 ff.
Vgl. SBS [203] (1998), S. 13.
Die Jahreszahl 1950 wurde willkürlich gewählt. Sie sollte lediglich, um Mißverständnisse zu vermeiden, weit genug vom Untersuchungszeitraum entfernt liegen.
Vgl. SBS [203] (1998), S. 12 ff.
Das Schlüsselwort Training ist etwas mißverständlich, weil dadurch der Trainings-und Validierungszeitraum bestimmt wird.
Vgl. für die sich ergebende Aufteilung Tabelle 5, S. 161.
Auf die Normierung mit Hilfe der Transformationsfunktion Norm wird weiter unten noch eingegangen werden.
Der Begriff Force geht zurück auf Samuelson [182] (1937), S. 470.
Vgl. für eine differenzierte Diskussion unterschiedlicher Arten von Wachstumsraten Geigant [62] (1971), S. 29 ff.
Stehle/Huber/Maier [209] (1955), S. 277.
Vgl. Geigant [63] (2000), S. 936.
Baun [10] (1994), S. 154.
Vgl. Schraudolph [197] (1998), S. 207 ff.
Vgl. Lecun ET AL. [122] (1998), S. 17.
Vgl. Zimmermann [247] (1994), S. 22 bzw. SBS [203] (1998), S. 28.
Vgl. auch BAUN [10] (1994), S. 154 bzw. Zimmermann [247] (1994), S. 22.
SBS [203] (1998), S. 25.
Vgl. SBS [203] (1998), S. 29.
Vgl. Granger [68] (1989), S. 63 ff.
Vgl. Schlomann [195] (1988), S. 47 f.
Bei den Dummy-Variablen D 7t+1 , D 15t+1 , D 23t+1 ist es nicht sinnvoll, Lags zu berücksichtigen, weil z.B. D 23 t = D 15t+1 und D 23t+1 = D 7t+2 ist.
Vgl. Baun [10] (1994), S. 153 f.
Vgl. SBS [203] (1998), S. 110 ff.
Vgl. Baun/Koehr [11] (1994), S. 49, Baun [10] (1994), S. 157 sowie Zimmermann [247] (1994), S. 26 ff.
Vgl. zur Definition und Erläuterung des Korrelationskoeffizienten Lange/Lorenz [112] (1998), S. 153.
So verwenden z.B. Wesche [235] (1998), S. 30 f. und Eberl [40] (2000), S. 123 ff. bei ihren Untersuchungen zur Schätzung der Geldnachfrage die für eine optimale Lag Struktur in (log)linearen Modellen häufig verwendeten Kriterien von Akaike (vgl.) Akaike [1] (1973), (S. 267 ff.) und von Schwarz (vgl. Schwarz [199] (1978), S. 461 ff.)
Vgl. Baun/Koehr [11] (1994), S. 49.
Vgl. SBS [203] (1998), S. 110 ff.
Vgl. Pindyck/Rubinfeld [157] (1998), S. 482 ff.
Vgl. SBS [203] (1998), S. 26.
Vgl. Baun [10] (1994), S. 157.
Die größte Differenz betrug 0.08.
Auskunft der Deutsche Börse AG, Frankfurt am Main.
Dies bleibt hier allerdings unberücksichtigt, weil eine alleinige Betrachtung des Korrelationskoeffizienten nicht hinreichend ist, um den Einfluß einer exogenen Variablen auf eine endogene Variable zu überprüfen.
Vgl. Pindyck/Rubinfeld [157] (1998), S. 95 ff.
SBS [203] (1998), S. 123.
Lecun ET AL. [122] (1998), S. 17.
Vgl. SBS [203] (1998), S. 95 ff.
Über das Menü Display kann auch die Validierungsdatenmenge ausgewählt werden.
Dieser Terminologie folgen z.B auch Baun [10] (1994) (vgl. insbes. Abbildung 1, S. 145), Uhlig [226] (1995) und Zimmermann [247] (1994).
Vgl. Anders [4] (1997), S. 112 ff.
In vielen Fällen wirkt der Parameter multiplikativ auf den Strafterm (vgl. z.B. die Darstellung in Anders [4] (1997), S. 112 ff. oder in Haykin [76] (1999), S. 220 ff.).
Das Verfahren geht zurück auf Werbos [234] (1974) bzw. Werbos [233] (1988), S. 343 ff.
Vgl. für eine detaillierte Beschreibung und eine Kombination des Weight Decay139 mit dem Stop-Training-Verfahren Roegnvaldsson [173] (1998), S. 71 ff.
Vgl. Anders [4] (1997), S. 113. Dies wird deutlich, wenn der Strafterm grafisch dargestellt wird (vgl. Haykin [76] (1999), Figure 4.22, S. 221).
Vgl. Bishop [13] (1995).
Anders [4] (1997), S. 113.
Vgl. Anders [4 (1997), S. 109.
Als Startkommando wird hier und im folgenden analog zum Abschnitt 4.4, S. 115 ff. die Kommandozeile senn mmodell-save-noRandom verwendet (vgl. für eine Beschreibung des Startkommandos SBS [203] (1998), S. 170).
Vgl. für die Initialisierung des Parametervektors mit anderen Werten SBS [203] (1998), S. 124.
Vgl. Pindyck/Rubinfeld [157] (1998), S. 57 ff.
Vgl. Rojas [176] (1996), S. 160 f. und Zimmermann [247] (1994), S. 51.
Vgl. HeinemannS/Lange [80] (1997), S. 14 ff. sowie Rojas [176] (1996), S. 151.
Wenn hier und im folgenden vom Fehlergebirge die Rede ist, so ist immer das Fehlergebirge unter Einbeziehung aller Trainingsdaten gemeint.
Ein solches Verfahren ist nicht in allen Fällen sinnvoll, weil dadurch zwar der Fehler auf Grundlage der Trainingsdatenmenge sinkt, aber die Gefahr besteht, daß es zum Overlearning kommt oder ein bereits eingetretenes Overlearning weiter verstärkt wird.
Durch die Berechnung der Wachstumsraten und durch die Verwendung gelagter Variablen wurde die Modellierungsdatenmenge um 11 Datensätze reduziert.
Vgl. Brause [21] (1995), S. 255. Zell [245] (1997), S. 118 ff.
VarioEta geht zurück auf Finnoff/Herget/Zimmermann [49] (1993). Vgl. für einen Überblick Neuneier/Zimmermann [149] (1998), S. 395 ff. sowie Zimmermann [247] (1994), S. 47 ff.
SBS [203] (1998), S. 52.
Vgl. SBS [203] (1998), S. 52.
Es werden 10 mal 25 Datensätze gezogen, bis die Anzahl der Trainingsdatensätze erreicht bzw. überschritten ist. Dann ist eine Epoche abgeschlossen. Folglich finden in einer Epoche 10 Aktualisierungen des Parametervektors statt, und es erfordert 20 Epochen, bis 200 Aktualisierungen erreicht sind.
Vgl. Anders [4] (1997), S. 14., HertzS/Krogh/Palmer [81] (1991), S. 147 sowie Abbildung 14, S. 58.
Vgl. für eine Systematisierung von Optimierungsstrategien Wiedmann/Jung [241] (1995), S. 38 f.
Vgl. für das Verrauschen der Input-Daten Bishop [13] (1995), Neuneier/Zimmer-Mann [149] (1998), S. 401 f. sowie SBS [203] (1998), S. 83 f.
Vgl. z.B. Anders [4] (1997), S. 122 ff. Moody [139] (1998), S. 363 ff. oder Zell [245] ( 1997), S. 328 ff.
Vgl. Baun [10] (1994), S. 166, Baun/KÖHR [11] (1994), S. 54 f. oder Zimmermann [247] (1994), S. 74 ff.
Vgl. Anders [4] (1997), S. 108, Haykin [76] (1999), S. 222 oder Zell [245] (1997), S. 319 ff.
Vgl. auch Haykin [76] (1999), S. 215 ff., Morgan/Bourlard [140] (1990), S. 413 ff., Plaut/Nowlan/Hinton [159] (1986), und Weigend/Rumelhart/Huberman [232] (1990), S. 193 ff.
Vgl. Zimmermann [247] (1994), S. 65.
Vgl. Anders [4] (1997), S. 91 f.
Das Problem tritt in ähnlicher Form auch in der (log)linearen Ökonometrie auf. Das diesbezüglich von Box/Jenkins [20] (1970) entwickelte Ablaufschema (vgl. auch Granger [68] (1989), S. 71 f.) kann hier allerdings nicht direkt angewendet werden, weil die Identifikation des Modells selbst bereits einen iterativen Prozeß darstellt.
Vgl. Haykin [76] (1999), S. 215 ff., Morgan/Bourlard [140] (1990), S. 413 ff., Plaut/Nowlan/Hinton [159] (1986) sowie Weigend/Rumelhart/Huberman [232] (1990), S. 193 ff.
Die Darstellung des Fehlers auf Basis der Generalisierungsdatenmenge ist zwar möglich, widerspricht aber dem Zweck der Generalisierungsdatenmenge, denn sie soll weder zum Training noch zur Optimierung des neuronalen Netzes herangezogen werden.
Vgl. SBS [203] (1998), S. 105 f.
Vgl. für eine Interpretation Baun/Koehr [11] (1994), S. 59 f. (Anm.: dort müssen in der Formel in Fußnote 5 die Klammern durch Betragszeichen ersetzt werden).
Vgl. Zimmermann [247] (1994), S. 78.
Vgl. Baun [10] (1994), S. 159 ff.
Diese Situation trat in der hier durchgeführten Schätzung in mehren Phasen der Optimierung auf.
Vgl. für eine ähnliche Argumentation Neuneier/Zimmermann [149] (1998), S. 410.
An diesem Kriterium setzt das in SENN für die Automatisierung des Trainings verwendete Verfahren DivSchedule an. Das Training wird solange fortgesetzt, bis zwischen Validierungs-und Trainingsfehler eine zuvor definierte Differenz (Divergence) erreicht ist (vgl. SBS [203] (1998), S. 71 f.).
Zimmermann [247] (1994), S. 65.
Zimmermann [247] (1994), S. 65.
Vgl. Anders [4] (1997), S. 91 f.
SBS [203] (1998), S. S. 117.
Immerhin war das neuronale Netz in der Lage, rund 83% des Zeitreihenverlaufs auf Basis der Valdierungsdaten zu prognostizieren (Die Fehlerpfadlänge betrag 0.169).
Input-Pruning geht zurück auf Mozer/Smolensky[141] (1989), S. 107 ff. sowie Mozer/Smolensky [142] (1989), S. 3 ff.
Vgl. Anders [4] (1997), S. 122 ff., Moody [139] (1998), S. 351 ff., Zell [245] (1997), S. 328 sowie Zimmermann [247] (1994), S. 76 f.
Eine Analyse auf Grundlage von Signalen ist in SENN nicht vorgesehen, deshalb wird hier der Durchschnitt der quadrierten Prognosefehler anstelle der Fehlerpfadlänge herangezogen.
Als Datenmenge können die Trainings-, die Validierungs-und (was nicht der Intention dieser Datenmenge entspricht) die Generalisierungsdatenmenge ausgewählt werden. Es ist darüberhinaus auch möglich, Teilmengen dieser Datenmengen auszuwählen, um z.B. Sensitivitätsanalysen über bestimmte Zeiträume durchzuführen (vgl. SBS [203] (1998), S. 117 ff.).
Vgl. Zimmermann [247] (1994), S. 76.
Vgl. SBS [203] (1998), S. 117 ff.
Zimmermann [247] (1994), S. 76.
Vgl. Abschnitt 4.7, S. 131 sowie SBS [203] (1998), S. 98 f.
Vgl. Anders [4] (1997), S. 108 ff., Haykin [76] (1999), S. 222 ff, oder Zell [245] (1997), S. 320 ff.
Im folgenden wird für das Löschen einer Verbindung oder eines Neurons der in der Literatur neuronaler Netze gebräuchliche Ausdruck Pruning (engl.: trimmen z.B. von Gartenhecken) verwendet (vgl. z.B. Anders [4] (1997), S. 108 ff. oder Zell [245] (1997), S. 319 ff.).
Vgl. SBS [203] (1998), S. 118 ff.
Vgl. Neuneier/Zimmermann [149] (1998), S. 416 sowie SBS [203] (1998), S. 122.
Neuneier/Zimmermann [149] (1998), S. 417, Fig. 17.24.
Vgl. Zell [245] (1997), S. 320 sowie Zimmermann [247] (1994), S. 66 f.
Zell [245] (1997), S. 320.
Einen Vergleich des Rechenaufwandes verschiedener Verfahren bietet Zell [245] (1997), S. 333 ff.
Vgl. Brause [21] (1995), S. 254, Finnoff/Zimmermann [50] (1992) sowie Miller [136] (1994), S. 136 f.
Vgl. Zimmermann [247] (1994), S. 66.
Es sei darauf verwiesen, daß dies im hier verwendeten Modell nicht auf die Gewichte zutrifft, welche die verdeckte Schicht mit dem Output-Neuron verbinden (γj), weil im Output-Neuron ohnehin eine lineare Aktivierungsfunktion verwendet wird.
Vgl. Haykin [76] (1999), S. 222, Tresp/Neuneier/Zimmermann [222] (1997), S. 670 f. sowie Zell [245] (1997), S. 320 ff.
Die OBD-Methode geht zurück auf Lecun/Denker/Solla [121] (1990), S. 598 ff.
Lecun/Denker/Solla [121] (1990), S. 598.
Lecun/Denker/Solla [121] (1990), S. 600.
Vgl. Lecun/Denker/Solla [121] (1990), S. 600, Zell [245] (1994), S. 320 ff. sowie SBS [203] (1998), S. 119 ff.
Vgl. für die Taylor-Reihenentwicklung Chiang [30] (1984), S. 256 ff.
Vgl. Chiang [30] (1984), S. 332 ff.
Vgl. Zell [245] (1994), S. S. 320 ff.
Der Stern beim Parametervektor zeigt an, daß ein lokales Minimum unterstellt ist.
Lecun/Denker/Solla [121] (1990), S. 600.
Vgl. Hassibi/Stork [74] (1993), S. 164 ff., Hassibi/Stork/Wolff [75] (1994), S. 263 ff., sowie Zell [245] (1994), S. 322 ff.
Anders [4] (1997), S. 110.
Abgesehen davon, daß die Optimal Brain Surgeon-Methode in SENN nicht implementiert ist, wird durch ihre Verwendung nicht sichergestellt, daß sich die Ergebnisse im Vergleich zur OBD-Methode verbessern (vgl. Pedersen/Hansen/Larsen [154] (1996), S. 521 ff.).
Vgl. Zimmermann [247] (1994), S. 68.
Vgl. Lecun [119] (1987) sowie BECKER/Lecun [12] (1989), S. 29 ff. Ein Ablaufschema des Algorithmus findet sich in Zimmermann [247] (1994), S. 69, Abb. 26.
Vgl. Lecun [118] (1989) sowie BECKER/Lecun [12] (1989) S.29 ff.
Vgl. Anders [4] (1997), S. 110. Er schlägt stattdessen vor, die Hesse-Matrix exakt zu berechnen (vgl. dafür Anders [4] (1997), S. 33 f.).
Vgl. Zimmermann [247] (1994), S. 70.
Vgl. Tresp/Neuneier/Zimmermann [222] (1997), S. 669 ff.
In Abbildung 8 ist der Trainingsprozeß einem lokalen Minimum bereits recht nahe gekommen, deshalb ist z.B. die Differenz zwischen dem tatsächlichen Wert von γj und dem zum Fehlerminimum gehörigen Wert nur gering. Die Nähe zu einem lokalen Minimum ist aber, wie noch gezeigt wird, keine Annahme, die notwendigerweise für die Durchführung der EBD-Methode erfüllt sein muß.
Dies würde einen viel zu großen Rechenaufwand erfordern.
Vgl. Haykin [76] (1999), Gleichung (4.100), S. 222.
Weil hier nicht von einem lokalen Minimum ausgegangen wird, muß der zweite Summand der Taylor-Reihe berücksichtigt werden.
Vgl. für die Herleitung Neuneier/Zimmermann [149] (1998), S. 406.
Vgl. SBS [203] (1998), S. 122.
Vgl. Neuneier/Zimmermann [149] (1998), S. 407.
Die Iterationsnummer m wurde der Übersichtlichkeit halber weggelassen.
Vgl. Neuneier/Zimmermann [149] (1998), S. 408.
Neuneier/Zimmermann [149] (1998), S. 408.
Vgl. Neuneier/Zimmermann [149] (1998), Gleichung 17.59, S. 408.
Damit ist die obige Betragsbildung überflüssig. Sie wurde aber aus der Quelle übernommen.
Vgl. Neuneier/Zimmermann [149] (1998), S. 408.
Pindyck/Rubinfeld [157] (1998), S. 47.
Vgl. Taylor [211] (1995), S. 44.
Vgl. Neuneier/Zimmermann [149] (1998), S. 408.
Der Jarque-Bera-Wert einer Verteilung wird aus einer Kombination der Skewness und der Kurtosis einer Verteilung berechnet, ist Chi-Quadrat verteilt und bei einer Normalverteilung gerade null (vgl. Pindyck/Rubinfeld [157] (1998), S. 47 f.).
Vgl. Neuneier/Zimmermann [149] (1998), S. 408 f.
Vgl. Neuneier/Zimmermann [149] (1998), S. 409.
Neuneier/Zimmermann [149] (1998), Gleichung (17.62), S. 409.
Vgl. Schlittgen [194] (1998), S. 345 ff.
Neuneier/Zimmermann [149] (1998), S. 409.
Vgl. Schlittgen [194] (1998), S. 346 f.
Vgl. Schlittgen [194] (1998), S. 348 f.
Vgl. SBS [203] (1998), S. 121 f.
Vgl. Neuneier/Zimmermann [149] (1998), S. 408 sowie SBS [203] (1998), S. 121.
Vgl. SBS [203] (1998), S. 121.
Vgl. für die entsprechende Option SBS [203] (1998), S. 122 sowie für eine kurze Erläute-rung Neuneier/Zimmermann [149] (1998), S. 410.
Das Statistische Prunen geht zurück auf Finnoff/Herget/Zimmermann [47] (1992), Finnoff/Zimmermann [50] (1992) und Rehkugler/Poddig [167] (1992).
Vgl. z.B. Neuneier/Zimmermann [149] (1998), S. 395 f.
Vgl. Brause [21] (1995), S. 254 sowie Zimmermann [247] (1994), S. 70 ff.
Dies ist die Definition von T est, j SPrune in SENN Version 3.0 (vgl. SBS [203] (1998), S.119). Davon etwas abweichende Definitionen der Testgröße T est, j SPrune geben Zimmermann [247] (1994), S. 71 bzw. Neuneier/Zimmermann [149] (1998), S. 405 an.
Vgl. Pindyck/Rubinfeld [157] (1998), S. 40.
Vgl. Davidson/Mackinnon [32] (1993), S. 88 ff.
SBS [203] (1998), S. 52.
Vorausgesetzt es wird der „Konvention“ (Anders [4] (1997), S. 119) gefolgt, den Gewichtsvektor mit kleinen Gewichten zu initialisieren.
Vgl. Neuneier/Zimmermann [149] (1998), S. 406.
Vgl. Zimmermann [247] (1994), S. 72.
SBS [203] (1998), S. 71.
Vgl. Neuneier/Zimmermann [149] (1998), S. 407 sowie Abbildung 50 und 51, S. 226 f.
SBS [203] (1998), S. 122.
Vgl. Neuneier/Zimmermann [149] (1998), S. 416.
Dies wird im folgenden anhand des Fehlerverlaufs während des Pruning-Prozesses, wie er in Abbildung 44 auf S. 214 dargestellt ist, deutlich werden.
Vgl. Neuneier/Zimmermann [149] (1998), S. 415.
Vgl. Rumelhart/Hinton/Williams [180] (1986), S. 45 ff., aber auch S. 27 dieser Arbeit.
Vgl. White [239] (1989), S. 425 ff.
Vgl. auch Miller [136] (1994), S. 137 ff.
Die Anzahl der in den 12 Prune-Schritten geprunten Gewichte wird neben der gewählten Reduzierungsrate auch vom Rundungsmechanismus von SENN beeinflußt, da nur ganze Gewichte geprunt werden können.
Vgl. für die Generierung eines Error-Fensters Abschnitt 4.7, S. 131 f.
Zimmermann [247] (1994), S. 72.
Vgl. Neuneier/Zimmermann [149] (1998), S. 415.
Diese Schicht wurde ja auch nicht zum Prunen freigegeben.
Vgl. für den Top-Down-und den Bottom-Up-Ansatz Anders [4] (1997), S. 127.
Vgl. Anders [4] (1997), S. 66 ff., Granger/Lin/Teraevirta [69] (1993), S. 209 ff. sowie White [239] (1989), S. 451.
Vgl. Anders [4] (1997), S. 126 ff.
Vgl. SBS [203] (1998), S. 117 ff.
Vgl. SBS [203] (1998), S. 123 ff.
Vgl. für eine mehrdimensionale Korrelationsanalyse von verdeckten Neuronen Weigend/Gershenfeld [230] (1994).
Vgl. Miller [136] (1994), S. 141 ff., Zimmermann [247] (1994), S. 74 ff. sowie Zimmermann/HERGERT/Finnoff [248] (1992).
Vgl. Miller [136] (1994), S. 141 f.
Das Gleichung (30) zugrundeliegende Verfahren ist im SENN-Handbuch nicht dokumentiert. Die entsprechenden Informationen beruhen auf einer telefonischen Auskunft der Firma Siemens auf Grundlage des Quellcodes von SENN.
Hier insbes., daß der Erwartungswert null beträgt (vgl. für Eigenschaften von Störgrößen Pindyck/Rubinfeld [157] (1998), S. 81 ff.).
Vgl. SBS [203] (1998), S. 123.
Vgl. SBS [203] (1998), S. 123 f.
Dies kann realisiert werden, indem die entsprechenden Elemente des Gradienten auf null gesetzt werden.
Vgl. Anders [4] (1997), S. 121 ff., Moody [139] (1998), S. 363 f. oder Zell [245] (1997), S. 328 ff.
Vgl.Mozer/Smolensky [141] (1989), S. 107 ff., Mozer/Smolensky [142] (1989), S. 3 ff. sowie Zimmermann [247] (1994), S. 75 ff.
Vgl. für eine detailliertere Beschreibung SBS [203] (1998), S. 117 f.
Gleiches gilt auch dann, wenn beim Weight-Prunen alle Gewichte eines verdeckten Neurons auf null gesetzt werden.
Vgl. TRESP/Neuneier/Zimmermann [222] (1997), S. 669 ff.
Vgl. Neuneier/Zimmermann [149] (1998), S. 407.
Ein Nachteil beim automatisierten EBD-Prunen in SENN besteht darin, daß ein Wiederbeleben der Gewichte nicht vorgesehen ist. Dieser Nachteil ist aber hinnehmbar, da das Wiederbeleben von Gewichten dann eingesetzt werden sollte, wenn in einem überdimensionierten neuronalen Netz die Testwerte noch unsicher sind (vgl. Zimmermann [247] (1994), S. 72). Da aber bereits im Abschnitt 5.6.3.6, S. 209 ff. bei keinem der PruneSchritte eine Situation eintrat, die ein Wiederbeleben von Gewichten gerechtfertigt hätte, ist davon auszugehen, daß im jetzigen Stadium des neuronalen Netzes die Testwerte nicht mehr unsicher sind.
Vgl. SBS [203] (1998), S. 70 ff.
Das entsprechende Intervall ergibt sich aus — Randomize und + Randomize.
Anschließend wird der Tracer automatisch neu initialisiert.
Da dort keine Signale ausgewählt werden können, wird anstelle des Signals Fehlerpfadlänge der durchschnittliche quadrierte Prognosefehler auf Basis der Validierungsdatenmenge verwendet.
Die Anzahl der Gewichte wird neben der gewählten Reduzierungsrate auch vom Rundungsmechanismus von SENN beeinflußt, da nur ganze Gewichte geprunt werden können.
Vgl. für die Generierung eines Error-Fensters S. 135 ff.
Neuneier/Zimmermann [149] (1998), S. 407.
Deshalb wurde dieses Segment auch im Abschnitt 5.6.3.6, S. 209 ff. für das Prunen gesperrt, um ein frühzeitiges Deaktivieren von verdeckten Neuronen zu verhindern.
Die Optimal-Brain-Surgeon-Methode geht zurück auf Hassibi/Stork [74] (1993), S. 164 ff. sowie auf Hassibi/Stork/Wolff [75] (1994), S. 263 ff. Eine Erläuterung findet sich bei Zell [245] (1994), S. 322 ff.
Vgl. Hassibi/Stork/Wolff [75] (1994), S. 263 ff.
Vgl. Tresp/Neuneier/Zimmermann [222] (1997), S. 672 f.
Vgl. Miller [136] (1994), S. 122 f.
Vgl. SBS [203] (1998), S. 98 f.
Vgl. SBS [203] (1998), S. 117.
Vgl. Anders [4] (1997), S. 121 ff., Moody [139] (1998), S. 363 f., sowie Abschnitt 5.6.2, S. 194 f.
Vgl. SBS [203] (1998), Gleichung 5.8, S. 111.
Vgl. Anders [4] (1997), S. 122.
Vgl. Anders [4] (1997), S. 34.
Vgl. SBS [203] (1998), S. 111.
au]Eine_gewisse Abschwäc hung dieses Effektes erfolgt bereits dadurch, daß sich die Sensitivität swerte auf die transformierten Inputs beziehen.
Damit werden, wie oben erwähnt, implizit rationale Erwartungen im Sinne von Muth unterstellt (vgl. Muth [144] (1961), S. 315 ff.).
Vgl. insbes. Cagan [28] (1957), S. 35.
Vgl. Friedman [57] (1956), S. 58.
Vgl. LÜTKEPOHL [130] (1998), S. 30.
Vgl. Hush/Sallas/Horne [91] (1991), S. 759 ff.
Vgl. Anders [4] (1997), S. 92 ff. sowie Zell [245] (1997), S. 117.
Anders schlägt z.B. vor, alle Inputs mit Ausnahme des analysierten durch ihren Mittelwert zu ersetzen, bevor die Sensitivitätswerte interpretiert werden (vgl. Anders [4] (1997), S. 122 ff.).
Vgl. Anders [4] (1997), S. 34 f.
Vgl. Bailey [8] (1956), S. 93 ff, Cagan [28] (1967), S. 25 ff. und Friedman [57] (1956), S. 58 aber auch Bohl [17] (1997), S. 103.
Der Tagesgeldsatz stellt für die meisten Wirtschaftssubjekte Opportunitätskosten der Geldhaltung dar und sollte insofern ein negatives Vorzeichen aufweisen — obgleich er für institutionelle Anleger auch als Ertrag der Geldhaltung (vgl. Wesche [235] (1998), S. 16) interpretiert werden könnte. Die Wachstumsrate der Einzelhandelsumsätze steht als Platzhalter für das Transaktionsvolumen in der Volkswirtschaft, weshalb ein positives Vorzeichen zu erwarten wäre (vgl. z.B. Bohl [18] (1999), S. 209 ff., Buscher [26] (1984), S. 507 ff., Neumann [146] (1983), S. 415 ff.).
Vgl. zur Interpretation von Saisondummies Pindyck/Rubinfeld [157] (1998), S. 122 ff.
So ist der Termin für die Zahlung der Umsatzsteuervorauszahlungen am 10. des Monats zuzüglich einer 5-tägigen Abgabeschonfrist (vgl. UStG [227] (1999), § 18, Abs. (1) sowie AEAO [6] (1998), § 152, Nr. 7).
Vgl. Zimmermann [247] (1994), S. 78 f.
Vgl. SBS [203] (1998), S. 111.
Vgl. Pindyck/Rubinfeld [157] (1998), S. 184 ff. und 188 ff. sowie S. 166 ff. dieser Arbeit.
Hier würde man anstelle der Koeffizienten selbst auf die Analyse ihrer t-Werte oder andere ökonometrische Verfahren zurückgreifen (vgl. Pindyck/Rubinfeld [157] (1998), S. 66 ff. und S. 88 ff.). Diese Verfahren sind allerdings bei neuronalen Netzen fast ausnahmslos nicht verwendbar oder ihre Aussagekraft ist stark eingeschränkt.
Vgl. Rehkugler/Poddig [168] (1994), S. 18 ff.
Vgl. z.B. Bohl [18] (1999), S. 209 ff., Buscher [26] (1984), S. 507 ff., Neumann [146] (1983), S. 415 ff.
Vgl. Pindyck/Rubinfeld [157] (1998), S. 549 ff.
Aufruf aus dem Simulator-Fenster mit View →Forecast Window.
Vgl. SBS [203] (1998), S. 114 ff.
In diesem Fall könnte z.B. ein gleitender Durchschnitt verwendet werden, was allerdings im Forecast-Fenster von SENN nicht implementiert ist.
Vgl. z.B. Rohde [174] (1995), S. 155 ff.
Diese Regel geht auf MILTON Friedman zurück. Er fordert eine konstante Geldmengenwachstumsrate. Die Wahl der richtigen Höhe dieser Wachstumsrate ist dabei für ihn eher zweitrangig und seine Empfehlungen dazu sind uneinheitlich (vgl. Friedman [58] (1968), Friedman [56] (1969) und Friedman [54] (1970)).
Author information
Authors and Affiliations
Rights and permissions
Copyright information
© 2004 Springer-Verlag Berlin Heidelberg
About this chapter
Cite this chapter
Lange, C. (2004). Prognose der kurzfristigen Geldnachfrage mit einem neuronalen Netz. In: Neuronale Netze in der wirtschaftswissenschaftlichen Prognose und Modellgenerierung. Wirtschaftswissenschaftliche Beiträge, vol 192. Physica, Heidelberg. https://doi.org/10.1007/978-3-7908-2696-8_5
Download citation
DOI: https://doi.org/10.1007/978-3-7908-2696-8_5
Publisher Name: Physica, Heidelberg
Print ISBN: 978-3-7908-0059-3
Online ISBN: 978-3-7908-2696-8
eBook Packages: Springer Book Archive