Zusammenfassung
Das Ziel der Untersuchung besteht darin, herauszufinden, ob die untersuchten Schätzansätze LISREL und Neuronale Netze, gemessen am Ablehnungsbereich der verwendeten Beurteilungskriterien, zur Schätzung der interessierenden Modelle geeignet sind und wie gut sie bei verschiedenen Szenarien abschneiden. Der Anwender kann nämlich erstens keinerlei Informationen über die Art der Beziehung zwischen den latenten Variablen, das Skalenniveau der Indikatorvariablen oder den Varianzerklärungsanteil im Strukturmodell haben. Er kann zweitens Vorwissen entweder über eines der drei Merkmale Beziehungsart, Skala, Varianzerklärungsanteil oder drittens über alle drei gleichzeitig verfügen. Deswegen erfolgt die Untersuchung für alle Faktorstufenkombinationen kumuliert, für jede Stufe der drei Experimentfaktoren und in einigen Fällen für einzelne von ihnen gebildeten Faktorstufenkombinationen.537) Bei der Darstellung dieser bereits statistisch ausgewerteten Ergebnisse der Simulationsstudie im vorliegenden Kapitel erfolgt zuerst die Präsentation der LISREL-Ergebnisse und dann die der Ergebnisse der Neuronalen Netze. Im Anschluß daran werden die beiden Methodiken vergleichend gegenübergestellt. Jeder dieser drei Abschnitte gliedert sich in die Bereiche Beurteilung des geschätzten Meß-, Struktur- und Gesamtmodells. Dabei wird auf die Ergebnisse der linearen und nichtlinearen Formulierung des Schätzmodells getrennt sowie im Vergleich eingegangen.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
Literatur
Bei einigen Fragestellungen werden darüberhinaus „Modellart“ (linear und nichtlinear) sowie „Datenmenge” (Training und Test) wie Experimentfaktoren i.e.S. behandelt.
Die Varianz wird zwar eigentlich mit Hilfe eines X2-Tests getestet, hier wird jedoch der Durchschnitt der Varianzen einzelner Treatmentkombinationen mittels t-Test getestet. Bei großen Freiheitsgraden ist der t-Test nicht sensitiv auf Nichtnormalität. Vgl. KLEJNEN/VAN GROENENDAAL (1992), S. 137, 145. Der Stichprobenumfang n betrug für die drei Varianzen und MM 24, für die restlichen Gütemaße war n=240.
Der prozentuale Bias ist der geschätzte Bias bezogen auf den wahren Parameterwert.
Lediglich für den Bias von eli.„ sowie für alle t-Werte liefert die Varianzanalyse ein R’ größer 0,8. Bei den restlichen Gütemaßen liegen sie weit darunter, was ein Indiz dafür ist, daß nicht alle maßgeblichen Einflußgrößen dieser Gütekriterien erfaßt wurden.
Auch hier findet für alle 20 Treatmentkombinationen zusammen eine Überprüfung mittels t-Tests daraufhin statt, ob der Mittelwert jedes Gütekriteriums signifikant besser als der kritische Wert für dieses Gütemaß ist (vgl. Anhang I1).
Die Sensitivität der Meßmodellgüte gegenüber einer Variation der Stufen der drei Experimentfaktoren wurde mit Hilfe von dreifaktoriellen Varianzanalysen untersucht (n=200). Die drei Varianzen und MM nur eine Ausprägung pro Treatmentkombination (n=20) aufweisen, wurden sie jeweils einer einfaktoriellen Varianzanalyse für jeden Experimentfaktor unterzogen. Diese Analysen liefern das Ergebnis in Anhang 12. Da mit dem nichtlinearen LISREL-Modell kein linearer Zusammenhang geschätzt wurde, entfällt die Ausprägung 0=linear für den Faktor Beziehung, der nur noch die Stufen 1 bis 5 enthält.
Zum Test darauf, ob die Faktoren Beziehung, Skala, EVA im linearen Modell einen Einfluß auf die LISREL-Gütemaße im Strukturmodell als abhängige Variablen ausüben, wurden dreifaktorielle Varianzanalysen durchgeführt. Da für SM nur eine Ausprägung pro Treatmentkombination vorliegt, wurden hierfür einfaktorielle Varianzanalysen für jeden Faktor durchgeführt. Die Ergebnisse dieser Analysen finden sich in Anhang 15.
Das Ergebnis der t-Tests zur Untersuchung, ob der Stichprobenmittelwert der Gütekriterien für das Strukturmodell signifikant vom Schwellenwert abweicht, ist in Anhang 17 zusammengefaßt. Da lediglich fünf Beziehungsarten untersucht wurden, lagen bei 10 Replikationen für jede der 20 Treatmentkombinationen 200 Beobachtungswerte vor. Für die Varianz und SM liegt nur eine Ausprägung pro Treatmentkombination und somit insgesamt 20 Datenfälle vor.
Dreifaktorielle Varianzanalysen zur Untersuchung, ob die Faktoren Beziehung (Faktorstufen 1 bis 5), Skala und EVA einen Einfluß auf die Gütemaße des Strukturmodells als abhängige Variablen ausüben, liefern das Ergebnis in Anhang 18.
Zur Überprüfung von Gütekriterien des Strukturmodells darauf, ob sie sich im nichtlinearen LISRELModell signifikant vom linearen unterscheiden, wurden t-Tests bei gepaarten Stichproben durchgeführt. Da mit dem nichtlinearen Modell keine Schätzung der Treatmentkombinationen 1 bis 4 erfolgte, wurden sie zur besseren Vergleichbarkeit auch beim linearen Modell weggelassen, womit n=200 beträgt. Infolgedessen sind auch die Mittelwerte für das lineare Modell nicht mit denen in Anhang 14 identisch. Ebenso fehlen mangels Vergleichbarkeit die Gütemaße für 7,2. Im Unterschied zu den vier anderen Kriterien weist SM jedoch nur eine Ausprägung pro Treatmentkombination auf, weshalb n hierfür 20 beträgt. Der Mittelwert für das lineare und nichtlineare Modell und die Differenz zwischen ihnen sind in Anhang 20 wiedergegeben.
Die Überprüfung für alle Treatmentkombinationen zusammen, ob der Mittelwert jedes Gütekriteriums signifikant besser ist als der kritische Wert für dieses Gütemaß, erfolgte mittels zweiseitiger t-Tests. Für Maße der Anpassungsgüte des Gesamtmodells liegen Ausprägungen fur die Trainings-und Testmenge vor. Deswegen wurde ferner ein gepaarter t-Test durchgeführt zur Feststellung, ob sich im linearen Modell die sechs LISREL-Gütemaße in der Trainingsmenge signifikant von denen in der Testmenge unterscheiden. Das Ergebnis beinhaltet Anhang 21.
Die Dreifaktorielle Varianzanalyse für jedes der sechs Gesamtmodellmaße in der Trainings-und Testmenge zur Feststellung, ob die Faktoren Beziehung, Skala, EVA, einen Einfluß auf die LISREL-Gütemaße für das Gesamtmodell als abhängige Variablen ausüben, liefert das Ergebnis in Anhang 22. Da für GF nur eine Ausprägung pro Faktorstufenkombination vorhanden ist, wurden drei einfaktorielle Varianzanalysen durchgeführt. Bei GF enthielten darüberhinaus alle Faktoren Mittelwerte von Null, weshalb keine Varianz-analyse möglich war.
Mittels zweiseitiger t-Tests findet für alle Treatmentkombinationen zusammen eine Überprüfung daraufhin statt, ob der Mittelwert jedes Gütekriteriums signifikant besser als sein kritischer Wert ist. Gleichzeitig erfolgt eine Überprüfung der Gütekriterien mit Hilfe von t-Tests bei gepaarten Stichproben darauf, ob sie sich in den Testdaten signifikant von den Trainingsdaten unterscheiden. Der Stichprobenumfang beträgt n=200 Paare, ohne die Treatmentkombinationen 1 bis 4, da beim nichtlinearen Modell hierzu keine Beobachtungswerte vorliegen. In Anhang 23 sind die Mittelwerte für die Test-und Trainingsstichprobe und die Differenz zwischen ihnen ausgewiesen.
Zur Feststellung, ob die Faktoren Beziehung, Skala, EVA, einen Einfluß auf die LISREL-Gütemaße für das Gesamtmodell als abhängige Variablen ausüben, werden dreifaktorielle Varianzanalysen für jedes der fünf Gesamtmodellmaße in der Trainings-und Testmenge durchgeführt. Für GF in Trainings-und Teststichprobe werden erneut nur einfaktorielle Varianzanalysen vorgenommen, da hier für eine dreifaktorielle Varianzanalyse wiederum nur eine Ausprägung pro Zelle vorhanden wäre. Dabei hat die Variable Beziehung nur die Ausprägungen 1 bis 5, da mit dem nichtlinearen LISREL-Modell kein linearer Zusammenhang geschätzt wurde. Die Ergebnisse sind in Anhang 24 ausgewiesen. Die Signifikanzprüfung der Mittelwertunterschiede der Fit-Maße bei den einzelnen Beziehungsarten geschah mit Hilfe der einfaktoriellen Varianzanalysen und des Scheffé-Tests.
Auch hier erfolgte eine Überprüfung von Gütekriterien des Gesamtmodells mit Hilfe von t-Tests bei gepaarten Stichproben darauf, ob sie sich im nichtlinearen LISREL-Modell signifikant vom linearen unterscheiden. Das geschah erneut ohne die Treatmentkombinationen I bis 4, so daß n 200 beträgt. Wieder weist GF im Unterschied zu den anderen Kriterien nur eine Ausprägung pro Treatmentkombination auf, so daß n dafür 20 beträgt. Anhang 25 beinhaltet diese Ergebnisse.
Zur Untersuchung, ob die Faktoren Skala, EVA, Daten (Trainings-oder Testmenge) einen Einfluß auf die NN-Gütemaße als abhängige Variablen ausüben, wurde eine dreifaktorielle Varianzanalyse durchgeführt. Die Beziehungsart ist dabei allerdings kein Faktor, da nur der lineare Zusammenhang mit dem linearen Neuronalen Netz geschätzt wurde. Für das Kriterium MM wurden zwei einfaktorielle Varianzanalysen durchgeführt, da es bei einer dreifaktoriellen nur eine Ausprägung pro Zelle hätte. MM wurde nur anhand der Trainingsdaten berechnet, weshalb keine Ausprägung für die Testdaten vorliegt. Anhang 27 faßt die Ergebnisse zusammen.
Zur Überprüfung der generellen Eignung des nichtlinearen Multi-Layer-Perceptrons wurde mit Hilfe von t-Tests getestet, ob sich die Mittelwerte der Testkriterien für das Meßmodell signifikant von ihren kritischen Werten unterscheiden. Die t-Tests für gepaarte Stichproben zur Überprüfung von Gütekriterien des Meßmodells darauf, ob sie sich in den Testdaten des nichtlinearen Neuronalen Netzes signifikant von den Trainingsdaten unterscheiden, liefern das Ergebnis in Anhang 28.
Im Rahmen der mit der Kovarianzstrukturanalyse zu schätzenden Modelle interessiert das Niveau der Ausprägungen der latenten Variablen in der Regel nicht.
Die vierfaktoriellen Varianzanalysen zur Überprüfung, ob die Faktoren Beziehung, Skala, EVA, Menge (Training oder Testmenge) einen Einfluß auf die Gütemaße des Meßmodells im nichtlinearen Neuronalen Netz als abhängige Variablen ausüben, liefern das in Anhang 29 dargestellte Ergebnis.
Zur Untersuchung, ob die Gütemaße für das lineare Neuronale Netz sich signifikant von denen für das nichtlineare Neuronale Netz unterscheiden, wurden t-Tests für gepaarte Stichproben durchgeführt. Ihre Ergebnisse finden sich in Anhang 30, und zwar nur für die Trainingsdaten. Gepaart bedeutet, daß nur Treatmentkombination 1 bis 4 untersucht wurde, da für das lineare Neuronale Netz nur hierzu Beobachtungswerte vorliegen. Für das lineare Modell stimmen die Mittelwerte mit denen oben überein. Der Stichprobenumfang umfaßt 40 Paare, bei MM jedoch nur 4.
Die Ergebnisse der t-Tests zur Überprüfung, ob sich die Maße für die Güte der Strukturmodellschätzung im linearen Neuronalen Netz signifikant von den kritischen Werten unterscheiden, finden sich in Anhang 31 (N=40). Die Ausprägungen der Gütemaße sind hier nur für die Trainingsdaten ausgewiesen, da dies erstens analog zu LISREL-Modellen erfolgt und zweitens bei keinem Kriterium ein signifikanter Unterschied zwischen Trainings-und Testdaten besteht. SM wurde jedoch nach wie vor anhand der Trainings-und Testmenge berechnet.
Die Ergebnisse der zweifaktoriellen Varianzanalysen zur Überprüfung, ob die Faktoren Skala und EVA einen Einfluß auf die NN-Gütemaße des Strukturmodells als abhängige Variablen ausüben, finden sich in Anhang 32.
Einstichproben-t-Tests zur Überprüfung, ob sich die Maße für die Güte der Strukturmodellschätzung im nichtlinearen Neuronalen Netz signifikant von den kritischen Werten unterscheiden, ergeben das Bild in Anhang 33 (N=240). Die Ausprägungen der Gütemaße sind nur für die Trainingsdaten ausgewiesen, da erstens bei keinem Kriterium ein signifikanter Unterschied zwischen Trainings-und Testdaten besteht, und zweitens in Anlehnung an das LISREL-Modell keine Betrachtung der Testdaten erfolgen soll. SM wurde jedoch nach wie vor anhand der Trainings-und Testmenge berechnet.
Die Ergebnisse der vierfaktoriellen Varianzanalysen zur Überprüfung, ob die Faktoren Beziehung, Skala, EVA einen Einfluß auf die NN-Gütemaße des Strukturmodells als abhängige Variablen ausüben, sind in Anhang 34 dargestellt. Bei SM wurden allerdings drei einfaktorielle Varianzanalysen durchgeführt. Da sich die Mittelwerte in den Trainingsdaten nicht signifikant von denen in der Teststichprobe unterscheiden, liegt der Analyse ein aus den Test-und Trainingsdaten bestehender Datensatz zugrunde.
Zum Vergleich der generellen Eignung des linearen und nichtlinearen Neuronalen Netzes bei der Schätzung des Strukturmodells wurden t-Tests für gepaarte Stichproben zur Untersuchung darauf durchgeführt, ob die Gütemaße des Strukturmodells für das lineare Neuronale Netz sich signifikant von denen für das nichtlineare Neuronale Netz unterscheiden. Die Berechnung fand nur für Treatmentkombination 1 bis 4 statt, weswegen die in Anhang 35 gegebenen Mittelwerte nur mit denen für das lineare Modell oben übereinstimmen. Da SM nur eine Ausprägung pro Treatmentkombination aufweist, beträgt hierfür n=4, sonst n=40 in jeder der beiden Gruppen (Paare). Die Berechnung der Gütemaße erfolgt nur auf der Basis der Trainingsdaten, da zwischen Schätz-und Testdaten keine signifikanten Unterschiede vorliegen.
Mit dem linearen Modell des Neuronalen Netzes wurde nur die lineare Beziehung (tkl-4) geschätzt. Einstichproben-t-Tests zum Test des Mittelwerts eines Gütemaßes auf Signifikanz seiner Abweichung vom kritischen Wert sowie t-Tests für gepaarte Stichproben zur Überprüfung von Gütekriterien des Gesamtmodells darauf, ob sie sich in den Testdaten signifikant von den Trainingsdaten für das lineare Neuronale Netz unterscheiden, sind in Anhang 36 zusammengefaßt.
Die Ergebnisse der dreifaktoriellen Varianzanalysen zur Überprüfung, ob die Faktoren Skala, EVA, Daten (Trainings-oder Testmenge) einen Einfluß auf die NN-Gütemaße als abhängige Variablen ausüben, sind in Anhang 37 ausgewiesen. „Beziehung“ ist kein Faktor, da nur der lineare Zusammenhang untersucht wird.
Zur Überprüfung, ob die Kriterien für die Anpassungsgüte des Gesamtmodells des nichtlinearen Neuronalen Netzes ihre jeweiligen kritischen Werte signifikant überschreiten, wurden t-Tests durchgeführt. Ferner liefern t-Tests für gepaarte Stichproben Aufschluß darüber, ob sich Gütekriterien des Gesamtmodells in den Testdaten des nichtlinearen Neuronalen Netzes signifikant von denen in den Trainingsdaten unterscheiden. Diese Ergebnisse finden sich in Anhang 38 wieder.
Vierfaktorielle Varianzanalysen zur Überprüfung, ob die Faktoren Beziehung, Skala, EVA, Daten (Trainings-oder Testmenge) einen Einfluß auf die NN-Gütemaße als abhängige Variablen ausüben, liefern das Ergebnis in Anhang 39. Für GF wurden allerdings erneut vier einfaktorielle Varianzanalysen durchgeführt (n=48).
Für den Vergleich wurden t-Tests für gepaarte Stichproben zur Untersuchung darauf, ob die Gütemaße des Gesamtmodells für das lineare Neuronale Netz sich signifikant von denen für das nichtlineare Neuronale Netz unterscheiden, durchgeführt. In die Untersuchung gingen allerdings nur die Treatmentkombinationen 1 bis 4 ein. Das Kriterium GF weist mit nur einer Ausprägung pro Treatmentkombination fir die vier Treatmentkombinationen mit linearem Zusammenhang nur einen Stichprobenumfang von n=4 in jeder der beiden Gruppen (n=4 Paare) auf, sonst beträgt n=40. (vgl. Anhang 40)
Zur Bestimmung, welche Methodik insgesamt besser ist, wurden gepaarte t-Tests für das lineare und nichtlineare Modell zusammen durchgeführt. Als Datenbasis diente dabei nur die Schnittmenge, d.h. tk1–4 für das lineare und tk5–24 für das nichtlineare Modell. Nur diese Treatmentkombinationen wurden nämlich mit beiden Modellspezifikationen von LISREL und Neuronalen Netzen geschätzt. Pro Variable lagen damit 24 Paare vor. Ferner dienten Einstichproben-t-Tests der Überprüfung, ob sich die Mittelwerte der Gütemaße signifikant von ihren kritischen Werten unterscheiden. Diese Ergebnisse finden sich in Anhang 41.
Rights and permissions
Copyright information
© 2001 Springer Fachmedien Wiesbaden
About this chapter
Cite this chapter
Zander, A. (2001). Ergebnisse der Simulationsstudie. In: Neuronale Netze zur Analyse von nichtlinearen Strukturmodellen mit latenten Variablen. Gabler Edition Wissenschaft. Deutscher Universitätsverlag, Wiesbaden. https://doi.org/10.1007/978-3-322-99297-0_7
Download citation
DOI: https://doi.org/10.1007/978-3-322-99297-0_7
Publisher Name: Deutscher Universitätsverlag, Wiesbaden
Print ISBN: 978-3-8244-7259-8
Online ISBN: 978-3-322-99297-0
eBook Packages: Springer Book Archive