Ergebnisse der Simulationsstudie

Zander, Adolf

doi:10.1007/978-3-322-99297-0_7

Adolf Zander

Part of the book series: Gabler Edition Wissenschaft ((GEW))

248 Accesses

Zusammenfassung

Das Ziel der Untersuchung besteht darin, herauszufinden, ob die untersuchten Schätzansätze LISREL und Neuronale Netze, gemessen am Ablehnungsbereich der verwendeten Beurteilungskriterien, zur Schätzung der interessierenden Modelle geeignet sind und wie gut sie bei verschiedenen Szenarien abschneiden. Der Anwender kann nämlich erstens keinerlei Informationen über die Art der Beziehung zwischen den latenten Variablen, das Skalenniveau der Indikatorvariablen oder den Varianzerklärungsanteil im Strukturmodell haben. Er kann zweitens Vorwissen entweder über eines der drei Merkmale Beziehungsart, Skala, Varianzerklärungsanteil oder drittens über alle drei gleichzeitig verfügen. Deswegen erfolgt die Untersuchung für alle Faktorstufenkombinationen kumuliert, für jede Stufe der drei Experimentfaktoren und in einigen Fällen für einzelne von ihnen gebildeten Faktorstufenkombinationen.⁵³⁷⁾ Bei der Darstellung dieser bereits statistisch ausgewerteten Ergebnisse der Simulationsstudie im vorliegenden Kapitel erfolgt zuerst die Präsentation der LISREL-Ergebnisse und dann die der Ergebnisse der Neuronalen Netze. Im Anschluß daran werden die beiden Methodiken vergleichend gegenübergestellt. Jeder dieser drei Abschnitte gliedert sich in die Bereiche Beurteilung des geschätzten Meß-, Struktur- und Gesamtmodells. Dabei wird auf die Ergebnisse der linearen und nichtlinearen Formulierung des Schätzmodells getrennt sowie im Vergleich eingegangen.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Log in via an institution

Chapter: USD 29.95; Price excludes VAT (USA)

eBook: USD 44.99; Price excludes VAT (USA)

Softcover Book: USD 59.99; Price excludes VAT (USA)

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Preview

Unable to display preview. Download preview PDF.

Literatur

Bei einigen Fragestellungen werden darüberhinaus „Modellart“ (linear und nichtlinear) sowie „Datenmenge” (Training und Test) wie Experimentfaktoren i.e.S. behandelt.
Google Scholar
Die Varianz wird zwar eigentlich mit Hilfe eines X²-Tests getestet, hier wird jedoch der Durchschnitt der Varianzen einzelner Treatmentkombinationen mittels t-Test getestet. Bei großen Freiheitsgraden ist der t-Test nicht sensitiv auf Nichtnormalität. Vgl. KLEJNEN/VAN GROENENDAAL (1992), S. 137, 145. Der Stichprobenumfang n betrug für die drei Varianzen und MM 24, für die restlichen Gütemaße war n=240.
Google Scholar
Der prozentuale Bias ist der geschätzte Bias bezogen auf den wahren Parameterwert.
Google Scholar
Lediglich für den Bias von eli.„ sowie für alle t-Werte liefert die Varianzanalyse ein R’ größer 0,8. Bei den restlichen Gütemaßen liegen sie weit darunter, was ein Indiz dafür ist, daß nicht alle maßgeblichen Einflußgrößen dieser Gütekriterien erfaßt wurden.
Google Scholar
Auch hier findet für alle 20 Treatmentkombinationen zusammen eine Überprüfung mittels t-Tests daraufhin statt, ob der Mittelwert jedes Gütekriteriums signifikant besser als der kritische Wert für dieses Gütemaß ist (vgl. Anhang I1).
Google Scholar
Die Sensitivität der Meßmodellgüte gegenüber einer Variation der Stufen der drei Experimentfaktoren wurde mit Hilfe von dreifaktoriellen Varianzanalysen untersucht (n=200). Die drei Varianzen und MM nur eine Ausprägung pro Treatmentkombination (n=20) aufweisen, wurden sie jeweils einer einfaktoriellen Varianzanalyse für jeden Experimentfaktor unterzogen. Diese Analysen liefern das Ergebnis in Anhang 12. Da mit dem nichtlinearen LISREL-Modell kein linearer Zusammenhang geschätzt wurde, entfällt die Ausprägung 0=linear für den Faktor Beziehung, der nur noch die Stufen 1 bis 5 enthält.
Google Scholar
Zum Test darauf, ob die Faktoren Beziehung, Skala, EVA im linearen Modell einen Einfluß auf die LISREL-Gütemaße im Strukturmodell als abhängige Variablen ausüben, wurden dreifaktorielle Varianzanalysen durchgeführt. Da für SM nur eine Ausprägung pro Treatmentkombination vorliegt, wurden hierfür einfaktorielle Varianzanalysen für jeden Faktor durchgeführt. Die Ergebnisse dieser Analysen finden sich in Anhang 15.
Google Scholar
Das Ergebnis der t-Tests zur Untersuchung, ob der Stichprobenmittelwert der Gütekriterien für das Strukturmodell signifikant vom Schwellenwert abweicht, ist in Anhang 17 zusammengefaßt. Da lediglich fünf Beziehungsarten untersucht wurden, lagen bei 10 Replikationen für jede der 20 Treatmentkombinationen 200 Beobachtungswerte vor. Für die Varianz und SM liegt nur eine Ausprägung pro Treatmentkombination und somit insgesamt 20 Datenfälle vor.
Google Scholar
Dreifaktorielle Varianzanalysen zur Untersuchung, ob die Faktoren Beziehung (Faktorstufen 1 bis 5), Skala und EVA einen Einfluß auf die Gütemaße des Strukturmodells als abhängige Variablen ausüben, liefern das Ergebnis in Anhang 18.
Google Scholar
Zur Überprüfung von Gütekriterien des Strukturmodells darauf, ob sie sich im nichtlinearen LISRELModell signifikant vom linearen unterscheiden, wurden t-Tests bei gepaarten Stichproben durchgeführt. Da mit dem nichtlinearen Modell keine Schätzung der Treatmentkombinationen 1 bis 4 erfolgte, wurden sie zur besseren Vergleichbarkeit auch beim linearen Modell weggelassen, womit n=200 beträgt. Infolgedessen sind auch die Mittelwerte für das lineare Modell nicht mit denen in Anhang 14 identisch. Ebenso fehlen mangels Vergleichbarkeit die Gütemaße für 7,₂. Im Unterschied zu den vier anderen Kriterien weist SM jedoch nur eine Ausprägung pro Treatmentkombination auf, weshalb n hierfür 20 beträgt. Der Mittelwert für das lineare und nichtlineare Modell und die Differenz zwischen ihnen sind in Anhang 20 wiedergegeben.
Google Scholar
Die Überprüfung für alle Treatmentkombinationen zusammen, ob der Mittelwert jedes Gütekriteriums signifikant besser ist als der kritische Wert für dieses Gütemaß, erfolgte mittels zweiseitiger t-Tests. Für Maße der Anpassungsgüte des Gesamtmodells liegen Ausprägungen fur die Trainings-und Testmenge vor. Deswegen wurde ferner ein gepaarter t-Test durchgeführt zur Feststellung, ob sich im linearen Modell die sechs LISREL-Gütemaße in der Trainingsmenge signifikant von denen in der Testmenge unterscheiden. Das Ergebnis beinhaltet Anhang 21.
Google Scholar
Die Dreifaktorielle Varianzanalyse für jedes der sechs Gesamtmodellmaße in der Trainings-und Testmenge zur Feststellung, ob die Faktoren Beziehung, Skala, EVA, einen Einfluß auf die LISREL-Gütemaße für das Gesamtmodell als abhängige Variablen ausüben, liefert das Ergebnis in Anhang 22. Da für GF nur eine Ausprägung pro Faktorstufenkombination vorhanden ist, wurden drei einfaktorielle Varianzanalysen durchgeführt. Bei GF enthielten darüberhinaus alle Faktoren Mittelwerte von Null, weshalb keine Varianz-analyse möglich war.
Google Scholar
Mittels zweiseitiger t-Tests findet für alle Treatmentkombinationen zusammen eine Überprüfung daraufhin statt, ob der Mittelwert jedes Gütekriteriums signifikant besser als sein kritischer Wert ist. Gleichzeitig erfolgt eine Überprüfung der Gütekriterien mit Hilfe von t-Tests bei gepaarten Stichproben darauf, ob sie sich in den Testdaten signifikant von den Trainingsdaten unterscheiden. Der Stichprobenumfang beträgt n=200 Paare, ohne die Treatmentkombinationen 1 bis 4, da beim nichtlinearen Modell hierzu keine Beobachtungswerte vorliegen. In Anhang 23 sind die Mittelwerte für die Test-und Trainingsstichprobe und die Differenz zwischen ihnen ausgewiesen.
Google Scholar
Zur Feststellung, ob die Faktoren Beziehung, Skala, EVA, einen Einfluß auf die LISREL-Gütemaße für das Gesamtmodell als abhängige Variablen ausüben, werden dreifaktorielle Varianzanalysen für jedes der fünf Gesamtmodellmaße in der Trainings-und Testmenge durchgeführt. Für GF in Trainings-und Teststichprobe werden erneut nur einfaktorielle Varianzanalysen vorgenommen, da hier für eine dreifaktorielle Varianzanalyse wiederum nur eine Ausprägung pro Zelle vorhanden wäre. Dabei hat die Variable Beziehung nur die Ausprägungen 1 bis 5, da mit dem nichtlinearen LISREL-Modell kein linearer Zusammenhang geschätzt wurde. Die Ergebnisse sind in Anhang 24 ausgewiesen. Die Signifikanzprüfung der Mittelwertunterschiede der Fit-Maße bei den einzelnen Beziehungsarten geschah mit Hilfe der einfaktoriellen Varianzanalysen und des Scheffé-Tests.
Google Scholar
Auch hier erfolgte eine Überprüfung von Gütekriterien des Gesamtmodells mit Hilfe von t-Tests bei gepaarten Stichproben darauf, ob sie sich im nichtlinearen LISREL-Modell signifikant vom linearen unterscheiden. Das geschah erneut ohne die Treatmentkombinationen I bis 4, so daß n 200 beträgt. Wieder weist GF im Unterschied zu den anderen Kriterien nur eine Ausprägung pro Treatmentkombination auf, so daß n dafür 20 beträgt. Anhang 25 beinhaltet diese Ergebnisse.
Google Scholar
Zur Untersuchung, ob die Faktoren Skala, EVA, Daten (Trainings-oder Testmenge) einen Einfluß auf die NN-Gütemaße als abhängige Variablen ausüben, wurde eine dreifaktorielle Varianzanalyse durchgeführt. Die Beziehungsart ist dabei allerdings kein Faktor, da nur der lineare Zusammenhang mit dem linearen Neuronalen Netz geschätzt wurde. Für das Kriterium MM wurden zwei einfaktorielle Varianzanalysen durchgeführt, da es bei einer dreifaktoriellen nur eine Ausprägung pro Zelle hätte. MM wurde nur anhand der Trainingsdaten berechnet, weshalb keine Ausprägung für die Testdaten vorliegt. Anhang 27 faßt die Ergebnisse zusammen.
Google Scholar
Zur Überprüfung der generellen Eignung des nichtlinearen Multi-Layer-Perceptrons wurde mit Hilfe von t-Tests getestet, ob sich die Mittelwerte der Testkriterien für das Meßmodell signifikant von ihren kritischen Werten unterscheiden. Die t-Tests für gepaarte Stichproben zur Überprüfung von Gütekriterien des Meßmodells darauf, ob sie sich in den Testdaten des nichtlinearen Neuronalen Netzes signifikant von den Trainingsdaten unterscheiden, liefern das Ergebnis in Anhang 28.
Google Scholar
Im Rahmen der mit der Kovarianzstrukturanalyse zu schätzenden Modelle interessiert das Niveau der Ausprägungen der latenten Variablen in der Regel nicht.
Google Scholar
Die vierfaktoriellen Varianzanalysen zur Überprüfung, ob die Faktoren Beziehung, Skala, EVA, Menge (Training oder Testmenge) einen Einfluß auf die Gütemaße des Meßmodells im nichtlinearen Neuronalen Netz als abhängige Variablen ausüben, liefern das in Anhang 29 dargestellte Ergebnis.
Google Scholar
Zur Untersuchung, ob die Gütemaße für das lineare Neuronale Netz sich signifikant von denen für das nichtlineare Neuronale Netz unterscheiden, wurden t-Tests für gepaarte Stichproben durchgeführt. Ihre Ergebnisse finden sich in Anhang 30, und zwar nur für die Trainingsdaten. Gepaart bedeutet, daß nur Treatmentkombination 1 bis 4 untersucht wurde, da für das lineare Neuronale Netz nur hierzu Beobachtungswerte vorliegen. Für das lineare Modell stimmen die Mittelwerte mit denen oben überein. Der Stichprobenumfang umfaßt 40 Paare, bei MM jedoch nur 4.
Google Scholar
Die Ergebnisse der t-Tests zur Überprüfung, ob sich die Maße für die Güte der Strukturmodellschätzung im linearen Neuronalen Netz signifikant von den kritischen Werten unterscheiden, finden sich in Anhang 31 (N=40). Die Ausprägungen der Gütemaße sind hier nur für die Trainingsdaten ausgewiesen, da dies erstens analog zu LISREL-Modellen erfolgt und zweitens bei keinem Kriterium ein signifikanter Unterschied zwischen Trainings-und Testdaten besteht. SM wurde jedoch nach wie vor anhand der Trainings-und Testmenge berechnet.
Google Scholar
Die Ergebnisse der zweifaktoriellen Varianzanalysen zur Überprüfung, ob die Faktoren Skala und EVA einen Einfluß auf die NN-Gütemaße des Strukturmodells als abhängige Variablen ausüben, finden sich in Anhang 32.
Google Scholar
Einstichproben-t-Tests zur Überprüfung, ob sich die Maße für die Güte der Strukturmodellschätzung im nichtlinearen Neuronalen Netz signifikant von den kritischen Werten unterscheiden, ergeben das Bild in Anhang 33 (N=240). Die Ausprägungen der Gütemaße sind nur für die Trainingsdaten ausgewiesen, da erstens bei keinem Kriterium ein signifikanter Unterschied zwischen Trainings-und Testdaten besteht, und zweitens in Anlehnung an das LISREL-Modell keine Betrachtung der Testdaten erfolgen soll. SM wurde jedoch nach wie vor anhand der Trainings-und Testmenge berechnet.
Google Scholar
Die Ergebnisse der vierfaktoriellen Varianzanalysen zur Überprüfung, ob die Faktoren Beziehung, Skala, EVA einen Einfluß auf die NN-Gütemaße des Strukturmodells als abhängige Variablen ausüben, sind in Anhang 34 dargestellt. Bei SM wurden allerdings drei einfaktorielle Varianzanalysen durchgeführt. Da sich die Mittelwerte in den Trainingsdaten nicht signifikant von denen in der Teststichprobe unterscheiden, liegt der Analyse ein aus den Test-und Trainingsdaten bestehender Datensatz zugrunde.
Google Scholar
Zum Vergleich der generellen Eignung des linearen und nichtlinearen Neuronalen Netzes bei der Schätzung des Strukturmodells wurden t-Tests für gepaarte Stichproben zur Untersuchung darauf durchgeführt, ob die Gütemaße des Strukturmodells für das lineare Neuronale Netz sich signifikant von denen für das nichtlineare Neuronale Netz unterscheiden. Die Berechnung fand nur für Treatmentkombination 1 bis 4 statt, weswegen die in Anhang 35 gegebenen Mittelwerte nur mit denen für das lineare Modell oben übereinstimmen. Da SM nur eine Ausprägung pro Treatmentkombination aufweist, beträgt hierfür n=4, sonst n=40 in jeder der beiden Gruppen (Paare). Die Berechnung der Gütemaße erfolgt nur auf der Basis der Trainingsdaten, da zwischen Schätz-und Testdaten keine signifikanten Unterschiede vorliegen.
Google Scholar
Mit dem linearen Modell des Neuronalen Netzes wurde nur die lineare Beziehung (tkl-4) geschätzt. Einstichproben-t-Tests zum Test des Mittelwerts eines Gütemaßes auf Signifikanz seiner Abweichung vom kritischen Wert sowie t-Tests für gepaarte Stichproben zur Überprüfung von Gütekriterien des Gesamtmodells darauf, ob sie sich in den Testdaten signifikant von den Trainingsdaten für das lineare Neuronale Netz unterscheiden, sind in Anhang 36 zusammengefaßt.
Google Scholar
Die Ergebnisse der dreifaktoriellen Varianzanalysen zur Überprüfung, ob die Faktoren Skala, EVA, Daten (Trainings-oder Testmenge) einen Einfluß auf die NN-Gütemaße als abhängige Variablen ausüben, sind in Anhang 37 ausgewiesen. „Beziehung“ ist kein Faktor, da nur der lineare Zusammenhang untersucht wird.
Google Scholar
Zur Überprüfung, ob die Kriterien für die Anpassungsgüte des Gesamtmodells des nichtlinearen Neuronalen Netzes ihre jeweiligen kritischen Werte signifikant überschreiten, wurden t-Tests durchgeführt. Ferner liefern t-Tests für gepaarte Stichproben Aufschluß darüber, ob sich Gütekriterien des Gesamtmodells in den Testdaten des nichtlinearen Neuronalen Netzes signifikant von denen in den Trainingsdaten unterscheiden. Diese Ergebnisse finden sich in Anhang 38 wieder.
Google Scholar
Vierfaktorielle Varianzanalysen zur Überprüfung, ob die Faktoren Beziehung, Skala, EVA, Daten (Trainings-oder Testmenge) einen Einfluß auf die NN-Gütemaße als abhängige Variablen ausüben, liefern das Ergebnis in Anhang 39. Für GF wurden allerdings erneut vier einfaktorielle Varianzanalysen durchgeführt (n=48).
Google Scholar
Für den Vergleich wurden t-Tests für gepaarte Stichproben zur Untersuchung darauf, ob die Gütemaße des Gesamtmodells für das lineare Neuronale Netz sich signifikant von denen für das nichtlineare Neuronale Netz unterscheiden, durchgeführt. In die Untersuchung gingen allerdings nur die Treatmentkombinationen 1 bis 4 ein. Das Kriterium GF weist mit nur einer Ausprägung pro Treatmentkombination fir die vier Treatmentkombinationen mit linearem Zusammenhang nur einen Stichprobenumfang von n=4 in jeder der beiden Gruppen (n=4 Paare) auf, sonst beträgt n=40. (vgl. Anhang 40)
Google Scholar
Zur Bestimmung, welche Methodik insgesamt besser ist, wurden gepaarte t-Tests für das lineare und nichtlineare Modell zusammen durchgeführt. Als Datenbasis diente dabei nur die Schnittmenge, d.h. tk1–4 für das lineare und tk5–24 für das nichtlineare Modell. Nur diese Treatmentkombinationen wurden nämlich mit beiden Modellspezifikationen von LISREL und Neuronalen Netzen geschätzt. Pro Variable lagen damit 24 Paare vor. Ferner dienten Einstichproben-t-Tests der Überprüfung, ob sich die Mittelwerte der Gütemaße signifikant von ihren kritischen Werten unterscheiden. Diese Ergebnisse finden sich in Anhang 41.
Google Scholar

Download references

Authors

Adolf Zander
View author publications
You can also search for this author in PubMed Google Scholar

Rights and permissions

Reprints and permissions

Copyright information

About this chapter

Cite this chapter

Zander, A. (2001). Ergebnisse der Simulationsstudie. In: Neuronale Netze zur Analyse von nichtlinearen Strukturmodellen mit latenten Variablen. Gabler Edition Wissenschaft. Deutscher Universitätsverlag, Wiesbaden. https://doi.org/10.1007/978-3-322-99297-0_7

Download citation

DOI: https://doi.org/10.1007/978-3-322-99297-0_7
Publisher Name: Deutscher Universitätsverlag, Wiesbaden
Print ISBN: 978-3-8244-7259-8
Online ISBN: 978-3-322-99297-0
eBook Packages: Springer Book Archive

Publish with us

Policies and ethics