1 Einleitung

Die Identifizierung von überdurchschnittlicher musikalischer Leistung und Begabung bei Kindern und Jugendlichen hat eine lange Tradition in der Musikpädagogik und Musikpsychologie (vgl. Seashore 1919). Denn musikalische Begabung frühzeitig zu identifizieren, ist eine der wichtigsten Voraussetzungen für die Förderung musikalischen Potentials und das Erreichen herausragender musikalischer Leistungen. Dennoch existieren derzeit keine etablierten Verfahren zur Messung musikalischer Begabung, so dass bei Förderentscheidungen und Auswahlprozessen bspw. die Zusammensetzung oder auch die (nicht‑) Orientierung an standardisierten Kriterien von lokalen Jurys eine große Rolle spielen können. Besonders problematisch ist das Fehlen verlässlicher Diagnoseverfahren für Kinder und Jugendliche aus bildungsfernen und sozial benachteiligten Bereichen der Gesellschaft. Denn wenn überhaupt, dann findet die Begegnung mit Musik hier oft abseits der traditionellen musikalischen Bildungseinrichtungen (Privatunterricht, Schulorchester, Musikschule) statt, die üblicherweise die Identifizierung und Förderung von musikalischer Begabung übernehmen. Das Spielen eines Instrumentes ist so in der Regel Voraussetzung für das Entdecken von Begabung, was auch bedeutet, dass Kinder mit hohem musikalischem Potenzial, aber ohne Instrumentalunterricht, übersehen werden können. Zudem liegt der Fokus bei traditionellen Ansätzen zur Identifizierung musikalischer Begabung häufig auf den Leistungen, die in einem bestimmten Alter erbracht werden. Dass diese Leistungen jedoch als Ergebnis eines Entwicklungsprozesses zu verstehen sind, machen neuere Ansätze der allgemeinen Begabungsforschung deutlich (vgl. Subotnik et al. 2011, 2012). Auch in der musikpädagogischen Forschung fehlt oft der Fokus auf den musikalischen Entwicklungsverlauf, so dass psychologische Faktoren, die musikalische Entwicklung entscheidend beeinflussen können, in der Regel nicht bei der Diagnose von Begabung berücksichtigt werden.

Deshalb ist es das Ziel dieses Beitrags auf Grundlage eines aktuellen Begabungsmodells – dem Talent Development in Achievement Domains (TAD, vgl. Preckel et al. 2020) – aufzuzeigen, wie musikalische Begabung ohne Berücksichtigung der Fähigkeiten am Instrument und mit einem Fokus auf die Entwicklung von Fähigkeiten über die Zeit mit Hilfe quantitativer Modelle beschrieben werden kann. Dieser am TAD-Modell angelehnte neue Ansatz soll zudem mit traditionellen Ansätzen verglichen werden, die musikalische Begabung mit hoher Leistung oder hohen Fähigkeiten zu einem bestimmten Zeitpunkt gleichsetzen. Zuletzt werden kognitive und psychosoziale Faktoren als Proxyvariablen in die Analyse miteinbezogen.

2 Theorieansätze zu musikalischem Potenzial und musikalischen Fähigkeiten

Ein in der Musikpädagogik sehr einflussreiches Begabungskonzept ist Gagnés „Integrative Model of Talent Developement“ (IMTD), welches von McPherson und Williamon (2016) für den musikalischen Bereich spezifiziert wurde. In diesem Modell wird zwischen „Gifts“ und „Talents“ unterschieden. Ersteres bezeichnet „natürliche“ Fähigkeiten, die nicht durch systematisches Training erworben werden und die in der Literatur meist als Potenzial oder Begabung benannt werden. Dabei gelten laut Gagné (Gagné und McPherson 2016, S. 5) die besten 10 % einer Altersgruppe zu der Kohorte der begabten Individuen. Als „Talents“ werden in diesem Modell systematisch entwickelte Fähigkeiten oder Fertigkeiten bezeichnetFootnote 1. Talentierte Individuen sind demnach diejenigen, die (bei gleicher Lernzeit) die obersten 10 % an Leistungen abbilden. Als musikspezifische Fähigkeiten benennen McPherson und Williamon (2016) das Spielen, Improvisieren, Komponieren, Arrangieren, Analysieren, Dirigieren und die Wertschätzung von Musik. Für den Entwicklungsprozess, in dem das Potenzial in systematisch entwickelte Fähigkeiten umgesetzt wird, benennt Gagné eine Reihe von Katalysatoren. Katalysatoren sind Eigenschaften oder Umstände, die dabei helfen den Umwandlungsprozess von „gifts“ zu „talents“ zu beschleunigen oder im negativen Fall Begabte davon abhalten ihre Leistungsfähigkeit voll auszuschöpfen. Die Konstruktion eines quantitativen Modells, durch Welches der Einfluss der Katalysatoren auf die Entwicklung von musikalischer Begabung modelliert und untersucht wird, steht derzeit jedoch noch aus.

Gagnés Modell wird durch das „Multifactorial Gene–Environment Interaction Model“ (MGIM) von Ullén et al. (2016) ergänzt, welches eine detaillierte Beschreibung verschiedener Genotyp-Umwelt-Interaktionen (passiv, aktiv, evokativ) darstellt, die auf Plomin et al. (1977) zurückgehen. Durch dieses Modell wird Gagnés Annahme, dass genetische Komponenten bei der Talententwicklung von großer Bedeutung sind, erweitert und in Hinsicht auf genetische Prozesse spezifiziert. Diese differenzierte Ausarbeitung verschiedener Arten von Genotyp-Umwelt-Interaktionen scheint auch für den Musikbereich sinnvoll und gut anwendbar. Eine passive Genotyp-Umwelt-Interaktion läge beispielsweise dann vor, wenn Kinder von ihren Eltern Fähigkeiten vererbt bekommen, die für das Musikmachen bedeutsam sind und sie gleichzeitig durch den Einfluss ihrer musikalischen Eltern in einer Umgebung aufwachsen, die reich an musikalischen Möglichkeiten ist. Dagegen läge eine aktive Interaktion dann vor, wenn der Genotyp beeinflusst, ob und welcher musikalischen Beschäftigung nachgegangen wird. Das kann zum Beispiel das Auslösen des eigenen neuronalen Belohnungssystems sein, wenn durch die motorische und kognitive Veranlagung Instrumente leicht und schnell erlernt werden. Hierdurch erfahrene externe oder eigene Bestätigung kann wiederum zu dem Ansporn führen, weiterhin Musik zu machen bzw. sogar noch mehr persönliche Ressourcen in Musik zu investieren. Schließlich sind evokative Genotyp-Umwelt-Einflüsse dadurch gekennzeichnet, dass Individuen mit ausgeprägten musikalischen Anlagen Musiklehrer/innen oder andere musikalische Peers auf sich aufmerksam machen, und so ggf. die Qualität und Quantität der musikalischen Beschäftigung steigt.

Durch die Ausdifferenzierung der möglichen Interaktionen zwischen genetischen Anlagen und der Umwelt gehen Ullén et al. (2016) auch auf die Bedeutung des gezielten Übens („deliberate practice“) ein, welche zudem in der Expertiseforschung eine wichtige Rolle spielt. Obwohl das IMTD und das MGIM exzellente Ansätze darstellen, die die Komplexität von musikalischer Talentwicklung verständlich machen, bleibt es weiterhin schwierig ihre modellhaften Annahmen und Mechanismen in quantitative und empirisch überprüfbare Modelle der Begabungsdiagnostik und -entwicklung umzusetzen.

Gemeinsam ist diesen Ansätzen, dass herausragende musikalische Fähigkeiten als hinreichender Indikator für Begabung verwendet werden. Gagné (1998) schlägt dabei vor, Subkategorien von begabten und talentierten Individuen anhand von unterschiedlichen Schwellenwerten zu unterscheiden (s. a. Gagné und McPherson 2016). Die Individuen, die bei der Verteilung musikalischer Fähigkeiten in die obersten 10 % fallen klassifiziert Gagné als „milde“ Hochbegabung (vgl. Gagné 1998). Dabei nutzt Gagné bewusst Prozentwerte und kein an die Standardabweichung angelehntes Kriterium, damit diese Schwellenwerte auch bei nicht normierten Tests oder nicht normalverteilten Merkmalen angewendet werden können. In ihrem kurzen Review zu Schwellenwerten bei Intelligenztests zur Erfassung von kognitiv hochbegabten Individuen bemerken McIntosh et al. (2018, S. 601), dass die meisten Studien einen Schwellenwert von mehr als zwei Standardabweichungen über dem Mittelwert der Normstichprobe annehmen. Dabei raten McIntosh et al. aber dringend davon ab, den Ein- oder Ausschluss von leistungsstarken Individuen in Fördermaßnahmen allein von einem Wert abhängig zu machen und raten dazu, auch weitere Faktoren sowie die individuelle Entwicklung in Betracht zu ziehen.

Ein neuer und in dieser Hinsicht vielversprechender Ansatz, mit dem Potenziale und Fähigkeiten musikalisch leistungsstarker Kinder und Jugendlicher abgebildet werden können, ist der „Talent Development in Achievement Domains“ (TAD) genannte Ansatz von Preckel et al. (2020), der auch für den Bereich der Musik ausgearbeitet wurde. Gemäß des TAD-Ansatzes ist musikalische Begabung oder musikalisches Potenzial eine latente Variable, die nicht direkt beobachtet werden kann. Allerdings wird postuliert, dass sich die latente Variable Begabung durch Proxyvariablen abschätzen lässt. Proxyvariablen werden als psychologische Faktoren definiert (z. B. Persönlichkeit, kognitive und Wahrnehmungsfähigkeiten, Selbstkonzepte, motivationale und psycho-soziale Variablen), die in der Interaktion mit geeignetem musikalischem Input (Trainingsintensität und -qualität z. B. beim instrumentalen Üben, Singen, aktiven Hören) die Vorhersage zukünftiger musikalischer Leistung erlauben. Der TAD-Ansatz schlägt auf Grundlage der existierenden Literatur konkrete Proxyvariablen vor. Dabei wird angenommen, dass für verschiedene Entwicklungsstadien, Altersstufen, Instrumente und musikalische Genres unterschiedliche Sets von Proxyvariablen bedeutsam sein können. Das heißt die Auswahl und Gewichtung der Faktoren, die den Entwicklungsverlauf beeinflussen sind nicht statisch, sondern verändern ihren Einfluss im Laufe der Entwicklung. Beispielsweise benötigt ein/e professionelle/r Musiker/in für eine erfolgreiche Karriere auch kommunikative und soziale Fertigkeiten, um mit Kolleg/innen, Publikum oder Agent/innen erfolgreich zu kommunizieren. Dagegen muss sich ein/e junge/r Musiker/in deutlich intensiver auf die Entwicklung motorischer Fertigkeiten konzentrieren. Um dieser Verschiebung von Einflussgrößen auf die musikalische Entwicklung Rechnung zu tragen, werden im TAD-Modell vier Level der Talententwicklung spezifiziert, die Müllensiefen et al. (2022) für den Bereich der Musik auch inhaltlich bestimmt haben:

  1. 1.

    Aptitude: In dieser Phase der Entwicklung werden vorhandene musikalische Veranlagungen in rudimentäre musikalische Fähigkeiten umgesetzt, indem die ersten Stationen systematischer Beschäftigung mit Musik in der Schule oder beim selbstregulierten Lernen durchlaufen werden. Hier zählen vor allem allgemeine kognitive Fähigkeiten (z. B. Gedächtnisleistung, Intelligenz), bestimmte Persönlichkeitsdimensionen (z. B. Offenheit für Neues) und motivationale Faktoren, intuitive Hörwahrnehmungs- und Produktionsleistungen sowie emotionales Verständnis von Musik zu den bedeutsamen Prädiktoren musikalischer Leistung.

  2. 2.

    Competence: In der Competence-Phase werden verschiedene musikbezogene Fähigkeiten erlernt, die im Allgemeinen die Bandbreite an Repertoire, Ausdruck und Kontexten erweitern, in denen sich die Individuen ausdrücken können. Dazu gehören je nach Genre das Verständnis zunehmend komplexerer musikalischer Strukturen, der Ausdruck von musikalischen Emotionen und die Regeln für das Zusammenspiel mit Anderen. In der Competence-Phase sind es vor allem die Fähigkeit selbstständig und zielgerichtet zu lernen, musikbezogene Einstellungen (z. B. Selbstkonzept, „growth mindset“) und musikalische Leistungsbereitschaft, die als Prädiktoren für die weitere Entwicklung von musikalischen Fähigkeiten angenommen werden.

  3. 3.

    Expertise: Hier werden musikalische Fähigkeiten erreicht, die von der Peer-Group anerkannt werden und eine berufliche Karriere im Musikbereich ermöglichen. Als Prädiktoren des Entwicklungsverlaufes in dieser Phase kommen allgemeine psychologische Faktoren wie zum Beispiel Resilienz, Offenheit und die Fähigkeit zur konstruktiven Kritik des eigenen Schaffens in Frage.

  4. 4.

    Transformational achievement: Diese höchste Entwicklungsstufe ist durch Erfolge, Anerkennung und Einfluss in der Musikwelt gekennzeichnet. Konzepte wie persönliches Charisma oder kreative Produktivität stehen hier als Marker für die erfolgreiche Entwicklung in dieser Phase.

Eine wichtige Implikation des TAD-Ansatzes ist die Minimierung des „selection bias“ (vgl. Geddes 1990), der bei der Untersuchung musikalisch Hochbegabter meist dadurch entsteht, dass ausschließlich musikalisch leistungsstarke Kinder und Jugendliche untersucht werden, die schon eine intensive Förderung im Bereich der westlichen Kunstmusik genossen haben (vgl. Gembris 2002). Die Gefahr des „selection bias“ besteht darin, dass post-hoc Variablen als Prädiktoren musikalischer Leistungsfähigkeit definiert werden, ohne dabei zu berücksichtigen, welchen Einfluss diese Variablen auf die Aufnahme und Fortführung musikalischen Trainings hatten und somit welche Bedeutung diesen Variablen für die Feststellung musikalischen Potentials a‑priori zukommt.

Ein zusätzlicher wichtiger Aspekt des TAD-Ansatzes ist die Entkoppelung von Alter und Entwicklungsstufe, was die Möglichkeit von unterschiedlichen Entwicklungsverläufen in verschiedenen musikalischen Genres eröffnet. So ist ein später Einstieg in das Instrumentalspiel in der populären Musik keine Seltenheit, wohingegen in der klassischen Musik systematisches Training im frühen Kindesalter in der Regel eine Voraussetzung für eine spätere Karriere ist (vgl. Creech et al. 2008). Empirische Modelle könnten eine entsprechende Differenzierung von Alter, musikalischem Genre und Entwicklungsstufe berücksichtigen.

Für den vorliegenden Beitrag ist es für die empirische Identifizierung von Begabung gemäß des TAD-Ansatzes wichtig, dass Lernfortschritt innerhalb eines Zeitintervalls unter ansonsten vergleichbaren Bedingungen im Hinblick auf andere Personen gemessen wird. Das heißt, begabte Schülerinnen und Schüler (SuS) zeigen bei identischem musikalischen Input im selben Zeitraum einen größeren Leistungszuwachs als unbegabte SuS. Musikalischer Input könnte beispielsweise über die Anzahl der Unterrichtsstunden bei derselben Lehrperson und die Anzahl der Übestunden definiert werden. Unterschiede in der individuellen Begabung werden als Ursache für die Unterschiede in den Leistungszuwächsen angenommen. Begabung ist zwar nicht direkt beobachtbar und wahrscheinlich zumindest teilweise genetisch determiniert. Aber nach TAD ist es möglich, eine Auswahl von Proxyvariablen zu identifizieren, die die Funktion der latenten Variable Begabung näherungsweise beschreibt.

Das Kriterium des Leistungszuwachses über die Zeit, dass für den TAD-Ansatz zentral ist, steht im Gegensatz zu absoluten Kriterien der musikalischen Leistung (z. B. top 10 % oder top 1 % der musikalischen Leistungen in einer Altersgruppe), die in anderen musikalischen Begabungsmodellen vorherrschen (z. B. Gagné und McPherson 2016). Zwar beschreiben auch Gagné und McPherson (2016, S. 23) ein Zuwachskriterium („musical progress quotient“), bleiben aber eine empirische Implementierung schuldig. Zudem fehlt dort die Differenzierung zwischen der Zuwachsrate als messbare Größe und der Begabung als latentes Konstrukt, welches durch Proxyvariablen näherungsweise beschrieben und für die empirische Modellierung verwendet werden kann.

2.1 Messung musikalischer Fähigkeiten

Die Fähigkeit musikalische Strukturen zu differenzieren und subtile akustisch-musikalische Unterschiede wahrzunehmen wurde schon von Michaelis (1805) und Galton (1869) als fundamental für die menschliche Musikalität angesehen. Galtons Überlegungen beeinflussten dann die Entwicklung der ersten musikalischen Testbatterie von Seashore (1919), bei der die jugendlichen Testpersonen (10–19 Jahre) Unterschiede zwischen kurzen Stimuli auf sechs grundlegenden auditorischen Dimensionen (Tonhöhe, Lautstärke, Rhythmen etc.) erkennen müssen. Auch die musikalischen Testbatterien von Wing (1939), Bentley (1966) und Gordon (1989, 1995) und vielen anderen zielen auf die Unterscheidungsfähigkeit für grundlegende musikalisch-akustische Parameter ab. Verwendet werden dafür fast ausschließlich abstrakte und relativ artifizielle Stimuli. Diesem Ansatz der Testkonstruktion liegt die Annahme zugrunde, dass die getesteten basalen Wahrnehmungsfähigkeiten nur wenig von musikalischem Training und Erfahrung beeinflusst werden und es so möglich sei, musikalische Begabung unverfälscht zu messen (Seashore verwendet den Begriff „talents“, Gordon „aptitude“).

Auch die Mehrzahl der in den letzten Jahren veröffentlichten modernen musikalischen Testbatterien (z. B. Law und Zentner 2012; Ullén et al. 2014; Wallentin et al. 2010) halten an dem traditionellen Ansatz fest, einfache und relativ abstrakte, d. h. von konkreter Musik losgelöste Fähigkeiten zu testen. So bleiben viele Facetten menschlicher Musikalität, die sich beim Umgang mit echter Musik zeigen, unberücksichtigt (vgl. die Kritik von Gembris 2002; Karma 1984; Sloboda und Howe 1991). Zudem sind auch viele moderne Testbatterien weiterhin stilistisch an die europäische Kunstmusik und die klassische Gehörbildung angelehnt und können so jenen Kindern einen Vorteil verschaffen, die Training in diesem Bereich erhalten haben. Schließlich steht eine umfassende Überprüfung des prognostischen Wertes der modernen Testbatterien für die Identifizierung von musikalischer Begabung derzeit noch aus. Viele der älteren traditionellen Testbatterien sind dafür kritisiert worden, dass sie generell nur einen geringen prognostischen Wert besitzen (vgl. Hodges und Haak 1996; Manturzewska 1990; Norton et al. 2005; Winner und Martino 2000).

Einen komplementären Ansatz verfolgt der Goldsmiths Musical Sophistication Index (Gold-MSI, vgl. Müllensiefen et al. 2014). Der Gold-MSI Selbstauskunftsfragebogen erhebt neben der Ausprägung musikalischer Wahrnehmungsfähigkeiten auch den produktiven (Singen, aktiver Umgang mit Musik, musikalisches Training) und emotionalen Umgang mit Musik. Besonderer Wert wird bei dem Gold-MSI u. a. darauf gelegt musikalische Umgangsweisen zu berücksichtigen, die für musikalische Stile auch abseits der westlichen Kunstmusik bedeutsam sind. Ergänzend zum Gold-MSI Selbstauskunftsfragebogen ist in den letzten Jahren eine Batterie neuer Hörtests entwickelt und veröffentlicht worden, die moderne psychometrische Verfahren verwenden (Item Response Theory, Computerised Adaptive Testing, Automatic Item Generation), um sich dem Fähigkeitsniveau der Versuchspersonen adaptiv anzupassen und so eine maximale Testeffizienz zu erreichen. Der adaptive Mechanismus der Tests und die Verwendung einer einheitlichen Fähigkeitsskala macht es möglich die Tests über längere Entwicklungszeiträume und für Stichproben mit sehr heterogenen Fähigkeitsniveaus zu verwenden. Gleichzeitig verwenden die im Zuge des Gold-MSI entwickelten Tests so weit wie möglich realistische und komplexe musikalische Stimuli aus vielen unterschiedlichen Genres, die der musikalischen Lebenswirklichkeit einer breiten Öffentlichkeit in westlichen Gesellschaften entsprechen. Zu den Tests, die mit Hilfe dieses Paradigmas entwickelt wurden, gehören der Melodic Discrimination Test (MDT; vgl. Harrison et al. 2017), der Mistuning Perception Test (MPT; vgl. Larrouy-Maestri et al. 2019), der Computerised Adaptive Beat Alignment Task (CA-BAT; vgl. Harrison und Müllensiefen 2018) und der Musical Emotion Discrimination Task (EDT; vgl. MacGregor und Müllensiefen 2019)Footnote 2. Die Verwendung der Gold-MSI-Tests in dieser Studie soll zum einen dem selection-bias entgegenwirken, da ausschließlich Hörfähigkeiten erhoben werden, die auch ohne vorherigen Instrumentalunterricht oder andere formale musikalische Vorkenntnisse entwickelt werden können. Zum anderen vermeiden die Tests durch die Verwendung realistischer musikalischer Stimuli und Höraufgaben den einseitigen Fokus auf einen bestimmten musikalischen Stil oder eine bestimmte Art musikalischer Ausbildung.

2.2 Auswahlkriterien und Förderpraktiken musikalisch leistungsfähiger Jugendlicher

Obwohl in Deutschland allgemeinbildende Schulen mit ausgeprägtem Musikprofil existieren, findet die Förderung musikalisch leistungsstarker Individuen in Deutschland i. d. R. außerhalb des schulischen Unterrichts statt (vgl. Clausen und Lessing 2018, S. 392). Hierfür stehen studienvorbereitende Kurse an Musikschulen und Frühförderungsprogramme an Musikhochschulen zur Verfügung, wie beispielsweise die Pre-Colleges der Musikhochschulen in Köln und Würzburg sowie das Institut für Frühförderung in Hannover. Für die Aufnahme in Frühförderungsprogramme und das Jungstudium an Musikhochschulen müssen Auswahlverfahren absolviert werden, bei denen vor allem herausragende individuelle Fähigkeiten im Instrumentalspiel und oft auch Prüfungen in Musiktheorie und Gehörbildung gefordert sind (vgl. Hochschule für Musik Würzburg 2017). Eine weitere Möglichkeit zur Auswahl und Förderung musikalisch leistungsfähiger Jugendliche sind Jugendensembles, die für viele unterschiedliche Besetzungen und Altersgruppen existieren. Vom Musikinformationszentrum (MIZ) werden derzeit 117 Jugendensembles auf Landes- und 11 auf Bundesebene verzeichnet (vgl. Deutsches Musikinformationszentrum 2021). Aufnahmebedingung sind hinreichende Fähigkeiten im Instrumentalspiel und oft eine Altersbeschränkung. Gefördert werden die Mitglieder dieser Jugendensembles durch intensive Probenarbeit, regelmäßige Auftritte und teilweise auch Kooperationen mit professionellen Ensembles (bspw. bei der Jungen Deutsche Philharmonie 2021). Eine dritte Säule der Identifikation und Selektion musikalisch leistungsstarker Kinder und Jugendlicher stellen Musikwettbewerbe dar, wie z. B. der bundesweit organisierte Wettbewerb „Jugend musiziert“. Hier erhalten Kinder und Jugendliche die Möglichkeit ihr Instrumentalspiel oder ihre Kompositionen von einer Fachjury einschätzen zu lassen und sich mit Gleichaltrigen zu vergleichen (vgl. Rademacher 2017).

Zusätzlich zu diesen institutionellen Selektions- und Förderinstrumenten, existieren Screening-Fragebögen und Checklisten, die spezifisch für die Identifikation und Selektion von musikalisch leistungsstarken Kindern im Kontext von allgemeinbildenden Schulen konzipiert sind. Über die Verbreitung und praktische Anwendung dieser Selektionswerkzeuge ist jedoch wenig bekannt (vgl. Heller und Perleth 2005; Mayr et al. 2010). Zwar können diese Werkzeuge auch von nicht speziell geschulten Personen eingesetzt werden, jedoch ist die Spezifität dieser Instrumente eher gering (Müllensiefen 2017, S. 138). Sie eignen sich daher eher für das Screening in der Breite und können ggf. mit Hörtests kombiniert werden, die für entsprechende Altersgruppen konzipiert und normiert wurden (s. oben: Bentley 1966; Gordon 1989; Wing 1939).

Insgesamt zeigt sich, dass zumindest in Deutschland in der Praxis keine standardisierten Tests zur Identifikation von musikalischer Begabung zum Einsatz kommen. Eine viel größere Bedeutung kommt dem Instrumentalvorspiel und den Fähigkeiten am Instrument zu, die in einem gewissen Alter erreicht werden. So gut wie keine Bedeutung haben psychologische Faktoren abseits musikalischer Fähigkeiten (z. B. Persönlichkeit, Motivation oder Lerneinstellungen) für die Praxis der Selektion und die gezielte Förderung musikalisch leistungsstarker Kinder und Jugendlicher. Entscheidend ist also meist die subjektive Meinung von Experten/innen und Fachjurys, ob Kinder und Jugendliche in Fördermaßnahmen aufgenommen werden sollen oder nicht. In den wenigen Studien, die sich mit musikalischen Fördermaßnahmen beschäftigen (vgl. Bastian und Koch 2010; Bullerjahn et al. 2020; Manturzewska 1990), wird die Validität, Reliabilität und Objektivität der in der Praxis angewandten Auswahlkriterien meist nicht geprüft. Vielmehr werden die vorgestellten Auswahl- und Förderungsmaßnahmen der genannten Studien rückwirkend dadurch legitimiert, dass ein Teil der Geförderten später als professionelle Musiker/innen beschäftigt sind. Mit diesem Ansatz ist es aber nicht möglich zu bestimmen, wie viele musikalische begabte Kinder und Jugendliche ‚übersehen‘ werden, d. h. von einem musikalischen Förderprogramm stark profitiert hätten, aber nicht am Auswahlprozess teilnehmen konnten bzw. an den spezifischen Auswahlkriterien gescheitert sind. Ein Problem der meisten Auswahl- und Förderinstrumente ist der vorherrschende Fokus auf westliche Kunstmusik, durch den die Frage nach musikalischer Begabung mit der Frage des musikalischen Geschmacks bzw. der musikalischen Sozialisation eng verknüpft wird und so die Auswahl von musikalischem Talent in anderen musikalischen Bereichen erschwert (vgl. Gembris 2002; Pape 2013). Aus diesen genannten Gründen ist es schwierig, die in der Praxis verbreiteten Auswahlkriterien für musikalisch leistungsstarke Kinder und Jugendliche hinsichtlich ihrer Effektivität und Validität einzuschätzen.

2.3 Entwicklung der Forschungsfrage

Die frühe und korrekte Identifizierung von musikalisch leistungsfähigen Individuen ist eine der wichtigsten Voraussetzungen für die zielgerichtete und effiziente Unterstützung zur Entwicklung musikalischen Potentials. In der Forschung wie in der Praxis erweist sich der Mangel an verlässlichen Diagnoseverfahren für Kinder und Jugendliche aus bildungsfernen und sozial benachteiligten Bereichen der Gesellschaft als problematisch. Denn hier findet die Begegnung mit Musik oft abseits der traditionellen musikalischen Bildungseinrichtungen (Musikschule, Privatunterricht, Jugendensemble, Frühförderung an Musikhochschulen) statt, die typischerweise die Identifizierung und Förderung von musikalischer Begabung leisten. Derzeit existiert jedoch kein modernes theoriebasiertes Verfahren zur Identifizierung von überdurchschnittlichem musikalischem Potenzial, welches eine Evidenzbasis für die systematische Entwicklung von herausragenden Leistungen in der Musik liefern könnte. Das Ziel dieses Beitrags ist es deshalb zu überprüfen, ob und inwieweit der vor kurzem entwickelte TAD-Ansatz als Theorierahmen für die Spezifizierung von empirischen Modellen dienen kann, um musikalische Begabungspotentiale zu identifizieren und musikalische Entwicklung vorherzusagen. Dabei soll der TAD-Ansatz mit traditionellen Begabungsansätzen verglichen werden, die sich an statischen Leistungskriterien orientieren. Der Vergleich der Forschungsansätze lässt sich anhand folgender Forschungsfragen gliedern:

Messung perzeptueller musikalischer Leistungsfähigkeit:

  1. 1.

    Wie lässt sich perzeptuelle musikalische Leistungsfähigkeit unabhängig vom Instrumentalspiel und ohne Voraussetzung formaler musikalischer Vorkenntnisse oder Terminologie messen?

Klassische Begabungsansätze:

  1. 2.

    Wie lassen sich, gemäß traditioneller Ansätze, musikalisch Begabte über statische Leistungskriterien identifizieren?

  2. 3.

    Welche extra-musikalischen Variablen sind robuste Prädiktoren für die in 2) identifizierten Begabten?

  3. 4.

    Wie verläuft die Entwicklung musikalischer Fähigkeiten für die in 2) identifizierten Begabten?

TAD-Ansatz:

  1. 5.

    Wie lassen sich Langzeitdaten musikalischer Leistungen zur Identifizierung musikalischer Begabter im Sinne des TAD-Ansatzes verwenden?

  2. 6.

    Welche extra-musikalischen Variablen sind robuste Prädiktoren für die in 5) identifizierten Begabten?

  3. 7.

    Wie verläuft die Entwicklung musikalischer Fähigkeiten für die in 5) identifizierten Begabten?

Vergleich der Ansätze:

  1. 8.

    Wie stark ähneln sich die Ergebnisse des TAD-Ansatzes und der Modelle, die traditionellen Leistungskriterien für die Feststellung individueller Begabung verwenden?

3 Methode und Erhebungsinstrumente

Die verwendeten Messinstrumente sind Teil der Langzeitstudie LongGoldFootnote 3, welche seit 2015 in England und seit 2018 in Deutschland an Sekundarschulen durchgeführt wird. Ziel des LongGold-Projektes ist es, die wechselseitigen Beziehungen zwischen musikalischer Entwicklung auf der einen Seite und der Entwicklung kognitiver Fähigkeiten, Lerneinstellungen, Persönlichkeit, psychosozialer Faktoren und akademischer Leistungen auf der anderen Seite im Jugendalter zu untersuchen. Für den vorliegenden Beitrag werden aus der LongGold-Datenbank Daten derjenigen Tests und Fragebögen verwendet, die sowohl gemäß traditionellen Ansätzen wie auch nach dem TAD-Ansatz für die Identifizierung und Entwicklung musikalischer Begabung als bedeutsam angenommen werden können (Müllensiefen et al. 2022).

3.1 Erhebung

Die hier verwendeten Daten wurden in einem Zeitraum von 2015 bis 2019 in der LongGold-Studie erhoben. An jeder Schule wurde in diesem Zeitraum einmal im Jahr eine Testung durchgeführt, wobei die Schulen in unterschiedlichen Jahren in die Studie aufgenommen wurden. Die Testungen wurden im Klassenverbund durchgeführt, wobei die Schülerinnen und Schüler (SuS) innerhalb einer Doppelstunde die Online-Testbatterie auf dem eigenen Tablet und mit eigenem Kopfhörer bearbeiteten. Für jede Klasse standen dabei mindestens zwei Testleiter/innen bereit, die die Einhaltung des Testprotokolls gewährleistenden und den Teilnehmenden bei Fragen helfen konnten.

3.2 Teilnehmende

Der für die Analysen verwendete Datensatz besteht aus N = 7451 Einzeldatensätzen aus dem Erhebungszeitraum, die N = 4084 Teilnehmende umfasst. Das durchschnittliche Eintrittsalter im 5. Schuljahr ist M = 10,5 mit einer Standardabweichung von SD = 0,69. Von den Teilnehmenden geben 53 % ihr Geschlecht als weiblich, 29,5 % männlich und 1,1 % geben ein non-binäres Geschlecht an. Die restlichen 16,4 % machen keine Angabe zu ihrem Geschlecht. Dabei sind 55,4 % der Stichprobe Teilnehmende aus deutschen und 44,6 % Teilnehmende aus den englischen Sekundarschulen (für weitere Stichprobendaten siehe Tab. 6, 7 und 8 im Anhang).

3.3 Messinstrumente

3.3.1 Abhängige Variablen: Musikalische Fähigkeiten

Im LongGold-Projekt werden musikalische Fähigkeit mit einer Batterie von unterschiedlichen Hörtests erhoben, die kein explizites musikalisches Vorwissen erfordern. Das heißt, es werden weder musikalische Fachterminologie noch instrumentale Fähigkeiten vorausgesetzt, die typischerweise im Musik- oder Instrumentalunterricht vermittelt werden. Die in diesem Rahmen getesteten Hörfähigkeiten können auch durch informelles und inzidentelles Lernen von Musik erworben werden und sind vom präferierten Musikgenre und -stil unabhängig. Dadurch soll insbesondere das Kriterium der Testfairness erfüllt werden, da die musikalischen Hörfähigkeiten auch von Individuen erhoben werden können, die keinen Musik- oder Instrumentalunterricht erhalten und keine oder nur wenig Erfahrung mit westlicher Kunstmusik haben. Alle musikalischen Hörtests verwenden einen adaptiven Mechanismus, der auf einem item response theory-Modell basiert. Dadurch sind alle Hörtests hoch effizient, vermeiden Decken- und Bodeneffekte und ermöglichen eine prinzipielle Abwägung von Testlänge und Messgenauigkeit, welche für den Einsatz in Schulen bedeutsam ist. Eine erste Analyse der Struktur musikalischer Hörwahrnehmungsfähigkeiten zeigt, dass ein Generalfaktor (G-Faktor) aus drei Wahrnehmungstests mit Fokus auf unterschiedlichen musikalischen Dimensionen das latente Konstrukt der musikalischen Hörwahrnehmungsfähigkeiten am besten repräsentiert (Pausch et al. 2022). Dieser G‑Faktor wird aus einem Beatwahrnehmungstest (Harrison und Müllensiefen 2018), aus einem Melodieunterscheidungstest (Harrison et al. 2017) und einem Intonationswahrnehmungstest (Larrouy-Maestri et al. 2019) gebildet.

Computerised Adaptive Beat Alignment Test (CA-BAT)

Der CA-BAT misst die Fähigkeit den zugrunde liegenden Puls eines Musikstückes zu abstrahieren (Harrison und Müllensiefen 2018). Diese Fähigkeit ist fundamental für erfolgreiche musikalische Synchronisation (Honing 2012). Konzeptionell verwandt ist der CA-BAT mit anderen Beat Alignment Tests, welche in verschiedenen Testparadigmen zur Pulswahrnehmung validiert werden konnten (Dalla Bella et al. 2017; Fujii und Schlaug 2013; Iversen und Patel 2008; Müllensiefen et al. 2014; Ross et al. 2018). Jedes Testitem des Computerised Adaptive Beat Alignment Tests besteht aus einem kurzen Musikausschnitt und einer darüber gelegten Metronomspur. Die Aufgabe der Versuchspersonen ist es anzugeben, ob das Metronom und der implizite Puls des Musikstückes absolut synchron sind oder nicht. Dabei konstituiert sich die Item-Schwierigkeit hauptsächlich über den Abstand zwischen Metronom und musikalischem Puls. Der Test zeigt mit 25 Items eine annehmbare Test-Retest-Reliabilität, \(r\left(50\right)=0{,}67{,\:}95{\%}\mathrm{CI}=[0{,}48{;\:}0{,}80]\), und korreliert mit der Subskala „musikalische Training“ des Gold-MSI Selbstauskunftsfragebogens, \(r(69)=0{,}41{,\:}p< 0{,}001{,\:}95{\%}\mathrm{CI}=[0{,}20{;\:}0{,}59]\) (Harrison und Müllensiefen 2018). Für die vorliegende Stichprobe liegt der MSE bei 0,95, \(95{\%}\mathrm{CI}=[0{,}94{;\:}0{,}96]\).

Melodic Discrimination Test (MDT)

Der MDT (Harrison et al. 2017) misst die Fähigkeit, Melodien im Arbeitsgedächtnis zu speichern und miteinander zu vergleichen. In einem forced-choice Design werden drei verschiedene Versionen einer Melodie nacheinander präsentiert, wobei die Versuchspersonen angeben müssen, welche Version sich von den beiden anderen unterscheidet. Die Itemschwierigkeit wird über Parameter Melodielänge, Tonalität und Kontur modelliert. In der vorliegenden Stichprobe liegt der MSE bei 0,86, \(95{\%}\mathrm{CI}=[0{,}85{;\:}0{,}88]\). Beim MPT kommt es für die Test-Retest-Reliabilität schon nach 11 Items zu einem Plateau bei einem Wert von \(r=0{,}67\) und die Korrelation mit „musikalischem Training“ nach 10 Items ein Plateau von \(r=0{,}44\) (Harrison et al. 2017).

Mistuning Perception Test (MPT)

Im MPT (Larrouy-Maestri et al., 2019) müssen die Teilnehmenden heraushören, ob Gesang und Begleitung eines kurzen Musikausschnitts zueinander verstimmt sind oder nicht, also ob die Sängerin oder der Sänger richtig intoniert oder nicht. Dabei wird die Item-Schwierigkeit hauptsächlich über den Abstand von Gesangsspur zu den anderen musikalischen Spuren im Frequenzbereich bestimmt. In der vorliegenden Stichprobe liegt der MSE bei 0,76, \(95{\%}\mathrm{CI}=[0{,}75{;\:}0{,}77]\). Für diesen Test wurde eine Test-Retest-Reliabilität von \(r=0{,}58{,\:}95{\%}\mathrm{CI}=[0{,}39{;\:}0{,}72]\) bei 15 und von \(r=0{,}70{,\:}95{\%}\mathrm{CI}=[0{,}54{;\:}0{,}81]\) bei den maximalen 30 Items gemessen. Auch hier stabilisiert sich die Korrelation mit der Subskala „musikalisches Training“ nach wenigen Items und liegt nach 10 Items um die \(r=0{,}4.\)

3.3.2 Unabhängige Variablen

Goldsmith Musical Sophistication Index (Gold-MSI, Müllensiefen et al. 2014)

Dieser Selbstauskunftsfragebogen wurde genutzt, um die musikalische Expertise und Erfahrungen der Teilnehmenden mithilfe von fünf Subskalen zu erfassen. Für diese Studie ist die Subskala „Musikalische Ausbildung“ von Bedeutung, die aus sieben Fragebogenitems besteht, die auf einer 7‑stufigen Skala beantwortet werden. Die Subskala misst das Ausmaß musikalischen Trainings in der Vergangenheit mithilfe von Fragen nach Trainingsdauer, -umfang und -erfolg. Die deutsche Übersetzung (Schaal et al. 2014) repliziert die Faktorstruktur des weit verbreiteten englischen Fragebogens und wurde zusätzlich an einer Stichprobe mit Schülerinnen und Schülern an weiterführenden Schulen validiert (Fiedler und Müllensiefen 2015). Die interne Konsistenz der englischen Subskala liegt bei alpha = 0,903 (deutsche Subskala: alpha 0,88) und die Test-Retest-Korrelation beträgt r = 0,974 (Müllensiefen et al. 2014).

Concurrent musical activities (CCM, Müllensiefen et al. 2015)

Mit Hilfe des CCM Fragebogens werden die musikalischen Aktivitäten während der letzten drei Monate vor dem Erhebungszeitpunkt erfasst. Der CCM ist damit komplementär zur Subskala Musikalisches Training des Gold-MSI, welcher die musikalische Aktivität über längere Zeiträume erfasst. Wie in Müllensiefen et al. (2015) erläutert, erfasst der CCM über eine Checkliste, welche musikalische Aktivitäten in den letzten drei Monaten ausgeübt wurden (z. B. Spiel in Orchester/Ensemble, Musikmachen mit Freunden, Einzel- oder Gruppenunterricht etc.). Die binären Daten der Checkliste werden durch ein Raschmodell zu einem numerischen Wert zusammengefasst. Zusätzlich wird über zwei 7‑Punkt-Skalen nach dem Ausmaß musikalischer Aktivität und musikalischen Trainings in den letzten drei Monaten gefragt. Ein Hauptkomponentenmodell aggregiert die drei numerischen Variablen des CCM zu einem einzigen Wert und erklärt 75 % der Varianz der Variablen.

Musical Home Environment (MHE, Ruth und Müllensiefen 2021)

Mithilfe der MHE Skala wird die musikalische Aktivität anderer Personen im selben Haushalt sowie die Unterstützung der eigenen musikalischer Aktivitäten durch die Eltern auf insgesamt vier binären Items und zwei Ratingskalen erfasst (Ruth und Müllensiefen 2021). Ähnlich wie beim CCM werden die binären Daten mit einem Raschmodell zusammengefasst dessen Output dann mit den beiden numerischen Variablen in einem Hauptkomponentenmodell aggregiert wird. Alle Variablen weisen Ladungen von > 0,5 auf der einzigen Komponente des Modells auf, was 67 % der Varianz der drei Variablen erklärt.

Theory of Intelligence and Goal Choice (TOI)

Der TOI Fragebogen (Dweck 2000; Dweck et al. 1995) ist ein weit verbreitetes Selbstauskunftsinventar und misst das sogenannte „growth mindset“ der Versuchspersonen über die Einstellung zur Veränderbarkeit der eigenen Intelligenz und die Wahl von selbst gesetzten Zielen. Die Fragen der beiden Subskalen (Theory of Intelligence und Goal Choice) werden zusammen in einem Block präsentiert, aber getrennt ausgewertet. Sechs Fragen verwenden eine 6‑Punkt Likert-Skala, die siebte Frage hat in binäres Antwortformat.

Theory of Musicality (TOM, Eisinger 2021)

Der TOM Fragebogen erfasst die subjektiven Theorien über Musikalität und ist vom TOI-Fragebogen von Dweck inspiriert. Im Gegensatz zum TOI verwendet der TOM eine hierarchische Skalen-Struktur, die an Biddle et al. (2003) angelehnt ist. Mit dem TOM Fragebogen wird erhoben, ob die Teilnehmenden musikalische Fähigkeiten eher als feststehende Begabung oder als Fähigkeit ansehen, die durch Training veränderbar ist. Insgesamt umfasst der TOM zwölf Fragen zur subjektiven Einschätzung von Veränderbarkeit und dem Ursprung von Musikalität. Die in der vorliegenden Untersuchung genutzten Faktoren erster Ordnung (Subskalen „entity“ & „incremental“, siehe Abb. 6 in Eisinger 2021) weisen einen Cronbachs-alpha von 0,63 und 0,79 auf.

Ten Item Personality Inventory (TIPI, Gosling et al. 2003)

Das TIPI ist ein kurzes Persönlichkeitsinventar auf Grundlage des Big Five-Persönlichkeitsmodells (Goldberg 1990), das für die Verwendung mit Kindern und Jugendliches leicht adaptiert wurde (Müllensiefen et al. 2015). Der TIPI wurde hinsichtlich Validität der Subskalen optimiert, die leicht besser ist als die anderer kurzer Persönlichkeitsinventare (Furnham et al. 2008). Die Test-Retest Reliabilität der fünf Subskalen des TIPI liegt zwischen 0,62 und 0,77 (Gosling et al. 2003) und damit größtenteils in einem akzeptablen Bereich.

Intelligenz (MyIQ Test, Chan und Kosinski 2015; Condon und Revelle 2014)

Der MyIQ-Test ist eine adaptive und IRT-basierte Version der Progressiven Ravens Matrizen, die vom Cambridge Psychometric Centre als offener Test für allgemeine Intelligenz und fluide Intelligenz entwickelt wurde. Es ist allerdings zu beachten, dass die Messung fluider Intelligenz als Fähigkeitskonstrukt i. d. R. den Einsatz mehrerer Tests für unterschiedliche inhaltliche Bereiche und verschiedene Aufgabenparadigmen erfordert. Der MyIQ-Test kann daher nur als Proxy für fluide Intelligenz gelten. Der MSE dieses Tests liegt in der vorliegenden Untersuchung bei 0,88, \(95{\%}\mathrm{CI}=[0{,}88{;\:}0{,}89]\).

Jack and Jill Working Memory Test (JAJ, Tsigeman et al. 2022)

Durch den JAJ Test wird das räumlich-visuelle Arbeitsgedächtnis getestet. Der JAJ ist als adaptiver IRT-Test implementiert, orientiert sich am Arbeitsgedächtnismodell von Baddeley und Hitch (1974) und basiert auf einem Dual-Task-Paradigma. Die Länge der zu merkenden Sequenzen bestimmt dabei die Schwierigkeit der präsentierten Items. In der vorliegenden Stichprobe der LongGold-Studie liegt der MSE dieses Tests bei 0,36, \(95{\%}\mathrm{CI}=[0{,}36{;\:}0{,}37]\). Mit JAJ-Test wurde bewusst ein Arbeitsgedächtnistest gewählt, bei dem keine auditorischen oder verbalen Informationen verarbeitet werden müssen. Das bedeutet, dass die Testergebnisse unabhängig von den Subsystemen des Arbeitsgedächtnisses sind (z. B. phonologische Schleife), von denen angenommen wird (z. B. Berz 1995), dass sie in einem engen Zusammenhang mit der Verarbeitung von musikalischen Informationen stehen. Das bedeutet, dass das visuell-räumlich Arbeitsgedächtnis als Prädiktor interpretiert werden kann, der seinerseits wahrscheinlich nur in einem geringen Maße (wenn überhaupt) durch musikalische Aktivität beeinflusst wird (s. a. Sala und Gobet 2017; Silas et al. 2022).

Demographie und akademische Leistungen

Alter, Geschlecht, Nationalität sowie weitere Merkmale werden über einen demographischen Fragebogen von den Teilnehmenden erhoben. Zeugnisnoten aller Teilnehmenden werden anonymisiert von den Schulen übermittelt und als standardisierte Werte pro schulischem Fachbereich (Sprachen, MINT, Sozial- und Kulturwissenschaft, künstlerische Fächer, angewandte Fächer) sowie als Gesamtwert erfasst.

4 Analyse und Ergebnisse

4.1 Messung musikalischer Leistungsfähigkeit unabhängig vom Instrumentalspiel und ohne Voraussetzung formaler musikalischer Vorkenntnisse oder Terminologie

Dem Ansatz von Pausch et al. (2022) folgend wurde ein Generalfaktor (G-Faktor) aus den Testscores der drei musikalischen Hörtests (CA-BAT, MPT und MDT) mithilfe einer explorativen Minimum-Residual-Faktorenanalyse anhand der Funktion fa () des R‑Pakets „psych“ (Revelle 2021) berechnet. Für die Analyse wurden nur Fälle verwendet, die den ersten Erhebungszeitpunkt eines/einer Teilnehmenden darstellen und aus den Klassen 5 oder 6 stammen. So können die Schülerinnen und Schüler (SuS) identifiziert werden, die bei ihrem Eintritt in die Studie musikalisch leistungsstark sind, ohne dass das Eintrittsalter als konfundierender Faktor wirkt. Insgesamt wurden so die Daten von N = 3090 SuS für die Faktorenanalyse verwendet. Das resultierende Faktormodell erklärte 56 % der Varianz der Testscores der drei Hörtests, d. h. die Daten legen nahe, dass eine latente Variable einen substanziellen Anteil der Varianz der Testdaten erklärt und für die Korrelationen der drei Tests verantwortlich ist. Diese latente Variable wird als perzeptuelle musikalische Leistungsfähigkeit interpretiert und durch aggregierte Scores eines Faktormodells (G-Faktor) gemessen. Die Verteilung des so ermittelten Wertes des G‑Faktors weist keine besonderen Ausreißer oder Schiefe auf (siehe Abb. 1). Die Messung des Konstrukts der perzeptuellen musikalischen Leistungsfähigkeit setzt somit weder voraus, dass die Versuchspersonen ein Instrument beherrschen, noch sonst über irgendwelche speziellen musikalischen Vorkenntnisse oder Terminologie verfügen.

Abb. 1
figure 1

Histogramm mit G-Faktorwerten der Grundgesamtheit und eingezeichnetem Mittelwert

4.2 Identifikation musikalisch Begabter anhand von statischen Leistungskriterien

In Anlehnung an den z. B. von Gagné (1998) vertretenen Ansatz, Begabung anhand von überdurchschnittlicher musikalischer Leistung festzustellen, wurden zwei verschiedene Methoden verwendet, um über insgesamt vier Schwellenwerte leistungsstarke SuS zu identifizieren. Die erste Methode verwendet die Verteilung der Personenscores auf dem G‑Faktor. Gemäß den Kriterien von Gagné (1998) wurden diejenigen SuS als musikalisch leistungsstark eingestuft, deren G‑Faktor Wert den obersten 1 % und 10 % in der Verteilung des G‑Faktors entsprechen.

Die zweite Methode berücksichtigt, dass musikalisches Training die Hörfähigkeiten verbessert, die dem G‑Faktor zugrunde liegen. Um das Fähigkeitsniveau unabhängig von dem genossenen musikalischen Training zu ermitteln, orientiert sich die zweite Methode an modellbasierten Residuen, d. h. an dem Anteil der musikalischen Leistung, der nicht durch das erhaltene Training erklärt werden kann. Um auch nicht-lineare Zusammenhänge zu berücksichtigen, wurden Generalized Additive Models (GAMs, Wood 2017) zur Modellierung benutzt. Als abhängige Variable wurden die G‑Faktor-Werte verwendet und als Prädiktoren mehrere Variablen, die unterschiedliche Aspekte von musikalischem Training und Förderung messen (i.e. Subskala Musikalische Ausbildung des Gold-MSI, CCM, MHE). Als musikalisch besonders leistungsstark wurden die obersten 1 % und 10 % der Residualverteilung der GAM-Modelle definiert, d. h. diejenigen SuS die eine musikalische Leistung hatten, die deutlich höher war als anhand von musikalischem Training und Förderung im häuslichen Umfeld zu erwarten war.

Insgesamt wurden durch die Kombination der beiden Methoden und beider Schwellenwerte vier neue binäre Variablen gebildet, die die SuS des Datensatzes jeweils als „begabt“ und „nicht-begabt“ im Sinne der Verteilungskriterien einteilen. Für die obersten 10 % und 1 % der Verteilung des G‑Faktors (d. h. die Gruppe der Begabten) waren dies N = 218 und N = 36 SuS. Die obersten 10 % und 1 % der Residualverteilung (d. h. die Begabten) der GAM-Modelle entsprachen N = 219 und N = 22 SuS. Der Anteil der Schnittmenge der beiden Kriterien war bezogen auf das Leistungskriterium der obersten 10 % der G‑Faktor Verteilung 75,2 % und für die obersten 10 % des Residualkriteriums 74,9 %.

4.3 Extra-musikalische Variablen als Prädiktoren für musikalische Begabte, die anhand von statischen Leistungskriterien ermittelt wurden

Um jene extra-musikalischen Variablen zu bestimmen, die mit dem musikalischen Leistungsniveau der SuS substanziell und robust assoziiert sind, wurden vier Bayessche logistische Regressionsmodelle für die vier verschiedenen Kriterien berechnetFootnote 4. Als abhängige Variable diente jeweils das in 4.2 ermittelte binäre Kriterium der musikalischen Begabung und als mögliche Prädiktoren die in Abschn. 3.1.2 aufgeführten unabhängigen Variablen (JAJ, MyIQ, TOI, TOM, akademische Gesamtleistungen, TIPI-Faktor „Openness“). Zur Variablenselektion wurden sogenannte „horseshoe priors“ verwendet, die Regressionskoeffizienten mit geringer Effektstärke gegen null schrumpfen, um praktisch nicht bedeutsame Effekte zu eliminieren (van Erp 2020). Die Ergebnisse wurden mithilfe des R‑Pakets „brms“ (Bürkner 2018) berechnet und sind in Abb. 2 zusammengefasst.

Abb. 2
figure 2

Punktdigramme der Bayesschen logistischen Regressionsmodelle mit Konfidenzintervallen. Anmerkung: Darstellung zeigt die logistischen Regressionskoeffizienten mit den jeweiligen 95 % Bayesschen Konfidenzintervallen als Balken (Hespanhol et al. 2019)

Wie zu erwarten, sind die kritischen Intervalle der Regressionskoeffizienten für die größere Stichprobe (d. h. obersten 10 %) kleiner, weil die empirische Basis für die Schätzung größer ist. Weitergehend zeigt sich, dass die Tests zu Arbeitsgedächtnis und Intelligenz die höchsten Koeffizienten aufweisen und positiv mit dem musikalischen Begabungsstatus zusammenhängen. Als einzige Variable besitzt TOM.entity einen negativen Koeffizienten, der darauf hinweist, dass SuS, die Musikalität als unveränderliche Gabe auffassen, durch geringere musikalische Leistung gekennzeichnet sind. Zusätzlich weist auch der Persönlichkeitsfaktor „Offenheit“ des TIPI Persönlichkeitsinventars eine substanzielle positive Assoziation mit dem Begabungsstatus auf.

4.4 Entwicklung perzeptueller musikalischer Fähigkeiten bei Begabten, die anhand von statischen Leistungskriterien ermittelt wurden

Für die Modellierung der Entwicklung musikalischer Fähigkeiten wurden nur die Daten der SuS verwendet, von denen mindestens drei Erhebungszeitpunkte verfügbar waren. Deskriptive Daten dieser Stichprobe befinden sich in Tab. 6, 7 und 8 im Anhang. Mit Bayesschen linearen Mixed-Effects-Modells wurde anschließend die Entwicklung der perzeptuellen musikalischen Fähigkeiten (d. h. der G‑Faktor-Werte) über die Zeit hinweg untersucht. Dabei wurden die unterschiedlichen Leistungsniveaus der SuS über modellbasierte „random intercepts“ (d. h. die individuellen Abweichungen vom mittleren Leistungsniveau) modelliert, sowie unterschiedliche Entwicklungsverläufe über sogenannte „random slopes“ (d. h. individuelle Abweichungen vom mittleren Entwicklungsverlauf). Abhängige Variable waren die G‑Faktor-Werte und unabhängige Variablen waren die in der vorherigen Analyse (4.3) ermittelten Prädiktoren (JAJ, MyIQ, TOM.entity, TIPI.openness) und die Variable „Alter“, die den Entwicklungsverlauf über die Zeit modelliert.

Aufgrund fehlender Datenpunkte konnten für die 1 %-Perzentilgruppen des Verteilungs- und des Residualkriteriums keine Modelle berechnet werden. Die folgenden Ergebnisse basieren deshalb nur auf den beiden obersten 10 %-Kriterien. Es wurden separate Modelle für die SuS mithilfe beider Kriterien für die begabte Gruppe gerechnet und die nicht-Begabten in einem Modell zusammengefasst. Für die Operationalisierung von nicht-Begabten bedeutet dies, dass Teilnehmende, die nach nur einem der beiden statischen Begabungskriterien als begabt eingestuft wurden, in der Aufbereitung des Datensatzes der nicht-Begabten herausgefiltert wurden (vgl. Tab. 1).

Tab. 1 Modellkoeffizienten der drei Baysschen longitudinalen linear mixed model Analysen nach klassischen Begabungskriterien

Wie zu erwarten, besitzt die Gruppe der nicht-Begabten ein niedrigeres fixed effects intercept als die Gruppe der Begabten. Bemerkenswert ist dagegen die Abnahme der musikalischen Hörleistungen (der G‑Faktor-Werte) bei den Begabten über die Zeit und das Wachstum der Hörleistungen bei den nicht-Begabten. Als Prädiktor ist Intelligenz (MyIQ) durchgehend positiv mit der Entwicklung der Hörleistungen assoziiert. Durchweg positiv mit dem Entwicklungsverlauf der musikalischen Fähigkeiten assoziiert ist auch die Persönlichkeitsdimension „Openness“. Arbeitsgedächtnis (JAJ) und die subjektive Theorie der Musikalität zeigen dagegen uneinheitliche Assoziation und haben Koeffizienten mit breiten kritischen Intervallen, was allenfalls geringe oder Nulleffekte dieser Prädiktoren nahelegt. Die Modell-Fits sind für das Perzentilkriterium mit \({R}_{\text{bayes}}^{2}=0{,}55\), für das Residualkriterium mit \({R}_{\text{bayes}}^{2}=0{,}55\) und die nicht-Begabten \({R}_{\text{bayes}}^{2}=0{,}67\), relativ hoch.

4.5 Identifikation von Begabten nach dem TAD-Ansatz und unter Verwendung von Langzeitdaten

Der TAD-Ansatz verknüpft Begabung mit akzelerierten positiven Entwicklungsverläufen. Gleichzeitig wird Begabung als nicht direkt messbare, sondern latente Größe angenommen, die aber über geeignete Proxy-Variablen angenähert werden kann. Um diese Annahmen zu operationalisieren, wird ein statistisches Modell benötigt, was Begabung als latente Variable repräsentiert und gleichzeitig am Zuwachs der perzeptuellen musikalischen Fähigkeiten über die Zeit festmacht. Soll die Einteilung des Begabungsstatus wie beim traditionellen Ansatz in zwei Klassen (begabt/nicht-begabt) erfolgen, dann bietet sich hierfür eine longitudinale Latent Class Analysis (LCA, Lin et al. 2002) an, welche mithilfe des R‑Pakets „lcmm“ (Proust-Lima et al. 2017) berechnet werden kann. In diesem Analysemodell wird davon ausgegangen, dass sich die Stichprobe in unterschiedliche Gruppen einteilen lässt, die sich in Bezug auf die Zunahme der Hörleistungen (G-Faktor) über die Zeit unterscheiden, d. h. unterschiedliche Gruppen von SuS können ggf. mithilfe der LCA anhand ihrer individuellen Wachstumskoeffizienten („random slopes“) identifiziert werden. Es wurden bei dieser Analyse nur diejenigen SuS berücksichtigt, die an drei oder mehr Erhebungszeitpunkten teilgenommen hatten, sodass ein Datensatz mit 1120 Datenpunkten von N = 364 SuS die Grundlage für die nachfolgende Analyse bildet.

Um die Vergleichbarkeit mit der 2‑Klasseneinteilung der statischen Begabungskriterien zu bewahren, wurden zwei Modelle mit jeweils zwei Klassen und unterschiedlichen „random effects“ Spezifikationen in der Modellauswahl betrachtet. Zur besseren Vergleichbarkeit und Einordnung der Fit-Werte, wurde zusätzlich ein Basismodell zum Abgleich herangezogen, bei dem die SuS nicht in unterschiedliche Klassen eingeteilt werden (= 1-Klassenmodell).

Nach der Betrachtung der Tab. 4 und 5 (siehe Anhang) konnte kein bedeutsamer Unterschied zwischen den 1‑ und 2‑Klassenmodell anhand des BICs, AICs, der log-likelihood und der mittleren Klassifikationswahrscheinlichkeiten festgestellt werden. Das lässt darauf schließen, dass die Wachstumsraten musikalischer Leistungsfähigkeit kontinuierlich verteilt sind und keine empirischen Hinweise für eine strikte Einteilung in zwei Klassen (begabt/unbegabt) vorliegt. Um diesem Umstand in der Analyse gerecht zu werden, wurde im Weiteren ein Latent Growth Model berechnet, das auf eine Einteilung in verschiedene latente Begabungsklassen verzichtet und stattdessen Begabung als kontinuierlich verteilte Variable annimmt.

4.6 Latentes Wachstumsmodell und Analyse extra-musikalischer Variablen als Prädiktoren für musikalischer Begabung (TAD-Ansatz)

Um die Vergleichbarkeit zwischen klassischen Begabungskriterien und TAD-Ansatz zu gewährleisten, wurde der Datensatz gefiltert. Als Obergrenze wurde ein Alter von 14 Jahren zum ersten Teilnahmezeitpunkt festgelegt, was dem höchsten Alter eines Sechstklässlers im Datensatz entspricht. Als statistischer Modellierungsansatz wurde das Latent Curve bzw. Growth Model (LGM/LCM) gewählt (Jung und Wickrama 2008). Diese gehören zur Familie der Strukturgleichungsmodelle und erlauben die Untersuchung longitudinaler Daten mit Messwiederholung. Dabei wird angenommen, dass die individuellen Wachstumskurven der Teilnehmenden anhand eines latenten Wachstumskoeffizienten („slope“) und des mittleren Fähigkeitsniveaus („intercept“) erklärt werden können (Ghisletta et al. 2015). Dieser an Wachstumskoeffizienten orientierte statistische Ansatz mit der Möglichkeit, zeitabhängige und zeitunabhängige Prädiktoren im selben Modell zu verwenden, ist dafür geeignet, Begabung als kontinuierlich verteilte Variable zu analysieren. Datengrundlage sind N = 1095 Datenpunkte, gesammelt über N = 3 Erhebungszeitpunkte von insgesamt N = 365 Teilnehmenden. Umgesetzt wurde das Modell mithilfe der Programmiersprache R und dem Softwarepaket „lavaan“ (Rosseel 2012).

Modell 1 (siehe Tab. 2) enthält noch keine Prädiktoren der latenten Faktoren „slope“ und „intercept“. Somit ist die Grundstruktur des Wachstumsmodells einfacher zu interpretieren und es kann ein Vergleich des voll ausspezifizierten Modells mit Prädiktoren und dem Basismodell (Modell 1) angestellt werden kann. Die Fit-Kriterien des Modells, \(CFI=1{,}\:TLI=1{,}\:\chi ^{2}(1{,}356)=0{,}01\,\mathrm{mit}\:p=0{,}94{,}\:\textit{RMSEA}=0\,\mathrm{mit}\:95{\%}\mathrm{CI}[0;\:0{,}03]{,}\:SRMR=0{,}001{,}\) zeigen eine sehr gute Passung von Modell und empirischen Daten an. Im Hinblick auf die latenten Wachstumskoeffizienten weist die Kohorte im Schnitt einen positiven Entwicklungsverlauf musikalischer Begabung auf.

Tab. 2 Modellkoeffizienten des Latent Growth Models (TAD-Ansatz) ohne Prädiktoren der latenten Wachstumsfaktoren

Modell 2 (siehe Tab. 3) beinhaltet zusätzliche Prädiktoren, die als Regressoren in einem Modell den Zusammenhangen mit den latenten Variablen des „intercepts“ und der „slope“ modellieren sollen. Auch hier weisen die Fit-Indizes eine sehr gute Passung von Modell und Daten auf, \(CFI=1{,}\:TLI=1{,}\:\chi ^{2}(8{,}356)=4{,}08\,\mathrm{mit}\:p=0{,}85{,}\:\textit{RMSEA}=0\,\mathrm{mit}\:95{\%}\mathrm{CI}[0;0{,}04]{,}\:SRMR=0{,}01.\) Dabei zeigt sich, dass fluide Intelligenz, die Leistung des Arbeitsgedächtnis und der Persönlichkeitsfaktor „Offenheit“ ein hohes anfängliches musikalisches Leistungsniveau begünstigen und die Einstellung, die Musikalität als unveränderliche Gabe aufzufassen, den gegenteiligen Effekt hat. Als einzig statistisch relevanter Prädiktor für eine hohe Wachstumsrate des musikalischen G‑Faktors weist das Modell das Arbeitsgedächtnis aus. Da dieser Regressor ein negatives Vorzeichen besitzt, bedeutet dies, dass je größer anfängliche Kapazität des Arbeitsgedächtnisses ist, desto niedriger die Wachstumsrate ausfällt. Durch den Umstand, dass das Einstiegsalter (9 bis 14 Jahre) und damit die Kapazität des Arbeitsgedächtnis zu Beginn der Testung innerhalb der Stichprobe stark variieren, ist davon auszugehen, dass die negative Korrelation mit der Wachstumsrate durch eine positive Korrelation von Einstiegsalter und Arbeitsgedächtnisleistung entstehen. Berücksichtig man diesen Umstand und die Annahme, dass Arbeitsgedächtnis und musikalische Begabung generell positiv korreliert sind, lässt sich die negative Korrelation von Wachstumsrate so deuten, dass jüngere Teilnehmende eine niedrigere Arbeitsgedächtnisleistung aufweisen und diese aber über die Zeit aufholen. In Tab. 9 im Anhang ist ein zusätzliches Modell aufgeführt, was diese Hypothese prüft, in dem ein zusätzlicher Interaktionsterm von Einstiegsalter × Arbeitsgedächtnis in das Modell aufgenommen wird. Dieser Interaktionsterm trägt in der Tat substanziell zur Erklärung der Wachstumsraten und ist positiv mit Wachstum assoziiert. Das bedeutet, dass eine größere Arbeitsgedächtniskapazität zumindest bei älteren SuS mit dem Wachstum musikalischer Leistungsfähigkeit assoziiert ist.

Tab. 3 Modellkoeffizienten des voll spezifizierten Latent Growth Models (TAD-Ansatz)

4.7 Vergleich der beiden Begabungsansätze

Die Variablenselektion im klassischen Begabungsansatz und die Signifikanzniveaus der Regressoren im LGM nach TAD ergaben, wenn auch unterschiedlich zu interpretierende, Prädiktoren für die Klassifizierung der Teilnehmenden in „begabt“ und „nicht begabt“.

Bei den Modellen zur Entwicklung musikalischer Fähigkeiten zeigt sich zunächst anhand der „intercepts“, dass die nach traditionellen Kriterien als begabt klassifizierten SuS höhere musikalische Fähigkeiten besitzen als die unbegabten SuS. Allerdings zeigen die Begabten eine deutlich negative Entwicklung des G‑Faktors über die Zeit. Dies steht im deutlichen Kontrast zu der Begabungskonzeption nach dem TAD-Ansatz, wo eine positive akzelerierte Entwicklung des G‑Faktors als grundlegender Mechanismus musikalischer Begabung angenommen wird. Dadurch, dass in der TAD-Modellierung der Entwicklung musikalischer Fähigkeiten keine Schwellenwerte vorgegeben werden, wird für die Verantwortlichen in der Förderung musikalisch begabter Kinder und Jugendlicher offengelassen, ab welchen Werten eine Person als „begabt“ eingestuft bzw. für das jeweilige Programm als geeignet erachtet wird. In Bezug auf die möglichen Proxyvariablen musikalischer Begabung zeigen sich in den Modellen mit JAJ, MIQ, TOM.entity und TPI.openness, in den Modellen beider Ansätze dieselben Variablen als Prädiktoren für die musikalische Begabung zu Beginn des Erhebungszeitraumes. Im Vergleich des longitudinalen Modells der anhand klassischer Kriterien eingeteilten Begabungsgruppen und der nach TAD ermittelten latenten Wachstumsrate musikalischer Begabung wird deutlich, dass fluide Intelligenz, Arbeitsgedächtnis und Offenheit mit hohen G‑Faktor-Werte einhergehen. Trotzdem haben diese Proxyvariablen keine oder nur eine geringe Vorhersagekraft für die musikalische Begabung im Sinne einer akzelerierten positiven musikalischen Entwicklung. Einzig das Arbeitsgedächtnis scheint bei älteren SuS im TAD-Modell positiv mit musikalischer Entwicklung assoziiert zu sein.

5 Diskussion

Ziel der vorliegenden Untersuchung war es, mithilfe zweier verschiedener Begabungsansätze (traditionelle Leistungskriterien vs. TAD-Ansatz) die jugendlichen Teilnehmenden einer Langzeitstudie in musikalische Begabte und Nicht-Begabte einzuteilen. Zusätzlich wurden in Querschnittsanalysen robuste Prädiktoren ermittelt, die mit dem Begabungsstatus der Jugendlichen assoziiert sind. Anschließend wurden dann für die beiden Begabungsgruppen Längsschnittmodelle berechnet, um den jeweiligen Entwicklungsverlauf musikalischer Hörleistungen zu untersuchen und die Prädiktoren aus den Querschnittsanalysen aus der Perspektive der Längsschnittuntersuchungen zu validieren. Diese wurden mit einem Längsschnittmodell verglichen, dass die individuellen Wachstumsraten berücksichtigt.

5.1 Unterschiede zwischen den Begabungsansätzen bei der Entwicklung perzeptueller musikalischer Leistungen

Als größter Unterschied zwischen den beiden Begabungsansätzen lässt sich der Entwicklungsverlauf innerhalb der Gruppe der Begabten festhalten. Für die nach traditionellen Leistungskriterien klassifizierten Begabten liefern das Längsschnittmodell zum musikalischen Entwicklungsverlauf kontraintuitive Ergebnisse. Hier lässt sich der Einfluss von Messfehlern und das Phänomen der Regression zur Mitte (vgl. Jerrim und Vignoles 2013) an den Modellen ablesen, die auf der Einteilung der SuS nach traditionellen Leistungskriterien beruhen. Die enorm hohen individuellen intercepts der Begabten zusammen mit der abwärts gerichteten Entwicklung der musikalischen Hörleistungen der SuS sind Indizien dafür, dass diese Entwicklungsmodelle nicht plausibel sind. Gerade weil es ein Alter betrifft, in dem sich die musikalischen Fähigkeiten gerade bei begabten SuS noch weiter entwickeln sollten. Es scheint also möglich, dass ein Anteil der hohen oder niedrigen G‑Faktor-Werte der ersten Datenerhebung als messfehlerbedingte statistische Abweichungen zu betrachten sind, die sich im weiteren Verlauf der Studie in Richtung des Gruppenmittelwerts bewegen.

Für die Praxis der Identifikation von musikalisch begabten Kindern und Jugendlichen bedeutet dies, dass die Anwendung von traditionellen Leistungskriterien auf einem Querschnittsdatensatz möglicherweise dazu führt, dass Individuen mit hohem Leistungspotential nicht entdeckt werden. Die so als begabt eingestuften Individuen können im weiteren Zeitverlauf sogar eine geringere musikalische Leistung als die sich schneller entwickelnden Gleichaltrigen aufweisen, die zunächst als weniger begabt eingestuft wurden. Die Ergebnisse der nach dem TAD-Ansatz modellierten LGMs zeigen demgegenüber, dass erst nach wiederholtem Testen die Einstufung als begabt robuste Aussagen darüber erlaubt, welche Individuen neben überdurchschnittlichen musikalischen Leistungen auch ein hohes Entwicklungspotential haben.

5.2 Prädiktoren für musikalische Begabung

Gemeinsam ist den Ergebnissen aus beiden Ansätzen, dass vor allem die fluide, allgemeine Intelligenz ein relevanter Prädiktor für musikalische Begabung zum ersten Erhebungszeitpunkt darstellen. In Bezug auf den weiteren Verlauf musikalischer Entwicklung zeigen sich im TAD-konformen LGM, abgesehen vom positiven Effekt des Arbeitsgedächtnisses bei älteren SuS noch keine robusten Ergebnisse, was seinen Grund unter anderem an den noch wenigen Erhebungszeitpunkten und durch diverse Filterungen verkleinerten Datensatz haben kann. Insgesamt konnten in der vorliegenden Studie die Leistungen des räumlich-visuellen Arbeitsgedächtnisses, der fluiden sowie allgemeinen Intelligenz, der Persönlichkeitsfaktor „Offenheit“ und die Überzeugung, dass Musikalität und Intelligenz veränderbare Konstrukte sind, als relevante Proxyvariablen identifiziert werden. Die hier vorgestellte Implementierung des TAD-Ansatzes erfüllt also einige der Forderungen, die McIntosh et al. (2018) an moderne Modelle zur Identifizierung von Hochbegabung stellen: Die Fixierung auf absolute Schwellenwerte wird vermieden und die Leistungsentwicklung über einen Zeitraum fließen in die Bewertung des Begabungsstaus mit ein. Zudem erlaubt die Operationalisierung als latentes Variablenmodell die Trennung des Messfehlers vom Zielkonstrukt Begabung. So können kontraintuitive Ergebnisse, wie die negative Entwicklung von Hörleistungen bei musikalisch Begabten, vermieden werden (Goldstein und French 2015). Allerdings bleibt es eine Aufgabe für zukünftige Studien mit robusteren Ergebnissen zu belegen, welche psychologischen Faktoren (d. h. Proxyvariablen) für die musikalische Entwicklung innerhalb des TAD-Ansatzes eine bedeutsame Rolle spielen.

5.3 Limitationen und Erweiterungen in zukünftigen Studien

Als limitierender Faktor dieser Studie ist zu nennen, dass für die meisten SuS nur drei Messzeitpunkte zur Verfügung standen. Da innerhalb der LongGold-Studie gegenwärtig weitere Daten gesammelt werden, sollte es aber in Zukunft leicht möglich sein, die hier erarbeiteten Modellen mit einer größeren Stichprobe, die weitere Messzeitpunkte für dieselben SuS enthält, zu überprüfen.

Eine weitere Einschränkung ist, dass die Stichprobe für die Untersuchung extremer Hochbegabung nicht groß genug bzw. nicht spezialisiert genug ist. Das bedeutet, dass die hier dargestellten Ergebnisse sich hinsichtlich herausragender oder extremer musikalischer Fähigkeiten oder Begabung nicht einfach generalisieren lassen. Eine Validierung der hier vorgestellten Modelle anhand von spezialisierten Populationen (z. B. SuS an Musikschulen oder allgemeinbildenden Schulen mit Musikschwerpunkt) wäre demnach ein wichtiger Schritt, um Aussagen über Entwicklungsverläufe und relevante Prädiktorvariablen auch bei musikalisch Hochbegabten und besonders Leistungsstarken zu ermöglichen.

In Bezug auf die Operationalisierung musikalischer Fähigkeiten ist festzuhalten, dass musikalische Hörtests nur eine von mehreren Fähigkeitsdimensionen abdecken und die Ergebnisse dieser Studie wahrscheinlich nicht eins zu eins auf andere musikalische Fähigkeiten, wie beispielsweise das Instrumentalspiel, übertragbar sind. Jedoch ist es möglich, den hier verwendeten musikalischen G‑Faktor gegen ein latentes Konstrukt auszutauschen, das die Fähigkeit zur musikalischen Produktion repräsentiert, wenn entsprechende Indikatorvariablen erhoben werden können. Mit Ausblick auf zukünftige Untersuchungen zur Identifikation und Entwicklung musikalischer Begabung wäre es zudem wünschenswert, weitere potenzielle Prädiktoren für musikalische Begabung, bspw. den Durchhaltewillen (grit, Duckworth et al. 2007), zu berücksichtigen, die in der Literatur derzeit diskutiert werden. Insgesamt zeigt sich anhand der Nulleffekte bzw. im Rahmen theoretischer Annahmen schwer interpretierbarer Ergebnisse in Bezug auf die Proxyvariablen, dass hier noch weiterer Forschungsbedarf besteht. Vor allem mit dem Alter konfundierte Variablen, wie die Leistung des visuell-räumlichen Arbeitsgedächtnis, sollten in Zukunft anhand von Normwerten in die Analyse miteinbezogen werden, was aufgrund der aktuellen Datenlage für diese Untersuchung noch nicht realisierbar war. In Bezug auf die Erhebungszeiträume könnte es zusätzlich sinnvoll sein, die Entwicklung musikalischer Fähigkeiten in kürzeren Zeitintervallen (z. B. 3 oder 6 Monate) zu erheben, sowie auch produktive musikalische Fähigkeiten (z. B. Instrumentalspiel) zu messen.

5.4 Bedeutung der Ergebnisse und Schlussfolgerungen

Trotz der genannten Einschränkungen besteht ein Vorteil dieser Studie in der Verwendung von allgemein verständlichen Hörtests und einer breiten, nicht spezialisierten Stichprobe. Dies erlaubt es, die Ergebnisse im Sinne einer breiten Population zu interpretieren, für die weder Instrumentalkenntnisse, intensiver Musikunterricht noch besondere Kenntnisse in Musiktheorie oder -terminologie vorausgesetzt werden müssen. Das bedeutet, dass die hier verwendeten Methoden es möglich machen, musikalische Begabung auch für Individuen zu abschätzen, die aufgrund sozialer oder ökonomischer Nachteile keine Instrumentalerfahrung sammeln oder außerschulischen musikalischen Aktivitäten nachgehen konnten. So können nach dem TAD-Ansatz Individuen, die zunächst nicht durch musikalische Höchstleistungen auffallen, aber trotzdem ein überdurchschnittliches musikalisches Entwicklungspotential besitzen, als begabt identifiziert und für musikalische Förderung ausgewählt werden.

Die Kombination aus Tests, die keine besonderen musikbezogenen Voraussetzungen besitzen, und der hier vorgeschlagenen statistischen Operationalisierung des TAD-Ansatzes eröffnet also neue Möglichkeiten für die Identifikation und Entwicklung von musikalischer Begabung. Zusammen mit der Nutzung von Stimulusmaterialien, die sich nicht auf die westliche Kunstmusik beschränken, kann dieser Ansatz somit ein Schritt in Richtung einer inklusiveren Definition von musikalischer Begabung sein, die Musik in ihrer stilistischen und praktischen Breite in der Gesellschaft repräsentiert.