Zusammenfassung
Adaptive Systeme sind gekennzeichnet durch einen Zustandsraum, Operatoren über diesem Zustandsraum, Inputs des Systems aus seiner Umwelt und ein Anpassungsverfahren [Holland 75, S. 28].
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
Literatur
Meist wird das Alphabet dieser Zeichenkette auf die Zeichen ‘0’ und ‘1’ beschränkt. [Goldberg 89, S. 7f], [HOLLAND 75, S. 89]
Dies sind Punkte im Lösungsraum S, die sowohl zur Mutter-wie auch zur Vaterlosung bzgl. der Nachbarschaftsrelation N eine Distanz aufiveisen, die geringer ist, als die zwischen beiden Elternteilen bestehende Distanz.
bezogen auf ein Maximierungsproblem
Ein Vergleich mit Simulated Annealing konnte in diese Tests leider nicht einbezogen werden, da die ersten Ansätze zu SA erst 1983 entwickelt wurden.
Die Grundversion des von Holland dargestellten GA kodiert den eigentlichen Lösungsraum S immer mit Hilfe von Binärstrings, d.h. fir Fälle in denen S sich nicht ‚natürlich‘ als Teilmenge von n darstel len läßt, muß eine geeignete Dekodierfunktion m: S gefunden werden, die jedem Binärstring eine eindeutige Lösung des eigentlichen Lösungsraums S zuordnet.
Da Darwin der Aufbau der DNS nicht bekannt war, verwendete er den Begriff ‚kontinuierlich‘. Natürlich vollzieht sich der Wandel nicht kontinuierlich sondern bedingt durch die kombinatorische Struktur der Chromosomen diskret, aber eben in kleinen und nicht in großen Sprüngen.
Das Fehlen solcher natürlicher Schutzmechanismen vor sinnlosen Paarungsversuchen stellt, wie sich zeigen wird, ein großes Problem künstlicher genetischer Algorithmen dar.
Vgl. zu den folgenden Ausführungen [GOLDBERG 89, S. 28–33] sowie die wesentlich ausfiihrlichere Darstellung in [HOLLAND 75, S. 66–74, 97–111]
Vgl. zu diesem Problem auch [BAKER 87], [HOLLAND 75, S. 94 f].
Diese Sprechweise ‚erwartete Häufigkeit eines Individuums‘ ist insofern etwas unsauber, als natürlich nicht ein Individuum mehrfach in der Population vorkommt, sondern mehrere Individuen identisches Erbmaterial aufweisen.
Unterstellt wird hierbei der sogenannte 1-point-Crossover, der die ersten k Binärzeichen des einen Indi viduums mit den letzten a.-k Zeichen des anderen Elternteils kombiniert.
Das Schema H bleibt sogar dann erhalten, sofern der ausgewechselte Teilstring des Rekombinations partners auch auf das Schema paßt. Hiervon soli jedoch abgesehen werden.
Bessere Näherungen findet man bei [BRIDGEs 87, S. 10–12], [SCHAFFER 87, S. 90, 92].
Vgl. [BRIDGES 87, S. 9], [GOLDBERG 89, S. 31 f], [HOLLAND 75, S. 102 f].
Vgl. [GOLDBERG 89, S. 33], [HOLLAND 75, S. 110 f].
Vgl. [GOLDBERG 89, S. 37], [HOLLAND 75, S. 76 f].
Vgl. [HOLLAND 75, S. 77–83], [GOLDBERG 89, S. 37 11.
Vgl. [GOLDBERG 89, S. 39], [HOLLAND 75, S. 85–87].
Vgl. [HOLLAND 75, S. 75 f.], [BOOKER 87, S. 61] zum auch bei Suchverfahren vorliegenden Dilemmazwischen exploration (Ausforschung) des Suchraumes und »exploitation« (Ausbeutung) bereits gefundener guter Lösungen.
Vgl. [BOOKER 87, S. 61], [GOLDBERG 89, S. 38 f], [HOLLAND 75, S. 87 f].
In der Praxis werden der Selektion häufig Skalierungsmechanismen vorgeschaltet, ohne daß dieseallerdings mit dem bestehenden theoretischen Instrumentarium fundiert würden; vielmehr werden heuristische Argumente angeführt, die den formalen Erkenntnissen, insbesondere dem Fundamentalsatz der genetischen Algorithmen, sogar widersprechen; vgl. [GOLDBERG 89, S. 76 f., 122].
Vgl. [HOLLAND 75, S. 71–74], [SCHAFFER 87, S. 89]; [GOLDBERG 89, S. 40] verwendet den Begriff »implicit parallelism« (impliziter Parallelismus); [GREFENSTETTE 87, S. 49] spricht von »inherent parallelism« (inhärentem Parallelismus).
Zu ähnlicher Kritik kommt auch [BERTONI 93].
Die von Goldberg angegebene Formel [GOLDBERG 89, S. 175 unten] ist in mehrfacher Hinsicht fehler haft: Der Binomiaikoeffizient im Nenner muß (o) lauten. Der Zähler entspricht der ersten Zeile von(G.8), allerdings wird die definierende Länge irrtümlich um eins größer als in der vome [GOLDBERG 89, S. 29] gegebenen Definition angenommen; zudem wird der Fall o = 1 nicht berücksichtigt.
Dies gilt nur unter der Annahme, daß alle Strings stochastisch unabhängig voneinander sind. Diese Bedingung kann zumindest für die Ausgangspopulation durch zufällige Belegung erfiillt werden, so daß wenigstens zu Beginn seines Wirkens dem genetischen Algorithmus die berechnete Anzahl von Schemata zur Verfügung steht. Auch [HOLLAND 75, S. 72] geht von dieser Prämisse aus.
Die Auswirkungen des Ändern eines bestimmten Bits oder einer Bitgruppe auf die Zielfunktion sind also abhängig vom augenblicklichen Wert anderer Bits.
Es gilt also f(11) f(00), f(11) j101), J(11) f(10) [GOLDBERG 87, S. 77].
Vgl. [MOHLENBEIN 91, S. 324], [GOLDBERG 89, S. 46].
Es wird hierbei immer von Maximierungsproblemen ausgegangen.
Hierbei kann statt der relativen Fitneß natürlich auch die absolute Fitneß eines jeden Individuums (oder zur Vermeidung von großen Rundungsfehlern ein beliebiges Vielfaches davon) herangezogen werden.
jeweils mit Zurücklegen der Lose
Hierdurch werden dem schlechtesten Individuum pmtn, dem besten Pmax Lose zugebilligt.
Hierunter versteht man das Anfertigen einer identischen Kopie, also eines ‚Clones‘ eines gegebenen In dividuums.
Vielmehr werden z.B. Anfahrreihenfolgcn erzeugt, in denen Stadt 3 mehrfach, Stadt 4 dagegen überhaupt nicht enthalten ist.
Unter dem Generation-Lag versteht man eine Anzahl von sehr guten Individuen, die auf jeden Fall (ohne Mutation und Crossover) in die Folgegeneration übernommen werden. Ein Generation-Lag von 1 vermeidet beispielsweise, daß das beste Individuum einer Population ausstirbt, bevor ein besseres gefunden wurde.
Vgl. [DoMscmcs 90, S. 99], [CROES 58, S. 791–812], [LIN 65, S. 2245–2269].
also Kanten, die in beiden Elternteilen vorkommen
Natürlich sind auch die bislang vorgestellten Crossover-Operatoren problemklassenspezifisch in dem Sinne, daß sie lediglich auf Reihenfolgeprobleme angewandt werden sollten. Wenn hier allerdings von ‚problemspezifischem‘ Wissen gesprochen wird, so handelt es sich um Wissen bzgl. des vorliegenden TSP (also der Instanz einer Klasse von Problemen), nämlich Wissen um die Distanzen der einzelnen Städte.
In den meisten Fällen interessiert hierbei nicht das absolute Zeitverhalten sondern nur die Abhängigkeit der Lösungszeit von der Problemgröße. Die Komplexitätstheorie kennt hierfür die sog. O-Notation, die den Rechenaufwand unter Vernachlässigung aller Koeffizienten als Funktion der Problemgröße ausdrückt. Für eine an kombinatorischen Optimimierungsproblemen orientierte Einführung in die Komplexitätstheorie sei auf [PAPADIMITRIVU 821 verwiesen.
Theoretisch ist dies natürlich sehr wohl möglich. Wie sich in den Kapiteln 5 und 7 zeigen wird, bieten sich bei stochastischen Suchverfahren wie GA und SA hierfür die Darstellung des Algorithmus als Markov-Kette an. Allerdings ist der Umfang des Zustandsraumes dieser Markovkette identisch mit der Kardinalität des Lösungsraums S. Dies bedeutet, daß die praktische Berechnung der Wahrscheinlichkeitsverteilung über die einzelnen Zustände mindestens ebenso aufwendig wird wie die Totalenumeration aller Lösungen des Problems und somit aus ‚technischen Gründen‘ unmöglich ist.
Bei CVRP ist ein Bezug auf die vorhandenen Problemstellungen nur zum Teil zu beobachten, mitunter wird auf stochastisch generierte Problemstellungen mit einer bestimmten Verteilung der Kunden auf einer vorgegebenen Fläche verwiesen.
Die Konzeption von ‚Problemgeneratoren‘, die TSP mit bekannter optimaler Lösung konstruktiv erzeu gen, wird z.B. von Arthur [ARTHUR 88] erörtert. Insbesondere für euklidische Problemstellungen ist es nach diesen Ausfihrungen kaum möglich, solche Konstruktionen durchzuführen: Die entstehenden Problemstellungen können mit den bekannten Heuristiken bedeutend einfacher gelöst werden als zufällig generierte TSP, deren optimale Lösung nicht bekannt ist.
Um die (fehleranfällige wie zeitraubende) manuelle Erfassung der Koordinaten zu umgehen, wurde auf die von REINELT BIXBY [REINELT 91] zusammengestellte Problembibliothek TSPLIB in der Version 1.2 zurückgegriffen. Sie enthält nahezu alle in der Literatur diskutierten Standardprobleme und wird im INTERNET kostenlos zur Verfügung gestellt. Der öffentliche Zugriff ist mittels FTP (FileTransferProtocol) über Adresse 128.42.1.30 möglich. (Directory: /public/tsplib.tar). Auch für andere kombinatorische Optimierungsprobleme sind Standardproblemstellungen auf elektronischem Wege verfügbar. Siehe hierzu [BEASLEY 90].
Zum Problem der Rundungsfehler vgl. auch [LAwLER 85, S.61].
Andere Gründe bedingen ein solches Vorgehen bei den Schnittebenen-Verfahren von Grötschel und Padberg [GROTSCHEL 911: Dort werden die zur ganzzahligen Linearen Programmierung benötigten Tableaus stets so pivotiert, daß ihre Ganzzahligkeit erhalten bleibt. Folglich müssen auch die Distanzenmatrizen der Problemstellung ganzzahlige Werte beinhalten.
bedingt durch das Ziehen der Quadratwurzel
Genau dieses wurde vom Autor der vorliegenden Arbeit in allen Berechnungen konsequent getan.
Verwendet wurde Lucid Common Lisp 4.0 auf SUN-Workstations mit einfacher Gleitkomma-Präzision.
Für die kürzeren, linken Touren des TSP76 und TSP101 konnte (im Gegensatz zum TSP51) die Optimalität vom Autor der vorliegenden Arbeit nicht nachgewiesen werden. Es ist also durchaus möglich, daß noch kürzere Touren existieren, obwohl dies bei der Häufigkeit, mit der die Lösungen von dem später vorgestellten COSA-Verfahren reproduziert wurden, sehr unwahrscheinlich ist.
Es wird in der Literatur davon ausgegangen, daß Heterosexualität und Diploidität des Chromoso mensatzes dazu dienen, rezessive Erbmerkmale, die sich in bestimmten Zeiten als sinnvoll herausgestellt haben, durch Phasen der Evolution zu ‚retten‘, in denen sie keinen Selektionsvorteil bewirken und bei haploidem Chromosomensatz schnell vom Aussterben bedroht wären. Ändern sich die Umweltbedingungen erneut, so ‚erinnert‘ sich die Evolution des rezessiven Merkmals. Da im Rahmen der hier behandelten Problemstellungen die Umwelt (sprich Zielfunktion) stets über die gesamte Evolution konstant bleibt, kann diese ‚Memory-Eigenschaft‘ keinen Gewinn mit sich bringen.
Bei der angegebenen Standardabweichung handelt es sich immer um die mit Hilfe der Stichprobe geschätzte Standardabweichung der Grundgesamtheit.
Genau diese Größe ist aber ein erstes Indiz für die mangelnde Fähigkeit von Crossover-Operatoren, bei geringen Unterschieden im Erbmaterial der Individuen überhaupt noch neue Punkte im Lösungsraum zu explorieren.
nur Individuen, die in die nächste Generation übernommen werden.
nicht notwendigerweise in der gleichen Reihenfolge
außer für das Sexual-Populationsmodell
Eine -Relation bedeutet, daß der links davon stehende Operator den rechts davon stehenden signify kant dominiert, das Gleichheitszeichen steht dafür, daß die Unterschiede zwischen TM und GX nicht signifikant sind. Die Werte in Klammem geben die jeweils über 100 Läufe gemittelte Tourlange des besten Individuums der letzten Generation an.
Die Werte beziehen sich jeweils auf eine SUN Sparc Station 2.
von diesen jeweils die Hallte durch Inversions-, die andere Hälfte durch Translokations-Mutation.
Für jede Parameterkombination wurden 20 Testreihen zu je 500 Generationen am Beispiel TSP51 durchgeführt.
Man könnte gegen dieses Verfahren einwenden, die Mutation dürfte nicht als Erzeugung von veränderten Kopien der Ausgangsindividuen verstanden werden, die selbst auch wieder der Selektion unterliegen, sondern müßte vielmehr destruktiv sein in dem Sinne, daß bei der Paarung zweier Individuen mittels Crossover eine kleine Veränderung der ‚Keimzellen‘ von Mutter und/oder Vater stattfindet, die sich unmittelbar auf das zu zeugende Kind auswirkt. Entsprechende Versuche zu dieser Methode zeigten analoge Resultate: Auch dieser ‚mutierende Crossover‘ zeigte schlechtere Ergebnisse als die puren Mutationsoperatoren und konnte auch in Kombination mit diesen nicht überzeugen.
Natürlich sind sie leider meistens in unterschiedlichen Individuen enthalten.
basierend auf zufällig gewählten Ausgangs-Permutationen.
Ein weiterer Schwachpunkt des Nearest-Neighbor-Verfahrens besteht im Vergleich zum 2-opt darin, daß überhaupt nur 51 verschiedene Touren produziert werden können: Je nach gewählter Anfangsstadt liefert das Verfahren immer die gleiche Nearest-Neighbor-Tour. Beim 2-opt-Verfahren ist dagegen die Anzahl möglicher 2-optimaler Touren, die erzeugt werden können, bei den meisten Problemen sehr groß.
Einc mittels 2-opt-one verbesserte Tour ist somit nicht notwendigerweise überschneidungsfrei. Die Mehrfachanwendung des 2-opt-one auf eine bestimmte Tour, bis keine Verbesserung mehr erzielt werden kann, entspricht im Ergebnis genau dem eines 2-opt.
Hierunter sollen solche Kanten verstanden werden, die zwar in 2-optimalen Touren sehr häufig vor kommen, jedoch nicht Bestandteil des globalen Optimums sind.
Der Drang vieler Autoren zur Parallelisierung scheint bisweilen eher aus ungenutzter Parallelrechner-Hardware oder einem falschen Verständnis des ‚impliziten Parallelismus‘ begründet zu sein.
Dies bedeutet jedoch keineswegs, daß dieser negative Effekt nicht durch eine insgesamt größere Anzahl bearbeiteter Individuen und Generationen bei Vorliegen eines Parallelrechners kompensiert werden kann. Es soll lediglich festgestellt werden, daß die künstliche Aufteilung in mehrere Teilpopulationen (auf einem Rechner) keinen Sinn macht.
Generiert wurden in jeder Generation je 20 Nachfahren per Inversion und 20 per Translokation. Eser folgten wiederum 100 Testläufe je Parametrisierung.
Der Anstieg der Rechenzeit bei gleicher Generationen- und Nachkommenzahl wird hervorgerufen durch den mit der Problemgröße ansteigenden Zeitbedarf der einzelnen Inversionen und Translokationen.
Rights and permissions
Copyright information
© 1995 Springer Fachmedien Wiesbaden
About this chapter
Cite this chapter
Wendt, O. (1995). Genetische Algorithmen (GA). In: Tourenplanung durch Einsatz naturanaloger Verfahren. Gabler Edition Wissenschaft. Deutscher Universitätsverlag, Wiesbaden. https://doi.org/10.1007/978-3-663-09046-5_4
Download citation
DOI: https://doi.org/10.1007/978-3-663-09046-5_4
Publisher Name: Deutscher Universitätsverlag, Wiesbaden
Print ISBN: 978-3-8244-6181-3
Online ISBN: 978-3-663-09046-5
eBook Packages: Springer Book Archive