Genetische Algorithmen (GA)

Wendt, Oliver

doi:10.1007/978-3-663-09046-5_4

Oliver Wendt

Part of the book series: Gabler Edition Wissenschaft ((GEWLV))

216 Accesses

Zusammenfassung

Adaptive Systeme sind gekennzeichnet durch einen Zustandsraum, Operatoren über diesem Zustandsraum, Inputs des Systems aus seiner Umwelt und ein Anpassungsverfahren [Holland 75, S. 28].

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Log in via an institution

Chapter: USD 29.95; Price excludes VAT (USA)

eBook: USD 49.99; Price excludes VAT (USA)

Softcover Book: USD 49.99; Price excludes VAT (USA)

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Preview

Unable to display preview. Download preview PDF.

Literatur

Meist wird das Alphabet dieser Zeichenkette auf die Zeichen ‘0’ und ‘1’ beschränkt. [Goldberg 89, S. 7f], [HOLLAND 75, S. 89]
Google Scholar
Dies sind Punkte im Lösungsraum S, die sowohl zur Mutter-wie auch zur Vaterlosung bzgl. der Nachbarschaftsrelation N eine Distanz aufiveisen, die geringer ist, als die zwischen beiden Elternteilen bestehende Distanz.
Google Scholar
bezogen auf ein Maximierungsproblem
Google Scholar
Ein Vergleich mit Simulated Annealing konnte in diese Tests leider nicht einbezogen werden, da die ersten Ansätze zu SA erst 1983 entwickelt wurden.
Google Scholar
Die Grundversion des von Holland dargestellten GA kodiert den eigentlichen Lösungsraum S immer mit Hilfe von Binärstrings, d.h. fir Fälle in denen S sich nicht ‚natürlich‘ als Teilmenge von n darstel len läßt, muß eine geeignete Dekodierfunktion m: S gefunden werden, die jedem Binärstring eine eindeutige Lösung des eigentlichen Lösungsraums S zuordnet.
Google Scholar
Da Darwin der Aufbau der DNS nicht bekannt war, verwendete er den Begriff ‚kontinuierlich‘. Natürlich vollzieht sich der Wandel nicht kontinuierlich sondern bedingt durch die kombinatorische Struktur der Chromosomen diskret, aber eben in kleinen und nicht in großen Sprüngen.
Google Scholar
Das Fehlen solcher natürlicher Schutzmechanismen vor sinnlosen Paarungsversuchen stellt, wie sich zeigen wird, ein großes Problem künstlicher genetischer Algorithmen dar.
Google Scholar
Vgl. zu den folgenden Ausführungen [GOLDBERG 89, S. 28–33] sowie die wesentlich ausfiihrlichere Darstellung in [HOLLAND 75, S. 66–74, 97–111]
Google Scholar
Vgl. zu diesem Problem auch [BAKER 87], [HOLLAND 75, S. 94 f].
Google Scholar
Diese Sprechweise ‚erwartete Häufigkeit eines Individuums‘ ist insofern etwas unsauber, als natürlich nicht ein Individuum mehrfach in der Population vorkommt, sondern mehrere Individuen identisches Erbmaterial aufweisen.
Google Scholar
Unterstellt wird hierbei der sogenannte 1-point-Crossover, der die ersten k Binärzeichen des einen Indi viduums mit den letzten a.-k Zeichen des anderen Elternteils kombiniert.
Google Scholar
Das Schema H bleibt sogar dann erhalten, sofern der ausgewechselte Teilstring des Rekombinations partners auch auf das Schema paßt. Hiervon soli jedoch abgesehen werden.
Google Scholar
Bessere Näherungen findet man bei [BRIDGEs 87, S. 10–12], [SCHAFFER 87, S. 90, 92].
Google Scholar
Vgl. [BRIDGES 87, S. 9], [GOLDBERG 89, S. 31 f], [HOLLAND 75, S. 102 f].
Google Scholar
Vgl. [GOLDBERG 89, S. 33], [HOLLAND 75, S. 110 f].
Google Scholar
Vgl. [GOLDBERG 89, S. 37], [HOLLAND 75, S. 76 f].
Google Scholar
Vgl. [HOLLAND 75, S. 77–83], [GOLDBERG 89, S. 37 11.
Google Scholar
Vgl. [GOLDBERG 89, S. 39], [HOLLAND 75, S. 85–87].
Google Scholar
Vgl. [HOLLAND 75, S. 75 f.], [BOOKER 87, S. 61] zum auch bei Suchverfahren vorliegenden Dilemmazwischen exploration (Ausforschung) des Suchraumes und »exploitation« (Ausbeutung) bereits gefundener guter Lösungen.
Google Scholar
Vgl. [BOOKER 87, S. 61], [GOLDBERG 89, S. 38 f], [HOLLAND 75, S. 87 f].
Google Scholar
In der Praxis werden der Selektion häufig Skalierungsmechanismen vorgeschaltet, ohne daß dieseallerdings mit dem bestehenden theoretischen Instrumentarium fundiert würden; vielmehr werden heuristische Argumente angeführt, die den formalen Erkenntnissen, insbesondere dem Fundamentalsatz der genetischen Algorithmen, sogar widersprechen; vgl. [GOLDBERG 89, S. 76 f., 122].
Google Scholar
Vgl. [HOLLAND 75, S. 71–74], [SCHAFFER 87, S. 89]; [GOLDBERG 89, S. 40] verwendet den Begriff »implicit parallelism« (impliziter Parallelismus); [GREFENSTETTE 87, S. 49] spricht von »inherent parallelism« (inhärentem Parallelismus).
Google Scholar
Zu ähnlicher Kritik kommt auch [BERTONI 93].
Google Scholar
Die von Goldberg angegebene Formel [GOLDBERG 89, S. 175 unten] ist in mehrfacher Hinsicht fehler haft: Der Binomiaikoeffizient im Nenner muß (o) lauten. Der Zähler entspricht der ersten Zeile von(G.8), allerdings wird die definierende Länge irrtümlich um eins größer als in der vome [GOLDBERG 89, S. 29] gegebenen Definition angenommen; zudem wird der Fall o = 1 nicht berücksichtigt.
Google Scholar
Dies gilt nur unter der Annahme, daß alle Strings stochastisch unabhängig voneinander sind. Diese Bedingung kann zumindest für die Ausgangspopulation durch zufällige Belegung erfiillt werden, so daß wenigstens zu Beginn seines Wirkens dem genetischen Algorithmus die berechnete Anzahl von Schemata zur Verfügung steht. Auch [HOLLAND 75, S. 72] geht von dieser Prämisse aus.
Google Scholar
Die Auswirkungen des Ändern eines bestimmten Bits oder einer Bitgruppe auf die Zielfunktion sind also abhängig vom augenblicklichen Wert anderer Bits.
Google Scholar
Es gilt also f(11) f(00), f(11) j101), J(11) f(10) [GOLDBERG 87, S. 77].
Google Scholar
Vgl. [MOHLENBEIN 91, S. 324], [GOLDBERG 89, S. 46].
Google Scholar
Es wird hierbei immer von Maximierungsproblemen ausgegangen.
Google Scholar
Hierbei kann statt der relativen Fitneß natürlich auch die absolute Fitneß eines jeden Individuums (oder zur Vermeidung von großen Rundungsfehlern ein beliebiges Vielfaches davon) herangezogen werden.
Google Scholar
jeweils mit Zurücklegen der Lose
Google Scholar
Hierdurch werden dem schlechtesten Individuum pmtn, dem besten Pmax Lose zugebilligt.
Google Scholar
Hierunter versteht man das Anfertigen einer identischen Kopie, also eines ‚Clones‘ eines gegebenen In dividuums.
Google Scholar
Vielmehr werden z.B. Anfahrreihenfolgcn erzeugt, in denen Stadt 3 mehrfach, Stadt 4 dagegen überhaupt nicht enthalten ist.
Google Scholar
Unter dem Generation-Lag versteht man eine Anzahl von sehr guten Individuen, die auf jeden Fall (ohne Mutation und Crossover) in die Folgegeneration übernommen werden. Ein Generation-Lag von 1 vermeidet beispielsweise, daß das beste Individuum einer Population ausstirbt, bevor ein besseres gefunden wurde.
Google Scholar
Vgl. [DoMscmcs 90, S. 99], [CROES 58, S. 791–812], [LIN 65, S. 2245–2269].
Google Scholar
also Kanten, die in beiden Elternteilen vorkommen
Google Scholar
Natürlich sind auch die bislang vorgestellten Crossover-Operatoren problemklassenspezifisch in dem Sinne, daß sie lediglich auf Reihenfolgeprobleme angewandt werden sollten. Wenn hier allerdings von ‚problemspezifischem‘ Wissen gesprochen wird, so handelt es sich um Wissen bzgl. des vorliegenden TSP (also der Instanz einer Klasse von Problemen), nämlich Wissen um die Distanzen der einzelnen Städte.
Google Scholar
In den meisten Fällen interessiert hierbei nicht das absolute Zeitverhalten sondern nur die Abhängigkeit der Lösungszeit von der Problemgröße. Die Komplexitätstheorie kennt hierfür die sog. O-Notation, die den Rechenaufwand unter Vernachlässigung aller Koeffizienten als Funktion der Problemgröße ausdrückt. Für eine an kombinatorischen Optimimierungsproblemen orientierte Einführung in die Komplexitätstheorie sei auf [PAPADIMITRIVU 821 verwiesen.
Google Scholar
Theoretisch ist dies natürlich sehr wohl möglich. Wie sich in den Kapiteln 5 und 7 zeigen wird, bieten sich bei stochastischen Suchverfahren wie GA und SA hierfür die Darstellung des Algorithmus als Markov-Kette an. Allerdings ist der Umfang des Zustandsraumes dieser Markovkette identisch mit der Kardinalität des Lösungsraums S. Dies bedeutet, daß die praktische Berechnung der Wahrscheinlichkeitsverteilung über die einzelnen Zustände mindestens ebenso aufwendig wird wie die Totalenumeration aller Lösungen des Problems und somit aus ‚technischen Gründen‘ unmöglich ist.
Google Scholar
Bei CVRP ist ein Bezug auf die vorhandenen Problemstellungen nur zum Teil zu beobachten, mitunter wird auf stochastisch generierte Problemstellungen mit einer bestimmten Verteilung der Kunden auf einer vorgegebenen Fläche verwiesen.
Google Scholar
Die Konzeption von ‚Problemgeneratoren‘, die TSP mit bekannter optimaler Lösung konstruktiv erzeu gen, wird z.B. von Arthur [ARTHUR 88] erörtert. Insbesondere für euklidische Problemstellungen ist es nach diesen Ausfihrungen kaum möglich, solche Konstruktionen durchzuführen: Die entstehenden Problemstellungen können mit den bekannten Heuristiken bedeutend einfacher gelöst werden als zufällig generierte TSP, deren optimale Lösung nicht bekannt ist.
Google Scholar
Um die (fehleranfällige wie zeitraubende) manuelle Erfassung der Koordinaten zu umgehen, wurde auf die von REINELT BIXBY [REINELT 91] zusammengestellte Problembibliothek TSPLIB in der Version 1.2 zurückgegriffen. Sie enthält nahezu alle in der Literatur diskutierten Standardprobleme und wird im INTERNET kostenlos zur Verfügung gestellt. Der öffentliche Zugriff ist mittels FTP (FileTransferProtocol) über Adresse 128.42.1.30 möglich. (Directory: /public/tsplib.tar). Auch für andere kombinatorische Optimierungsprobleme sind Standardproblemstellungen auf elektronischem Wege verfügbar. Siehe hierzu [BEASLEY 90].
Google Scholar
Zum Problem der Rundungsfehler vgl. auch [LAwLER 85, S.61].
Google Scholar
Andere Gründe bedingen ein solches Vorgehen bei den Schnittebenen-Verfahren von Grötschel und Padberg [GROTSCHEL 911: Dort werden die zur ganzzahligen Linearen Programmierung benötigten Tableaus stets so pivotiert, daß ihre Ganzzahligkeit erhalten bleibt. Folglich müssen auch die Distanzenmatrizen der Problemstellung ganzzahlige Werte beinhalten.
Google Scholar
bedingt durch das Ziehen der Quadratwurzel
Google Scholar
Genau dieses wurde vom Autor der vorliegenden Arbeit in allen Berechnungen konsequent getan.
Google Scholar
Verwendet wurde Lucid Common Lisp 4.0 auf SUN-Workstations mit einfacher Gleitkomma-Präzision.
Google Scholar
Für die kürzeren, linken Touren des TSP76 und TSP101 konnte (im Gegensatz zum TSP51) die Optimalität vom Autor der vorliegenden Arbeit nicht nachgewiesen werden. Es ist also durchaus möglich, daß noch kürzere Touren existieren, obwohl dies bei der Häufigkeit, mit der die Lösungen von dem später vorgestellten COSA-Verfahren reproduziert wurden, sehr unwahrscheinlich ist.
Google Scholar
Es wird in der Literatur davon ausgegangen, daß Heterosexualität und Diploidität des Chromoso mensatzes dazu dienen, rezessive Erbmerkmale, die sich in bestimmten Zeiten als sinnvoll herausgestellt haben, durch Phasen der Evolution zu ‚retten‘, in denen sie keinen Selektionsvorteil bewirken und bei haploidem Chromosomensatz schnell vom Aussterben bedroht wären. Ändern sich die Umweltbedingungen erneut, so ‚erinnert‘ sich die Evolution des rezessiven Merkmals. Da im Rahmen der hier behandelten Problemstellungen die Umwelt (sprich Zielfunktion) stets über die gesamte Evolution konstant bleibt, kann diese ‚Memory-Eigenschaft‘ keinen Gewinn mit sich bringen.
Google Scholar
Bei der angegebenen Standardabweichung handelt es sich immer um die mit Hilfe der Stichprobe geschätzte Standardabweichung der Grundgesamtheit.
Google Scholar
Genau diese Größe ist aber ein erstes Indiz für die mangelnde Fähigkeit von Crossover-Operatoren, bei geringen Unterschieden im Erbmaterial der Individuen überhaupt noch neue Punkte im Lösungsraum zu explorieren.
Google Scholar
nur Individuen, die in die nächste Generation übernommen werden.
Google Scholar
nicht notwendigerweise in der gleichen Reihenfolge
Google Scholar
außer für das Sexual-Populationsmodell
Google Scholar
Eine -Relation bedeutet, daß der links davon stehende Operator den rechts davon stehenden signify kant dominiert, das Gleichheitszeichen steht dafür, daß die Unterschiede zwischen TM und GX nicht signifikant sind. Die Werte in Klammem geben die jeweils über 100 Läufe gemittelte Tourlange des besten Individuums der letzten Generation an.
Google Scholar
Die Werte beziehen sich jeweils auf eine SUN Sparc Station 2.
Google Scholar
von diesen jeweils die Hallte durch Inversions-, die andere Hälfte durch Translokations-Mutation.
Google Scholar
Für jede Parameterkombination wurden 20 Testreihen zu je 500 Generationen am Beispiel TSP51 durchgeführt.
Google Scholar
Man könnte gegen dieses Verfahren einwenden, die Mutation dürfte nicht als Erzeugung von veränderten Kopien der Ausgangsindividuen verstanden werden, die selbst auch wieder der Selektion unterliegen, sondern müßte vielmehr destruktiv sein in dem Sinne, daß bei der Paarung zweier Individuen mittels Crossover eine kleine Veränderung der ‚Keimzellen‘ von Mutter und/oder Vater stattfindet, die sich unmittelbar auf das zu zeugende Kind auswirkt. Entsprechende Versuche zu dieser Methode zeigten analoge Resultate: Auch dieser ‚mutierende Crossover‘ zeigte schlechtere Ergebnisse als die puren Mutationsoperatoren und konnte auch in Kombination mit diesen nicht überzeugen.
Google Scholar
Natürlich sind sie leider meistens in unterschiedlichen Individuen enthalten.
Google Scholar
basierend auf zufällig gewählten Ausgangs-Permutationen.
Google Scholar
Ein weiterer Schwachpunkt des Nearest-Neighbor-Verfahrens besteht im Vergleich zum 2-opt darin, daß überhaupt nur 51 verschiedene Touren produziert werden können: Je nach gewählter Anfangsstadt liefert das Verfahren immer die gleiche Nearest-Neighbor-Tour. Beim 2-opt-Verfahren ist dagegen die Anzahl möglicher 2-optimaler Touren, die erzeugt werden können, bei den meisten Problemen sehr groß.
Google Scholar
Einc mittels 2-opt-one verbesserte Tour ist somit nicht notwendigerweise überschneidungsfrei. Die Mehrfachanwendung des 2-opt-one auf eine bestimmte Tour, bis keine Verbesserung mehr erzielt werden kann, entspricht im Ergebnis genau dem eines 2-opt.
Google Scholar
Hierunter sollen solche Kanten verstanden werden, die zwar in 2-optimalen Touren sehr häufig vor kommen, jedoch nicht Bestandteil des globalen Optimums sind.
Google Scholar
Der Drang vieler Autoren zur Parallelisierung scheint bisweilen eher aus ungenutzter Parallelrechner-Hardware oder einem falschen Verständnis des ‚impliziten Parallelismus‘ begründet zu sein.
Google Scholar
Dies bedeutet jedoch keineswegs, daß dieser negative Effekt nicht durch eine insgesamt größere Anzahl bearbeiteter Individuen und Generationen bei Vorliegen eines Parallelrechners kompensiert werden kann. Es soll lediglich festgestellt werden, daß die künstliche Aufteilung in mehrere Teilpopulationen (auf einem Rechner) keinen Sinn macht.
Google Scholar
Generiert wurden in jeder Generation je 20 Nachfahren per Inversion und 20 per Translokation. Eser folgten wiederum 100 Testläufe je Parametrisierung.
Google Scholar
Der Anstieg der Rechenzeit bei gleicher Generationen- und Nachkommenzahl wird hervorgerufen durch den mit der Problemgröße ansteigenden Zeitbedarf der einzelnen Inversionen und Translokationen.
Google Scholar

Download references

Authors

Oliver Wendt
View author publications
You can also search for this author in PubMed Google Scholar

Rights and permissions

Reprints and permissions

Copyright information

About this chapter

Cite this chapter

Wendt, O. (1995). Genetische Algorithmen (GA). In: Tourenplanung durch Einsatz naturanaloger Verfahren. Gabler Edition Wissenschaft. Deutscher Universitätsverlag, Wiesbaden. https://doi.org/10.1007/978-3-663-09046-5_4

Download citation

DOI: https://doi.org/10.1007/978-3-663-09046-5_4
Publisher Name: Deutscher Universitätsverlag, Wiesbaden
Print ISBN: 978-3-8244-6181-3
Online ISBN: 978-3-663-09046-5
eBook Packages: Springer Book Archive

Publish with us

Policies and ethics