1 Einleitung

Die sogenannte letzte Meile gehört zu dem zeit- und kostenintensivsten Teil einer Lieferkette. Gerade in dicht bebauten urbanen Räumen kann hier ein Liefersystem mit Lastenrädern gegenüber der konventionellen Belieferung mit Lastkraftwagen viele Vorteile bieten. Zum einen sind Lastenräder emissionsfrei und haben damit Zugang zu beschränkten Bereichen wie Umweltschutz- oder Fußgängerzonen. Gleichzeitig verursachen Lastenräder keinen Lärm und benötigen kein Parken in zweiter Reihe, was zu einer lebenswerteren Stadt beiträgt.

Fahrraddienste können nicht nur in der Warenzustellung Anwendung finden. Auch andere Dienstleistungen, in denen mehrere Standorte besucht werden müssen, können mit (Lasten-)Fahrrädern absolviert werden. Beispiele hierfür sind ambulante Pflegedienste oder das Einsammeln von Recyclingprodukten. Je nach Anwendungsfall kann die Dienstleistung ausschließlich mit Lastenrädern oder auch in Kombination mit Elektrofahrzeugen gestaltet werden. Letzteres eignet sich insbesondere für zweistufige Liefermodelle, in denen Waren an Umschlagsplätze von größeren Fahrzeugen auf Lastenräder umgeladen werden.

In der Tourenplanung geht es darum, mit den vorhandenen Ressourcen (Räder, Fahrer:innen, Depots und UmschlagplätzeFootnote 1) alle Aufträge (z. B. das Ausliefern aller Pakete) durchzuführen. Hierfür müssen in der Regel alle Standorte von Kund:innen besucht werden. Das Ziel der Tourenplanung ist zu bestimmen, wie diese verschiedenen Standorte abgefahren und so zu einer Tour zusammengefügt werden. Dieses Kapitel stellt hierfür zunächst die verschiedenen Planungsebenen vor, welche bei der Bestimmung von Touren zum Tragen kommen. Anschließend wird ein Blick auf die benötigten Ressourcen geworfen. Der darauffolgende Abschnitt erläutert, wie das Tourenplanungsmodell mathematische formuliert und gelöst werden kann.

2 Planungsebenen in der Tourenplanung

In der Touren- und Auftragsplanung werden laut Muchna et al. (2021) die drei Hauptebenen der strategischen, taktischen und operativen Planung unterschieden. Die Ebene der strategischen Planung beschäftigt sich damit, übergeordnete Strategien für bestimmte Geschäftsfelder auf lange Sicht festzulegen. Der Planungshorizont beträgt in der Regel fünf bis zehn Jahre. Für diesen Zeitraum muss das Unternehmen die strategischen Erfolgsfaktoren erkennen und nutzbar machen. Welche Faktoren hier relevant sind, ergibt sich aus dem Zusammenspiel von zahlreichen Komponenten. Hierzu gehören das Unternehmen selbst, die Qualifikation seiner Mitarbeiter:innen, dessen Kooperationsfähigkeit und -bereitschaft mit anderen Unternehmen sowie dessen Investitionsintensität, aber auch die staatlichen und gesellschaftlichen Rahmenbedingungen und das Marktgeschehen (Ehrmann 2017; Wöhe 2016). Eine Entscheidung auf strategischer Ebene kann beispielsweise das Festlegen von Standorten für Depots oder Umschlagplätze (siehe Kap. 11) oder die Bestimmung der Lieferflottengröße betreffen. Beides sind langfristige Entscheidungen, die einen großen Einfluss auf die späteren Planungsebenen haben.

Die taktische Planungsebene umfasst in der Regel einen Zeitraum von bis zu fünf Jahren. Auf dieser Stufe werden detailliertere Planungen und Vorgaben realisiert, welche durch die Führungsebene der Geschäftsbereiche festgelegt werden (Muchna et al. 2021). Dies kann beispielsweise die Definition der Ablaufphasen im Jahresmaßstab beinhalten (Gleißner und Femerling 2012; Scholl 2008). Ein Beispiel für eine taktische Entscheidung stellt das Festlegen einer Rahmentour dar. Rahmentouren bleiben über mehrere Monate oder Jahre bestehen und werden nur bei grundlegenden Änderungen angepasst. Dies kann insbesondere dann sinnvoll sein, wenn Unternehmen einen festen Stamm an Kund:innen und eine sichere, kontinuierliche Auftragslage aufweisen. In einigen Unternehmen werden zudem Grobpläne für Wochen oder Monate erstellt, was die Personalplanung erleichtert und eine frühzeitige Avisierung von Lieferfenster ermöglicht. In dieser Hinsicht überlappt die die taktische Planung häufig mit der operativen Planung – die Grenzen der zeitlichen Horizonte sind nicht zwingend trennscharf.

Die operative Planungsebene betrifft das Tagesgeschäft und stellt damit die hierarchisch unterste Planungsstufe dar, siehe Muchna et al. (2021). Die Entscheidungen der operativen Planung unterscheiden sich zwischen Unternehmen sowie Geschäftsfeldern (Gleißner und Femerling 2012; Ehrmann 2017) und werden meist von den Leitungen der Funktionsabteilungen verantwortet. Die operative Planung umfasst sehr detaillierte und weit aufgegliederte Umsetzungsschritte, die sich auf kurzfristige Zeiträume wie Monate, Wochen oder Tage beziehen. Somit ergänzt sie die strategische und taktische Planung und ist insbesondere dann wichtig, wenn sich ändernde Rahmenbedingungen vorliegen. Dies ist beispielsweise bei einem ständig wechselnden Stamm an Kund:innen oder unsicherer Auftragslage der Fall. Häufig wird auf der operativen Ebene nur für denselben oder den nächsten Tag geplant, um möglichst alle vorhandenen Informationen für eine fundierte Entscheidung miteinzubeziehen.

3 Ressourcenplanung

Bei der Planung einer Lastenradbelieferung spielen alle unternehmensüblichen Ressourcen eine Rolle. Allerdings geht dieses Kapitel nicht auf Gemeinkosten wie Infrastruktur, Energie, Verwaltung, Marketing, Vertrieb oder Betriebskosten ein. Vielmehr soll ein detaillierter Einblick auf lastenradspezifische Ressourcen gegeben werden. Auch wenn diese auf den ersten Blick in einigen Punkten deckungsgleich mit einer traditionellen Belieferung auf der letzten Meile erscheinen, so liegen doch einige Unterschiede vor, insbesondere auf operativer Ebene.

Im Bereich Personalplanung lohnt es sich, einen genaueren Blick auf die Bereiche Abholung und Auslieferung, Warenhandling, Disposition, Fuhrparkmanagement und Lagermanagement zu werfen. Während grundsätzliche Regelungen zu Lenk- und Ruhezeiten einzuhalten sind, spielen diese bei den eher kürzeren Tourenlängen meist eine untergeordnete Rolle in der Planung. Arbeitszeitregelungen, Lieferzeitfenster, Fixtermine sowie die Entscheidung über eine zusätzliche Abholung von Gütern haben dagegen einen großen Einfluss auf die Personalplanung. Da gefahrene Touren häufig kürzer sind als in der traditionellen Belieferung, können diese besser hinsichtlich der Arbeitszeiten der Mitarbeitenden aufgeteilt werden. In der Regel sind Lastenräder zudem weniger durch verkehrliche Störungen beeinträchtigt, was eine präzisere Festlegung von Lieferzeitfenstern und fixen Terminen möglich macht. Zu beachten ist an dieser Stelle allerdings, dass dieser Service unter Umständen auch mit einem erhöhten Personalaufwand verbunden sein kann. Gleichzeitig gewinnt das Gesamtsystem durch eine steigende Anzahl an Mitarbeitenden jedoch an Flexibilität.

Auch die Umschlagsplanung gehört zu den wichtigen Planungsschritten eines Liefersystems. Mit Umschlagsplanung oder auch Warenhandling sind an dieser Stelle Prozesse gemeint, die den Umschlag oder eine mögliche Zwischenlagerung in einem Depot umfassen. Während das Warenhandling hinsichtlich der Ressourcen größtenteils deckungsgleich zur traditionellen Auslieferung erfolgt, unterscheidet sich unter Umständen die umgeschlagene Ware und der Platzbedarf für den Umschlag. Aufgrund der geringen Größe von Lastenrädern werden weniger große Laderampen und Warenbereitstellungsbereiche benötigt. Auch Gewichts- und Größenrestriktionen hinsichtlich der Ware können einen positiven Einfluss auf die Arbeitsbedingungen und damit auf Ausfallrisiken und Kosten für Präventionsmaßnahmen haben. Die Entscheidung, ob Güter nicht nur ausgeliefert, sondern auch abgeholt werden sollen, hat in der Lastenradbelieferung einen weitaus größeren Einfluss auf die Ressourcenplanung als in der traditionellen Belieferung. Aufgrund des deutlich geringeren maximalen Ladevolumens der genutzten Fahrzeuge kann eine simultane Abholung das Warenhandling deutlich erschweren, während eine separate Abholung zusätzliche Touren zur Folge hat. Doch auch hier bringt der erhöhte Aufwand durch zusätzliche Touren eine größere Flexibilität mit sich.

Neben der Personal- und Umschlagsplanung stellt auch das Fuhrparkmanagement einen wichtigen Aspekt der Lastenradbelieferung dar. Grundsätzlich bleibt das traditionelle Fuhrparkmanagement in seinen Aufgaben erhalten, auch wenn sich die eingesetzten Fahrzeuge ändern. Aufgrund kleinerer Ladekapazitäten pro Fahrzeug wird meist ein größerer Fuhrpark als in der Belieferung mittels LKW benötigt. Daher gilt es eine größere Flotte an kleineren und günstigeren Fahrzeugen zu verwalten. Diese Flotte kann zudem aus unterschiedlichen Fahrzeugen bestehen, zum Beispiel aus Lastenrädern verschiedener Typen oder mit diverser Ausstattung (z. B. Temperaturführung oder Gefahrgutausstattung). Während die Anschaffung einer heterogenen Flotte mehr Ressourcen bedarf, kann damit der Fuhrpark an die Nutzungshäufigkeit verschiedener Fahrzeugtypen angepasst werden. Dies erlaubt besser auf spezifische Anforderungen von Kund:innen einzugehen und vereinfacht den Planungsaufwand spezieller Anwendungsfälle. Zu den Mehrkosten einer solchen Ausstattung ist zum jetzigen Zeitpunkt noch keine Aussage möglich. Fest steht jedoch, dass eine heterogene Flotte die Flexibilität der Einsätze erhöht und die Planungssicherheit fördert. Für Lastenräder werden außerdem häufigere Wartungen empfohlen. Jedoch können einige Reparaturen selbst durchgeführt werden, sodass weniger Werkstattaufenthalte nötig sind. Zudem lassen sich Ersatzteile günstiger lagern. Darüber hinaus sind die Anschaffungskosten eines Lastenrades gegenüber einem LKW deutlich geringer, wodurch es deutlich günstiger wird, einige Fahrzeuge als Puffer zur Verfügung zu halten. All dies erhöht die Planungssicherheit des Liefersystems.

Zuletzt sei noch der Bereich der IT-Infrastruktur erwähnt, in dem weiterhin Tourenplanungs- und Routenoptimierungssoftware benötigt wird. Allerdings müssen diese fähig sein, den abweichenden Lastenradanforderungen gerecht zu werden. Beispielsweise ist es notwendig, individuelle Fahrzeuge einzupflegen und deren Parameter wie Ladevolumen, zulässige Zuladung und Reichweite, aber auch Größe und Wendekreis festzulegen. Diese Parameter spielen eine große Rolle für die Anzahl an benötigten Touren als auch für die Wege, welche für die Auslieferung genutzt werden können. Die Wege, welche von Lastenrädern befahren werden, können sich deutlich vom bislang üblichen PKW-Routing unterscheiden (Strazoon 2023, siehe auch Kap. 13, „Routenplanung“). Die Geräte, die während der Auslieferung zur Tourenführung genutzt werden (wie beispielsweise Smartphones), bleiben grundsätzlich dieselben, allerdings muss aufgrund der größeren Flotte mit mehr benötigten Geräten gerechnet werden.

4 Mathematische Modellierung

Der folgende Abschnitt beschäftigt sich mit der mathematischen Modellierung des Tourenplanungsproblems. Diese umfasst die Formulierung, Modellierung und das anschließende Lösen des Problems. In der Problemformulierung geht es zunächst darum, alle relevanten Rahmenbedingungen festzustellen sowie Planungsziele festzulegen. Abschn. 12.3.1 beschreibt hierfür zunächst das klassische Tourenplanungsproblem und stellt anschließend mögliche Varianten davon vor. Zudem werden unterschiedliche Planungsziele diskutiert und verschiedene Formulierungsmöglichkeiten gegenübergestellt. Auf der Ebene der Modellierung wird die Problemformulierung in ein mathematisches Modell übersetzt. Wie dies umgesetzt werden kann, wird in Abschn. 12.3.2 erläutert. Abhängig von der nach gewählten Formulierung bieten sich der Rahmen eines gemischt-ganzzahligen linearen Optimierungsmodells oder eines sequenziellen Entscheidungsprozesses an. Nachdem das Problem mathematisch modelliert ist, gilt es dieses zu lösen. Dies wird in Abschn. 12.3.3 adressiert. Je nach Modell eignen sich verschiedene Lösungsmethoden: für gemischt-ganzzahlige Optimierungsprobleme gibt es neben exakten Lösungsverfahren auch heuristische Ansätze. Für sequenzielle Entscheidungsprozesse hingegen stehen Ansätze der Approximativen Dynamischen Programmierung zur Verfügung.

4.1 Problemformulierung

In der klassischen Variante des Tourenplanungsproblems (in der englischsprachigen Literatur auch Vehicle Routing Problem genannt) gibt es eine Menge an Kund:innen, die jeweils eine gewisse Nachfrage aufweisen. Eine solche Nachfrage kann eine Ware (z. B. ein Paket) sein, aber auch eine gewisse Dienstleistung, die von der/dem Fahrer:in durchgeführt wird (z. B. ein ambulanter Pflegedienst oder Handwerksarbeiten). In der klassischen Variante des Tourenplanungsproblems wird davon ausgegangen, dass alle Kund:innen die gleiche Form der Nachfrage stellen, also beispielsweise alle ein Paket zugestellt bekommen oder alle vom ambulanten Pflegedienst besucht werden sollen. Zusätzlich zur Nachfrage sind die Adressen der Kund:innen bekannt. Auf Anbieterseite steht klassischerweise eine Flotte an homogenen (Lasten-)Fahrrädern zur Verfügung, mit denen die Nachfrage sämtlicher Kund:innen gedeckt werden soll. Es wird angenommen, dass pro Fahrrad ein:e Fahrer:in zur Verfügung steht. Die Fahrräder befinden sich anfangs in einem Depot, welches zum Beispiel eine Warenlagerhalle oder der Standort des Pflegedienstes sein kann. Von dort führen die Fahrer:innen Touren durch, um die Kund:innen zu besuchen und so deren Nachfrage zu erfüllen. Am Ende der Tour müssen die Fahrer:innen wieder in das Depot zurückkehren, um dort die Fahrräder abzustellen. Abb. 12.1 zeigt beispielhaft die Lösung eines Tourenplanungsproblems mit einem Depot, drei Fahrzeugen und zehn Kundenstandorten.

Abb. 12.1
figure 1

Beispiel eines Tourenplanungsproblems samt Lösung

4.1.1 Problemvarianten

Zunächst sollen einige Erweiterungen vorgestellt werden, die zu der klassischen Variante des Tourenplanungsproblems hinzugefügt werden können. Es gibt eine Vielzahl an möglichen Erweiterungen, Toth und Vigo (2002) sowie Vidal et al. (2020) stellen hierzu einen Überblick über bestehende und neue Problemvarianten vor. Im Folgenden werden die meist verbreitetsten Varianten vorgestellt.

In der Regel haben Lastenräder eine begrenzte Ladekapazität. Im Falle einer Tourenplanung zur Warenauslieferung ist es daher sinnvoll, diese Kapazitätsbeschränkungen im Modell zu berücksichtigen. Sobald ein Lastenrad alle transportierten Waren ausgeliefert hat, kehrt es zum Depot zurück, wo es – wenn nötig – abermals beladen und eine weitere Tour starten kann. Auf diese Weise können alle Anfragen von Kund:innen bedient werden.

Oftmals ist auch die Berücksichtigung von Zeitfenstern relevant. Auf der Seite der Fahrenden kann dies ein begrenzter Planungshorizont sein, der üblicherweise der Länge eines Arbeitstages entspricht. Gleichzeitig können von Seiten der Kund:innen Zeitfenster berücksichtigt werden, innerhalb welcher die Nachfrage erfüllt werden muss. Dies ist beispielsweise der Fall, wenn Kund:innen Lieferzeitfenster gewählt haben oder wenn gewisse Pflegetätigkeiten in einem gewissen Zeitfenster erfüllt werden müssen. Eine Übersicht hierzu findet sich in Bräysy und Gendreau (2005).

Werden unterschiedliche Typen von Lastenrädern verwendet, spricht man von einer heterogenen Flotte. Dies kann ebenfalls im Modell integriert werden, siehe Koç et al. (2016). Unterscheiden sich die verschiedenen Lastenräder beispielsweise in ihrer maximalen Ladekapazität oder Geschwindigkeit, sollte dies im Modell widergespiegelt werden.

In manchen Anwendungen müssen Waren nicht nur zugestellt, sondern zuvor an anderer Stelle abgeholt werden. In diesem Fall spricht man vom sogenannten Abhol- und Lieferproblem, englischsprachig „Pickup and Delivery Problem“ genannt. Dabei geht es darum, mit der vorhandenen Flotte sowohl die Abholung als auch die Zustellung von Waren durchzuführen. Dabei können die Standorte zur Abholung und Zustellung gepaart (one-to-one) oder ungepaart (one-to-many) auftreten. Übersichten dazu finden sich in Parragh et al. (2008) sowie in Koç und Laporte (2020).

Im Kontext der urbanen Warenauslieferung werden außerdem häufig zweistufige Ausliefersysteme verwendet. In Abb. 12.2 wird ein solches System illustriert. Die erste Fahrzeugflotte beliefert ein oder mehrere Zwischenlager im Stadtgebiet aus einem Warenlager am Rande der Stadt. Aufgrund der Distanzen und Liefermengen werden hierfür meist größere Lieferwagen verwendet. Eine zweite Flotte an Lastenrädern ist dann für die Zustellung der Waren von Zwischenlagern zu Kund:innen zuständig. Cuda et al. (2015) und Sluijk et al. (2022) bieten eine Literaturübersicht zu dem Thema. Auch in einem einstufigen System können mehrere Depots in die Planung aufgenommen werden, siehe Abb. 12.3 zur Veranschaulichung sowie Montoya-Torres et al. (2015) für weitergehende Informationen.

Abb. 12.2
figure 2

Illustration eines zweistufigen Tourenplanungsproblems

Abb. 12.3
figure 3

Illustration eines einstufigen Tourenplanungsproblems mit mehreren Depots

In manchen Fällen sind die Reisezeiten zwischen zwei Standorten zeitabhängig. So ist im städtischen Raum zu Stoßzeiten meist erhöhter Verkehr, was zu verlängerten Reisezeiten führt. Auch sind jahreszeitbedingte Änderungen in der Reisezeit möglich, beispielsweise durch Witterungen wie Glatteis oder Nässe. Hier können Formulierungen herangezogen werden, die solch zeitabhängige Reisezeiten in die Planung einbeziehen. In Gendreau et al. (2015) werden solche Problemformulierungen vorgestellt.

In vielen Anwendungsfällen sind zur Zeit der Planung noch nicht alle Informationen bekannt. Beispielsweise kann noch unsicher sein, ob und welche Kund:innen eine Nachfrage stellen oder wie viel Zeit eine Dienstleistung bei der/dem Kund:in in Anspruch nimmt. Im ersten Fall spricht man in der Literatur von stochastischer Nachfrage bzw. stochastischen Kund:innen, im zweiten von einer stochastischen Servicezeit. Liegen Unsicherheiten dieser Art vor, kann dies entsprechend modelliert werden. Oyola et al. (2018) stellen eine Zusammenfassung zu stochastischen Tourenplanungsproblemen vor.

Um den Anforderungen aus der Praxis gerecht zu werden, können die genannten Erweiterungen beliebig kombiniert werden. Abschließend soll hier erwähnt sein, dass auch eine gleichzeitige Planung von Touren und Depot-Standorten möglich ist, siehe beispielsweise Prodhon und Prins (2014) und Drexl und Schneider (2015) für einen Überblick. Da die Standortwahl der Depots die Touren beeinflusst und umgekehrt, kann eine integrierte Planung von Vorteil sein. In dem Modell von Enthoven et al. (2020) werden beispielsweise die Touren sowie die Standorte von Paketstationen und Zwischenlagern kombiniert optimiert.

4.1.2 Planungsziele

Bei der Formulierung des Tourenplanungsproblems muss neben den oben genannten Rahmenbedingungen ein Planungsziel festgelegt werden. Das gängigste Ziel ist die Minimierung der Reisezeit oder der Transportkosten. Auch üblich ist die Maximierung des erzielten Gewinnes. Ist die Anzahl der verfügbaren Lastenräder nicht im Vorhinein festgelegt, kann auch die Flottengröße minimiert werden. Wird die Bedingung, dass alle Kund:innen bedient werden müssen, relaxiert, so kann auch die Servicerate maximiert werden. Darunter versteht man, dass unter den gegebenen Bedingungen so viele Kund:innen wie möglich bedient werden sollen. Werden Zeitfenster betrachtet, innerhalb welcher Kund:innen bedient werden sollten, kann auch die Verspätungsminimierung das Ziel des Problems sein.

4.1.3 Problemklassen

Neben den Rahmenbedingungen und des Planungszieles muss auch die Problemklasse des Tourenplanungsproblems festgelegt werden, bevor es mathematisch modelliert werden kann. Tourenplanungsprobleme können anhand der Dimensionen deterministisch versus stochastisch sowie statisch versus dynamisch klassifiziert werden.

Die Dimension deterministisch versus stochastisch betrachtet die Modellierung der Probleminformationen. In deterministischen Tourenplanungsproblemen sind entscheidungsrelevante Informationen a priori gegeben, also vor Modellierung bekannt. Sind zum Zeitpunkt der Planung nicht alle Informationen bekannt, so spricht man von einem stochastischen Tourenplanungsproblem. Die unbekannten Informationen sind Realisationen eines exogenen stochastischen Prozesses, und können – soweit vorhanden – nur durch Wahrscheinlichkeitsverteilungen repräsentiert werden.

Die Dimension statisch versus dynamisch kategorisiert die Entscheidungspunkte eines Tourenplanungsproblems. In statischen Tourenplanungsproblemen wird nur ein initialer Entscheidungspunkt benötigt, zu dem der Tourenplan festgelegt wird. Liegen beispielsweise zu Beginn eines Arbeitstages alle auszuliefernden Paketanfragen vor, so können die Touren der Lastenräder erst geplant, und anschließend abgefahren werden. Im Gegensatz dazu sind dynamische Tourenplanungsprobleme durch sequenzielle Entscheidungspunkte gekennzeichnet, die es ermöglichen immer wieder auf neue Informationen reagieren zu können. Sobald eine neue Information bekannt wird, wird der bisherige Tourenplan auf diese neue Information angepasst.

Toth und Vigo (2002), Cordeau et al. (2007), Laporte (2007) sowie Baldacci et al. (2007) geben eine ausführliche Zusammenfassung über (deterministisch) statische Tourenplanungsproblemen und deren Lösung. Pillac et al. (2013) sowie Soeffker et al. (2022) resümieren den Forschungsstand für (stochastisch) dynamische Tourenplanungsprobleme.

4.2 Modell

Nachdem das Problem formuliert wurde, kann es in ein mathematisches Modell überführt werden. Statische Entscheidungsprobleme werden in der Regel als gemischt-ganzzahliges Programm modelliert. Wie dies für das Tourenplanungsproblem umgesetzt werden kann, erläutert Abschn. 12.3.2.1. Im Gegensatz dazu benötigen dynamische Entscheidungsprobleme einen sequenziellen Entscheidungsprozess, dessen Funktionsweise in Abschn. 12.3.2.2 erklärt wird.

4.2.1 Gemischt-ganzzahlige Programmierung

Gegeben sei eine Menge an Kund:innen {1, …, n}, n ∈ N, sowie ein Depot, welches mit dem Index 0 gekennzeichnet wird. Insgesamt liegen also die Standorte V ≔ {0,1, …, n} vor, zwischen denen sich die Lastenräder bewegen können. Die Menge an Lastenrädern wird mit K ≔ {1, …m}, m ∈ N bezeichnet. Fährt ein Lastenrad zwischen Standort i ∈ V und Standort j ∈ V, so entstehen Kosten ci, j für den/die Anbieter:in. Der/die Anbieter:in möchte nun alle Kund:innen mit der bestehenden Flotte K bedienen, sodass die Transportkosten minimiert werden. Hierfür werden die Entscheidungsvariablen \( {x}_{i,j}^k \) für i, j ∈ V, k ∈ K definiert, welche den Wert 1 annehmen, wenn Fahrzeug k direkt von Standort i zu Standort j fährt, und 0 sonst. Das zugehörige lineare Modell lautet wie folgt:

figure a

Die Zielfunktion (1) minimiert die Gesamtkosten aller Touren. Die Nebenbedingungen (2) sorgen dafür, dass jede:r Kund:in von genau einem Lastenrad besucht wird und somit jede Nachfrage erfüllt wird. Dabei wird durch die Nebenbedingungen (3) sichergestellt, dass jedes Lastenrad, welches einen Standort eines:r Kund:in besucht, diesen auch wieder verlässt um die Tour fortzusetzen. Die Nebenbedingungen (4) und (5) garantieren, dass die Tour jedes Lastenrades im Depot startet und endet. In Nebenbedingung (6) wird der Zulässigkeitsbereich der Entscheidungsvariablen beschrieben. Für eine Übersicht an weiteren Modellierungsmöglichkeiten sei an Toth und Vigo (2002) verwiesen.

4.2.2 Sequenzieller Entscheidungsprozess

Ein sequenzieller Entscheidungsprozess modelliert dynamische Entscheidungsprobleme, also Probleme, die gekennzeichnet sind durch eine stetige Änderung der Entscheidungslage. Viele Tourenplanungsprobleme der Radlogistik erfüllen diese Kriterien. Spontane Anfragen von Kund:innen, schwankende Verkehrslage, sporadische verfügbare Fahrende (Crowdsourced Delivery) und andere problemspezifische stochastische Faktoren sind oft Realisationen eines exogenen stochastischen Prozesses. Diese stochastischen Entwicklungen sind für Planende schwer beeinflussbar und nur bedingt vorhersehbar, erzwingen aber die Anpassung vergangener Entscheidungen an die sich stetig ändernde Situation. Um die Dynamik dieser Probleme auch im Modell abzubilden, kann nicht wie in der linearen Programmierung angenommen werden, dass alle entscheidungsrelevanten Informationen a priori gegeben sind. Stattdessen muss explizit modelliert werden, zu welchen Zeitpunkten Entscheidungen angepasst werden (Entscheidungspunkt), welche relevanten Informationen in einem gegebenen Entscheidungspunkt bekannt sind (Entscheidungszustand), wie auf diesen Entscheidungszustand reagiert wird (Entscheidung), welche sofortigen Kosten die Entscheidung induziert (Kosten/Belohnung), und wie auf Grundlage des letzten Entscheidungszustands, der Entscheidung, und realisierter stochastischer Informationen in den nächsten Entscheidungszustand übergeleitet wird (stochastischer Übergang). Abb. 12.4 resümiert das Zusammenspiel aller Elemente eines sequenziellen Entscheidungsprozesses. Im Folgenden wird ein kurzer Überblick gegeben, welche Formen die Elemente des Sequenziellen Entscheidungsprozesses im Hinblick auf die Radlogistik annehmen können. Es sei verwiesen auf Powell (2019) für eine detaillierte Einführung in sequenzielle Entscheidungsprozesse und auf Ulmer et al. (2020) für eine Anleitung zur Integrierung von Tourenplänen in sequenzielle Entscheidungsprozesse.

Abb. 12.4
figure 4

Schematische Darstellung eines sequenziellen Entscheidungsprozesses mit Entscheidungszustand Sk am Entscheidungspunkt k, einer Entscheidung x und dazugehöriger Belohnung R(Sk, x). Nach-Entscheidungszustand \( {S}_k^x \) und stochastischem Übergang ωk ensteht ein neuer Entscheidungszustand Sk + 1 am Entscheidungspunkt k + 1. (Angelehnt an Ulmer (2017))

Entscheidungspunkt

Entscheidungspunkte sind die Zeitpunkte, in denen Entscheidungen getroffen werden. Entscheidungspunkte können in a priori festgelegten Zeitabständen stattfinden, beispielsweise alle 5 min, oder ereignisbasiert induziert werden, beispielsweise, wenn ein Stopp in einer Tour absolviert wird oder eine neue Anfrage von Kund:innen offenbart wird.

Entscheidungszustand

Entscheidungszustände modellieren alle entscheidungsrelevanten Informationen. Das beinhaltet in der Regel die Systemzeit, den Zustand offener Anfragen der Kund:innen und den Zustand der Lieferflotte beziehungsweise den aktuellen Tourenplan.

Entscheidung

Eine Entscheidung stellt eine Modifizierung des Tourenplans dar. Diese Modifizierung ist in der Regel gegeben durch die Zuweisung von (neuen) Anfragen von Kund:innen an einzelne Fahrzeuge der Flotte und deren (oft subsequente) Eingliederung in die entsprechende Tour. Eine Entscheidung kann aber auch durch das Annehmen/Ablehnen von Anfragen der Kund:innen, eine Änderung der momentanen Flottengröße, eine Anpassung von Servicezonen oder des Angebots gegeben sein.

Kosten/Belohnung

Basierend auf einem Entscheidungszustand und der gewählten Entscheidung können sofortige Kosten oder Belohnungen gesammelt werden. Kosten können direkter Natur sein, zum Beispiel die Verwendung von Ressourcen (Stromkosten), aber auch indirekter Natur, wie die Verletzung von Serviceversprechen (Verspätungen und Wartezeit). Alternativ ist es oft sinnvoll Belohnungen an Stelle von Kosten zu definieren. Belohnungen können durch erhaltenen Profit oder Umsatz gegeben sein oder durch die Anzahl der bedienten Anfragen von Kund:innen dargestellt sein.

Stochastischer Übergang

Basierend auf dem gegeben Entscheidungszustands, der gewählten Entscheidung, und des stochastischen Prozesses ergibt sich der nächste Entscheidungszustand. Dazu wird zum Beispiel der Zustand von Anfragen der Kund:innen und unseres Tourenplans durch das Vorspulen zur neuen Systemzeit angepasst.

4.3 Lösungsmethoden

Nach der Formulierung und der Modellierung des Tourenplanungsproblems widmet sich dieser Abschnitt möglichen Lösungsmethoden. Für unterschiedliche Problemklassen stehen unterschiedliche Methoden zur Verfügung: Abschn. 12.3.3.1 präsentiert Lösungsverfahren für gemischt-ganzzahlige Programme, während Abschn. 12.3.3.2 die Approximative Dynamische Programmierung als Lösungsverfahren für dynamische Entscheidungsprobleme vorstellt.

4.3.1 Lösungsverfahren für gemischt-ganzzahlige Programmierung

Für gemischt-ganzzahlige Probleme steht eine ganze Bandbreite an Lösungsmethoden zur Verfügung. Dabei wird grundsätzlich zwischen exakten und heuristischen Lösungsverfahren unterschieden. Während exakte Methoden zu einer nachgewiesen optimalen Lösung des Problems führen, erzielen heuristische Ansätze lediglich näherungsweise optimale Lösungen. Da an dieser Stelle nicht alle Ansätze erläutert werden können, sollen im Folgenden die bekanntesten Verfahren genannt sowie auf weiterführende Literatur verwiesen werden.

Exakte Lösungsverfahren

Um Tourenplanungsprobleme exakt zu lösen, stehen kommerzielle Solver zur Verfügung. Diese greifen häufig auf sogenannte Branch-and-Bound-Verfahren zurück, welche den Lösungsraum (komplett) durchsuchen und so zu einer optimalen Lösung gelangen. Durch geschicktes Ausloten können Teile des Lösungsraumes ausgeschlossen werden, was das Verfahren beschleunigt. Dabei gibt es verschiedene Techniken, wie der Lösungsraum reduziert werden kann. Bekannt sind hier Branch-and-Price, Branch-and-Cut oder Branch-Price-and-Cut Methoden. Letzte gehören zu den führenden exakten Algorithmen und werden von Costa et al. (2019) für Tourenplanungsprobleme zusammengefasst.

Heuristische Lösungsverfahren

Gelangen exakte Verfahren aufgrund von langen Rechenzeiten oder begrenzten Speicherkapazitäten an ihre Grenzen, so kommen heuristische Verfahren ins Spiel. Problemspezifische Heuristiken nutzen vorhandene Strukturen des Problems aus, um so zu einer guten Lösung zu gelangen. Das Verfahren des besten Nachfolgers oder der sukzessiven Einbeziehung konstruieren beispielsweise Startlösungen für das Tourenplanungsmodell. Eine gefundene Startlösung kann anschließend durch ein Verbesserungsverfahren weiter optimiert werden. Für das Tourenplanungsmodell steht hier zum Beispiel das k-opt Verfahren zur Verfügung. Toth und Vigo (2002) und Laporte et al. (2014) stellen eine umfassende Übersicht zu Konstruktions- und Verbesserungsheuristiken für Tourenplanungsprobleme zusammen.

Neben problemspezifischen Heuristiken gibt es auch generische Näherungsverfahren. Hierzu gehören Metaheuristiken, die auf Einzellösungen basieren, wie die Lokale Suche, Tabu Suche, Nachbarschaftssuche, oder Simulated Annealing, sowie populationsbasierte Metaheuristiken, worunter beispielsweise evolutionäre Algorithmen fallen. Labadie et al. (2016) bieten einen umfangreichen Blick auf Metaheuristiken speziell für Tourenplanungsprobleme.

4.3.2 Lösungsverfahren für Sequenzielle Entscheidungsprozess

Für das Lösen von dynamischen Entscheidungsproblemen steht unter dem Namen der Approximativen Dynamischen Programmierung eine breite Sammlung an Methoden zur Verfügung. Die Lösung eines dynamischen Entscheidungsproblem ist kein Entscheidungsvektor wie in der statischen Optimierung, sondern eine sogenannte Policy, also eine Handlungsanweisung die jedem Entscheidungszustand eine Entscheidung zuordnet. In Powell (2011) findet sich eine ganzheitlich Darlegung der Approximativen Dynamischen Programmierung. Die Lösungsmethoden lassen sich nach Powell in zwei Klassen einteilen.

Policy Suchverfahren

Policy Suchverfahren ist die Klasse von Lösungsmethoden, die über einen Raum von Parametrisierungsklassen und zu lernenden Parametern sucht, um effektive Zuordnungen von Entscheidungszuständen zu Entscheidungen zu lernen. Policy Function Approximations und Cost Function Approximations sind die wichtigsten Vertreter dieser Klasse. Policy Function Approximations sind direkte Zuordnungen von Entscheidungszustand zu Entscheidung. Diese Klasse beinhaltet unter anderem einfache Daumenregeln (zum Beispiel first-come-first-serve), komplexere Entscheidungsbäume (zum Beispiel Regelsysteme abgeleitet aus Expertenwissen), und parametrische Funktionen (zum Beispiel lineare Abbildungen). Cost Function Approximations sind parametrisierte Optimierungsprobleme. Die Parameter können beispielsweise Nebenbedingungen verschärfen, um Ressourcen für zukünftige Entscheidungspunkte zu reservieren. Sie behandeln also jeden Entscheidungspunkt als ein statisches Optimierungsproblem, berücksichtigen aber zukünftige Entwicklungen durch die gelernten Parameter, die das Optimierungsproblem modifizieren.

Lookahead-Verfahren

Lookahead-Verfahren schätzen die langfristigen Implikationen von Entscheidungen in jedem Entscheidungszustand. Die prominentesten Lösungsmethoden dieser Klasse sind direkte Lookahead-Verfahren und Wertefunktionsapproximationen. In direkten Lookahead-Verfahren erfolgt die Schätzung zukünftiger Kosten durch Ziehung und anschließender Optimierung über stochastische Stichproben möglicher zukünftiger Ereignisse. So wird beispielsweise eine Menge an zukünftigen Szenarien generiert und eine Lösung gesucht, die robust ist, also möglichst effektiv für alle Szenarien. In der Wertefunktionsapproximation wird der langfristig Wert einer Entscheidung in einem Entscheidungszustand direkt gelernt. Dafür werden Approximationsarchitekturen (lineare Funktionen, Tabelle, neuronale Netze) extensiv in einer Simulation trainiert, bevor die trainierte Architektur dann in der Entscheidungsunterstützung instantane Handlungsempfehlungen geben kann.

Eine Zusammenfassung zu Lösungsmethoden explizit für (stochastisch dynamische) Tourenplanungsprobleme findet sich sowohl in Ulmer (2017) für die Klasse der Approximativen Dynamischen Programmierung sowie in Hildebrandt et al. (2022) für die (Sub-)klasse der Reinforcement-Learning-Verfahren.

5 Fazit

Die Tourenplanung bestimmt, wie unter Berücksichtigung limitierter Ressourcen die zu besuchenden Kund:innen auf die Flotte der Fahrer:innen aufgeteilt und in welcher Reihenfolge diese besucht werden. Sind die Kund:innen a priori bekannt, so fällt die Tourenplanung meist in die taktische Planungsebene und wird als gemischt-ganzzahligen Programm modelliert und exakt gelöst. Sind die Kund:innen, Anfrageorte oder Anfragezeitpunkte jedoch ungewiss, so fällt das Problem in die operative Planung. Hier bietet sich ein sequenzieller Entscheidungsprozess als Modell an, welcher mit Methoden der approximativen dynamischen Programmierung gelöst werden kann.