Newton’s Method for Global Free Flight Trajectory Optimization

Borndörfer, Ralf; Danecker, Fabian; Weiser, Martin

doi:10.1007/s43069-023-00238-z

Newton’s Method for Global Free Flight Trajectory Optimization

Research
Open access
Published: 08 August 2023

Volume 4, article number 63, (2023)
Cite this article

Download PDF

You have full access to this open access article

Operations Research Forum Aims and scope Submit manuscript

Newton’s Method for Global Free Flight Trajectory Optimization

Download PDF

691 Accesses
Explore all metrics

Abstract

Globally optimal free flight trajectory optimization can be achieved with a combination of discrete and continuous optimization. A key requirement is that Newton’s method for continuous optimization converges in a sufficiently large neighborhood around a minimizer. We show in this paper that, under certain assumptions, this is the case.

Numerical Investigation on Flight Trajectory Optimization Methods

The global optimization problem and the contribution of Prof. Angelo Miele: the Green’ s theorem approach

Article 01 October 2017

Error Bounds for Discrete-Continuous Free Flight Trajectory Optimization

Article Open access 09 July 2023

Use our pre-submission checklist

Avoid common mistakes on your manuscript.

1 Introduction

Around the world countries are implementing Free Flight airspaces that allow aircraft to choose their own route, as opposed to being restricted to a predetermined three-dimensional network. The primary factors that influence costs are time and fuel consumption, which are closely interrelated [1]. Based on the relative weights of these factors (cf. cost index) the optimal airspeed can be determined, which typically remains largely constant [2,3,4]. Additionally, the vertical flight path can usually be predetermined using aircraft performance data [5]. Consequently, the problem can be well approximated in a way proposed by Zermelo in 1931 [6], which involves finding the most efficient trajectory from point A to B for an aircraft flying at a constant airspeed in a given two-dimensional wind field.

The Free Flight Trajectory Optimization Problem is usually solved using direct or indirect methods from Optimal Control [5, 7,8,9,10,11]. These are highly efficient, but suffer from one key drawback: They only converge locally and are thus dependent on a sufficiently good starting point. This makes such methods, used as a standalone, incapable of meeting airlines’ high expectations regarding the global optimality of routes.

In [12,13,14] a deterministic two-stage algorithm was proposed that combines discrete and continuous optimization in order to find a globally optimal solution to the free flight trajectory optimization problem. With this approach the exponential complexity of other branch and bound based algorithms is circumvented.

The primary objective of the first stage is to obtain a finite sample in a systematic manner that adequately covers the search space. This deterministic approach eliminates the potential for infinite runtime, which may occur when using stochastic global optimization algorithms, such as Particle Swarm Optimization, Simulated Annealing, or Monotonic Basin Hopping [15,16,17,18].

One approach is to create a locally dense directed graph with a specific density determined by the node spacing $h$ and connectivity length $\ell$, thereby implicitly defining the sample. The instances can then be selected in order of quality by applying Yen’s algorithm [19] to calculate the k^th shortest paths.

Promising paths serve as initial guesses for a subsequent refinement stage in which a continuous solution to the problem is calculated up to the desired accuracy.

Analytical evidence and numerical experiments have demonstrated that the new hybrid algorithm has a time complexity of $\mathcal {O}(\ell ^{-1})$, making it superior to the conventional purely discrete approach, which has a time complexity of $\mathcal {O}(\ell ^{-6})$ [12]. In this context, $\ell$ refers to the maximum arc length in a graph and the discretization length in a continuous optimization scenario. Thus, $\ell ^{-1}$ serves as a comparable metric for the precision of the solution.

The present paper is concerned with the second stage. One way to generate a continuous solution is to apply Newton’s method to the first order necessary conditions (the KKT-conditions) — an approach commonly referred to as Newton-KKT or Sequential Quadratic Programming (SQP) (see, e.g., [20]). It is now shown that there is a quantifiable domain around a global optimum such that Newton-KKT converges if initialized accordingly.

Since the computational effort of the first graph-searching stage depends exclusively on the problem instance, i.e., the wind conditions, the algorithm asymptotically inherits the super fast convergence rates of the Newton-KKT method.

The paper is structured as follows. After defining the problem and introducing a formulation that is convenient for the analytical discussion in Section 2, we formally state the necessary and sufficient conditions as well as the Newton-KKT approach in Section 3. The proof of convergence is provided in Section 4 followed by a conclusion emphasizing the impact on previous and future work.

2 The Free Flight Trajectory Optimization Problem

2.1 Notation

Throughout this article lower case subscripts, e.g., $x_t$ or ${\xi _\tau }$, denote partial derivatives, while total derivatives are indicated by primes, e.g., $T'$ or $f'$. Locally and globally optimal quantities are indicated by single and double superscript stars, respectively, e.g., $\xi ^\star$ or $\xi ^{\star \star }$. If not stated otherwise, we assume $\Vert \cdot \Vert$ to denote the $l^2$-norm. Accordingly, we use the following quantitative definition of the $L^\infty$-norm in terms of the $l^2$-norm.

Definition 1

Let $f: \Omega \mapsto {\mathbb {R}}^n$. Then we define

$$\begin{aligned} \Vert f\Vert _{L^{\infty }(\Omega )} := \inf \{ C \ge 0: \Vert f(x)\Vert _2 \le C ~\text {for a.a. } x\in \Omega \}. \end{aligned}$$

(1)

2.2 Problem Statement

Neglecting any traffic flow restrictions, we consider Lipschitz-continuous flight paths $\xi \in C^{0,1}(]0,1[,{\mathbb {R}}^2)$ connecting origin $\xi (0)=x_O$ and destination $\xi (1) =x_D$. By Rademacher’s theorem, such paths are almost everywhere differentiable, and moreover contained in the Sobolev space $W^{1,\infty }(\mathopen ]0,1\mathclose [,{\mathbb {R}}^2)$.

A short calculation reveals that an aircraft travelling along such a path $\xi$ with constant airspeed ${\overline{v}}$ through a three times continuously differentiable wind field $w\in C^3({\mathbb {R}}^2,{\mathbb {R}}^2)$ with bounded magnitude $\Vert w(x)\Vert < {\overline{v}}$ reaches the destination after a flight duration

$$\begin{aligned} T(\xi ) = \int _0^1 f\big (\xi (\tau ),{\xi _\tau }(\tau )\big )\, d\tau \end{aligned}$$

(2)

with $\xi _\tau$ denoting the time derivative of $\xi$ and

$$\begin{aligned} f(\xi ,{\xi _\tau }) := t_\tau = \frac{-{\xi _\tau }^Tw + \sqrt{({\xi _\tau }^Tw)^2+({\overline{v}}^2 - w^Tw)({\xi _\tau }^T {\xi _\tau })}}{{\overline{v}}^2 - w^Tw}, \end{aligned}$$

(3)

see [12,13,14].

Among these paths $\xi$, we need to find one with minimal flight duration $T(\xi )$, since that is essentially proportional to fuel consumption [1]. This classic of optimal control is known as Zermelo’s navigation problem [6]. It can easily be shown that in case of bounded wind speed, the optimal trajectory cannot be arbitrarily longer than the straight connection of origin and destination. Hence, every global minimizer is contained in an ellipse $\Omega \subset {\mathbb {R}}^2$ with focal points $x_O$ and $x_D$.

The flight duration T as defined in (2) is based on a time reparametrization from actual flight time $t\in [0,T]$ to pseudo-time $\tau \in [0,1]$ according to the actual flight trajectory $x(t) = \xi (\tau (t))$ such that $\Vert x_t(t)-w(x(t))\Vert = {\overline{v}}$, where $x_t$ denotes the so-called ground speed, i.e., the derivative of position x with respect to the unscaled time t. As a consequence, the actual parametrization of $\xi$ in terms of pseudo-time $\tau$ is irrelevant for the value of T. Calling two paths $\xi ,{\tilde{\xi }}$ equivalent if there exists a Lipschitz-continuous bijection $r:\mathopen ]0,1\mathclose [\rightarrow \mathopen ]0,1\mathclose [$ such that $\xi (r(\tau )) = {\tilde{\xi }}(\tau )$, we can restrict the optimization to equivalence classes. Moreover, every equivalence class contains a representative with constant ground speed $\Vert {\xi _\tau }(\tau )\Vert =L$ for almost all $\tau$, that can be obtained from any ${\tilde{\xi }}$ with $\Vert {\tilde{\xi }_\tau }(\tau )\Vert \ne 0 ~ \forall \tau$ via

$$\begin{aligned} \xi (\tau ) := L\int _0^\tau \frac{{\tilde{\xi }_\tau }(t)}{\Vert {\tilde{\xi }_\tau }(t)\Vert } dt, \quad L:=\int _0^1 \Vert {\tilde{\xi }_\tau }(\tau )\Vert d\tau . \end{aligned}$$

(4)

Hence, we introduce $z:=(L,\xi ) \in Z:= {\mathbb {R}}\times X$ and the affine space of valid trajectories

$$\begin{aligned} X := \{\xi \in W^{1,\infty }(]0,1[, {\mathbb {R}}^2) \; \mid \; \xi (0) = x_O, \; \xi (1) = x_D\}. \end{aligned}$$

(5)

and subsequently consider the equivalent constrained minimization problem

$$\begin{aligned} \min _{z\in Z} T(\xi ), \quad \text {s.t.} \quad h(z) = 0\quad\mathrm{for\; a.a.}\; \tau \in \mathopen ]0,1\mathclose [ \end{aligned}$$

(6)

with

$$\begin{aligned} h: Z \rightarrow \Lambda := L^\infty (]0,1[, {\mathbb {R}}), \quad z \mapsto {\xi _\tau }^T{\xi _\tau }-L^2. \end{aligned}$$

(7)

If the constraint is satisfied, L also represents the path length, since

$$\begin{aligned} \int _0^1 {\Vert {\xi _\tau }\Vert }d\tau = L. \end{aligned}$$

(8)

Note that $T:X\rightarrow {\mathbb {R}}$ is Fréchet differentiable with respect to the corresponding linear space

$$\begin{aligned} {\delta X}:= W^{1,\infty }_0(\mathopen ]0,1\mathclose [,{\mathbb {R}}^2) \end{aligned}$$

(9)

of directions ${\delta \xi }$ with zero boundary values, that consequently do not change origin and destination, equipped with the norm

$$\begin{aligned} \Vert {\delta \xi }\Vert _{X^{\infty }} = \Vert {\delta \xi }\Vert _{L^{\infty }({]0,1[})} + \Vert {\delta \xi _\tau }\Vert _{L^{\infty }({]0,1[})} . \end{aligned}$$

(10)

Further we define the linear space

$$\begin{aligned} {\delta Z}:= {\mathbb {R}}\times {\delta X}\end{aligned}$$

(11)

and equip the spaces Z and ${\delta Z}$ with the norms

$$\begin{aligned} \Vert z\Vert _{Z^{\infty }} = |L| + \Vert \xi \Vert _{L^{\infty }({]0,1[})} + \Vert {\xi _\tau }\Vert _{L^{\infty }({]0,1[} )} , \quad \text {and} \end{aligned}$$

(12a)

$$\begin{aligned} \Vert z\Vert _{Z^{2}} = |L| + \Vert \xi \Vert _{L^{2}({]0,1[})} + \Vert {\xi _\tau }\Vert _{L^{2}({]0,1[})} . \end{aligned}$$

(12b)

3 Continuous Optimization: Newton-KKT

In order to find a continuous solution to the free flight optimization problem (6) we apply Newton’s method to the first order necessary conditions (the KKT-conditions), which is also known as sequential quadratic programming (SQP). Before we formally introduce Newton’s method, we discuss the necessary and sufficient conditions for optimality, which also defines the goal of the presented algorithm.

3.1 Optimality Conditions

3.1.1 Necessary Conditions

The goal of the present paper is to find an isolated globally optimal solution $\xi ^{\star \star }$ to (6) that satisfies $T(\xi ^{\star \star }) \le T(\xi ) \; \forall \xi \in X$, contrary to a local optimizer $\xi ^{\star }$ that is only superior to trajectories in a certain neighborhood, $T(\xi ^{\star }) \le T(\xi ) \; \forall \xi \in \mathcal {N}(\xi ^{\star }) \subseteq X$. An isolated global minimizer satisfies the necessary Karush-Kuhn-Tucker (KKT) optimality conditions [21] given that it is a regular point, which is always the case, as confirmed by the following Theorem.

Theorem 1

Let $z=(L,\xi )\in Z$ with $L>0$ and assume there is a direction $u\in {\mathbb {R}}^2$ and $c>0$ such that ${\xi _\tau }^T u \ge c$ almost everywhere. Then, $h'(z):{\delta Z}\rightarrow L^\infty (]0,1[)$ is surjective, i.e., $z$ is regular.

Proof

Let $f\in L^\infty (]0,1[)$ be given and $b:={\xi _\tau }^T u\ge c$. We set

$$\begin{aligned} {\delta L}= - \frac{\int _0^1 b^{-1}f/2\,d\tau }{L \int _0^1 b^{-1}\,d\tau } \end{aligned}$$

and

$$\begin{aligned} g = b^{-1} \left( f/2 + L{\delta L}\right) , \quad {\delta \xi _\tau }= gu. \end{aligned}$$

Due to $b\ge c$ almost everywhere, $b^{-1}$ is bounded and hence $g,{\xi _\tau }\in L^\infty (]0,1[)$. By construction, $\int _0^1 {\delta \xi _\tau }\,d\tau = 0$ holds, such that ${\delta z}= ({\delta L},{\delta \xi })\in {\delta Z}$.

Now we obtain

$$\begin{aligned} \begin{aligned} h'(z)[{\delta z}]&= 2 {\xi _\tau }^T {\delta \xi _\tau }- 2L{\delta L}\\&= 2bg - 2L{\delta L}\\&= 2(f/2+L{\delta L}) - 2L {\delta L}\\&= f, \end{aligned} \end{aligned}$$

and thus the claim.

For $\lambda \in \Lambda ^*$, the Lagrangian is defined as

$$\begin{aligned} \mathcal {L}(z,\lambda ) := T(\xi ) + \langle \lambda , h(z)\rangle . \end{aligned}$$

(13)

The KKT-conditions guarantee for a regular minimizer $z^{\star \star }$ the existence of a Lagrange multiplier $\lambda ^{\star \star }\in \Lambda ^*$, such that

$$\begin{aligned} \begin{aligned} 0&= \mathcal {L}_z(z^{\star \star },\lambda ^{\star \star })[{\delta z}] \quad&\forall ~{\delta z}\in {\delta Z}, \\ 0&= \langle {\delta \lambda },h(z^{\star \star })\rangle&\forall ~{\delta \lambda }\in \Lambda ^* \end{aligned} \end{aligned}$$

hold, where ${\delta z}:= ({\delta L},{\delta \xi }) \in {\delta Z}$. In our case, these necessary conditions read

$$0=\underbrace{T'(\xi ^{\star \star })[{\delta \xi }]}_{=0 ~ (16)} + 2\int _0^1 \lambda ^{\star \star } \left( {\delta \xi _\tau }^T {\xi _\tau }^{\star \star }- {\delta L}\,L^{\star \star } \right) d\tau \qquad \forall ~{\delta z}\in {\delta Z}$$

(14a)

$$0= \int _0^1 {\delta \lambda }\left( ({\xi _\tau }^{\star \star })^T {\xi _\tau }^{\star \star }- (L^{\star \star })^2\right) \; d\tau \qquad\qquad\qquad\quad\ \forall ~ {\delta \lambda }\in \Lambda ^*.$$

(14b)

Let us for a moment consider the unconstrained problem analogous to (6),

$$\begin{aligned} \underset{\xi \in X}{\min }~T. \end{aligned}$$

(15)

Any global minimizer $\tilde{\xi }^{\star \star }$ of (15) is clearly non-isolated due to possible reparametrizations of the time. Let $\xi ^{\star \star }$ denote the equivalent trajectory with constant ground speed, i.e., $\Vert {\xi _\tau }^{\star \star }(\tau )\Vert =L^{\star \star }$ for almost all $\tau$. Both solutions $\tilde{\xi }^{\star \star },\xi ^{\star \star }$ satisfy the first order necessary condition

$$\begin{aligned} 0=T'(\xi ^{\star \star })[{\delta \xi }] \quad \forall {\delta \xi }\in {\delta X}. \end{aligned}$$

(16)

Moreover, $\xi ^{\star \star }$ — together with $L^{\star \star }$ from (8) — is a global minimizer of the constrained problem, which indicates that the ground speed constraint (7) is only weakly active. We confirm this by showing that the corresponding Lagrange multipliers $\lambda ^{\star \star }$ vanish.

Lemma 2

Let $z^{\star \star } = (\xi ^{\star \star },L^{\star \star })$ be a global minimizer of (6). Then, this solution together with

$$\begin{aligned} \lambda ^{\star \star } = 0 \end{aligned}$$

(17)

satisfies the necessary conditions (14).

Proof

Since $\xi ^{\star \star }$ is also a global minimizer of the unconstrained problem, the necessary condition (16) states that $T'(\xi ^{\star \star }){\delta \xi }=0$. The term $\int _0^1 \lambda ^{\star \star }\left( {\delta \xi _\tau }^T {\xi _\tau }^{\star \star }- {\delta L}\,L^{\star \star }\right) d\tau$ of (14a) vanishes for $\lambda ^{\star \star }=0$. (14b) is satisfied because $\Vert {\xi _\tau }^{\star \star }\Vert = L^{\star \star }$ for almost all $\tau \in ]0,1[$.

3.1.2 Sufficient Conditions

Now we turn to the second order sufficient conditions for optimality. In general, a stationary point $(z^{\star },\lambda ^{\star })$ is a strict minimizer, if, in addition to the necessary conditions above, the well known Ladyzhenskaya-Babuška-Brezzi (LBB) conditions (e.g., [22]) are satisfied, which comprise (a) the so-called inf-sup condition and (b) the requirement that the Lagrangian’s Hessian regarding $z$, $\mathcal {L}_{zz}$, need be positive definite on the kernel of $h'$.

The inf-sup condition states that for the minimizer $z^{\star }$ there is a $\kappa > 0$ such that

$$\begin{aligned} \inf _{{\delta \lambda }\ne 0\in L^2(]0,1[)} \sup _{{\delta z}\in {\delta Z}^2} \frac{\langle {\delta \lambda }, h'(z^{\star })[{\delta z}]\rangle }{ \Vert {\delta \lambda }\Vert _{L^{2}({]0,1[} )} \Vert {\delta z}\Vert _{Z^{2}} } \ge \kappa . \end{aligned}$$

(18)

Formally, the second part of the LBB-conditions requires that there is a ${\underline{\mathcal {B}}}> 0$ such that

$$\begin{aligned} \mathcal {L}_{zz}(z^{\star })[{\delta z}]^2 \ge {\underline{\mathcal {B}}}\; \Vert {\delta z}\Vert _{Z^{2}} ^2 \end{aligned}$$

for any ${\delta z}\in {\delta Z}$ that satisfies

$$\begin{aligned} \langle {\delta \lambda }, h'(z^{\star })[{\delta z}]\rangle = 0 \quad \forall ~{\delta \lambda }\in L^2(]0,1[). \end{aligned}$$

In the present case, this reads

$$\begin{aligned} T''(\xi ^{\star })[{\delta \xi }]^2 + 2\int _0^1 \lambda ^{\star } ({\delta \xi _\tau }^T{\delta \xi _\tau }- {\delta L}^2) d\tau \ge {\underline{\mathcal {B}}} \Vert {\delta z}\Vert _{Z^{2}} ^2 \end{aligned}$$

(19)

for any ${\delta z}\in {\delta Z}$ such that

$$\begin{aligned} \int _0^1 {\delta \lambda }\left( {\delta \xi _\tau }^T {\xi _\tau }^{\star }- {\delta L}\,L^{\star } \right) d\tau =0 \quad \forall ~{\delta \lambda }\in L^2(]0,1[). \end{aligned}$$

In case of a global minimizer $z^{\star \star } = (\xi ^{\star \star }, L^{\star \star })$, this can be reduced using $\lambda ^{\star \star }=0$ from Lemma 2. Moreover, the constraint is equivalent to requiring that ${\delta \xi _\tau }^T{\xi _\tau }^{\star \star }= {\delta L}\,L^{\star \star }$ almost everywhere. With this, we conclude that for any isolated global minimizer $z^{\star \star }$ of (6) that satisfies the inf-sup condition, there exists a ${\underline{\mathcal {B}}}>0$ such that

$$\begin{aligned} T''(\xi ^{\star \star })[{\delta \xi },{\delta \xi _\tau }]^2 \ge {\underline{\mathcal {B}}} \Vert {\delta z}\Vert _{Z^{2}} ^2 \end{aligned}$$

(20)

for any ${\delta z}\in {\delta Z}$ such that ${\delta \xi _\tau }^T{\xi _\tau }^{\star \star }= {\delta L}\,L^{\star \star }$ almost everywhere.

It is important to note that the second order sufficient conditions are formulated in a $L^2$-setting, while differentiability only holds in $L^\infty$. This is known as two-norm-discrepancy [23].

3.2 Newton’s Method

In order to provide a more compact notation, we use $\chi := (z,\lambda ) \in Z\times \Lambda ^* =: Y$ in this context and define $F$ as the total derivative of the Lagrangian,

$$\begin{aligned} F: Z\times \Lambda ^* \mapsto {\delta Z}^* \times \Lambda , \qquad F(\chi ) := \mathcal {L}'(z,\lambda ). \end{aligned}$$

(21)

On $Y$ we define the following norms,

$$\begin{array}{ll} \Vert \chi \Vert _{Y^{\infty }} = \Vert z\Vert _{Z^{\infty }} + \Vert \lambda \Vert _{L^{\infty }({]0,1[})} & \text {and} \end{array}$$

(22a)

$$\begin{array}{ll} \Vert \chi \Vert _{Y^{2}} = \Vert z\Vert _{Z^{2}} + \Vert \lambda \Vert _{L^{2}({]0,1[} )}. & \end{array}$$

(22b)

The problem is now to find a $\chi ^{\star \star }$ such that the first order necessary conditions for optimality as stated in (14) are satisfied, which translates to

$$\begin{aligned} F(\chi ^{\star \star }) = 0. \end{aligned}$$

(23)

Applying Newton’s method, we iteratively solve

$$\begin{aligned} F'(\chi ^k)[\Delta \chi ^k] = -F(\chi ^k) \end{aligned}$$

(24)

for $\Delta \chi ^k$ and proceed with $\chi ^{k+1} \leftarrow \chi ^k + \Delta \chi ^k$, starting with some initial value $\chi ^0$. In other words, in every iteration we need to find $({\Delta z}^k, {\Delta \lambda }^k)$ such that

$$\begin{aligned} \begin{aligned} T''(\xi ^k)[{\delta \xi }][{\Delta \xi }^k]&+ \langle \lambda ^k, h''(z^k)[{\delta z}][{\Delta z}^k] \rangle + \langle {\Delta \lambda }^k, h'(z^k)[{\delta z}] \rangle \\&= -T'(\xi ^k)[{\delta \xi }] - \langle \lambda ^k, h'(z^k)[{\delta z}] \rangle \qquad \forall {\delta z}\in {\delta Z}, \end{aligned} \end{aligned}$$

(25a)

$$\begin{array}{ll} \langle {\delta \lambda }, h'(z^k)[{\Delta z}^k] \rangle = -\langle {\delta \lambda }, h(z^k) \rangle & \forall {\delta \lambda }\in \Lambda ^*. \end{array}$$

(25b)

4 Proof of Convergence

On the way to prove the existence of a non-empty domain $\mathcal {B}(\chi ^{\star \star },R)$ such that Newton’s method as defined in Section 3.2 converges to the corresponding global minimizer $\chi ^{\star \star }$, if initialized with a starting point within this neighborhood, we first prove that the KKT-operator $F'$ is invertible and that the Newton step $\Delta \chi ^k$ is always well defined. Essentially, this is the case if the LBB-conditions as given in (18) and (20) are satisfied. Hence, we will show that there is a $R>0$ such that the inf-sup condition is satisfied and that the Lagrangian is positive definite on the kernel of the constraints for any $\chi \in \mathcal {B}(\chi ^{\star \star },R)$ . Further, we show that an affine covariant Lipschitz condition holds, which finally helps to complete the proof.

Before we get there, we recall the following Lemma from [13, Lemma 7] which provides a bound for the path length of a global minimizer.

Lemma 3

Let $z^{\star \star } = (L^{\star \star },\xi ^{\star \star })$ be a global minimizer of (6), let $\Vert w\Vert _{L^{\infty }(\Omega )} \le {\overline{c}}_0$, and define $\tilde{L} = \Vert x_D-x_O\Vert$. Then it holds that

$$\begin{aligned} \tilde{L} \le L^{\star \star } \le \frac{{\overline{v}}+{\overline{c}}_0}{{\overline{v}}-{\overline{c}}_0} \tilde{L}. \end{aligned}$$

(26)

As most of the subsequent results hold in a $L^\infty$-neighborhood of a minimizer, we introduce the following notation.

Definition 1 We call the $L^\infty$-neighborhood of a point $z\in Z$ or $x\in Y$,

$$\begin{array}{ll} \mathcal {B}(z,R) : = \{\tilde{z}\in Z: \Vert \tilde{z}-z\Vert _{Z^{\infty }} \le R \} & \text {or} \end{array}$$

(27a)

$$\begin{array}{ll} \mathcal {B}(\chi,R ) : = \{\tilde{\chi }\in Y: \Vert \tilde{\chi }-\chi \Vert _{Y^{\infty }} \le R \}, & \end{array}$$

(27b)

respectively.

Moreover, we provide three simple yet useful bounds that hold in such a $L^\infty$-neighborhood of a minimizer.

Lemma 4

Let $\chi ^{\star \star }= (z^{\star \star }, \lambda ^{\star \star })$ be a global minimizer of (6) and the corresponding Lagrange multipliers. Then for every $\chi \in \mathcal {B}(\chi ^{\star \star },R)$ it holds that

$$\begin{aligned} L^{\star \star } - R&\le L{} & {} \le L^{\star \star } + R, \end{aligned}$$

(28a)

$$\begin{aligned} L^{\star \star } - R&\le \Vert {\xi _\tau }\Vert _{L^{\infty }({]0,1[} )}{} & {} \le L^{\star \star } + R, \end{aligned}$$

(28b)

$$\begin{aligned} 0&\le \Vert \lambda \Vert _{L^{\infty }({]0,1[} )}{} & {} \le R. \end{aligned}$$

(28c)

Proof

The first two inequalities follow immediately, since a global minimizer satisfies the constraint from (6). The latter two are a direct consequence of Lemma 2.

4.1 Inf-Sup Condition

We now show that the inf-sup condition, introduced in (18), holds in a certain neighborhood around a global minimizer. First, however, we point out that deviations ${\delta \xi }$ and ${\delta \xi _\tau }$ from a trajectory are inherently related and that the former is always bounded by the latter.

Theorem 5

(Wirtinger's inequality)

Let ${\delta \xi }\in H^1_0(]0,1[)$. Then

$$\begin{aligned} \Vert {\delta \xi }\Vert _{L^{2}({]0,1[} )} ^2 \le \frac{1}{\pi } \Vert {\delta \xi _\tau }\Vert _{L^{2}({]0,1[} )} ^2 \end{aligned}$$

(29)

holds.

Theorem 6

Let $z^{\star \star }$ be a global minimizer of (6). Further, let there be a constant $c>0$ and some direction $u\in {\mathbb {R}}^2$ with $\Vert u\Vert =1$ such that $u^T {\xi _\tau }^{\star \star }\ge c$ for almost all $\tau \in ]0,1[$. Then for any $z=(L,\xi )\in \mathcal {B}(z^{\star \star }, R)$ with $R < c$ there is some $\kappa > 0$ such that

$$\begin{aligned} \inf _{\lambda \ne 0\in L^2(]0,1[)}\sup _{{\delta z}\in {\delta Z}} \frac{\langle \lambda , h'(z)[{\delta z}]\rangle }{ \Vert \lambda \Vert _{L^{2}({]0,1[} )} \Vert {\delta z}\Vert _{Z^{2}} } \ge \kappa \end{aligned}$$

with

$$\begin{aligned} \kappa (R) = (c-R) \left[ \frac{3}{8} + 2 \left( \frac{{\overline{v}}+ {\overline{c}}_0}{{\overline{v}}- {\overline{c}}_0} + \frac{R}{\tilde{L}}\right) ^2\right] ^{-1/2}. \end{aligned}$$

Proof

For $f\in L^2(]0,1[)$ we define

$$\begin{aligned} \overline{f} := \int _0^1 f \, d\tau \in {\mathbb {R}}\quad \text {and} \quad \tilde{f} = f - \overline{f}, \end{aligned}$$

respectively, such that $(\overline{f}, \tilde{f})_{L^2(]0,1[)} = 0$ and

$$\begin{aligned} \Vert f\Vert _{L^{2}({]0,1[} )} ^2 = \Vert \tilde{f} + \overline{f}\Vert _{L^{2}({]0,1[} )} ^2 = \Vert \tilde{f}\Vert _{L^{2}({]0,1[} )} ^2 + \overline{f}^2. \end{aligned}$$

With

$$\begin{aligned} \begin{aligned} \frac{{\overline{v}}+ {\overline{c}}_0}{{\overline{v}}- {\overline{c}}_0}\tilde{L} + R \underset{(26)}{\ge }\ L^{\star \star } + R \ge b := \xi _\tau ^T u \ge c - R \end{aligned} \end{aligned}$$

(30)

we choose ${\delta \xi _\tau }= \frac{1}{2}\tilde{\lambda }u$ and ${\delta L}= \frac{1}{2L}\left( \overline{b\tilde{\lambda }}- (c-R) \overline{\lambda }\right)$. Note that ${\delta \xi }\in {\delta X}$ holds. For this choice, we obtain for ${\delta z}=({\delta L},{\delta \xi })$

$$\begin{aligned} \begin{aligned} \langle \lambda , h'(z)[{\delta z}]\rangle&= \int _0^1 (2{\xi _\tau }^T {\delta \xi _\tau }\lambda - 2 L {\delta L}\lambda ) \, d\tau \\&= \int _0^1 b\tilde{\lambda }\lambda \, d\tau - 2 L {\delta L}\overline{\lambda } \\&= \int _0^1 (b\tilde{\lambda }^2 + b\tilde{\lambda }\overline{\lambda }) \,d\tau - 2 L {\delta L}\overline{\lambda } \\&\underset{(32)}{\ge }\ (c-R) \Vert \tilde{\lambda }\Vert _{L^{2}({]0,1[} )} ^2 + \left( \int _0^1 b\tilde{\lambda }\,d\tau - 2 L {\delta L}\right) \overline{\lambda } \\&= (c-R) \Vert \tilde{\lambda }\Vert _{L^{2}({]0,1[} )} ^2 + \left( \int _0^1 b\tilde{\lambda }\,d\tau - \overline{b\tilde{\lambda }} + (c-R) \overline{\lambda }\right) \overline{\lambda } \\&= (c-R) \left( \Vert \tilde{\lambda }\Vert _{L^{2}({]0,1[} )} ^2 + \overline{\lambda }^2\right) \\&= (c-R) \Vert \lambda \Vert _{L^{2}({]0,1[} )} ^2. \end{aligned} \end{aligned}$$

Moreover, we have

$$\begin{aligned} \Vert {\delta \xi _\tau }\Vert _{L^{2}({]0,1[} )} \le \frac{1}{2} \Vert \tilde{\lambda }\Vert _{L^{2}({]0,1[} )} \end{aligned}$$

and, since clearly $c \le L^{\star \star }$,

$$\begin{aligned} \begin{aligned} |{\delta L}|&\le \frac{1}{2 L} \left( \Vert b\Vert _{L^{2}({]0,1[} )} \Vert \tilde{\lambda }\Vert _{L^{2}({]0,1[} )} + (c-R) |\overline{\lambda }| \right) \\&\underset{(32)}{\le }\ \frac{1}{\tilde{L}} \left( (L^{\star \star } + R) \Vert \tilde{\lambda }\Vert _{L^{2}({]0,1[} )} + (c-R) |\overline{\lambda }| \right) \\&\le \left( \frac{{\overline{v}}+ {\overline{c}}_0}{{\overline{v}}- {\overline{c}}_0} + \frac{R}{\tilde{L}}\right) \left( \Vert \tilde{\lambda }\Vert _{L^{2}({]0,1[} )} + |\overline{\lambda }| \right) , \end{aligned} \end{aligned}$$

which implies

$$\begin{aligned} \begin{aligned} \Vert {\delta z}\Vert _{Z^{2}} ^2&\underset{(12\textrm{b})}{=} \Vert {\delta \xi }\Vert _{L^{2}({]0,1[} )} ^2 + \Vert {\delta \xi _\tau }\Vert _{L^{2}({]0,1[} )} ^2 + {\delta L}^2 \\&\underset{(29)}{\le }\ \frac{3}{2} \Vert {\delta \xi _\tau }\Vert _{L^{2}({]0,1[} )} ^2 + {\delta L}^2 \\&\le \frac{3}{8} \Vert \tilde{\lambda }\Vert _{L^{2}({]0,1[} )} ^2 + \left( \frac{{\overline{v}}+ {\overline{c}}_0}{{\overline{v}}- {\overline{c}}_0} + \frac{R}{\tilde{L}}\right) ^2 \left( \Vert \tilde{\lambda }\Vert _{L^{2}({]0,1[} )} + \overline{\lambda }\right) ^2 \\&\le \frac{3}{8} \Vert \tilde{\lambda }\Vert _{L^{2}({]0,1[} )} ^2 + 2 \left( \frac{{\overline{v}}+ {\overline{c}}_0}{{\overline{v}}- {\overline{c}}_0} + \frac{R}{\tilde{L}}\right) ^2 \Vert \tilde{\lambda }\Vert _{L^{2}({]0,1[} )} ^2 + 2 \left( \frac{{\overline{v}}+ {\overline{c}}_0}{{\overline{v}}- {\overline{c}}_0} + \frac{R}{\tilde{L}}\right) ^2 \overline{\lambda }^2 \\&\le \left[ \frac{3}{8} + 2 \left( \frac{{\overline{v}}+ {\overline{c}}_0}{{\overline{v}}- {\overline{c}}_0} + \frac{R}{\tilde{L}}\right) ^2 \right] \left( \Vert \tilde{\lambda }\Vert _{L^{2}({]0,1[} )} ^2 + \overline{\lambda }^2 \right) \\&= \left[ \frac{3}{8} + 2 \left( \frac{{\overline{v}}+ {\overline{c}}_0}{{\overline{v}}- {\overline{c}}_0} + \frac{R}{\tilde{L}}\right) ^2 \right] \Vert \lambda \Vert _{L^{2}({]0,1[} )} ^2. \end{aligned} \end{aligned}$$

Consequently,

$$\begin{aligned} \langle \lambda , h'(z)[{\delta z}]\rangle \ge (c-R) \left[ \frac{3}{8} + 2 \left( \frac{{\overline{v}}+ {\overline{c}}_0}{{\overline{v}}- {\overline{c}}_0} + \frac{R}{\tilde{L}}\right) ^2\right] ^{-1/2} \Vert \lambda \Vert _{L^{2}({]0,1[} )} \, \Vert {\delta z}\Vert _{Z^{2}} \end{aligned}$$

yields the claim.

4.2 Positive Definiteness of the Lagrangian

The next step in order prove invertibility of the KKT-operator $F'(\chi )$, (24), is to show that the second partial derivative of the Lagrangian $\mathcal {L}(\chi )$, (13), with respect to the state $z$ is positive definite on the kernel of the linearized constraints. On the way we derive a similar result for the objective $T(\xi )$, (2) for which we first derive an upper bound for its third derivative.

Lemma 7

Let $\Vert w\Vert _{L^{\infty }(\Omega )} \le {\overline{c}}_0 \le {\overline{v}}/\sqrt{5}$, $\Vert w_x\Vert _{L^{\infty }(\Omega )} \le {\overline{c}}_1$, $\Vert w_{xx}\Vert _{L^{\infty }(\Omega )} \le {\overline{c}}_2$, and $\Vert w_{xxx}\Vert _{L^{\infty }(\Omega )} \le {\overline{c}}_3$ and define ${\underline{v}}^2:= {\overline{v}}^2 - {\overline{c}}_0^2$. Then, for any $\xi \in X$, the third directional derivative of $f$ as given in (3) is bounded by

$$\begin{aligned} \begin{aligned}&\hspace{-2cm}|f'''(\xi ,{\xi _\tau }) [{\delta \xi },{\delta \xi _\tau }]^2[{\Delta \xi },{\Delta \xi _\tau }]| \\ \le ~&\left( {\overline{\gamma }}_0 {\Vert {\xi _\tau }\Vert }{\Vert {\delta \xi }\Vert }^2 + {\overline{\gamma }}_2 {\Vert {\delta \xi }\Vert }{\Vert {\delta \xi _\tau }\Vert }+ \frac{{\overline{\gamma }}_4}{{\Vert {\xi _\tau }\Vert }} {\Vert {\delta \xi _\tau }\Vert }^2 \right) ~ {\Vert {\Delta \xi }\Vert }\\ +&\left( {\overline{\gamma }}_1 {\Vert {\delta \xi }\Vert }^2 + \frac{{\overline{\gamma }}_3}{{\Vert {\xi _\tau }\Vert }} {\Vert {\delta \xi }\Vert }{\Vert {\delta \xi _\tau }\Vert }+\frac{{\overline{\gamma }}_5}{{\Vert {\xi _\tau }\Vert }^2} {\Vert {\delta \xi _\tau }\Vert }^2 \right) ~ {\Vert {\Delta \xi _\tau }\Vert }\end{aligned} \end{aligned}$$

(31)

with ${\overline{\gamma }}_i\ge 0$, $i\in 0,\dots ,5$, given as

$$\begin{aligned} \begin{aligned} {\overline{\gamma }}_0&= \frac{2}{{\underline{v}}^4} \left( 37 {\overline{c}}_1^3 +21 {\overline{c}}_1 {\overline{c}}_2 {\underline{v}}+2 {\overline{c}}_3 {\underline{v}}^2 \right) ,&{\overline{\gamma }}_3&= 40\frac{{\overline{c}}_1}{{\underline{v}}^2}, \\ {\overline{\gamma }}_1&= \frac{1}{{\underline{v}}^3} \left( 29 {\overline{c}}_1^2 + 7 {\underline{v}}{\overline{c}}_2\right) ,&{\overline{\gamma }}_4&= 20\frac{{\overline{c}}_1}{{\underline{v}}^2}, \\ {\overline{\gamma }}_2&=\frac{1}{{\underline{v}}^3} (57 {\overline{c}}_1^2 + 13{\underline{v}}{\overline{c}}_2),&{\overline{\gamma }}_5&= 18 \frac{1}{{\underline{v}}}. \end{aligned} \end{aligned}$$

(32)

The proof can again be found in the Appendix. With this result we can derive a bound for the third directional derivative of $T$.

Theorem 8

Let $(L^{\star \star }, \xi ^{\star \star })$ be a global minimizer of (6) and define $\tilde{L}:= \Vert x_D-x_O\Vert$ and ${\Delta \xi }:= \xi -\xi ^{\star \star }$. Moreover, let $\Vert w(p)\Vert \le {\overline{c}}_0 \le {\overline{v}}/ \sqrt{5}$, $\Vert w_x(p)\Vert \le {\overline{c}}_1$, $\Vert w_{xx}(p)\Vert \le {\overline{c}}_2$, and $\Vert w_{xxx}(p)\Vert \le {\overline{c}}_3$ for every $p\in \Omega$. Then, for any $\xi \in X$ with $\Vert {\Delta \xi }\Vert _{X^{\infty }} \le R < \tilde{L}$, it holds that

$$\begin{aligned} |T'''(\xi )[{\delta \xi }]^2[{\Delta \xi }]| \le {\overline{\Gamma }}\left( \Vert {\delta \xi }\Vert _{L^{2}({]0,1[} )} ^2 + \Vert {\delta \xi _\tau }\Vert _{L^{2}({]0,1[} )} ^2\right) ~ \Vert \Delta\xi\Vert _{C^{0,1}{(]0,1[)}} . \end{aligned}$$

(33)

with $\Vert\Delta\xi\Vert_{C^{0,1}(]0,1[)} = \Vert {\Delta\xi}\Vert_{L^{\infty}({]0,1[})} + \Vert\Delta\xi_\tau\Vert_{L^\infty(]0,1[)}$ and

$$\begin{aligned} \begin{aligned} {\overline{\Gamma }}:= \max \bigg \{&\left( \frac{{\overline{v}}+{\overline{c}}_0}{{\overline{v}}-{\overline{c}}_0} \tilde{L} + R\right) {\overline{\gamma }}_0 + \frac{{\overline{\gamma }}_2}{2}, \quad \frac{{\overline{\gamma }}_4}{\tilde{L} - R} + \frac{{\overline{\gamma }}_2}{2}, \\&{\overline{\gamma }}_1 + \frac{{\overline{\gamma }}_3}{2(\tilde{L} - R)}, \quad \frac{{\overline{\gamma }}_3}{2(\tilde{L} - R)} + \frac{{\overline{\gamma }}_5}{(\tilde{L} - R)^2} \bigg \} \end{aligned} \end{aligned}$$

(34)

and ${\overline{\gamma }}_0,\dots ,{\overline{\gamma }}_5$ as given in Lemma 7 above.

Proof

From the definition of T in (2), we know that

$$\begin{aligned} T'''(\xi )[{\delta \xi }]^2[{\Delta \xi }] =\int _0^1 \, f'''(\xi ,{\xi _\tau }) [{\delta \xi },{\delta \xi _\tau }]^2[{\Delta \xi },{\Delta \xi _\tau }] d\tau . \end{aligned}$$

Inserting the bound from Lemmas 4 and 7 above and using Young’s inequality yields

$$\begin{aligned} \begin{aligned}&|T'''(\xi )[{\delta \xi }]^2[{\Delta \xi }]| \\&\le \int _0^1 ~ \left( {\overline{\gamma }}_0 {\Vert {\xi _\tau }\Vert }{\Vert {\delta \xi }\Vert }^2 + {\overline{\gamma }}_2 {\Vert {\delta \xi }\Vert }{\Vert {\delta \xi _\tau }\Vert }+ \frac{{\overline{\gamma }}_4}{{\Vert {\xi _\tau }\Vert }} {\Vert {\delta \xi _\tau }\Vert }^2 \right) ~ {\Vert {\Delta \xi }\Vert }\\&\hspace{0.8cm}+ \left( {\overline{\gamma }}_1 {\Vert {\delta \xi }\Vert }^2 + \frac{{\overline{\gamma }}_3}{{\Vert {\xi _\tau }\Vert }} {\Vert {\delta \xi }\Vert }{\Vert {\delta \xi _\tau }\Vert }+ \frac{{\overline{\gamma }}_5}{{\Vert {\xi _\tau }\Vert }^2} {\Vert {\delta \xi _\tau }\Vert }^2 \right) ~ {\Vert {\Delta \xi _\tau }\Vert }~d\tau . \\&\le \Vert {\Delta \xi }\Vert _{L^{\infty }} \int _0^1 {\overline{\gamma }}_0 {\Vert {\xi _\tau }\Vert }{\Vert {\delta \xi }\Vert }^2 + {\overline{\gamma }}_2 {\Vert {\delta \xi }\Vert }{\Vert {\delta \xi _\tau }\Vert }+ \frac{{\overline{\gamma }}_4}{{\Vert {\xi _\tau }\Vert }} {\Vert {\delta \xi _\tau }\Vert }^2 d\tau \\&\quad + \Vert {\Delta \xi _\tau }\Vert _{L^{\infty }} \int _0^1 {\overline{\gamma }}_1 {\Vert {\delta \xi }\Vert }^2 + \frac{{\overline{\gamma }}_3}{{\Vert {\xi _\tau }\Vert }} {\Vert {\delta \xi }\Vert }{\Vert {\delta \xi _\tau }\Vert }+ \frac{{\overline{\gamma }}_5}{{\Vert {\xi _\tau }\Vert }^2} {\Vert {\delta \xi _\tau }\Vert }^2 d\tau \\&\underset{(28)}{\le } \Vert {\Delta \xi }\Vert _{L^{\infty }} \int _0^1 \left( \frac{{\overline{v}}+{\overline{c}}_0}{{\overline{v}}-{\overline{c}}_0} \tilde{L} + R\right) {\overline{\gamma }}_0 {\Vert {\delta \xi }\Vert }^2 + {\overline{\gamma }}_2 {\Vert {\delta \xi }\Vert }{\Vert {\delta \xi _\tau }\Vert }+ \frac{{\overline{\gamma }}_4}{\tilde{L} - R} {\Vert {\delta \xi _\tau }\Vert }^2 d\tau \\&\quad + \Vert {\Delta \xi _\tau }\Vert _{L^{\infty }} \int _0^1 {\overline{\gamma }}_1 {\Vert {\delta \xi }\Vert }^2 + \frac{{\overline{\gamma }}_3}{\tilde{L} - R} {\Vert {\delta \xi }\Vert }{\Vert {\delta \xi _\tau }\Vert }+ \frac{{\overline{\gamma }}_5}{(\tilde{L} - R)^2} {\Vert {\delta \xi _\tau }\Vert }^2 d\tau \\&\underset{\text {(Y)}}{\le } \Vert {\Delta \xi }\Vert _{L^{\infty }} \left[ \left( \left( \frac{{\overline{v}}+{\overline{c}}_0}{{\overline{v}}-{\overline{c}}_0} \tilde{L} + R\right) {\overline{\gamma }}_0 + \frac{{\overline{\gamma }}_2}{2} \right) \Vert {\delta \xi }\Vert _{L^{2}} ^2 + \left( \frac{{\overline{\gamma }}_4}{\tilde{L} - R} + \frac{{\overline{\gamma }}_2}{2} \right) \Vert {\delta \xi _\tau }\Vert _{L^{2}} ^2 \right] \\&\quad + \Vert {\Delta \xi _\tau }\Vert _{L^{\infty }} \left[ \left( {\overline{\gamma }}_1 + \frac{{\overline{\gamma }}_3}{2(\tilde{L} - R)} \right) \Vert {\delta \xi }\Vert _{L^{2}} ^2 + \left( \frac{{\overline{\gamma }}_3}{2(\tilde{L} - R)} + \frac{{\overline{\gamma }}_5}{(\tilde{L} - R)^2}\right) \Vert {\delta \xi _\tau }\Vert _{L^{2}} ^2 \right] \\&\underset{(34)}{\le } {\overline{\Gamma }}\left( \Vert {\delta \xi }\Vert _{L^{2}({]0,1[} )} ^2 + \Vert {\delta \xi _\tau }\Vert _{L^{2}({]0,1[} )} ^2\right) ~ \Vert\Delta\xi\Vert_{C^{0,1}(]0,1[) }. \end{aligned} \end{aligned}$$

Having bounded the third derivative of T, we can estimate the potential decay of $T''$ and thus derive a lower bound for the size of this neighborhood. Similarly, we can bound $h''$ and hence $\mathcal {L}_{zz}$.

Theorem 9

Let $\Vert w\Vert _{L^{\infty }(\Omega )} \le {\overline{c}}_0 < {\overline{v}}/\sqrt{5}$, $\Vert w_x\Vert _{L^{\infty }(\Omega )} \le {\overline{c}}_1$, $\Vert w_{xx}\Vert _{L^{\infty }(\Omega )} \le {\overline{c}}_2$, and $\Vert w_{xxx}\Vert _{L^{\infty }(\Omega )} \le {\overline{c}}_3$ and define $\tilde{L}:= \Vert x_D-x_O\Vert$. Moreover, let $\chi ^{\star \star }:= (z^{\star \star }, \lambda ^{\star \star })$ be a globally optimal solution to problem (6), that satisfies the necessary and sufficient conditions (14), (18), and (20) with ${\underline{\mathcal {B}}}>0$. Then there is a $0< R < \min \left\{ \frac{{\underline{\mathcal {B}}}}{2{\overline{\Gamma }}},\; \frac{{\underline{\mathcal {B}}}}{40},\; \frac{\tilde{L}}{2} \right\}$ with ${\overline{\Gamma }}$ from Theorem 8 such that

$$\begin{aligned} \mathcal {L}_{zz}(\chi )[{\delta z}]^2 \ge \frac{{\underline{\mathcal {B}}}}{4} \Vert {\delta z}\Vert _{Z^{2}} ^2 \end{aligned}$$

(35)

holds for any $\chi \in \mathcal {B}(\chi ^{\star \star }, R)$ and any ${\delta z}\in {\delta Z}$ such that ${\xi _\tau }^T {\delta \xi _\tau }= L{\delta L}$ holds almost everywhere.

Proof

Let ${\Delta \xi }:= \xi -\xi ^{\star \star }$ and note that $\Vert {\Delta \xi }\Vert _{L^{\infty }({]0,1[} )} \le \Vert {\Delta z}\Vert _{Z^{\infty }} \le R < \frac{{\underline{\mathcal {B}}}}{2{\overline{\Gamma }}}$. Then we obtain

$$\begin{aligned} \begin{aligned} T''(\xi )[{\delta \xi },{\delta \xi _\tau }]^2&= T''(\xi ^{\star \star })[{\delta \xi },{\delta \xi _\tau }]^2 + \int _0^1 T'''(\xi +\nu {\Delta \xi })[{\delta \xi },{\delta \xi _\tau }]^2[{\Delta \xi },{\Delta \xi _\tau }]\,d\nu \\&\underset{(20)}{\ge } {\underline{\mathcal {B}}} \Vert {\delta z}\Vert _{Z^{2}} ^2 + \int _0^1 T'''(\xi +\nu {\Delta \xi })[{\delta \xi },{\delta \xi _\tau }]^2[{\Delta \xi },{\Delta \xi _\tau }]\,d\nu \\&\underset{(33)}{\ge } {\underline{\mathcal {B}}} \Vert {\delta z}\Vert _{Z^{2}} ^2 - {\overline{\Gamma }}\left( \Vert {\delta \xi }\Vert _{L^{2}({]0,1[} )} ^2 + \Vert {\delta \xi _\tau }\Vert _{L^{2}({]0,1[} )} ^2\right)~ \Vert {\Delta z}\Vert _{Z^{\infty }} \\&\underset{(12b)}{\ge }\ {\underline{\mathcal {B}}} \Vert {\delta z}\Vert _{Z^{2}} ^2 - {\overline{\Gamma }} \Vert {\delta z}\Vert _{Z^{2}} ^2 ~ \Vert {\Delta z}\Vert _{Z^{\infty }} , \\&\ge \frac{{\underline{\mathcal {B}}}}{2} \Vert {\delta z}\Vert _{Z^{2}} ^2. \end{aligned} \end{aligned}$$

Further, we point out that

$$\begin{aligned} R \le \frac{\tilde{L}}{2} \le \frac{L^{\star \star }}{2}, \end{aligned}$$

(36)

which together with the bounds from Lemma 4 yields

$$\begin{aligned} \begin{aligned} \langle h''(z)[{\delta z}]^2 \rangle&= \int _0^1 \lambda \left( {\delta \xi _\tau }^T{\delta \xi _\tau }- {\delta L}^2 \right) d\tau \\&= \int _0^1 \lambda \left( {\Vert {\delta \xi _\tau }\Vert }^2 - \left( \frac{{\xi _\tau }^T{\delta \xi _\tau }}{L}\right) ^2 \right) d\tau \\&\ge - \Vert \lambda \Vert _{L^{\infty }({]0,1[} )} \left( \Vert {\delta \xi _\tau }\Vert _{L^{2}({]0,1[} )} ^2 + \int _0^1 \frac{{\Vert {\xi _\tau }\Vert }^2 {\Vert {\delta \xi _\tau }\Vert }^2}{L^2} \; d\tau \right) \\&\ge - \Vert \lambda \Vert _{L^{\infty }({]0,1[} )} \left( \Vert {\delta \xi _\tau }\Vert _{L^{2}({]0,1[} )} ^2 + \frac{ \Vert {\xi _\tau }\Vert _{L^{\infty }({]0,1[} )} ^2}{L^2} \int _0^1 {\Vert {\delta \xi _\tau }\Vert }^2 \; d\tau \right) \\&\underset{(28)}{\ge } - R \left( \Vert {\delta \xi _\tau }\Vert _{L^{2}({]0,1[} )} ^2 + \frac{(L^{\star \star } + R)^2}{(L^{\star \star } - R)^2} \Vert {\delta \xi _\tau }\Vert _{L^{2}({]0,1[} )} ^2 \right) \\&\ge - R \left( 1 + \frac{(L^{\star \star } + R)^2}{(L^{\star \star } - R)^2} \right) \Vert {\delta \xi _\tau }\Vert _{L^{2}({]0,1[} )} ^2 \\&\underset{(36)}{\ge } - 10 R \Vert {\delta \xi _\tau }\Vert _{L^{2}({]0,1[} )} ^2 \\&\ge - \frac{{\underline{\mathcal {B}}}}{4} \Vert {\delta \xi _\tau }\Vert _{L^{2}({]0,1[} )} ^2 \\&\underset{(12b)}{\ge } - \frac{{\underline{\mathcal {B}}}}{4} \Vert {\delta z}\Vert _{Z^{2}} ^2. \end{aligned} \end{aligned}$$

Together, these bounds yield the claim with

$$\begin{aligned} \begin{aligned} \mathcal {L}_{zz}(\chi )[{\delta z}]^2&= T''(\xi )[{\delta \xi }]^2 + \langle h''(z)[{\delta z}]^2 \rangle \\&\ge \frac{{\underline{\mathcal {B}}}}{2} \Vert {\delta z}\Vert _{Z^{2}} ^2 - \frac{{\underline{\mathcal {B}}}}{4} \Vert {\delta z}\Vert _{Z^{2}} ^2 \\&\ge \frac{{\underline{\mathcal {B}}}}{4} \Vert {\delta z}\Vert _{Z^{2}} ^2. \end{aligned} \end{aligned}$$

4.3 Upper Bound for the Lagrangian

As a counterpart to the previous Lemma, we also derive an upper bound for $L_{zz}$ close to a minimizer. Again we start with the underlying function $f$ in order to bound the error in the objective function $T$ .

Lemma 10

Let $\Vert w\Vert _{L^{\infty }(\Omega )} \le {\overline{c}}_0 \le {\overline{v}}/\sqrt{5}$, $\Vert w_x\Vert _{L^{\infty }(\Omega )} \le {\overline{c}}_1$, and $\Vert w_{xx}\Vert _{L^{\infty }(\Omega )} \le {\overline{c}}_2$. Moreover, let ${\underline{v}}^2:= {\overline{v}}^2 - {\overline{c}}_0^2$. Then, for any $\xi \in X$, the second directional derivative of $f$ as given in (3) is bounded by

$$\begin{aligned} \begin{aligned} |f''(\xi ,{\xi _\tau }) [{\delta \xi },{\delta \xi _\tau }][{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }]| \le \quad&{\overline{\beta }}_0 {\Vert {\xi _\tau }\Vert }{\Vert {\delta \xi }\Vert }{\Vert {\tilde{\delta \xi }}\Vert }\\ +&{\overline{\beta }}_1 \left( {\Vert {\delta \xi }\Vert }{\Vert {\tilde{\delta \xi }_\tau }\Vert }+ {\Vert {\delta \xi _\tau }\Vert }{\Vert {\tilde{\delta \xi }}\Vert }\right) \\ +&{\overline{\beta }}_2 {\Vert {\xi _\tau }\Vert }^{-1} {\Vert {\delta \xi _\tau }\Vert }{\Vert {\tilde{\delta \xi }_\tau }\Vert }\end{aligned} \end{aligned}$$

(37)

with

$$\begin{aligned} {\overline{\beta }}_0 = 14 \frac{{\overline{c}}_1^2}{{\underline{v}}^3} + 4 \frac{{\overline{c}}_2}{{\underline{v}}^2}, \qquad {\overline{\beta }}_1 = 7\frac{{\overline{c}}_1}{{\underline{v}}^2}, ~ \text {and} \qquad {\overline{\beta }}_2 = \frac{4}{{\underline{v}}} . \end{aligned}$$

(38)

The proof can be found in the Appendix.

Theorem 11

Let $z^{\star \star } = (L^{\star \star },\xi ^{\star \star })$ be a global minimizer of (6) and ${\Delta z}:= z - z^{\star \star }$. Moreover, let $\Vert w\Vert _{L^{\infty }(\Omega )} \le {\overline{c}}_0 \le \bar{v} / \sqrt{5}$, $\Vert w_x\Vert _{L^{\infty }(\Omega )} \le {\overline{c}}_1$, and $\Vert w_{xx}\Vert _{L^{\infty }(\Omega )} \le {\overline{c}}_2$. Also define ${v}^2:= {\overline{v}}^2 - {\overline{c}}_0^2$ and $\tilde{L}:= \Vert x_D-x_O\Vert$. Then, for any $z\in \mathcal {B}(z^{\star \star }, R)$ , the second directional derivative of T as defined in (2) is bounded by

$$\begin{aligned} |T''(\xi )[{\Delta \xi }]^2| \le {\overline{\mathcal {B}}} \Vert {\Delta z}\Vert _{Z^{2}} ^2 \end{aligned}$$

(39)

with ${\overline{\mathcal {B}}}:= {\overline{\beta }}_1 + \max \left\{ \left( \frac{{\overline{v}}+{\overline{c}}_0}{{\overline{v}}-{\overline{c}}_0} \tilde{L} + R\right) {\overline{\beta }}_0, \; \frac{{\overline{\beta }}_2}{\tilde{L} + R} \right\}$ and ${\overline{\beta }}_0,{\overline{\beta }}_1,{\overline{\beta }}_2$ as defined in Lemma 10.

Proof

From the definition of T in (2) we know that

$$\begin{aligned} T''(\xi )[{\Delta \xi },{\Delta \xi _\tau }]^2 = \int _0^1 f''[{\Delta \xi },{\Delta \xi _\tau }]^2 d\tau , \end{aligned}$$

which, together with the bounds from Lemmas 4 and 10 as well as Young’s inequality, then leads to

$$\begin{aligned} \begin{aligned} |T''(\xi )[{\Delta \xi },{\Delta \xi _\tau }]^2|&\le \int _0^1 \left( {\overline{\beta }}_0 {\Vert {\xi _\tau }\Vert }{\Vert {\Delta \xi }\Vert }^2 + 2{\overline{\beta }}_1 {\Vert {\Delta \xi }\Vert }{\Vert {\Delta \xi _\tau }\Vert }+ \frac{{\overline{\beta }}_2}{{\Vert {\xi _\tau }\Vert }} {\Vert {\Delta \xi _\tau }\Vert }^2 \right) \, d\tau \\&\underset{(28)}{\le } {\overline{\beta }}_0 (L^{\star \star } + R) \int _0^1 {\Vert {\Delta \xi }\Vert }^2 d\tau \\ {}&\qquad + 2{\overline{\beta }}_1 \int _0^1 {\Vert {\Delta \xi }\Vert }{\Vert {\Delta \xi _\tau }\Vert }d\tau \\ {}&\qquad + \frac{{\overline{\beta }}_2}{L^{\star \star } + R} \int _0^1 {\Vert {\Delta \xi _\tau }\Vert }^2 d\tau \\&\underset{\text {(Y)}}{\le } \left( (L^{\star \star } + R) {\overline{\beta }}_0 + {\overline{\beta }}_1 \right) \Vert {\Delta \xi }\Vert _{L^{2}({]0,1[} )} ^2 \\ {}&\qquad + \left( {\overline{\beta }}_1 + \frac{{\overline{\beta }}_2}{L^{\star \star } + R} \right) \Vert {\Delta \xi _\tau }\Vert _{L^{2}({]0,1[} )} ^2 \\&\underset{(26)}{\le } \left( \left( \frac{{\overline{v}}+{\overline{c}}_0}{{\overline{v}}-{\overline{c}}_0} \tilde{L} + R\right) {\overline{\beta }}_0 + {\overline{\beta }}_1 \right) \Vert {\Delta \xi }\Vert _{L^{2}({]0,1[} )} ^2 \\ {}&\qquad + \left( {\overline{\beta }}_1 + \frac{{\overline{\beta }}_2}{\tilde{L} + R} \right) \Vert {\Delta \xi _\tau }\Vert _{L^{2}({]0,1[} )} ^2 \\&\le {\overline{\mathcal {B}}}\left( \Vert {\Delta \xi }\Vert _{L^{2}({]0,1[} )} ^2 + \Vert {\Delta \xi _\tau }\Vert _{L^{2}({]0,1[} )} ^2 \right) \\&\underset{(12b)}{\le }\ {\overline{\mathcal {B}}} \Vert {\Delta z}\Vert _{Z^{2}} ^2. \end{aligned} \end{aligned}$$

Theorem 12

Let $\chi ^{\star \star }= (z^{\star \star }, \lambda ^{\star \star })$ be a global minimizer of (6) and the corresponding Lagrange multipliers. Then for every $\chi \in \mathcal {B}(\chi ^{\star \star }, R)$ and every ${\delta z}\in {\delta Z}$ it holds that

$$\begin{aligned} |\mathcal {L}_{zz}(\chi )[{\delta z}]^2| \le \left( {\overline{\mathcal {B}}}+ R \right) \Vert {\delta z}\Vert _{Z^{2}} ^2 \end{aligned}$$

(40)

with ${\overline{\mathcal {B}}}(R)$ from Theorem 11.

Proof

Using the bound from Theorem 11 and Young’s inequality, we get

$$\begin{aligned} \begin{aligned} |\mathcal {L}_{zz}(\chi )[{\delta z}]^2|&= |T''(\xi )[{\delta \xi }]^2 + \langle h''(z)[{\delta z}]^2 \rangle | \\&\underset{(39)}{\le } {\overline{\mathcal {B}}} \Vert dz\Vert _{Z^{2}} ^2 + \int _0^1 |\lambda \left( {\delta \xi _\tau }^T{\delta \xi _\tau }- {\delta L}^2 \right) | \; d\tau \\&\le {\overline{\mathcal {B}}} \Vert dz\Vert _{Z^{2}} ^2 + \Vert \lambda \Vert _{L^{\infty }({]0,1[} )} \left( \Vert {\delta \xi _\tau }\Vert _{L^{2}({]0,1[} )} ^2 + {\delta L}^2 \right) \\&\underset{(28)}{\le } {\overline{\mathcal {B}}} \Vert dz\Vert _{Z^{2}} ^2 + R \left( \Vert {\delta \xi _\tau }\Vert _{L^{2}({]0,1[} )} ^2 + {\delta L}^2 \right) \\&\underset{(12b)}{\le } \left( {\overline{\mathcal {B}}}+ R \right) \Vert dz\Vert _{Z^{2}} ^2 . \end{aligned} \end{aligned}$$

4.4 Invertibility of the KKT-Operator

Using the previous three results, which together state the existence of a neighborhood around a minimizer such that the LBB-conditions are satisfied, we are now ready to prove that the KKT-operator $F'$ is invertible.

Lemma 13

Let $\chi ^{\star \star }= (z^{\star \star }, \lambda ^{\star \star })$ be a global minimizer of (6), that satisfies the first and second order conditions for optimality with some ${\underline{\mathcal {B}}}> 0$, and the corresponding Lagrange multipliers. Further, let there be a u with $\Vert u\Vert =1$ such that $u^T {\xi _\tau }^{\star \star }\ge c > 0$ for almost all $\tau \in ]0,1[$. Then for $F$ as given in (21) it holds that

$$\begin{aligned} \Vert F'(\chi )^{-1}\Vert _{Y^{2}} \le \omega _1 \end{aligned}$$

(41)

for every $\chi =(z,\lambda )\in \mathcal {B}(\chi ^{\star \star }, R)$ and

$$\begin{aligned} \omega _1 = \sqrt{2} \max \left\{ \frac{4}{{\underline{\mathcal {B}}}}, \; \frac{1}{\kappa }\left( 1+\frac{4({\overline{\mathcal {B}}}+R)}{{\underline{\mathcal {B}}}}\right) , \; \frac{{\overline{\mathcal {B}}}+R}{\kappa ^2} \right\} \end{aligned}$$

(42)

and ${\overline{\mathcal {B}}}(R)$ and $\kappa (R)$ as given in Theorems 6 and 11, respectively.

Proof

The proof builds on some prerequisites that have been established above and are briefly summarized.

(i)
In Theorem 6 it was proved that the inf-sup condition is satisfied:
$$\begin{aligned} \underset{{\delta \lambda }\in L^2(]0,1[)}{\inf }\ \; \underset{{\delta z}\in {\delta Z}}{\sup }\ \; \frac{\langle {\delta \lambda }, h'(z)[{\delta z}]\rangle }{ \Vert {\delta z}\Vert _{Z^{2}} \Vert {\delta \lambda }\Vert _{L^{2}({]0,1[} )} } \ge \kappa > 0. \end{aligned}$$
(ii)
In Theorem 9 it was proved that $\mathcal {L}_{zz}$ is positive definite on the kernel of the constraints, i.e.,
$$\begin{aligned} \mathcal {L}_{zz}(\chi )[{\delta z}]^2 = T''(\xi )[{\delta \xi }]^2 + \langle h''(z)[{\delta z}]^2 \rangle \ge \frac{{\underline{\mathcal {B}}}}{4} \Vert {\delta z}\Vert _{Z^{2}} ^2 \end{aligned}$$
for all ${\delta z}\in {\delta Z}$ such that $h'(z)[{\delta z}] = 0$.
(iii)
In Theorem 12 it was proved that $\mathcal {L}_{zz}$ is bounded from above as
$$\begin{aligned} |\mathcal {L}_{zz}(\chi )[{\delta z}]^2| = |T''(\xi )[{\delta \xi }]^2 + \langle h''(z)[{\delta z}]^2 \rangle | \le ({\overline{\mathcal {B}}}+ R) \Vert {\delta z}\Vert _{Z^{2}} ^2 . \end{aligned}$$

Under these conditions, it follows from Brezzi’s Splitting Theorem [22, Thm. 4.3] that $F'(x)$ is isomorphic. Further, it can be shown that for every right hand side F(x) of the saddle point problem (24) there is exactly one solution $({\Delta z}, {\Delta \lambda })$ with

$$\begin{aligned} \begin{aligned} \Vert {\Delta z}\Vert _{Z^{2}}&\le \frac{4}{{\underline{\mathcal {B}}}}\; \Vert T'(\xi ) + \langle \lambda , h'(z) \rangle \Vert _{Z^{2}} \\&\quad + \frac{1}{\kappa }\left( 1+\frac{4({\overline{\mathcal {B}}}+R)}{{\underline{\mathcal {B}}}}\right) \Vert h(z)\Vert _{L^{2}({]0,1[} )} , \\ \Vert {\Delta \lambda }\Vert _{L^{2}({]0,1[} )}&\le \frac{1}{\kappa }\left( 1+\frac{4({\overline{\mathcal {B}}}+R)}{{\underline{\mathcal {B}}}}\right) \Vert T'(\xi ) + \langle \lambda , h'(z) \rangle \Vert _{Z^{2}} \\&\quad + \frac{{\overline{\mathcal {B}}}+R}{\kappa ^2} \left( 1+\frac{4({\overline{\mathcal {B}}}+R)}{{\underline{\mathcal {B}}}}\right) \Vert h(z)\Vert _{L^{2}({]0,1[} )} . \end{aligned} \end{aligned}$$

With $\Vert F(\chi )\Vert = \Vert T'(\xi ) + \langle \lambda , h'(z) \rangle \Vert _{Z^{2}} ^2 + \Vert h(z)\Vert _{L^{2}({]0,1[} )} ^2$ follows that

$$\begin{aligned} \begin{aligned} \Vert {\Delta z}\Vert _{Z^{2}}&\le \sqrt{2} \max \left\{ \frac{4}{{\underline{\mathcal {B}}}}, \; \frac{1}{\kappa }\left( 1+\frac{4({\overline{\mathcal {B}}}+R)}{{\underline{\mathcal {B}}}}\right) \right\} \Vert F(\chi )\Vert , \\ \Vert {\Delta \lambda }\Vert _{L^{2}({]0,1[} )}&\le \sqrt{2} \max \left\{ \frac{1}{\kappa }\left( 1+\frac{4({\overline{\mathcal {B}}}+R)}{{\underline{\mathcal {B}}}}\right) , \; \frac{{\overline{\mathcal {B}}}+R}{\kappa ^2} \right\} \Vert F(\chi )\Vert , \end{aligned} \end{aligned}$$

which directly yields

$$\begin{aligned} \Vert \Delta \chi \Vert _{Y^{2}} ^2 \underset{(22b)}{=}\ \Vert {\Delta z}\Vert _{Z^{2}} ^2 + \Vert {\Delta \lambda }\Vert _{L^{2}({]0,1[} )} ^2 \le \omega _1^2 \Vert F(\chi )\Vert \end{aligned}$$

with $\omega _1 = \sqrt{2} \max \left\{ \frac{4}{{\underline{\mathcal {B}}}}, \frac{1}{\kappa }\left( 1+\frac{4({\overline{\mathcal {B}}}+R)}{{\underline{\mathcal {B}}}}\right) , \frac{{\overline{\mathcal {B}}}+R}{\kappa ^2} \right\}$. This completes the proof, since

$$\begin{aligned} \Vert F'(\chi )^{-1}\Vert _{Y^{2}} = \underset{ \Vert F(\chi )\Vert _{Y^{2}} }{\sup } \frac{ \Vert \Delta \chi \Vert _{Y^{2}} }{ \Vert F(\chi )\Vert _{Y^{2}} } \le \omega _1. \end{aligned}$$

4.5 Lipschitz Constant

We are on the verge of presenting a Lipschitz constant for the free flight problem. To accomplish this, we introduce an additional bound in the form of a Lemma. This bound incorporates the constant $\hat{\mathcal {B}}$, which is derived in the Appendix (Lemma 18). It serves to define an upper limit on the second derivative of $f$ as defined in 3. Its value is contingent upon the overall characteristics of the wind field.

Lemma 14

Let $\chi ^{\star \star }= (z^{\star \star }, \lambda ^{\star \star })$ be a global minimizer of (6) and the corresponding Lagrange multipliers. For any $\chi _{i\in \{1,2\}} \in \mathcal {B}(\chi^{\star\star}, R)$ there is a $\hat{\mathcal {B}}$ such that

$$\begin{aligned} \Vert (F'(\chi _2) - F'(\chi _1)) [\chi _2-\chi _1]\Vert _{Y^{2}} \le \omega _2 \Vert \chi _2-\chi _1\Vert _{Y^{2}} \end{aligned}$$

(43)

with

$$\begin{aligned} \omega _2 = (8+\hat{\mathcal {B}}) R. \end{aligned}$$

(44)

Proof

From Lemma 4 it directly follows that

$$\begin{aligned} |L_2-L_1|&\le 2R, \end{aligned}$$

(45a)

$$\begin{aligned} \Vert \xi _{\tau ,2}-\xi _{\tau ,1}\Vert _{L^{\infty }({]0,1[} )}&\le 2R, \end{aligned}$$

(45b)

$$\begin{aligned} \Vert \lambda _2-\lambda _1\Vert _{L^{\infty }({]0,1[} )}&\le R. \end{aligned}$$

(45c)

Using these bounds as well as the Cauchy-Schwarz inequality and Young’s inequality, we show that for any $\delta \chi \in {\delta Z}\times L^2(]0,1[)$ with $\Vert \delta \chi \Vert _{L^{2}({]0,1[} )} \le 1$ it holds that

$$\begin{aligned} \begin{aligned}&\hspace{-1cm} | \langle \lambda _2, h''(z_2)[z_2-z_1, {\delta z}]\rangle - \langle \lambda _1, h''(z_1)[z_2-z_1, {\delta z}]\rangle | \\&= |\int _0^1 \lambda _2 ({\delta \xi _\tau }^T (\xi _{\tau ,2}-\xi _{\tau ,1}) - {\delta L}(L_2-L_1)) \\&\qquad - \lambda _1 ({\delta \xi _\tau }^T (\xi _{\tau ,2}-\xi _{\tau ,1}) - {\delta L}(L_2-L_1)) d\tau | \\&= |\int _0^1 (\lambda _2- \lambda _1) ({\delta \xi _\tau }^T (\xi _{\tau ,2}-\xi _{\tau ,1}) - {\delta L}(L_2-L_1)) d\tau | \\&\le \int _0^1 |\lambda _2- \lambda _1| {\Vert {\delta \xi _\tau }\Vert }\Vert \xi _{\tau ,2}-\xi _{\tau ,1}\Vert d\tau \\&\quad + {|\delta L|}|L_2-L_1| \int _0^1 {|{\delta \lambda }|}d\tau \\&\underset{\text {(CS)}}{\le } \left[ \int _0^1 {\Vert {\delta \xi _\tau }\Vert }^2 d\tau \right] ^{1/2} \left[ \int _0^1 (\lambda _2- \lambda _1)^2 \Vert \xi _{\tau ,2}-\xi _{\tau ,1}\Vert ^2 d\tau \right] ^{1/2} \\&\quad + {|\delta L|}\; |L_2-L_1| \Vert \lambda _2-\lambda _1\Vert _{L^{1}} \\&\underset{(45)}{\le } \Vert {\delta \xi _\tau }\Vert _{L^{2}} \left[ 2R^2 \int _0^1 |\lambda _2-\lambda _1| \Vert \xi _{\tau ,2}-\xi _{\tau ,1}\Vert d\tau \right] ^{1/2}\\&\quad + R \; {|\delta L|}\; |L_2-L_1| \\&\underset{\text {(CS)}}{\le } \sqrt{2} R \Vert {\delta \xi _\tau }\Vert _{L^{2}} \Vert \lambda _2-\lambda _1\Vert _{L^{2}} ^{1/2} \Vert \xi _{\tau ,2}-\xi _{\tau ,1}\Vert _{L^{2}} ^{1/2}\\&\quad + R \; {|\delta L|}\; |L_2-L_1| \\&\underset{\text {(Y)}}{\le } \frac{\sqrt{2}}{2} R \Vert {\delta \xi _\tau }\Vert _{L^{2}} \left[ \Vert \lambda _2-\lambda _1\Vert _{L^{2}} + \Vert \xi _{\tau ,2}-\xi _{\tau ,1}\Vert _{L^{2}} \right] \\&\quad + R \; {|\delta L|}\; |L_2-L_1| \\&\le \frac{\sqrt{2}}{2} R \left[ \Vert \lambda _2-\lambda _1\Vert _{L^{2}} + \Vert \xi _{\tau ,2}-\xi _{\tau ,1}\Vert _{L^{2}} \right] \\&\quad + R \; |L_2-L_1| \\&\le R \bigg [ \Vert \lambda _2-\lambda _1\Vert _{L^{2}} + \Vert \xi _{\tau ,2}-\xi _{\tau ,1}\Vert _{L^{2}} + \Vert \xi _2-\xi _1\Vert _{L^{2}} + |L_2-L_1| \bigg ] \\&\le 2 R \bigg [ \Vert \lambda _2-\lambda _1\Vert _{L^{2}} ^2 + \Vert \xi _{\tau ,2}-\xi _{\tau ,1}\Vert _{L^{2}} ^2 + \Vert \xi _2-\xi _1\Vert _{L^{2}} ^2 + |L_2-L_1|^2 \bigg ]^{1/2} \\&\underset{(22b)}{=} 2 R \Vert \chi _2-\chi _1\Vert _{Y^{2}} \end{aligned} \end{aligned}$$

as well as

$$\begin{aligned} \begin{aligned}&\hspace{-1cm} |\langle \lambda _2-\lambda _1, (h'(z_2)-h'(z_1))[{\delta z}]\rangle | \\&= | \int _0^1 (\lambda _2-\lambda _1) \left( (\xi _{\tau ,2}-\xi _{\tau ,1})^T {\delta \xi _\tau }- (L_2-L_1){\delta L}\right) d\tau | \\&\le \int _0^1 |\lambda _2-\lambda _1| \Vert \xi _{\tau ,2}-\xi _{\tau ,1}\Vert {\Vert {\delta \xi _\tau }\Vert }d\tau \\&\quad + |L_2-L_1| {|\delta L|}\int _0^1 |\lambda _2-\lambda _1| d\tau \\&\underset{\text {(CS)}}{\le } \left[ \int _0^1 {\Vert {\delta \xi _\tau }\Vert }^2 d\tau \right] ^{1/2} \left[ \int _0^1 (\lambda _2-\lambda _1)^2 \Vert \xi _{\tau ,2}-\xi _{\tau ,1}\Vert ^2 d\tau \right] ^{1/2} \\&\quad + |L_2-L_1| {|\delta L|} \Vert \lambda _2-\lambda _1\Vert _{L^{1}} \\&\underset{(45)}{\le } \Vert {\delta \xi _\tau }\Vert _{L^{2}} \left[ 2R^2 \int _0^1 |\lambda _2-\lambda _1| \; \Vert \xi _{\tau ,2}-\xi _{\tau ,1}\Vert d\tau \right] ^{1/2} \\&\quad + R |L_2-L_1| {|\delta L|}\\&\le \sqrt{2} R \left[ \int _0^1 (\lambda _2-\lambda _1) \Vert \xi _{\tau ,2}-\xi _{\tau ,1}\Vert d\tau \right] ^{1/2} \\&\quad + R |L_2-L_1| \\&\underset{\text {(CS)}}{\le } \sqrt{2} R \Vert \lambda _2-\lambda _1\Vert _{L^{2}} ^{1/2} \Vert \xi _{\tau ,2}-\xi _{\tau ,1}\Vert _{L^{2}} ^{1/2} \\&\quad + R |L_2-L_1| \\&\underset{\text {(Y)}}{\le } \frac{\sqrt{2}}{2} R \left[ \Vert \lambda _2-\lambda _1\Vert _{L^{2}} + \Vert \xi _{\tau ,2}-\xi _{\tau ,1}\Vert _{L^{2}} \right] \\&\quad + R |L_2-L_1| \\&\le R \bigg [ \Vert \lambda _2-\lambda _1\Vert _{L^{2}} + \Vert \xi _{\tau ,2}-\xi _{\tau ,1}\Vert _{L^{2}} + \Vert \xi _2-\xi _1\Vert _{L^{2}} + |L_2-L_1|\bigg ] \\&\le 2 R \bigg [ \Vert \lambda _2-\lambda _1\Vert _{L^{2}} ^2 + \Vert \xi _{\tau ,2}-\xi _{\tau ,1}\Vert _{L^{2}} ^2 + \Vert \xi _2-\xi _1\Vert _{L^{2}} ^2 + |L_2-L_1|^2 \bigg ]^{1/2} \\&\underset{(22b)}{=} 2 R \Vert \chi _2-\chi _1\Vert _{Y^{2}} \end{aligned} \end{aligned}$$

and

$$\begin{aligned} \begin{aligned}&\hspace{-1cm} |\langle {\delta \lambda }, (h'(z_2)-h'(z_1))[z_2-z_1]\rangle | \\&= | \int _0^1 {\delta \lambda }((\xi _{\tau ,2}-\xi _{\tau ,1})^T (\xi _{\tau ,2}-\xi _{\tau ,1}) - (L_2-L_1)^2) d\tau | \\&\le \int _0^1 {|{\delta \lambda }|}\Vert \xi _{\tau ,2}-\xi _{\tau ,1}\Vert ^2 d\tau + (L_2-L_1)^2 \int _0^1 {|{\delta \lambda }|}d\tau \\&\underset{(45)}{\le } 2R \int _0^1 {|{\delta \lambda }|}\Vert \xi _{\tau ,2}-\xi _{\tau ,1}\Vert d\tau + 2R |L_2-L_1| \Vert {\delta \lambda }\Vert _{L^{1}} \\&\underset{\text {(CS)}}{\le } 2R \left[ \int _0^1 {\delta \lambda }^2 d\tau \right] ^{1/2} \left[ \int _0^1 \Vert \xi _{\tau ,2}-\xi _{\tau ,1}\Vert ^2 d\tau \right] ^{1/2} \\&\quad + 2R |L_2-L_1| \; \Vert {\delta \lambda }\Vert _{L^{1}} \\&\le 2R \Vert {\delta \lambda }\Vert _{L^{2}} \Vert \xi _{\tau ,2}-\xi _{\tau ,1}\Vert _{L^{2}} \\&\quad + 2R |L_2-L_1| \; \Vert {\delta \lambda }\Vert _{L^{1}} \\&\le 2R \Vert \xi _{\tau ,2}-\xi _{\tau ,1}\Vert _{L^{2}} + 2R |L_2-L_1| \\&\le 2R \bigg [ \Vert \lambda _2-\lambda _1\Vert _{L^{2}} + \Vert \xi _{\tau ,2}-\xi _{\tau ,1}\Vert _{L^{2}} + \Vert \xi _2-\xi _1\Vert _{L^{2}} + |L_2-L_1| \bigg ] \\&\le 4 R \bigg [ \Vert \lambda _2-\lambda _1\Vert _{L^{2}} ^2 + \Vert \xi _{\tau ,2}-\xi _{\tau ,1}\Vert _{L^{2}} ^2 + \Vert \xi _2-\xi _1\Vert _{L^{2}} ^2 + |L_2-L_1|^2 \bigg ]^{1/2} \\&\underset{(22b)}{=} 4 R \Vert \chi _2-\chi _1\Vert _{Y^{2}} . \end{aligned} \end{aligned}$$

As shown in Lemma 18 in the Appendix, there is a $\hat{B}<\infty$ such that

$$\begin{aligned} \begin{aligned} |\left( f''(\xi _2) - f''(\xi _1)\right)&[\xi _2-\xi _1, {\delta \xi }] | \\&\le \hat{\mathcal {B}} \sqrt{\Vert \xi _2-\xi _1\Vert ^2 + \Vert \xi _{\tau ,2}-\xi _{\tau ,1}\Vert ^2} \sqrt{{\Vert {\delta \xi }\Vert }^2 + {\Vert {\delta \xi _\tau }\Vert }^2}, \end{aligned} \end{aligned}$$

which provides the following bound, as

$$\begin{aligned} \begin{aligned}&\quad |\left( T''(\xi _2) - T''(\xi _1)\right) [\xi _2-\xi _1, {\delta \xi }]| \\&= |\int _0^1 \left( f''(\xi _2) - f''(\xi _1)\right) [\xi _2-\xi _1, {\delta \xi }] d\tau | \\&\le \hat{\mathcal {B}} \int _0^1 \sqrt{\Vert \xi _2-\xi _1\Vert ^2 + \Vert \xi _{\tau ,2}-\xi _{\tau ,1}\Vert ^2} \sqrt{{\Vert {\delta \xi }\Vert }^2 + {\Vert {\delta \xi _\tau }\Vert }^2} d\tau \\&\underset{\text {(CS)}}{\le } \hat{\mathcal {B}} \int _0^1 \Vert \xi _2-\xi _1\Vert ^2 + \Vert \xi _{\tau ,2}-\xi _{\tau ,1}\Vert ^2 d\tau \int _0^1 {\Vert {\delta \xi }\Vert }^2 + {\Vert {\delta \xi _\tau }\Vert }^2 d\tau \\&\le \hat{\mathcal {B}} \left( \Vert \xi _2-\xi _1\Vert _{L^{2}({]0,1[} )} ^2 + \Vert \xi _{\tau ,2}-\xi _{\tau ,1}\Vert _{L^{2}({]0,1[} )} ^2\right) \left( \Vert {\delta \xi }\Vert _{L^{2}({]0,1[} )} ^2 + \Vert {\delta \xi _\tau }\Vert _{L^{2}({]0,1[} )} ^2\right) \\&\underset{(22b)}{\le }\ \hat{B} \Vert \chi _2-\chi _1\Vert _{Y^{2}} \Vert \delta \chi \Vert _{Y^{2}} \\&\le \hat{B} R \Vert \chi _2-\chi _1\Vert _{Y^{2}} . \end{aligned} \end{aligned}$$

Finally, we use the bounds derived above to show that for any $\delta x$ with $\Vert \delta x\Vert _{Y^{2}} \le 1$ it holds that

$$\begin{aligned} \begin{aligned} |(F'(\chi _2) - F'(\chi _1)) [\chi _2-\chi _1, \delta \chi ]|&= | \left( T''(\xi _2) - T''(\xi _1)\right) [{\delta \xi }, \xi _2-\xi _1] \\&\quad + \langle \lambda _2, h''(z_2)[{\delta z}, z_2-z_1]\rangle \\&\qquad - \langle \lambda _1, h''(z_1)[{\delta z},z_2-z_1]\rangle \\&\quad + \langle \lambda _2-\lambda _1, (h'(z_2)-h'(z_1))[{\delta z}]\rangle \\&\quad + \langle {\delta \lambda }, (h'(z_2)-h'(z_1))[z_2-z_1]\rangle | \\&\le \hat{\mathcal {B}} R \Vert \chi _2-\chi _1\Vert _{Y^{2}} \\&\quad + 2R \Vert \chi _2-\chi _1\Vert _{Y^{2}} \\&\quad + 2R \Vert \chi _2-\chi _1\Vert _{Y^{2}} \\&\quad + 4R \Vert \chi _2-\chi _1\Vert _{Y^{2}} \\&\le (8 + \hat{\mathcal {B}}) R \Vert \chi _2-\chi _1\Vert _{Y^{2}} \\&\le \omega _2 \Vert \chi _2-\chi _1\Vert _{Y^{2}} \end{aligned} \end{aligned}$$

with

$$\begin{aligned} \omega _2(R) = (8 + \hat{\mathcal {B}}) R. \end{aligned}$$

This directly yields the claim, as

$$\begin{aligned} \begin{aligned} \Vert (F'(\chi _2) - F'(\chi ))[\chi _2-\chi _1]\Vert _{L^{2}({]0,1[} )}&= \underset{ \Vert \delta \chi \Vert _{Y^{2}} = 1}{\sup }|(F'(\chi _2) - F'(\chi _1)) [\chi _2-\chi _1, \delta \chi ]| \\&\le \omega _2 \Vert \chi _2-\chi _1\Vert _{Y^{2}} . \end{aligned} \end{aligned}$$

(46)

4.6 Convergence of Newton’s Method

We are now ready to connect the results outlined above to prove that the Newton-KKT method applied to the free flight optimization problem (6) converges to a global minimizer as characterized in Section 3.1 provided that there is a $u\in {\mathbb {R}}^2$ with $\Vert u\Vert =1$ such that $u^T{\xi _\tau }^{\star \star }\ge c$. Roughly speaking, the optimal route needs to head towards the destination, dominating any route that involves flying the opposite direction. It is intuitively clear that this holds even for relatively strong wind conditions.

Theorem 15

Let $\chi ^{\star \star }= (z^{\star \star }, \lambda ^{\star \star })$ be a global solution of (6) that satisfies the first and second order conditions for optimality with ${\underline{\mathcal {B}}}>0$. Moreover let there be a $c>0$ and a $u\in {\mathbb {R}}^2$ with $\Vert u\Vert =1$ such that $u^T{\xi _\tau }^{\star \star }\ge c$ for almost all $\tau \in ]0,1[$. Finally, let $\omega :=\omega _1\omega _2$, as given in Lemmas 13 and 14.

Then there is a $R_C>0$, such that the ordinary Newton iterates defined in Section 3.2 converge to $\chi ^{\star \star }$ at an estimated rate

$$\begin{aligned} \Vert \chi ^{k+1}-\chi ^{\star \star }\Vert _{Y^{2}} \le \frac{\omega }{2} \Vert \chi ^k - \chi ^{\star \star }\Vert _{Y^{2}} , \end{aligned}$$

(47)

if initialized with $\chi ^0\in \mathcal {B}(\chi ^{\star \star }, R_C){}$ and provided that the iterates $\chi ^k$ remain in $\mathcal {B}(\chi ^{\star \star }, R_C){}$. Moreover, $\chi ^{\star \star }$ is unique in $\mathcal {B}(\chi ^{\star \star }, R_C){}$.

Proof

In Theorems 6, 9 and 12 we showed that the inf-sup condition is satisfied, that, $\mathcal {L}_{zz}(\chi )$ is positive definite on the kernel of the constraint for all $x\in \mathcal {B}(\chi ^{\star \star }, R_C){}$, and that it is bounded from above. Consequently, $F'(\chi )$ is invertible with

$$\begin{aligned} \Vert F'(\chi )^{-1}\Vert \le \omega _1 \qquad \forall ~\chi \in \mathcal {B}(\chi ^{\star \star }, R_C){}, \end{aligned}$$

as confirmed in Lemma 13. Further, it follows from Lemmas 13 and 14 that

$$\begin{array}{l}\Vert F'(\chi _1)^{-1} (F'(\chi _2) - F'(\chi )) [\chi _2-\chi _1]\Vert _{Y^{2}} \\ \qquad \le \Vert F'(\chi _1)^{-1}\Vert _{Y^{2}} \Vert (F'(\chi _2) - F'(\chi _1)) [\chi _2-\chi _1]\Vert _{Y^{2}} \\ \qquad \le \omega _1 \omega _2 \Vert \chi _2-\chi _1\Vert _{Y^{2}} \\ \qquad \le \omega \Vert \chi _2-\chi _1\Vert _{Y^{2}} \end{array}$$

for $\chi _1,\chi _2 \in \mathcal {B}(\chi ^{\star \star }, R_C){}$. It is clear that since $\omega _1$ is bounded and $\omega _2 = (8 + \hat{\mathcal {B}}) R$, there is a $R_C>0$ such that $\omega := \omega _1\omega _2 < 2$. We now define $e_k:= \chi ^k - \chi ^{\star \star }$ and proceed for $\mu \in ]0,1[$ as follows:

$$\begin{array}{l}\Vert \chi ^k + \mu \Delta \chi ^k - \chi ^{\star \star }\Vert _{Y^{2}} \\\qquad= \Vert e_k - \mu F'(\chi ^k)^{-1} F(\chi ^k) \Vert _{Y^{2}} \\\qquad= \Vert e_k - \mu F'(\chi ^k)^{-1} (F(\chi ^k)-\underbrace{F(\chi ^{\star \star })}_{=0}) \Vert _{Y^{2}} \\\qquad= \Vert (1-\mu ) e_k - \mu F'(\chi ^k)^{-1} \int _{s=0}^1 \left( F'(\chi ^k - s e_k) - F'(\chi ^k)\right) e_k \, ds \; \Vert _{Y^{2}} \\\qquad\qquad\le (1-\mu ) \, \Vert e_k\Vert _{Y^{2}} + \frac{\mu }{2} \omega \, \Vert e_k\Vert _{Y^{2}} , \end{array}$$

which yields the claim with $\mu =1$ as

$$\begin{aligned} \Vert e_{k+1}\Vert _{Y^{2}} \le \frac{\omega }{2} \Vert e_k\Vert _{Y^{2}} . \end{aligned}$$

In order to prove uniqueness in $\mathcal {B}(\chi ^{\star \star }, R_C){}$, assume there is a second solution $\chi ^{\star }\ne \chi ^{\star \star }$ with $F(\chi ^{\star })=0$ and $\chi ^{\star }\in \mathcal {B}(\chi ^{\star \star }, R_C){}$. Initialized with $\chi ^0:= \chi ^{\star }$ it certainly holds that $\chi ^1 = \chi ^{\star }$. However, from (47) we obtain

$$\begin{aligned} \Vert \chi ^1-\chi ^{\star \star }\Vert _{Y^{2}} \le \frac{\omega }{2} \Vert \chi ^0 - \chi ^{\star \star }\Vert _{Y^{2}} < \Vert \chi ^0 - \chi ^{\star \star }\Vert _{Y^{2}} , \end{aligned}$$

due to $\omega <2$, which yields a contradiction.

5 Conclusion

It has been demonstrated that the Newton-KKT method can be used to solve the free flight trajectory optimization problem under certain conditions. These conditions are i) the requirement for the iterates to remain within a $L^\infty$-neighborhood of the solution, and ii) a starting point that is sufficiently close to the solution. Such a suitable starting point can be found efficiently by calculating shortest paths on a specific graph [13]. Hence an important tool for efficient deterministic global optimization of the free flight problem has been established.

Data Availability

Data sharing not applicable to this article as no datasets were generated or analyzed during the current study.

References

Wells CA, Williams PD, Nichols NK, Kalise D, Poll I (2021) Reducing Transatlantic Flight Emissions by Fuel-Optimised Routing. Environ Res Lett 16(2). https://doi.org/10.1088/1748-9326/abce82
Article Google Scholar
Karisch SE, Altus SS, Stojković G, Stojković M (2012) In: Barnhart, C., Smith, B. (eds.) Operations, pp. 283–383. Springer, Boston, MA. https://doi.org/10.1007/978-1-4614-1608-1_6
Alizadeh A, Uzun M, Koyuncu E, Inalhan G (2018) Optimal En-Route Trajectory Planning based on Wind Information. IFAC-PapersOnLine 51(9):180–185. https://doi.org/10.1016/j.ifacol.2018.07.030. 15th IFAC Symposium on Control in Transportation Systems CTS 2018
Rumler W, Günther T, Weißhaar U, Fricke H (2010) Flight Profile Variations due to the Spreading Practice of Cost Index Based Flight Planning. In: 4th International Conference on Research in Air Transportation, Budapest
Ng HK, Sridhar B, Grabbe S (2014) Optimizing Aircraft Trajectories with Multiple Cruise Altitudes in the Presence of Winds. Journal of Aerospace Information Systems 11(1):35–47. https://doi.org/10.2514/1.I010084
Article Google Scholar
Zermelo E (1931) Über das Navigationsproblem bei ruhender oder veränderlicher Windverteilung. ZAMM 11(2):114–124. https://doi.org/10.1002/zamm.19310110205
Article Google Scholar
Betts JT (2011) Practical Methods for Optimal Control and Estimation Using Nonlinear Programming (Second Edition). Siam (Society for Industrial and Applied Mathematics), Philadelphia. https://doi.org/10.1137/1.9780898718577
Dreves A, Gerdts M, Sama M, D’Ariano A (2017) Free Flight Trajectory Optimization and Generalized Nash Equilibria in Conflicting Situations. preprint
Geiger B, Horn J, DeLullo A, Niessner A, Long L (2006) Optimal Path Planning of UAVs Using Direct Collocation with Nonlinear Programming. https://doi.org/10.2514/6.2006-6199
Article Google Scholar
Girardet B, Lapasset L, Delahaye D, Rabut C, Brenier Y (2013) Generating Optimal Aircraft Trajectories with Respect to Weather Conditions. In: ISIATM 2013, 2nd International Conference on Interdisciplinary Science for Innovative Air Traffic Management, Toulouse, France. https://hal-enac.archives-ouvertes.fr/hal-00867818
Girardet B, Lapasset L, Delahaye D, Rabut C (2014) Wind-optimal path planning: Application to aircraft trajectories. In: 2014 13th International Conference on Control Automation Robotics Vision (ICARCV), pp 1403–1408
Borndörfer R, Danecker F, Weiser M (2021) A Discrete-Continuous Algorithm for Free Flight Planning. Algorithms 14(1):4. https://doi.org/10.3390/a14010004
Article Google Scholar
Borndörfer R, Danecker F, Weiser M (2022) A Discrete-Continuous Algorithm for Globally Optimal Free Flight Trajectory Optimization. In: D’Emidio, M., Lindner, N. (eds.) 22nd Symposium on Algorithmic Approaches for Transportation Modelling, Optimization, and Systems (ATMOS 2022). Open Access Series in Informatics (OASIcs), vol. 106, pp. 2–1213. Schloss Dagstuhl – Leibniz-Zentrum für Informatik, Dagstuhl, Germany. https://doi.org/10.4230/OASIcs.ATMOS.2022.2. https://drops.dagstuhl.de/opus/volltexte/2022/17106
Borndörfer R, Danecker F, Weiser M (2022) Error Bounds for Discrete-Continuous Shortest Path Problems with Application to Free Flight Trajectory Optimization. arXiv. https://doi.org/10.48550/ARXIV.2204.05853. https://arxiv.org/abs/2204.05853
Locatelli, M.: Simulated Annealing Algorithms for Continuous Global Optimization. In: Handbook of Global Optimization, pp. 179–229. Springer, Boston, MA (2002). https://doi.org/10.1007/978-1-4757-5362-2_6
Cassioli, A., Izzo, D., DiLorenzo, D., Locatelli, M., Schoen, F.: 5. In: Fasano, G., Pintér, J.D. (eds.) Global Optimization Approaches for Optimal Trajectory Planning, pp. 111–140. Springer, New York, NY (2013). https://doi.org/10.1007/978-1-4614-4469-5_5
Addis B, Cassioli A, Locatelli M, Schoen F (2011) A Global Optimization Method for the Design of Space Trajectories. Comput Optim Appl 48:635–652. https://doi.org/10.1007/s10589-009-9261-6
Article Google Scholar
Bonyadi MR, Michalewicz Z (2017) Particle Swarm Optimization for Single Objective Continuous Space Problems: A Review. Evol Comput 25(1):1–54. https://doi.org/10.1162/EVCO_r_00180
Article Google Scholar
Yen JY (1971) Finding the k Shortest Loopless Paths in a Network. Manag Sci 17(11):712–716. https://doi.org/10.1287/mnsc.17.11.712
Nocedal J, Wright SJ (2006) Numerical Optimization. Springer, New York, NY . https://doi.org/10.1007/978-0-387-40065-5
Maurer H, Zowe J (1979) First and Second-Order Necessary and Sufficient Optimality Conditions for Infinite-Dimensional Programming Problems. Math. Programming 16:98–110. https://doi.org/10.1007/BF01582096
Article Google Scholar
Braess D (2013) Finite Elemente, 5th edn. Springer, Heidelberg. https://doi.org/10.1007/978-3-642-34797-9
Casas E, Tröltzsch F (2015) Second Order Optimality Conditions and Their Role in PDE Control. Jahresber Deutsch Math-Verein 117(1):3–44. https://doi.org/10.1365/s13291-014-0109-3
Article Google Scholar

Download references

Funding

Open Access funding enabled and organized by Projekt DEAL. This research was funded by the DFG Research Center of Excellence MATH$^+$ – Berlin Mathematics Research Center, Project TrU-4.

Author information

Ralf Borndörfer, Fabian Danecker and Martin Weiser contributed equally to this work.

Authors and Affiliations

Network Optimization, Zuse Institute Berlin, Takustr. 7, 14195, Berlin, Germany
Ralf Borndörfer & Fabian Danecker
Modeling and Simulation of Complex Processes, Zuse Institute Berlin, Takustr. 7, 14195, Berlin, Germany
Fabian Danecker & Martin Weiser

Authors

Ralf Borndörfer
View author publications
You can also search for this author in PubMed Google Scholar
Fabian Danecker
View author publications
You can also search for this author in PubMed Google Scholar
Martin Weiser
View author publications
You can also search for this author in PubMed Google Scholar

Contributions

Conceptualization, R.B and M.W.; methodology, F.D. and M.W.; validation, F.D.; formal analysis, F.D. and M.W.; investigation, F.D. and M.W.; resources, R.B., F.D. and M.W.; writing-original draft preparation, F.D. and M.W.; writing-review and editing, R.B.; supervision, R.B.; project administration, R.B. and M.W.; funding acquisition, R.B. and M.W. All authors have read and agreed to the published version of the manuscript.

Corresponding author

Correspondence to Fabian Danecker.

Ethics declarations

Ethics Approval

Not applicable

Consent to Participate

Not applicable

Consent for Publication

We confirm that all authors agree with the submission of this manuscript to Public Transport Optimization: From Theory to Practice.

Competing Interests

The authors declare no competing interests.

Additional information

Publisher's Note

Springer Nature remains neutral with regard to jurisdictional claims in published maps and institutional affiliations.

Appendix

1.1 A.1 Global bounds

The derivative $f=t_\tau$ of parametrized time as defined in (3) consists of two terms, the tailwind term

$$\begin{aligned} f_1 = -\frac{{\xi _\tau }^T w}{g}, \end{aligned}$$

(48)

$$\begin{aligned} g = {\overline{v}}^2 - w^T w, \end{aligned}$$

(49)

and the length term

$$\begin{aligned} f_2 = g^{-1}\left( ({\xi _\tau }^T w)^2 + g ({\xi _\tau }^T{\xi _\tau })\right) ^{1/2}. \end{aligned}$$

(50)

At each time $\tau$, we obtain

$$\begin{aligned} {\underline{v}}^2:={\overline{v}}^2 - {\overline{c}}_0^2 \le g \le {\overline{v}}^2. \end{aligned}$$

(51)

The directional derivatives of g in direction ${\delta \xi }$ and ${\Delta \xi }\in {\delta X}$ read

$$\begin{array}{ll} & g' {\delta \xi }= -2w^T w_x {\delta \xi }\end{array}$$

(52)

$$\begin{array}{ll} \Rightarrow & \Vert g'\Vert \le 2{\overline{c}}_0 {\overline{c}}_1 \end{array}$$

(53)

$$\begin{aligned} {\delta \xi }^T g'' {\delta \xi }= - 2{\delta \xi }^T w_x^T w_x {\delta \xi }- 2w_{xx}[w,{\delta \xi },{\delta \xi }] \end{aligned}$$

(54)

$$\begin{aligned} \Rightarrow \quad \Vert g''\Vert \le 2({\overline{c}}_1^2+{\overline{c}}_0{\overline{c}}_2). \end{aligned}$$

(55)

$$\begin{aligned} g'''[{\delta \xi },{\delta \xi },{\Delta \xi }] = - 6 w_{xx}[ w_x{\delta \xi },{\delta \xi },{\Delta \xi }] -2 w_{xxx}[w,{\delta \xi },{\delta \xi },{\Delta \xi }]) \end{aligned}$$

(56)

$$\begin{aligned} \Rightarrow \quad \Vert g'''\Vert \le 2(3{\overline{c}}_1{\overline{c}}_2 + {\overline{c}}_0{\overline{c}}_3). \end{aligned}$$

(57)

For the tailwind term, we consider

$$\begin{aligned} f_1'(\xi ,{\xi _\tau })[{\delta \xi },{\delta \xi _\tau }] = g^{-2} ({\xi _\tau }^Tw) (g'{\delta \xi }) - g^{-1} {\xi _\tau }^Tw_x{\delta \xi }- g^{-1} w^T{\delta \xi _\tau }, \end{aligned}$$

(58)

which is bounded by

$$\begin{aligned} \begin{aligned} |f_1'(\xi ,{\xi _\tau })[{\delta \xi },{\delta \xi _\tau }]|&\le \left( 2\frac{{\overline{c}}_0^2 {\overline{c}}_1}{{\underline{v}}^4} + \frac{{\overline{c}}_1}{{\underline{v}}^2} \right) {\Vert {\xi _\tau }\Vert }{\Vert {\delta \xi }\Vert }+ \frac{{\overline{c}}_0}{{\underline{v}}^2} {\Vert {\delta \xi _\tau }\Vert }. \end{aligned} \end{aligned}$$

(59)

The second directional derivatives is

$$\begin{array}{ll} f_1''(\xi ,{\xi _\tau })[{\delta \xi },{\delta \xi _\tau }][{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }]= - 2g^{-3} (g'{\tilde{\delta \xi }}) ({\xi _\tau }^T w) (g'{\delta \xi }) \quad{} & {} + g^{-2} ({\tilde{\delta \xi }_\tau }^T w) (g'{\delta \xi }) \\\qquad\qquad\qquad\qquad\qquad\quad\ +\ g^{-2} ({\xi _\tau }^T w_x {\tilde{\delta \xi }}) (g'{\delta \xi }) \quad{} & {} + g^{-2} ({\xi _\tau }^T w) ({\delta \xi }^Tg''{\tilde{\delta \xi }}) \\\qquad\qquad\qquad\qquad\qquad\quad\ +\ g^{-2} (g'{\tilde{\delta \xi }}) ({\xi _\tau }^T w_x {\delta \xi }) \quad{} & {} - g^{-1} ({\tilde{\delta \xi }_\tau }w_x {\delta \xi }) \\\qquad\qquad\qquad\qquad\qquad\quad\ -\ g^{-1} w_{xx}[{\xi _\tau },{\delta \xi },{\tilde{\delta \xi }}] \quad{} & {} + g^{-2} (g'{\tilde{\delta \xi }}) (w^T {\delta \xi _\tau }) \\\qquad\qquad\qquad\qquad\qquad\quad\ -\ g^{-1} ({\delta \xi _\tau }^T w_x {\tilde{\delta \xi }}) \end{array}$$

(60)

and in particular

$$\begin{array}{ll} f_1''(\xi ,{\xi _\tau })[{\delta \xi },{\delta \xi _\tau }]^2= - 2g^{-3} (g'{\delta \xi })^2 ({\xi _\tau }^T w) & + 2g^{-2} (g'{\delta \xi }) ({\xi _\tau }^T w_x{\delta \xi }) \\\qquad\qquad\qquad\qquad\ +\ g^{-2} ({\delta \xi }^Tg''{\delta \xi }) ({\xi _\tau }^T w) & - g^{-1} w_{xx}[{\xi _\tau },{\delta \xi },{\delta \xi }] \\\qquad\qquad\qquad\qquad\ - 2g^{-1} ({\delta \xi _\tau }^T w_x{\delta \xi }) & + 2g^{-2} ({\delta \xi _\tau }^T w) (g'{\delta \xi }), \end{array}$$

(61)

which yields

$$\begin{aligned} \begin{aligned} |f_1''(\xi ,{\xi _\tau })[{\delta \xi },{\delta \xi _\tau }][{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }]|&\le \bigg [ 8 \frac{{\overline{c}}_0^3 {\overline{c}}_1^2}{{\underline{v}}^{6}} + 6 \frac{{\overline{c}}_0 {\overline{c}}_1^2}{{\underline{v}}^{4}} + 2 \frac{{\overline{c}}_0^2 {\overline{c}}_2}{{\underline{v}}^{4}} + \frac{{\overline{c}}_2}{{\underline{v}}^{2}} \bigg ] {\Vert {\xi _\tau }\Vert }{\Vert {\delta \xi }\Vert }{\Vert {\tilde{\delta \xi }}\Vert }\\&\quad + \bigg [ 2\frac{{\overline{c}}_0^2 {\overline{c}}_1}{{\underline{v}}^4} + \frac{{\overline{c}}_1}{{\underline{v}}^2} \bigg ] {\Vert {\delta \xi _\tau }\Vert }{\Vert {\tilde{\delta \xi }}\Vert }\\&\quad + \bigg [ 2 \frac{{\overline{c}}_0^2 {\overline{c}}_1}{{\underline{v}}^4} + \frac{{\overline{c}}_1}{{\underline{v}}^2} \bigg ] {\Vert {\delta \xi }\Vert }{\Vert {\tilde{\delta \xi }_\tau }\Vert }\end{aligned} \end{aligned}$$

(62)

and

$$\begin{aligned} \begin{aligned} |f_1''(\xi ,{\xi _\tau })[{\delta \xi },{\delta \xi _\tau }]^2|&\le \bigg [ 8 \frac{{\overline{c}}_0^3 {\overline{c}}_1^2}{{\underline{v}}^{6}} + 6 \frac{{\overline{c}}_0 {\overline{c}}_1^2}{{\underline{v}}^{4}} + 2 \frac{{\overline{c}}_0^2 {\overline{c}}_2}{{\underline{v}}^{4}} + \frac{{\overline{c}}_2}{{\underline{v}}^{2}} \bigg ] {\Vert {\xi _\tau }\Vert }{\Vert {\delta \xi }\Vert }^2 \\&\quad + \bigg [ 4 \frac{{\overline{c}}_0^2 {\overline{c}}_1}{{\underline{v}}^4} + 2\frac{{\overline{c}}_1}{{\underline{v}}^2} \bigg ] {\Vert {\delta \xi }\Vert }{\Vert {\delta \xi _\tau }\Vert }, \end{aligned} \end{aligned}$$

(63)

respectively.

Finally, the third directional derivative is

$$\begin{array}{ll} f_1'''(\xi ,{\xi _\tau })[{\delta \xi },{\delta \xi _\tau }]^2[{\Delta \xi },{\Delta \xi _\tau }] \\ = 6g^{-4} (g'{\Delta \xi }) (g'{\delta \xi })^2 ({\xi _\tau }^T w) & - 4g^{-3} (g'{\delta \xi }) ({\Delta \xi }^Tg''{\delta \xi }) ({\xi _\tau }^T w) \\- 2g^{-3} (g'{\Delta \xi }) ({\delta \xi }^Tg''{\delta \xi }) ({\xi _\tau }^T w) & + g^{-2} g'''[{\delta \xi },{\delta \xi },{\Delta \xi }] ({\xi _\tau }^T w) \\- 2g^{-3} (g'{\delta \xi })^2 ({\xi _\tau }^T w_x {\Delta \xi }) & + g^{-2} ({\delta \xi }^Tg''{\delta \xi }) ({\xi _\tau }^T w_x {\Delta \xi }) \\- 4g^{-3} (g'{\Delta \xi }) (g'{\delta \xi }) ({\xi _\tau }^T w_x {\delta \xi }) & + 2g^{-2} ({\Delta \xi }^T g''{\delta \xi }) ({\xi _\tau }^T w_x {\delta \xi }) \\+ 2g^{-2} (g'{\delta \xi }) w_{xx}[{\xi _\tau },{\delta \xi },{\Delta \xi }] & + g^{-2} (g'{\Delta \xi }) w_{xx}[{\xi _\tau },{\delta \xi },{\delta \xi }] \\- g^{-1} w_{xxx}[{\xi _\tau },{\delta \xi },{\delta \xi },{\Delta \xi }] \\- 2g^{-3} (g'{\delta \xi })^2 ({\Delta \xi _\tau }^T w) & + g^{-2} ({\delta \xi }^Tg''{\delta \xi }) ({\Delta \xi _\tau }^T w) \\+ 2g^{-2} (g'{\delta \xi }) ({\Delta \xi _\tau }^T w_x {\delta \xi }) & - g^{-1} w_{xx}[{\Delta \xi _\tau },{\delta \xi },{\delta \xi }] \\- 4g^{-3} (g'{\Delta \xi }) (g'{\delta \xi }) ({\delta \xi _\tau }^T w) & + 2g^{-2} ({\Delta \xi }^T g''{\delta \xi }) ({\delta \xi _\tau }^T w) \\+ 2g^{-2} (g'{\delta \xi }) ({\delta \xi _\tau }^T w_x {\Delta \xi }) & + 2g^{-2} (g'{\Delta \xi }) ({\delta \xi _\tau }^T w_x {\delta \xi }) \\- 2g^{-1} w_{xx} [{\delta \xi _\tau },{\delta \xi },{\Delta \xi }], \end{array}$$

(64)

which is bounded by

$$\begin{array}{l}|f_1'''(\xi ,{\xi _\tau })[{\delta \xi },{\delta \xi _\tau }]^2[{\Delta \xi },{\Delta \xi _\tau }]| \\ \qquad \le \frac{{\Vert {\xi _\tau }\Vert }}{{\underline{v}}} \bigg [ \frac{{\overline{c}}_1^3}{{\underline{v}}^3} \left( 48\frac{{\overline{c}}_0^4}{{\underline{v}}^4} +48\frac{{\overline{c}}_0^2}{{\underline{v}}^2} + 6 \right) \\ \qquad\qquad + \frac{{\overline{c}}_1 {\overline{c}}_2}{{\underline{v}}^2} \left( 24\frac{{\overline{c}}_0^3}{{\underline{v}}^3} +18\frac{{\overline{c}}_0}{{\underline{v}}} \right) \\ \qquad\qquad + \frac{{\overline{c}}_3}{{\underline{v}}} \left( 2\frac{{\overline{c}}_0^2}{{\underline{v}}^2} + 1 \right) \bigg ] {\Vert {\delta \xi }\Vert }^2 {\Vert {\Delta \xi }\Vert }\\\qquad+ \left[ \frac{{\overline{c}}_1^2}{{\underline{v}}^3} \left( 8\frac{{\overline{c}}_0^3}{{\underline{v}}^3} + 6\frac{{\overline{c}}_0}{{\underline{v}}}\right) + \frac{{\overline{c}}_2}{{\underline{v}}^2} \left( 2\frac{{\overline{c}}_0^2}{{\underline{v}}^2} + 1 \right) \right] {\Vert {\delta \xi }\Vert }^2 {\Vert {\Delta \xi _\tau }\Vert }\\\qquad+ \left[ \frac{{\overline{c}}_1^2}{{\underline{v}}^3} \left( 16 \frac{{\overline{c}}_0^3}{{\underline{v}}^3} +12 \frac{{\overline{c}}_0}{{\underline{v}}} \right) + \frac{{\overline{c}}_2}{{\underline{v}}^2} \left( 4 \frac{{\overline{c}}_0^2}{{\underline{v}}^2} + 2 \right) \right] {\Vert {\delta \xi }\Vert }{\Vert {\delta \xi _\tau }\Vert }{\Vert {\Delta \xi }\Vert }. \end{array}$$

(65)

Before we turn to the length term $f_2$, we first consider the term

$$\begin{aligned} F := ({\xi _\tau }^T w)^2 + g ({\xi _\tau }^T{\xi _\tau }) \end{aligned}$$

(66)

with

$$\begin{aligned} {\underline{v}}^2 {\Vert {\xi _\tau }\Vert }^2 \le F \le {\Vert {\xi _\tau }\Vert }^2 {\overline{\overline{v}}}^2. \end{aligned}$$

We also note that

$$\begin{aligned} \frac{g}{F} \le \frac{1}{{\Vert {\xi _\tau }\Vert }^2}. \end{aligned}$$

Then

$$\begin{aligned} \begin{aligned} F'(\xi ,{\xi _\tau })[{\delta \xi },{\delta \xi _\tau }] =&2 ({\xi _\tau }^T w) (({\delta \xi _\tau }^T w) + ({\xi _\tau }^T w_x {\delta \xi })) \\&+ (g'{\delta \xi }) ({\xi _\tau }^T{\xi _\tau }) + 2g({\xi _\tau }^T {\delta \xi _\tau }), \end{aligned} \end{aligned}$$

(67)

which is bounded by

$$\begin{aligned} |F'(\xi ,{\xi _\tau })[{\delta \xi },{\delta \xi _\tau }]| \le 2 {\overline{\overline{v}}}^2 {\Vert {\xi _\tau }\Vert }{\Vert {\delta \xi _\tau }\Vert }+ 4 {\overline{c}}_0 {\overline{c}}_1 {\Vert {\xi _\tau }\Vert }^2 {\Vert {\delta \xi }\Vert }, \end{aligned}$$

(68)

The second derivative is

$$\begin{aligned} \begin{aligned}&\hspace{-1.5cm}F''(\xi ,{\xi _\tau })[{\delta \xi },{\delta \xi _\tau }][{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }] \\&= 2 ({\xi _\tau }^T w) ({\delta \xi _\tau }^T w_x {\tilde{\delta \xi }})&\quad&+ 2 ({\xi _\tau }^T w_x{\tilde{\delta \xi }}) ({\delta \xi _\tau }^T w) \\&\quad + 2 ({\tilde{\delta \xi }_\tau }^T w) ({\delta \xi _\tau }^T w)&\quad&+ 2 ({\xi _\tau }^T w_x {\tilde{\delta \xi }}) ({\xi _\tau }^T w_x {\delta \xi }) \\&\quad + 2 ({\xi _\tau }^T w) w_{xx}[{\xi _\tau },{\delta \xi },{\tilde{\delta \xi }}]&\quad&+ 2 ({\tilde{\delta \xi }_\tau }^T w) ({\xi _\tau }^T w_x {\delta \xi }) \\&\quad + 2 ({\xi _\tau }^T w) ({\tilde{\delta \xi }_\tau }^T w_x {\delta \xi })&\quad&+ ({\tilde{\delta \xi }}^T g''{\delta \xi }) ({\xi _\tau }^T{\xi _\tau }) \\&\quad + 2(g'{\delta \xi }) ({\tilde{\delta \xi }_\tau }^T{\xi _\tau })&\quad&+ 2(g'{\tilde{\delta \xi }}) ({\xi _\tau }^T {\delta \xi _\tau }) \\&\quad + 2g({\tilde{\delta \xi }_\tau }^T {\delta \xi _\tau }) \end{aligned} \end{aligned}$$

(69)

and in particular

$$\begin{aligned} \begin{aligned} F''(\xi ,{\xi _\tau })[{\delta \xi },{\delta \xi _\tau }]^2&= 4 ({\xi _\tau }^T w) ({\delta \xi _\tau }^T w_x {\delta \xi })&\quad&+ 4 ({\delta \xi _\tau }^T w) ({\xi _\tau }^T w_x {\delta \xi }) \\&\quad + 2 ({\delta \xi _\tau }^T w)^2&\quad&+ 2 ({\xi _\tau }^T w_x {\delta \xi })^2 \\&\quad + 2 ({\xi _\tau }^T w) w_{xx}[{\xi _\tau },{\delta \xi },{\delta \xi }]&\quad&+ ({\delta \xi }^T g''{\delta \xi }) ({\xi _\tau }^T{\xi _\tau }) \\&\quad + 4(g'{\delta \xi }) ({\delta \xi _\tau }^T{\xi _\tau })&\quad&+ 2g({\delta \xi _\tau }^T {\delta \xi _\tau }), \end{aligned} \end{aligned}$$

(70)

which yields

$$\begin{aligned} \begin{aligned} |F''(\xi ,{\xi _\tau })[{\delta \xi },{\delta \xi _\tau }][{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }]|&\le \left( 4 {\overline{c}}_1^2 + 4{\overline{c}}_0 {\overline{c}}_2\right) {\Vert {\xi _\tau }\Vert }^2 {\Vert {\delta \xi }\Vert }{\Vert {\tilde{\delta \xi }}\Vert }\\&\quad + 8 {\overline{c}}_0 {\overline{c}}_1 {\Vert {\xi _\tau }\Vert }{\Vert {\delta \xi }\Vert }{\Vert {\tilde{\delta \xi }_\tau }\Vert }\\&\quad + 8 {\overline{c}}_0 {\overline{c}}_1 {\Vert {\xi _\tau }\Vert }{\Vert {\delta \xi _\tau }\Vert }{\Vert {\tilde{\delta \xi }}\Vert }\\&\quad + 2 {\overline{\overline{v}}}^2 {\Vert {\delta \xi _\tau }\Vert }{\Vert {\tilde{\delta \xi }_\tau }\Vert }\end{aligned} \end{aligned}$$

(71)

and

$$\begin{aligned} \begin{aligned} |F''(\xi ,{\xi _\tau })[{\delta \xi },{\delta \xi _\tau }]^2|&\le \left( 4 {\overline{c}}_1^2 + 4{\overline{c}}_0 {\overline{c}}_2\right) {\Vert {\xi _\tau }\Vert }^2 {\Vert {\delta \xi }\Vert }^2 \\&\quad +16 {\overline{c}}_0 {\overline{c}}_1 {\Vert {\xi _\tau }\Vert }{\Vert {\delta \xi }\Vert }{\Vert {\delta \xi _\tau }\Vert }\\&\quad + 2 {\overline{\overline{v}}}^2 {\Vert {\delta \xi _\tau }\Vert }^2 , \end{aligned} \end{aligned}$$

(72)

respectively. The third derivative is

$$\begin{aligned} \begin{aligned}&\quad F'''(\xi ,{\xi _\tau })[{\delta \xi },{\delta \xi _\tau }]^2 [{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }] \\&= 4 ({\tilde{\delta \xi }_\tau }^T w) ({\delta \xi _\tau }^T w_x {\delta \xi }){} & {} + 4 ({\xi _\tau }^T w_x {\tilde{\delta \xi }}) ({\delta \xi _\tau }^T w_x {\delta \xi }) \\&\quad + 4 ({\xi _\tau }^T w) w_{xx}[{\delta \xi _\tau },{\delta \xi },{\tilde{\delta \xi }}]{} & {} + 4 ({\delta \xi _\tau }^T w_x {\tilde{\delta \xi }}) ({\xi _\tau }^T w_x {\delta \xi }) \\&\quad + 4 ({\delta \xi _\tau }^T w) ({\tilde{\delta \xi }_\tau }^T w_x {\delta \xi }){} & {} + 4 ({\delta \xi _\tau }^T w) w_{xx}[{\xi _\tau },{\delta \xi },{\tilde{\delta \xi }}] \\&\quad + 4 ({\delta \xi _\tau }^T w) ({\delta \xi _\tau }^T w_x {\tilde{\delta \xi }}){} & {} + 4 ({\xi _\tau }^T w_x {\delta \xi }) ({\tilde{\delta \xi }_\tau }^T w_x {\delta \xi }) \\&\quad + 4 ({\xi _\tau }^T w_x {\delta \xi }) w_{xx}[{\xi _\tau },{\delta \xi },{\tilde{\delta \xi }}]{} & {} + 2 ({\tilde{\delta \xi }_\tau }^T w) w_{xx}[{\xi _\tau },{\delta \xi },{\delta \xi }] \\&\quad + 2 ({\xi _\tau }^T w_x {\tilde{\delta \xi }}) w_{xx}[{\xi _\tau },{\delta \xi },{\delta \xi }]{} & {} + 2 ({\xi _\tau }^T w) w_{xxx}[{\xi _\tau },{\delta \xi },{\delta \xi },{\tilde{\delta \xi }}] \\&\quad + 2 ({\xi _\tau }^T w) w_{xx}[{\tilde{\delta \xi }_\tau },{\delta \xi },{\delta \xi }]{} & {} + g'''[{\delta \xi },{\delta \xi },{\tilde{\delta \xi }}] ({\xi _\tau }^T{\xi _\tau }) \\&\quad + 2 ({\delta \xi }^T g''{\delta \xi }) ({\tilde{\delta \xi }_\tau }^T {\xi _\tau }){} & {} + 4 ({\tilde{\delta \xi }}^T g''{\delta \xi }) ({\delta \xi _\tau }^T {\xi _\tau }) \\&\quad + 4 (g'{\delta \xi }) ({\delta \xi _\tau }^T {\tilde{\delta \xi }_\tau }){} & {} + 2 (g'{\tilde{\delta \xi }}) ({\delta \xi _\tau }^T {\delta \xi _\tau }), \end{aligned} \end{aligned}$$

(73)

which is bounded by

$$\begin{aligned} \begin{aligned} |F'''(\xi ,{\xi _\tau })[{\delta \xi },{\delta \xi _\tau }]^2 [{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }]|&\le 4 {\Vert {\xi _\tau }\Vert }^2 ({\overline{c}}_0 {\overline{c}}_3 +3 {\overline{c}}_1 {\overline{c}}_2){\Vert {\delta \xi }\Vert }^2 {\Vert {\tilde{\delta \xi }}\Vert }\\&\quad + 8 {\Vert {\xi _\tau }\Vert }({\overline{c}}_1^2+{\overline{c}}_0{\overline{c}}_2) {\Vert {\delta \xi }\Vert }^2 {\Vert {\tilde{\delta \xi }_\tau }\Vert }\\&\quad +16 {\Vert {\xi _\tau }\Vert }({\overline{c}}_1^2+{\overline{c}}_0{\overline{c}}_2) {\Vert {\delta \xi }\Vert }{\Vert {\delta \xi _\tau }\Vert }{\Vert {\tilde{\delta \xi }}\Vert }\\&\quad +16 {\overline{c}}_0 {\overline{c}}_1 {\Vert {\delta \xi }\Vert }{\Vert {\delta \xi _\tau }\Vert }{\Vert {\tilde{\delta \xi }_\tau }\Vert }\\&\quad + 8 {\overline{c}}_0 {\overline{c}}_1 {\Vert {\delta \xi _\tau }\Vert }^2 {\Vert {\tilde{\delta \xi }}\Vert }. \end{aligned} \end{aligned}$$

(74)

For the length term $f_2 = g^{-1} \sqrt{F}$, we thus obtain

$$\begin{aligned} f_2'(\xi ,{\xi _\tau })[{\delta \xi },{\delta \xi _\tau }] = -g^{-2} (g'{\delta \xi }) F^{1/2} + \frac{1}{2} g^{-1} F^{-1/2} F'[{\delta \xi },{\delta \xi _\tau }], \end{aligned}$$

(75)

which is bounded by

$$\begin{aligned} |f_2'(\xi ,{\xi _\tau })[{\delta \xi },{\delta \xi _\tau }]| \le \left( 2 \frac{{\overline{c}}_0 {\overline{c}}_1 {\overline{\overline{v}}}}{{\underline{v}}^4} + 4 \frac{{\overline{c}}_0 {\overline{c}}_1}{{\underline{v}}^3}\right) {\Vert {\xi _\tau }\Vert }{\Vert {\delta \xi }\Vert }+ 2 {\underline{v}}^{-3} {\overline{\overline{v}}}^2 {\Vert {\delta \xi _\tau }\Vert }. \end{aligned}$$

(76)

The second derivative is

$$\begin{aligned} \begin{aligned} f_2''(\xi ,{\xi _\tau })[{\delta \xi },{\delta \xi _\tau }][{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }] =&\quad 2g^{-3} (g'{\tilde{\delta \xi }}) (g'{\delta \xi }) F^{1/2} \\&- g^{-2} ({\delta \xi }^T g''{\tilde{\delta \xi }}) F^{1/2} \\&- \frac{1}{2} g^{-2} (g'{\delta \xi }) F^{-1/2} F'[{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }] \\&- \frac{1}{2} g^{-2} (g'{\tilde{\delta \xi }}) F^{-1/2} F'[{\delta \xi },{\delta \xi _\tau }] \\&+ \frac{1}{2} g^{-1} F^{-1/2} F''[{\delta \xi },{\delta \xi _\tau }][{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }] \\&- \frac{1}{4} g^{-1} F^{-3/2} F'[{\delta \xi },{\delta \xi _\tau }] F'[{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }] \end{aligned} \end{aligned}$$

(77)

and in particular

$$\begin{aligned} \begin{aligned} f_2''(\xi ,{\xi _\tau })[{\delta \xi },{\delta \xi _\tau }]^2 =&\quad 2g^{-3} (g'{\delta \xi })^2 F^{1/2} \\&- g^{-2} ({\delta \xi }^T g''{\delta \xi }) F^{1/2} \\&- g^{-2} (g'{\delta \xi }) F^{-1/2} F'[{\delta \xi },{\delta \xi _\tau }] \\&+ \frac{1}{2} g^{-1} F^{-1/2} F''[{\delta \xi },{\delta \xi _\tau }]^2 \\&- \frac{1}{4} g^{-1} F^{-3/2} (F'[{\delta \xi },{\delta \xi _\tau }])^2, \end{aligned} \end{aligned}$$

(78)

which yields

$$\begin{array}{l}|f_2''(\xi ,{\xi _\tau })[{\delta \xi },{\delta \xi _\tau }][{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }]| \\\qquad\le \left[ 8 \frac{{\overline{c}}_0^2 {\overline{c}}_1^2 {\overline{\overline{v}}}}{{\underline{v}}^6} +12 \frac{{\overline{c}}_0^2 {\overline{c}}_1^2}{{\underline{v}}^5} + 2 \frac{({\overline{c}}_1^2 + {\overline{c}}_0 {\overline{c}}_2) {\overline{\overline{v}}}}{{\underline{v}}^4} + 2 \frac{{\overline{c}}_1^2 + {\overline{c}}_0 {\overline{c}}_2}{{\underline{v}}^3} \right] {\Vert {\xi _\tau }\Vert }{\Vert {\delta \xi }\Vert }{\Vert {\tilde{\delta \xi }}\Vert }\\\qquad + \left[ 4 \frac{{\overline{c}}_0 {\overline{c}}_1 {\overline{\overline{v}}}^2}{{\underline{v}}^5} + 4 \frac{{\overline{c}}_0 {\overline{c}}_1}{{\underline{v}}^3} \right] {\Vert {\delta \xi }\Vert }{\Vert {\tilde{\delta \xi }_\tau }\Vert }\\\qquad + \left[ 4 \frac{{\overline{c}}_0 {\overline{c}}_1 {\overline{\overline{v}}}^2}{{\underline{v}}^5} + 4 \frac{{\overline{c}}_0 {\overline{c}}_1}{{\underline{v}}^3} \right] {\Vert {\delta \xi _\tau }\Vert }{\Vert {\tilde{\delta \xi }}\Vert }\\\qquad + \left[ \frac{{\overline{\overline{v}}}^4}{{\underline{v}}^5} + \frac{{\overline{\overline{v}}}^2}{{\underline{v}}^3} \right] {\Vert {\xi _\tau }\Vert }^{-1} {\Vert {\delta \xi _\tau }\Vert }{\Vert {\tilde{\delta \xi }_\tau }\Vert }\end{array}$$

(79)

and

$$\begin{aligned} \begin{aligned}&|f_2''(\xi ,{\xi _\tau })[{\delta \xi },{\delta \xi _\tau }]^2| \\&\le \left[ 8 \frac{{\overline{c}}_0^2 {\overline{c}}_1^2 {\overline{\overline{v}}}}{{\underline{v}}^6} +12 \frac{{\overline{c}}_0^2 {\overline{c}}_1^2}{{\underline{v}}^5} + 2 \frac{({\overline{c}}_1^2 + {\overline{c}}_0 {\overline{c}}_2) {\overline{\overline{v}}}}{{\underline{v}}^4} + 2 \frac{{\overline{c}}_1^2 + {\overline{c}}_0 {\overline{c}}_2}{{\underline{v}}^3} \right] {\Vert {\xi _\tau }\Vert }{\Vert {\delta \xi }\Vert }^2 \\&\quad + \left[ 8 \frac{{\overline{c}}_0 {\overline{c}}_1 {\overline{\overline{v}}}^2}{{\underline{v}}^5} + 8 \frac{{\overline{c}}_0 {\overline{c}}_1}{{\underline{v}}^3} \right] {\Vert {\delta \xi }\Vert }{\Vert {\delta \xi _\tau }\Vert }\\&\quad + \left[ \frac{{\overline{\overline{v}}}^4}{{\underline{v}}^5} + \frac{{\overline{\overline{v}}}^2}{{\underline{v}}^3} \right] {\Vert {\xi _\tau }\Vert }^{-1} {\Vert {\delta \xi _\tau }\Vert }^2 \end{aligned} \end{aligned}$$

(80)

The third derivative is

$$\begin{aligned} f_2'''(\xi ,{\xi _\tau })[{\delta \xi },{\delta \xi _\tau }]^2 [{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }] =&-6g^{-4} (g'{\tilde{\delta \xi }}) (g'{\delta \xi })^2 F^{1/2} \\&+4g^{-3} (g'{\delta \xi }) ({\tilde{\delta \xi }}^Tg''{\delta \xi }) F^{1/2} \\&+ g^{-3} (g'{\delta \xi })^2 F^{-1/2} F'[{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }] \\&+2g^{-3} (g'{\tilde{\delta \xi }}) ({\delta \xi }^T g''{\delta \xi }) F^{1/2} \\&- g^{-2} g'''[{\delta \xi },{\delta \xi },{\tilde{\delta \xi }}] F^{1/2} \\&-\frac{1}{2} g^{-2} ({\delta \xi }^T g''{\delta \xi }) F^{-1/2} F'[{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }] \\&+ g^{-3} (g'{\tilde{\delta \xi }}) (g'{\delta \xi }) F^{-1/2} F'[{\delta \xi },{\delta \xi _\tau }] \\&-\frac{1}{2} g^{-2} ({\tilde{\delta \xi }}^Tg''{\delta \xi }) F^{-1/2} F'[{\delta \xi },{\delta \xi _\tau }] \\&+\frac{1}{4} g^{-2} (g'{\delta \xi }) F^{-3/2} F'[{\delta \xi },{\delta \xi _\tau }] F'[{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }] \\&-\frac{1}{2} g^{-2} (g'{\delta \xi }) F^{-1/2} F''[{\delta \xi },{\delta \xi _\tau }][{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }] \\&+ g^{-3} (g'{\tilde{\delta \xi }}) (g'{\delta \xi }) F^{-1/2} F'[{\delta \xi },{\delta \xi _\tau }] \\&- \frac{1}{2} g^{-2} ({\tilde{\delta \xi }}g''{\delta \xi }) F^{-1/2} F'[{\delta \xi },{\delta \xi _\tau }] \\&+ \frac{1}{4} g^{-2} (g'{\delta \xi }) F^{-3/2} F'[{\delta \xi },{\delta \xi _\tau }] F'[{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }] \\&- \frac{1}{2} g^{-2} (g'{\delta \xi }) F^{-1/2} F''[{\delta \xi },{\delta \xi _\tau }][{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }] \\&+ \frac{1}{4} g^{-2} (g'{\tilde{\delta \xi }}) F^{-3/2} (F'[{\delta \xi },{\delta \xi _\tau }])^2 \\&+ \frac{3}{8} g^{-1} F^{-5/2} (F'[{\delta \xi },{\delta \xi _\tau }])^2 F'[{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }] \\&- \frac{1}{2} g^{-1} F^{-3/2} F'[{\delta \xi },{\delta \xi _\tau }] F''[{\delta \xi },{\delta \xi _\tau }][{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }] \\&- \frac{1}{2} g^{-2} (g'{\tilde{\delta \xi }}) F^{-1/2} F''[{\delta \xi },{\delta \xi _\tau }]^2 \\&- \frac{1}{4} g^{-1} F^{-3/2} F''[{\delta \xi },{\delta \xi _\tau }]^2 F'[{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }] \\&+ \frac{1}{2} g^{-1} F^{-1/2} F'''[{\delta \xi },{\delta \xi _\tau }]^2[{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }], \end{aligned}$$

(81)

which is bounded by

$$\begin{aligned} \begin{aligned}&|f_2'''(\xi ,{\xi _\tau })[{\delta \xi },{\delta \xi _\tau }]^2 [{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }]| \\&\le \frac{2{\Vert {\xi _\tau }\Vert }}{{\underline{v}}} \Bigg [ \frac{{\overline{c}}_3}{{\underline{v}}} \left( \frac{{\overline{c}}_0}{{\underline{v}}} + \frac{{\overline{\overline{v}}}{\overline{c}}_0}{{\underline{v}}^2} \right) \\ {}&+ \frac{3{\overline{c}}_1 {\overline{c}}_2}{{\underline{v}}^2} \left( 1 + \frac{{\overline{\overline{v}}}}{{\underline{v}}} + 6 \frac{{\overline{c}}_0^2}{{\underline{v}}^2} + 4 \frac{{\overline{\overline{v}}}{\overline{c}}_0^2}{{\underline{v}}^3} \right) \\ {}&+ \frac{6{\overline{c}}_1^3}{{\underline{v}}^3} \left( 3 \frac{{\overline{c}}_0}{{\underline{v}}} +2\frac{{\overline{\overline{v}}}{\overline{c}}_0}{{\underline{v}}^2} +8\frac{{\overline{c}}_0^3}{{\underline{v}}^3} +4\frac{{\overline{\overline{v}}}{\overline{c}}_0^3}{{\underline{v}}^4} \right) \Bigg ] {\Vert {\delta \xi }\Vert }^2 {\Vert {\tilde{\delta \xi }}\Vert }\\&\quad + \frac{4}{{\underline{v}}} \Bigg [ \frac{{\overline{c}}_1^2}{{\underline{v}}^2} \left( 1 + \frac{{\overline{v}}^2}{{\underline{v}}^2} + 9\frac{{\overline{c}}_0^2}{{\underline{v}}^2} + 7\frac{{\overline{c}}_0^2 {\overline{\overline{v}}}^2}{{\underline{v}}^4} \right) \\ {}&+ \frac{{\overline{c}}_2}{{\underline{v}}} \left( \frac{{\overline{c}}_0}{{\underline{v}}} + \frac{{\overline{v}}^2 {\overline{c}}_0}{{\underline{v}}^3} + \frac{{\overline{c}}_0^3}{{\underline{v}}^3} \right) \Bigg ] {\Vert {\delta \xi }\Vert }^2 {\Vert {\tilde{\delta \xi }_\tau }\Vert }\\&\quad + \frac{8}{{\underline{v}}} \Bigg [ \frac{{\overline{c}}_1^2}{{\underline{v}}^2} \left( 1 + \frac{{\overline{v}}^2}{{\underline{v}}^2} + 9\frac{{\overline{c}}_0^2}{{\underline{v}}^2} + 7\frac{{\overline{c}}_0^2 {\overline{\overline{v}}}^2}{{\underline{v}}^4} \right) \\ {}&+ \frac{{\overline{c}}_2}{{\underline{v}}} \left( \frac{{\overline{c}}_0}{{\underline{v}}} + \frac{{\overline{v}}^2{\overline{c}}_0}{{\underline{v}}^3} + \frac{{\overline{c}}_0^3}{{\underline{v}}^3} \right) \Bigg ] {\Vert {\delta \xi }\Vert }{\Vert {\delta \xi _\tau }\Vert }{\Vert {\tilde{\delta \xi }}\Vert }\\&\quad + \frac{8{\overline{c}}_0{\overline{c}}_1}{{\Vert {\xi _\tau }\Vert }{\underline{v}}^3} \left( 1 +3\frac{{\overline{\overline{v}}}^2}{{\underline{v}}^2} +2\frac{{\overline{\overline{v}}}^4}{{\underline{v}}^4} \right) {\Vert {\delta \xi }\Vert }{\Vert {\delta \xi _\tau }\Vert }{\Vert {\tilde{\delta \xi }_\tau }\Vert }\\&\quad + \frac{4{\overline{c}}_0{\overline{c}}_1}{{\Vert {\xi _\tau }\Vert }{\underline{v}}^3} \left( 1 +3\frac{{\overline{\overline{v}}}^2}{{\underline{v}}^2} +2\frac{{\overline{\overline{v}}}^4}{{\underline{v}}^4} \right) {\Vert {\delta \xi _\tau }\Vert }^2 {\Vert {\tilde{\delta \xi }}\Vert }\\&\quad + \frac{3{\overline{\overline{v}}}^4}{{\Vert {\xi _\tau }\Vert }^2{\underline{v}}^5} \left( 1 + \frac{{\overline{\overline{v}}}^2}{{\underline{v}}^2} \right) {\Vert {\delta \xi _\tau }\Vert }^2 {\Vert {\tilde{\delta \xi }_\tau }\Vert }. \end{aligned} \end{aligned}$$

(82)

Lemma 16

Let $\Vert w(p)\Vert \le {\overline{c}}_0 \le {\overline{v}}/\sqrt{5}$, $\Vert w_x(p)\Vert \le {\overline{c}}_1$, $\Vert w_{xx}(p)\Vert \le {\overline{c}}_2$, and $\Vert w_{xxx}(p)\Vert \le {\overline{c}}_3$ for every $p\in \Omega$. Moreover let ${\underline{v}}^2:= {\overline{v}}^2 - {\overline{c}}_0^2$ and ${\overline{\overline{v}}}^2:= {\overline{v}}^2 + {\overline{c}}_0^2$. Then, for any $\xi \in X$, the third directional derivative of f as given in (3) is bounded by

$$\begin{array}{l}|f'''(\xi ,{\xi _\tau }) [{\delta \xi },{\delta \xi _\tau }]^2[{\Delta \xi },{\Delta \xi _\tau }]| \\ \qquad \le ~\bigg ({\Vert {\xi _\tau }\Vert }{\overline{\gamma }}_0 {\Vert {\delta \xi }\Vert }^2 + {\overline{\gamma }}_2 {\Vert {\delta \xi }\Vert }{\Vert {\delta \xi _\tau }\Vert }+ \frac{{\overline{\gamma }}_4}{{\Vert {\xi _\tau }\Vert }} {\Vert {\delta \xi _\tau }\Vert }^2{} \bigg )~ {\Vert {\Delta \xi }\Vert }\\ \qquad +\bigg ({\overline{\gamma }}_1 {\Vert {\delta \xi }\Vert }^2 + \frac{{\overline{\gamma }}_3}{{\Vert {\xi _\tau }\Vert }} {\Vert {\delta \xi }\Vert }{\Vert {\delta \xi _\tau }\Vert }+\frac{{\overline{\gamma }}_5}{{\Vert {\xi _\tau }\Vert }^2} {\Vert {\delta \xi _\tau }\Vert }^2 \bigg )~ {\Vert {\Delta \xi _\tau }\Vert }\end{array}$$

with

$$\begin{aligned} \begin{aligned} {\overline{\gamma }}_0&= \frac{2}{{\underline{v}}^4} \left( 37 {\overline{c}}_1^3 +21 {\overline{c}}_1 {\overline{c}}_2 {\underline{v}}+2 {\overline{c}}_3 {\underline{v}}^2 \right) ,&{\overline{\gamma }}_3&= 40\frac{{\overline{c}}_1}{{\underline{v}}^2 {\Vert {\xi _\tau }\Vert }}, \\ {\overline{\gamma }}_1&= \frac{1}{{\underline{v}}^3} \left( 29 {\overline{c}}_1^2 + 7 {\underline{v}}{\overline{c}}_2\right) ,&{\overline{\gamma }}_4&= 20\frac{{\overline{c}}_1}{{\underline{v}}^2 {\Vert {\xi _\tau }\Vert }}, \\ {\overline{\gamma }}_2&=\frac{1}{{\underline{v}}^3} (57 {\overline{c}}_1^2 + 13{\underline{v}}{\overline{c}}_2),&{\overline{\gamma }}_5&= 18 \frac{1}{{\underline{v}}{\Vert {\xi _\tau }\Vert }^2}. \end{aligned} \end{aligned}$$

Proof

We obtain f by adding $f_1$ and $f_2$. The third derivative of f can thus be bounded using (65), (82), and the triangle inequality.

$$\begin{array}{l}|f'''[{\delta \xi },{\delta \xi _\tau }]^2 [{\Delta \xi },{\Delta \xi _\tau }]| \\ \qquad \le \frac{{\Vert {\xi _\tau }\Vert }}{{\underline{v}}} \Bigg [ \frac{{\overline{c}}_3}{{\underline{v}}} \left( 1 + 2\frac{{\overline{c}}_0}{{\underline{v}}} + 2\frac{{\overline{\overline{v}}}{\overline{c}}_0}{{\underline{v}}^2} + 2\frac{{\overline{c}}_0^2}{{\underline{v}}^2} \right) \\ \qquad + 6\frac{{\overline{c}}_1 {\overline{c}}_2}{{\underline{v}}^2} \left( 1 + 1\frac{{\overline{\overline{v}}}}{{\underline{v}}} + 3\frac{{\overline{c}}_0}{{\underline{v}}} + 6\frac{{\overline{c}}_0^2}{{\underline{v}}^2} + 4\frac{{\overline{\overline{v}}}{\overline{c}}_0^2}{{\underline{v}}^3} + 4\frac{{\overline{c}}_0^3}{{\underline{v}}^3} \right) \\ \qquad + 6\frac{{\overline{c}}_1^3}{{\underline{v}}^3} \left( 1 + 6\frac{{\overline{c}}_0}{{\underline{v}}} + 4\frac{{\overline{\overline{v}}}{\overline{c}}_0}{{\underline{v}}^2} + 8\frac{{\overline{c}}_0^2}{{\underline{v}}^2} +16\frac{{\overline{c}}_0^3}{{\underline{v}}^3} + 8\frac{{\overline{\overline{v}}}{\overline{c}}_0^3}{{\underline{v}}^4} + 8\frac{{\overline{c}}_0^4}{{\underline{v}}^4} \right) \Bigg ] {\Vert {\delta \xi }\Vert }^2 {\Vert {\Delta \xi }\Vert }\\ \qquad + \frac{1}{{\underline{v}}} \Bigg [ 2\frac{{\overline{c}}_1^2}{{\underline{v}}^2} \left( 2 + 3\frac{{\overline{c}}_0}{{\underline{v}}} + 2\frac{{\overline{v}}^2}{{\underline{v}}^2} +18\frac{{\overline{c}}_0^2}{{\underline{v}}^2} + 4\frac{{\overline{c}}_0^3}{{\underline{v}}^3} +14\frac{{\overline{c}}_0^2 {\overline{\overline{v}}}^2}{{\underline{v}}^4} \right) \\ \qquad + \frac{{\overline{c}}_2}{{\underline{v}}} \left( 1 + 4\frac{{\overline{c}}_0}{{\underline{v}}} + 2\frac{{\overline{c}}_0^2}{{\underline{v}}^2} + 4\frac{{\overline{v}}^2 {\overline{c}}_0}{{\underline{v}}^3} + 4\frac{{\overline{c}}_0^3}{{\underline{v}}^3} \right) \Bigg ] {\Vert {\delta \xi }\Vert }^2 {\Vert {\Delta \xi _\tau }\Vert }\\ \qquad + \frac{1}{{\underline{v}}} \Bigg [ 4 \frac{{\overline{c}}_1^2}{{\underline{v}}^2} \left( 2 + 4\frac{{\overline{c}}_0^3}{{\underline{v}}^3} + 3\frac{{\overline{c}}_0}{{\underline{v}}} + 2\frac{{\overline{v}}^2}{{\underline{v}}^2} +18\frac{{\overline{c}}_0^2}{{\underline{v}}^2} +14\frac{{\overline{c}}_0^2 {\overline{\overline{v}}}^2}{{\underline{v}}^4} \right) \\ \qquad + 2\frac{{\overline{c}}_2}{{\underline{v}}} \left( 1 + 4\frac{{\overline{c}}_0}{{\underline{v}}} + 2 \frac{{\overline{c}}_0^2}{{\underline{v}}^2} + 4\frac{{\overline{v}}^2{\overline{c}}_0}{{\underline{v}}^3} + 4\frac{{\overline{c}}_0^3}{{\underline{v}}^3} \right) \Bigg ] {\Vert {\delta \xi }\Vert }{\Vert {\delta \xi _\tau }\Vert }{\Vert {\Delta \xi }\Vert }\\ \qquad + \frac{8{\overline{c}}_0{\overline{c}}_1}{{\Vert {\xi _\tau }\Vert }{\underline{v}}^3} \left( 1 +3\frac{{\overline{\overline{v}}}^2}{{\underline{v}}^2} +2\frac{{\overline{\overline{v}}}^4}{{\underline{v}}^4} \right) {\Vert {\delta \xi }\Vert }{\Vert {\delta \xi _\tau }\Vert }{\Vert {\Delta \xi _\tau }\Vert }\\ \qquad + \frac{4{\overline{c}}_0{\overline{c}}_1}{{\Vert {\xi _\tau }\Vert }{\underline{v}}^3} \left( 1 +3\frac{{\overline{\overline{v}}}^2}{{\underline{v}}^2} +2\frac{{\overline{\overline{v}}}^4}{{\underline{v}}^4} \right) {\Vert {\delta \xi _\tau }\Vert }^2 {\Vert {\Delta \xi }\Vert }\\ \qquad + \frac{3{\overline{\overline{v}}}^4}{{\Vert {\xi _\tau }\Vert }^2{\underline{v}}^5} \left( 1 + \frac{{\overline{\overline{v}}}^2}{{\underline{v}}^2} \right) {\Vert {\delta \xi _\tau }\Vert }^2 {\Vert {\Delta \xi _\tau }\Vert }. \end{array}$$

With $\frac{{\overline{c}}_0}{{\overline{v}}} \le \frac{1}{\sqrt{5}}$, we note that

$$\begin{aligned} \frac{{\overline{c}}_0}{{\underline{v}}} \le \frac{1}{2}, \qquad \frac{{\overline{\overline{v}}}}{{\underline{v}}} \le \sqrt{\frac{3}{2}}, \quad \text {and} \qquad \frac{{\overline{v}}}{{\underline{v}}} \le \frac{\sqrt{5}}{2} \end{aligned}$$

and obtain

$$\begin{aligned} \begin{aligned} |f'''[{\delta \xi },{\delta \xi _\tau }]^2 [{\Delta \xi },{\Delta \xi _\tau }]|&\le \frac{{\Vert {\xi _\tau }\Vert }}{{\underline{v}}} \bigg [ \frac{{\overline{c}}_3}{{\underline{v}}} \left( \frac{5}{2} + \sqrt{\frac{3}{2}} \right) \\ {}&+ 6\frac{{\overline{c}}_1 {\overline{c}}_2}{{\underline{v}}^2} \left( \frac{9}{2} + 2\sqrt{\frac{3}{2}} \right) \\ {}&+ 6\frac{{\overline{c}}_1^3}{{\underline{v}}^3} \left( \frac{17}{2} + 3 \sqrt{\frac{3}{2}} \right) \bigg ] {\Vert {\delta \xi }\Vert }^2 {\Vert {\Delta \xi }\Vert }\\&\quad + \frac{1}{{\underline{v}}} \bigg [ \frac{57}{2} \frac{{\overline{c}}_1^2}{{\underline{v}}^2} + \frac{13}{2} \frac{{\overline{c}}_2}{{\underline{v}}} \bigg ] {\Vert {\delta \xi }\Vert }^2 {\Vert {\Delta \xi _\tau }\Vert }\\&\quad + \frac{1}{{\underline{v}}} \bigg [ 57 \frac{{\overline{c}}_1^2}{{\underline{v}}^2} + 13\frac{{\overline{c}}_2}{{\underline{v}}} \bigg ] {\Vert {\delta \xi }\Vert }{\Vert {\delta \xi _\tau }\Vert }{\Vert {\Delta \xi }\Vert }\\&\quad + 40 \frac{{\overline{c}}_1}{{\Vert {\xi _\tau }\Vert }{\underline{v}}^2} {\Vert {\delta \xi }\Vert }{\Vert {\delta \xi _\tau }\Vert }{\Vert {\Delta \xi _\tau }\Vert }\\&\quad + 20 \frac{{\overline{c}}_1}{{\Vert {\xi _\tau }\Vert }{\underline{v}}^2} {\Vert {\delta \xi _\tau }\Vert }^2 {\Vert {\Delta \xi }\Vert }\\&\quad + \frac{135}{8{\Vert {\xi _\tau }\Vert }^2{\underline{v}}} {\Vert {\delta \xi _\tau }\Vert }^2 {\Vert {\Delta \xi _\tau }\Vert }, \end{aligned} \end{aligned}$$

Rounding up the values yields the bound

$$\begin{aligned} \begin{aligned} |f'''[{\delta \xi },{\delta \xi _\tau }]^2 [{\Delta \xi },{\Delta \xi _\tau }]|&\le \frac{{\Vert {\xi _\tau }\Vert }}{{\underline{v}}} \bigg [ 4\frac{{\overline{c}}_3}{{\underline{v}}} + 42\frac{{\overline{c}}_1 {\overline{c}}_2}{{\underline{v}}^2} + 74\frac{{\overline{c}}_1^3}{{\underline{v}}^3} \bigg ] {\Vert {\delta \xi }\Vert }^2 {\Vert {\Delta \xi }\Vert }\\&\quad + \frac{1}{{\underline{v}}} \bigg [ 29 \frac{{\overline{c}}_1^2}{{\underline{v}}^2} + 7 \frac{{\overline{c}}_2}{{\underline{v}}} \bigg ] {\Vert {\delta \xi }\Vert }^2 {\Vert {\Delta \xi _\tau }\Vert }\\&\quad + \frac{1}{{\underline{v}}} \bigg [ 57 \frac{{\overline{c}}_1^2}{{\underline{v}}^2} + 13\frac{{\overline{c}}_2}{{\underline{v}}} \bigg ] {\Vert {\delta \xi }\Vert }{\Vert {\delta \xi _\tau }\Vert }{\Vert {\Delta \xi }\Vert }\\&\quad + 40 \frac{{\overline{c}}_1}{{\Vert {\xi _\tau }\Vert }{\underline{v}}^2} {\Vert {\delta \xi }\Vert }{\Vert {\delta \xi _\tau }\Vert }{\Vert {\Delta \xi _\tau }\Vert }\\&\quad + 20 \frac{{\overline{c}}_1}{{\Vert {\xi _\tau }\Vert }{\underline{v}}^2} {\Vert {\delta \xi _\tau }\Vert }^2 {\Vert {\Delta \xi }\Vert }\\&\quad + 18 \frac{1}{{\Vert {\xi _\tau }\Vert }^2{\underline{v}}} {\Vert {\delta \xi _\tau }\Vert }^2 {\Vert {\Delta \xi _\tau }\Vert }. \end{aligned} \end{aligned}$$

Lemma 17

Let $\Vert w(p)\Vert \le {\overline{c}}_0 \le {\overline{v}}/\sqrt{5}$, $\Vert w_x(p)\Vert \le {\overline{c}}_1$, and $\Vert w_{xx}(p)\Vert \le {\overline{c}}_2$ for every $p\in \Omega$. Moreover let ${\underline{v}}^2:= {\overline{v}}^2 - {\overline{c}}_0^2$ and ${\overline{\overline{v}}}^2:= {\overline{v}}^2 + {\overline{c}}_0^2$. Then, for any $\xi \in X$, the second directional derivative of f as given in (3) is bounded by

$$\begin{aligned} \begin{aligned} |f''(\xi ,{\xi _\tau }) [{\delta \xi },{\delta \xi _\tau }][{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }]| \le&{\overline{\beta }}_0 {\Vert {\xi _\tau }\Vert }{\Vert {\delta \xi }\Vert }{\Vert {\tilde{\delta \xi }}\Vert }+ {\overline{\beta }}_1 {\Vert {\delta \xi }\Vert }{\Vert {\tilde{\delta \xi }_\tau }\Vert }\\&+ {\overline{\beta }}_1 {\Vert {\delta \xi _\tau }\Vert }{\Vert {\tilde{\delta \xi }}\Vert }+ {\overline{\beta }}_2 {\Vert {\xi _\tau }\Vert }^{-1} {\Vert {\delta \xi _\tau }\Vert }{\Vert {\tilde{\delta \xi }_\tau }\Vert }\end{aligned} \end{aligned}$$

with

$$\begin{aligned} {\overline{\beta }}_0 = 14 \frac{{\overline{c}}_1^2}{{\underline{v}}^3} + 4 \frac{{\overline{c}}_2}{{\underline{v}}^2}, \qquad {\overline{\beta }}_1 = 7\frac{{\overline{c}}_1}{{\underline{v}}^2}, \qquad {\overline{\beta }}_2 = \frac{4}{{\underline{v}}} . \end{aligned}$$

Proof

We obtain f by adding $f_1$ and $f_2$. The second derivative of f can thus be bounded using (62), (79), and the triangle inequality.

$$\begin{aligned} \begin{aligned} |f''(\xi ,{\xi _\tau })[{\delta \xi },{\delta \xi _\tau }][{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }]|&\le \bigg [ 8 {\overline{c}}_0^2 {\overline{c}}_1^2\frac{{\overline{c}}_0 + {\overline{\overline{v}}}}{{\underline{v}}^6} +12 \frac{{\overline{c}}_0^2 {\overline{c}}_1^2}{{\underline{v}}^5} \\ {}&\qquad + 2 \frac{{\overline{c}}_1^2 {\overline{\overline{v}}}+ {\overline{c}}_0 {\overline{c}}_2 {\overline{\overline{v}}}+ 3 {\overline{c}}_0 {\overline{c}}_1^2 + {\overline{c}}_0^2 {\overline{c}}_2}{{\underline{v}}^4} \\ {}&\qquad + 2 \frac{{\overline{c}}_1^2 + {\overline{c}}_0 {\overline{c}}_2}{{\underline{v}}^3} + \frac{{\overline{c}}_2}{{\underline{v}}^{2}} \bigg ] {\Vert {\xi _\tau }\Vert }{\Vert {\delta \xi }\Vert }{\Vert {\tilde{\delta \xi }}\Vert }\\&\quad + \bigg [ 4 \frac{{\overline{c}}_0 {\overline{c}}_1 {\overline{\overline{v}}}^2}{{\underline{v}}^5} + 2 \frac{{\overline{c}}_0^2 {\overline{c}}_1}{{\underline{v}}^4} + 4 \frac{{\overline{c}}_0 {\overline{c}}_1}{{\underline{v}}^3} + \frac{{\overline{c}}_1}{{\underline{v}}^2} \bigg ] {\Vert {\delta \xi _\tau }\Vert }{\Vert {\tilde{\delta \xi }}\Vert }\\&\quad + \bigg [ 4 \frac{{\overline{c}}_0 {\overline{c}}_1 {\overline{\overline{v}}}^2}{{\underline{v}}^5} + 2 \frac{{\overline{c}}_0^2 {\overline{c}}_1}{{\underline{v}}^4} + 4 \frac{{\overline{c}}_0 {\overline{c}}_1}{{\underline{v}}^3} + \frac{{\overline{c}}_1}{{\underline{v}}^2} \bigg ] {\Vert {\delta \xi }\Vert }{\Vert {\tilde{\delta \xi }_\tau }\Vert }\\&\quad + \left[ \frac{{\overline{\overline{v}}}^4}{{\underline{v}}^5} + \frac{{\overline{\overline{v}}}^2}{{\underline{v}}^3} \right] {\Vert {\xi _\tau }\Vert }^{-1} {\Vert {\delta \xi _\tau }\Vert }{\Vert {\tilde{\delta \xi }_\tau }\Vert }. \end{aligned} \end{aligned}$$

With $\frac{{\overline{c}}_0}{{\overline{v}}} \le \frac{1}{\sqrt{5}}$, we note that

$$\begin{aligned} \frac{{\overline{c}}_0}{{\underline{v}}} \le \frac{1}{2}, \qquad \frac{{\overline{\overline{v}}}}{{\underline{v}}} \le \sqrt{\frac{3}{2}}, \quad \text {and} \qquad \frac{{\overline{v}}}{{\underline{v}}} \le \frac{\sqrt{5}}{2} \end{aligned}$$

and obtain

$$\begin{aligned} \begin{aligned} |f''(\xi ,{\xi _\tau })[{\delta \xi },{\delta \xi _\tau }][{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }]|&\le \left[ \left( 9 + 4 \sqrt{\frac{3}{2}} \right) \frac{{\overline{c}}_1^2}{{\underline{v}}^3} + 4 \frac{{\overline{c}}_2}{{\underline{v}}^2} \right] {\Vert {\xi _\tau }\Vert }{\Vert {\delta \xi }\Vert }{\Vert {\tilde{\delta \xi }}\Vert }\\&\quad + \frac{13{\overline{c}}_1}{2{\underline{v}}^2} {\Vert {\delta \xi _\tau }\Vert }{\Vert {\tilde{\delta \xi }}\Vert }\\&\quad + \frac{13{\overline{c}}_1}{2{\underline{v}}^2} {\Vert {\delta \xi }\Vert }{\Vert {\tilde{\delta \xi }_\tau }\Vert }\\&\quad + \frac{15}{4{\underline{v}}} {\Vert {\xi _\tau }\Vert }^{-1} {\Vert {\delta \xi _\tau }\Vert }{\Vert {\tilde{\delta \xi }_\tau }\Vert }. \end{aligned} \end{aligned}$$

Rounding up the values yields the bound

$$\begin{aligned} \begin{aligned} |f''(\xi ,{\xi _\tau })[{\delta \xi },{\delta \xi _\tau }][{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }]|&\le \bigg [ 14 \frac{{\overline{c}}_1^2}{{\underline{v}}^3} + 4 \frac{{\overline{c}}_2}{{\underline{v}}^2} \bigg ] {\Vert {\xi _\tau }\Vert }{\Vert {\delta \xi }\Vert }{\Vert {\tilde{\delta \xi }}\Vert }\\&\quad + 7\frac{{\overline{c}}_1}{{\underline{v}}^2} {\Vert {\delta \xi _\tau }\Vert }{\Vert {\tilde{\delta \xi }}\Vert }\\&\quad + 7\frac{{\overline{c}}_1}{{\underline{v}}^2} {\Vert {\delta \xi }\Vert }{\Vert {\tilde{\delta \xi }_\tau }\Vert }\\&\quad + \frac{4}{{\underline{v}}} {\Vert {\xi _\tau }\Vert }^{-1} {\Vert {\delta \xi _\tau }\Vert }{\Vert {\tilde{\delta \xi }_\tau }\Vert }. \end{aligned} \end{aligned}$$

1.2 A.2 Bounds in a neighborhood of a minimizer

Below we derive bounds that hold in a $L^\infty$-neighborhood of a global minimizer. Let $x^{\star \star } = (z^{\star \star }, \lambda ^{\star \star })$ be a global minimizer of (6) and the corresponding Lagrange multipliers. Moreover, let $x_1,x_2 \in \mathcal {B}(x^{\star \star },R)$ and define $\Delta x:= x_2-x_1$. Then it holds that $\Vert \Delta x\Vert _{Y^{\infty }} \le 2R$ and consequently

$$\begin{aligned} \Vert {\Delta \xi }\Vert _{L^{\infty }({]0,1[} )} \underset{(22a)}{\le }\ 2R, \end{aligned}$$

(83)

$$\begin{aligned} \Vert {\Delta \xi _\tau }\Vert _{L^{\infty }({]0,1[} )} \underset{(22a)}{\le }\ 2R. \end{aligned}$$

(84)

Let $\Vert w\Vert _{L^{\infty }(\Omega )} \le {\overline{c}}_0$, $\Vert w_x\Vert _{L^{\infty }(\Omega )} \le {\overline{c}}_1$, $\Vert w_{xx}\Vert _{L^{\infty }(\Omega )} \le {\overline{c}}_2$, and $\Vert w_{xxx}\Vert _{L^{\infty }(\Omega )} \le {\overline{c}}_3$, then the following bounds hold,

$$\begin{aligned} |w(\xi _2) - w(\xi _1)| = |\int _0^1 w_x(\xi _1 + \mu {\delta \xi })[{\delta \xi }] d\mu \; | \; \le {\overline{c}}_1 {\Vert {\delta \xi }\Vert }\le 2R {\overline{c}}_1, \end{aligned}$$

(85)

$$\begin{aligned} \Vert w_x(\xi _2) - w_{x,}(\xi _1)\Vert = |\int _0^1 w_{xx}(\xi _1 + \mu {\delta \xi }) d\mu \; | \le {\overline{c}}_2 {\Vert {\delta \xi }\Vert }\le 2R {\overline{c}}_2, \end{aligned}$$

(86)

$$\begin{aligned} \Vert w_{xx}(\xi _2) - w_{xx}(\xi _1)\Vert = |\int _0^1 w_{xxx}(\xi _1 + \mu {\delta \xi }) d\mu \; | \le {\overline{c}}_3 {\Vert {\delta \xi }\Vert }\le 2R {\overline{c}}_3. \end{aligned}$$

(87)

Moreover, we show that

$$\begin{aligned} \begin{aligned} |g(\xi _2)-g(\xi _1)|&= |{\overline{v}}^2 - w(\xi _2)^Tw(\xi _2) - {\overline{v}}^2 + w(\xi _1)^Tw(\xi _1)| \\&= |w(\xi _2)^Tw(\xi _2) - w(\xi _1)^Tw(\xi _1)| \\&\le 2 {\overline{c}}_0 {\overline{c}}_1 {\Vert {\delta \xi }\Vert }\\&\le 4R {\overline{c}}_0 {\overline{c}}_1 \end{aligned} \end{aligned}$$

(88)

$$\begin{aligned} \begin{aligned} |g(\xi _2)^2-g(\xi _1)^2|&= |(g(\xi _2)-g(\xi _1))(g(\xi _2)+g(\xi _1))| \\&\le (2 {\overline{c}}_0 {\overline{c}}_1 {\Vert {\delta \xi }\Vert }) (2{\overline{v}}^2) \\&\le 4 {\overline{c}}_0 {\overline{c}}_1 {\overline{v}}^2 {\Vert {\delta \xi }\Vert }\\&\le 8R {\overline{c}}_0 {\overline{c}}_1 {\overline{v}}^2 \end{aligned} \end{aligned}$$

(89)

$$\begin{aligned} \begin{aligned} |g(\xi _2)^3 - g(\xi _1)^3|&= |g(\xi _2)-g(\xi _1)| \; |g(\xi _1)^2 + 2g(\xi _1)g(\xi _2) + g(\xi _2)^2| \\&\le (2 {\overline{c}}_0 {\overline{c}}_1 {\Vert {\delta \xi }\Vert }) (4{\overline{v}}^4) \\&\le 8 {\overline{c}}_0 {\overline{c}}_1 {\overline{v}}^4 {\Vert {\delta \xi }\Vert }\\&\le 16R {\overline{c}}_0 {\overline{c}}_1 {\overline{v}}^4 \end{aligned} \end{aligned}$$

(90)

$$\begin{aligned} \begin{aligned} |g'(\xi _2) - g'(\xi _1)|&= |\int _0^1 g''(\xi _1 + \mu {\delta \xi })[{\delta \xi }] \, d\mu \, | \\&\le 2({\overline{c}}_1^2 + {\overline{c}}_0{\overline{c}}_2) {\Vert {\delta \xi }\Vert }\\&\le 4R ({\overline{c}}_1^2 + {\overline{c}}_0{\overline{c}}_2) \end{aligned} \end{aligned}$$

(91)

$$\begin{aligned} \begin{aligned} \Vert g''(\xi _2) - g''(\xi _1)\Vert&= |\int _0^1 g'''(\xi _1 + \mu {\delta \xi }) \, d\mu \, | \\&\le 2(3{\overline{c}}_1{\overline{c}}_2 + {\overline{c}}_0{\overline{c}}_3) {\Vert {\delta \xi }\Vert }\\&\le 2R (3{\overline{c}}_1{\overline{c}}_2 + {\overline{c}}_0{\overline{c}}_3) \end{aligned} \end{aligned}$$

(92)

Furthermore, with F as given in (66), and (28) we get

$$\begin{aligned} {\underline{v}}^2 (L^{\star \star } - R)^2 \le {\underline{v}}^2 {\Vert {\xi _\tau }\Vert }^2 \le F \le {\Vert {\xi _\tau }\Vert }^2 {\overline{\overline{v}}}^2 \le (L^{\star \star } + R)^2 {\overline{\overline{v}}}^2 \end{aligned}$$

and

$$\begin{aligned} \begin{aligned} |F'(\xi ,{\xi _\tau })[{\delta \xi },{\delta \xi _\tau }]|&\le 2 {\overline{\overline{v}}}^2 {\Vert {\xi _\tau }\Vert }{\Vert {\delta \xi _\tau }\Vert }+ 4 {\overline{c}}_0 {\overline{c}}_1 {\Vert {\xi _\tau }\Vert }^2 {\Vert {\delta \xi }\Vert }\\&\le 2 {\overline{\overline{v}}}^2 (L^{\star \star } + R) {\Vert {\delta \xi _\tau }\Vert }+ 4 {\overline{c}}_0 {\overline{c}}_1 (L^{\star \star } + R)^2 {\Vert {\delta \xi }\Vert }. \end{aligned} \end{aligned}$$

(93)

This yields

$$\begin{array}{l}|F(\xi _2,\xi _{\tau ,2})^{1/2} - F(\xi _1,\xi _{\tau ,1})^{1/2}| \\\qquad\le \frac{1}{2} | \int _0^1 F(\xi _1+\mu {\delta \xi })^{-1/2} F'(\xi _1+\mu {\delta \xi }) \, d\mu \, | \\\qquad\le \frac{{\overline{\overline{v}}}^2 (L^{\star \star } + R)}{{\underline{v}}(L^{\star \star } - R)} {\Vert {\delta \xi _\tau }\Vert }+ \frac{2 {\overline{c}}_0 {\overline{c}}_1 (L^{\star \star } + R)^2}{{\underline{v}}(L^{\star \star } - R)} {\Vert {\delta \xi }\Vert }\end{array}$$

(94)

$$\begin{array}{l}|F(\xi _2,\xi _{\tau ,2})^{-1/2} - F(\xi _1,\xi _{\tau ,1})^{-1/2}| \\\qquad\le \frac{1}{2} | \int _0^1 F(\xi _1+\mu {\delta \xi })^{-3/2} F'(\xi _1+\mu {\delta \xi }) \, d\mu \, | \\\qquad\le \frac{{\overline{\overline{v}}}^2 (L^{\star \star } + R)}{{\underline{v}}^3 (L^{\star \star } - R)^3} {\Vert {\delta \xi _\tau }\Vert }+ \frac{2 {\overline{c}}_0 {\overline{c}}_1 (L^{\star \star } + R)^2}{{\underline{v}}^3 (L^{\star \star } - R)^3} {\Vert {\delta \xi }\Vert }\end{array}$$

(95)

$$\begin{array}{l}|F(\xi _2,\xi _{\tau ,2})^{-3/2} - F(\xi _1,\xi _{\tau ,1})^{-3/2} \, | \\\qquad\le \frac{3}{2} | \int _0^1 F(\xi _1+\mu {\delta \xi })^{-5/2} F'(\xi _1+\mu {\delta \xi }) \, d\mu \, | \\\qquad\le \frac{{\overline{\overline{v}}}^2 (L^{\star \star } + R)}{{\underline{v}}^5 (L^{\star \star } - R)^5} {\Vert {\delta \xi _\tau }\Vert }+ \frac{2 {\overline{c}}_0 {\overline{c}}_1 (L^{\star \star } + R)^2}{{\underline{v}}^5 (L^{\star \star } - R)^5} {\Vert {\delta \xi }\Vert }\end{array}$$

(96)

For $f_1$ as defined in (48), we obtain

$$\begin{aligned} \begin{aligned}&\hspace{-4cm}\left( f_1''(\xi _2,\xi _{\tau ,2}) - f_1''(\xi _1,\xi _{\tau ,1})\right) [{\Delta \xi },{\Delta \xi _\tau }][{\delta \xi },{\delta \xi _\tau }] \\ = g(\xi _1)^{-3} g(\xi _2)^{-3} \bigg [&- 2g(\xi _1)^3 (g'(\xi _2){\delta \xi }) (\xi _{\tau ,2}^T w(\xi _2)) (g'(\xi _2){\Delta \xi }) \\&+ 2g(\xi _2)^3 (g'(\xi _1){\delta \xi }) (\xi _{\tau ,1}^T w(\xi _1)) (g'(\xi _1){\Delta \xi }) \\&+ g(\xi _1)^3 g(\xi _2) ({\delta \xi _\tau }^T w(\xi _2)) (g'(\xi _2){\Delta \xi }) \\&- g(\xi _2)^3 g(\xi _1) ({\delta \xi _\tau }^T w(\xi _1)) (g'(\xi _1){\Delta \xi }) \\&+ g(\xi _1)^3 g(\xi _2) (\xi _{\tau ,2}^T w_x(\xi _2) {\delta \xi }) (g'(\xi _2){\Delta \xi }) \\&- g(\xi _2)^3 g(\xi _1) (\xi _{\tau ,1}^T w_x(\xi _1) {\delta \xi }) (g'(\xi _1){\Delta \xi }) \\&+ g(\xi _1)^3 g(\xi _2) (\xi _{\tau ,2}^T w(\xi _2)) ({\Delta \xi }^Tg''(\xi _2){\delta \xi }) \\&- g(\xi _2)^3 g(\xi _1) (\xi _{\tau ,1}^T w(\xi _1)) ({\Delta \xi }^Tg''(\xi _1){\delta \xi }) \\&+ g(\xi _1)^3 g(\xi _2) (g'(\xi _2){\delta \xi }) (\xi _{\tau ,2}^T w_x(\xi _2) {\Delta \xi }) \\&- g(\xi _2)^3 g(\xi _1) (g'(\xi _1){\delta \xi }) (\xi _{\tau ,1}^T w_x(\xi _1) {\Delta \xi }) \\&- g(\xi _1)^3 g(\xi _2)^2 ({\delta \xi _\tau }w_x(\xi _2) {\Delta \xi }) \\&+ g(\xi _2)^3 g(\xi _1)^2 ({\delta \xi _\tau }w_x(\xi _1) {\Delta \xi }) \\&- g(\xi _1)^3 g(\xi _2)^2 w_{xx}(\xi _2)[\xi _{\tau ,2},{\Delta \xi },{\delta \xi }] \\&+ g(\xi _2)^3 g(\xi _1)^2 w_{xx}(\xi _1)[\xi _{\tau ,1},{\Delta \xi },{\delta \xi }] \\&+ g(\xi _1)^3 g(\xi _2) (g'(\xi _2){\delta \xi }) (w(\xi _2)^T {\Delta \xi _\tau }) \\&- g(\xi _2)^3 g(\xi _1) (g'(\xi _1){\delta \xi }) (w(\xi _1)^T {\Delta \xi _\tau }) \\&- g(\xi _1)^3 g(\xi _2)^2 ({\Delta \xi _\tau }^T w_x(\xi _2) {\delta \xi }) \\&+ g(\xi _2)^3 g(\xi _1)^2 ({\Delta \xi _\tau }^T w_x(\xi _1) {\delta \xi }) \bigg ]. \end{aligned} \end{aligned}$$

Using the bounds from above we finally obtain

$$\begin{aligned} \begin{aligned} |\left( f_1''(\xi _2,\xi _{\tau ,2}) - f_1''(\xi _1,\xi _{\tau ,1})\right) [{\Delta \xi },{\Delta \xi _\tau }][{\delta \xi },{\delta \xi _\tau }]| \\ \le \hat{\beta }_1 R \sqrt{{\Vert {\Delta \xi }\Vert }^2+{\Vert {\Delta \xi _\tau }\Vert }^2} \sqrt{{\Vert {\delta \xi }\Vert }^2+{\Vert {\delta \xi _\tau }\Vert }^2} \end{aligned} \end{aligned}$$

(97)

with

$$\begin{aligned} \begin{aligned} \hat{\beta }_1 = \frac{4}{{\underline{v}}^{12}} \big (&5 +80 {\overline{c}}_0 {\overline{c}}_1 {\overline{v}}^4 + 8 {\overline{c}}_0 {\overline{c}}_1 {\overline{v}}^2 +12 {\overline{c}}_0 {\overline{c}}_1 +16 {\overline{c}}_0 {\overline{c}}_2 + 4 {\overline{c}}_0 {\overline{c}}_3 \\&+16 {\overline{c}}_1^2 +12 {\overline{c}}_1{\overline{c}}_2 + 4 {\overline{c}}_1 + 4 {\overline{c}}_2 + 2 {\overline{c}}_3 \big ). \end{aligned} \end{aligned}$$

(98)

For $f_2$ as defined in (50) we obtain

$$\begin{aligned} \begin{aligned}&\hspace{-3cm}\left(f_2''(\xi _2,\xi _{\tau ,2}) -f_2''(\xi _1,\xi _{\tau ,1})\right)[{\Delta \xi },{\Delta \xi _\tau }][{\delta \xi },{\delta \xi _\tau }] \\ = g(\xi _1)^{-3} g(\xi _2)^{-3}\bigg [&~2 g(\xi _1)^3(g'(\xi _2){\delta \xi }) (g'(\xi _2){\Delta \xi }) F(\xi _2)^{1/2} \\&-2 g(\xi _2)^3(g'(\xi _1){\delta \xi }) (g'(\xi _1){\Delta \xi }) F(\xi _1)^{1/2} \\&- g(\xi _2) g(\xi _1)^3({\Delta \xi }^T g''(\xi _2){\delta \xi }) F(\xi _2)^{1/2} \\&+ g(\xi _1) g(\xi _2)^3({\Delta \xi }^T g''(\xi _1){\delta \xi }) F(\xi _1)^{1/2} \\&- \frac{1}{2} g(\xi _2) g(\xi _1)^3(g(\xi _2)'{\Delta \xi }) F(\xi _2)^{-1/2} F'(\xi _2)[{\delta \xi },{\delta \xi _\tau }] \\&+ \frac{1}{2} g(\xi _1) g(\xi _2)^3(g(\xi _1)'{\Delta \xi }) F(\xi _1)^{-1/2} F'(\xi _1)[{\delta \xi },{\delta \xi _\tau }] \\&- \frac{1}{2} g(\xi _2) g(\xi _1)^3(g'(\xi _2){\delta \xi }) F(\xi _2)^{-1/2} F'(\xi _2)[{\Delta \xi },{\Delta \xi _\tau }] \\&+ \frac{1}{2} g(\xi _1) g(\xi _2)^3(g'(\xi _1){\delta \xi }) F(\xi _1)^{-1/2} F'(\xi _1)[{\Delta \xi },{\Delta \xi _\tau }] \\&+ \frac{1}{2} g(\xi _2)^2 g(\xi _1)^3F(\xi _2)^{-1/2} F''(\xi _2)[{\Delta \xi },{\Delta \xi _\tau }][{\delta \xi },{\delta \xi _\tau }] \\&- \frac{1}{2} g(\xi _1)^2 g(\xi _2)^3F(\xi _1)^{-1/2} F''(\xi _1)[{\Delta \xi },{\Delta \xi _\tau }][{\delta \xi },{\delta \xi _\tau }] \\&- \frac{1}{4} g(\xi _2)^2 g(\xi _1)^3F(\xi _2)^{-3/2} F'(\xi _2)[{\Delta \xi },{\Delta \xi _\tau }] F'(\xi _2)[{\delta \xi },{\delta \xi _\tau }] \\&+ \frac{1}{4} g(\xi _1)^2 g(\xi _2)^3F(\xi _1)^{-3/2} F'(\xi _1)[{\Delta \xi },{\Delta \xi _\tau }] F'(\xi _1)[{\delta \xi },{\delta \xi _\tau }] \bigg ]. \end{aligned} \end{aligned}$$

Using the bounds from above, this yields

$$\begin{aligned} |\left(f_2''(\xi _2,\xi _{\tau ,2}) -f_2''(\xi _1,\xi _{\tau ,1})\right)[{\delta \xi },{\delta \xi _\tau }][{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }]\,| \le \hat{\beta }_2 R \sqrt{{\Vert {\Delta \xi }\Vert }^2 + {\Vert {\Delta \xi _\tau }\Vert }^2} \sqrt{{\Vert {\delta \xi }\Vert }^2 + {\Vert {\delta \xi _\tau }\Vert }^2} \end{aligned}$$

(99)

with

$$\begin{aligned} \begin{aligned} \hat{\beta }_2 \le \frac{4}{{\underline{v}}^{12}} \bigg [ &20 +10 {\overline{c}}_1 + 7 {\overline{c}}_2 + {\overline{c}}_3 +10 {\overline{c}}_0 {\overline{c}}_1 +36 {\overline{c}}_0 {\overline{c}}_1 {\overline{v}}^2 +88 {\overline{c}}_0 {\overline{c}}_1 {\overline{v}}^4 \\&+20 {\overline{c}}_0 {\overline{c}}_2 + 8 {\overline{c}}_0 {\overline{c}}_3 +20 {\overline{c}}_1^2 +24 {\overline{c}}_1{\overline{c}}_2 \\&+ \left( \frac{3}{{\underline{v}}(L^{\star \star } - R)} + \frac{6}{{\underline{v}}^3 (L^{\star \star } - R)^3} + \frac{6}{{\underline{v}}^5 (L^{\star \star } - R)^5} \right) \\&\qquad \left( {\overline{\overline{v}}}^2 (L^{\star \star } + R) + 2 {\overline{c}}_0 {\overline{c}}_1 (L^{\star \star } + R)^2 \right) \bigg]. \end{aligned} \end{aligned}$$

(100)

Lemma 18

Let $x^{\star \star } = (z^{\star \star }, \lambda ^{\star \star })$ be a global minimizer of (6) and the corresponding Lagrange multipliers. Moreover, let $x_1,x_2 \in \mathcal {B}(x^{\star \star }, R)$ and define $\Delta x:= x_2-x_1$. Then there is a $\hat{B} < \infty$ such that

$$\begin{aligned} |\left(f''(\xi _2,\xi _{\tau ,2}) -f''(\xi _1,\xi _{\tau ,1})\right)[{\Delta \xi },{\Delta \xi _\tau }][{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }]\,| \le \hat{B} R \; \Vert x_2-x_1\Vert \, \Vert \delta x\Vert . \end{aligned}$$

(101)

Proof

With (97) and (99) we obtain

$$\begin{array}{l}|\left(f''(\xi _2,\xi _{\tau ,2}) -f''(\xi _1,\xi _{\tau ,1})\right)[{\Delta \xi },{\Delta \xi _\tau }][{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }]\,| \\\qquad\le |(f_1''(\xi _2,\xi _{\tau ,2}) -f_1''(\xi _1,\xi _{\tau ,1}))[{\Delta \xi },{\Delta \xi _\tau }][{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }]| \\\qquad + |(f_2''(\xi _2,\xi _{\tau ,2}) -f_2''(\xi _1,\xi _{\tau ,1}))[{\Delta \xi },{\Delta \xi _\tau }][{\tilde{\delta \xi }},{\tilde{\delta \xi }_\tau }]| \\\qquad\le \hat{B} R \sqrt{{\Vert {\Delta \xi }\Vert }^2 + {\Vert {\Delta \xi _\tau }\Vert }^2} \sqrt{{\Vert {\delta \xi }\Vert }^2 + {\Vert {\delta \xi _\tau }\Vert }^2} \\\qquad\le \hat{B} R \; \Vert x_2-x_1\Vert \; \Vert \delta x\Vert \end{array}$$

with $\hat{B} = \max \{ \hat{\beta }_1, \hat{\beta }_2 \}$.

Rights and permissions

Open Access This article is licensed under a Creative Commons Attribution 4.0 International License, which permits use, sharing, adaptation, distribution and reproduction in any medium or format, as long as you give appropriate credit to the original author(s) and the source, provide a link to the Creative Commons licence, and indicate if changes were made. The images or other third party material in this article are included in the article's Creative Commons licence, unless indicated otherwise in a credit line to the material. If material is not included in the article's Creative Commons licence and your intended use is not permitted by statutory regulation or exceeds the permitted use, you will need to obtain permission directly from the copyright holder. To view a copy of this licence, visit http://creativecommons.org/licenses/by/4.0/.

Reprints and permissions

About this article

Cite this article

Borndörfer, R., Danecker, F. & Weiser, M. Newton’s Method for Global Free Flight Trajectory Optimization. Oper. Res. Forum 4, 63 (2023). https://doi.org/10.1007/s43069-023-00238-z

Download citation

Received: 31 January 2023
Accepted: 30 June 2023
Published: 08 August 2023
DOI: https://doi.org/10.1007/s43069-023-00238-z

Newton’s Method for Global Free Flight Trajectory Optimization

Abstract

Similar content being viewed by others

Numerical Investigation on Flight Trajectory Optimization Methods

The global optimization problem and the contribution of Prof. Angelo Miele: the Green’ s theorem approach

Error Bounds for Discrete-Continuous Free Flight Trajectory Optimization

1 Introduction

2 The Free Flight Trajectory Optimization Problem

2.1 Notation

Definition 1

2.2 Problem Statement

3 Continuous Optimization: Newton-KKT

3.1 Optimality Conditions

3.1.1 Necessary Conditions

Theorem 1

Proof

Lemma 2

Proof

3.1.2 Sufficient Conditions

3.2 Newton’s Method

4 Proof of Convergence

Lemma 3

Lemma 4

Proof

4.1 Inf-Sup Condition

Theorem 5

Theorem 6

Proof

4.2 Positive Definiteness of the Lagrangian

Lemma 7

Theorem 8

Proof

Theorem 9

Proof

4.3 Upper Bound for the Lagrangian

Lemma 10

Theorem 11

Proof

Theorem 12

Proof

4.4 Invertibility of the KKT-Operator

Lemma 13

Proof

4.5 Lipschitz Constant

Lemma 14

Proof

4.6 Convergence of Newton’s Method

Theorem 15

Proof

5 Conclusion

Data Availability

References

Funding

Author information

Authors and Affiliations

Contributions

Corresponding author

Ethics declarations

Ethics Approval

Consent to Participate

Consent for Publication

Competing Interests

Additional information

Publisher's Note

Appendix

Appendix

1.1 A.1 Global bounds

Lemma 16

Proof

Lemma 17

Proof

1.2 A.2 Bounds in a neighborhood of a minimizer

Lemma 18

Proof

Rights and permissions

About this article

Cite this article

Share this article

Keywords

Mathematics Subject Classification