Interpretation of higher order multivariate differential.

derivativesdifferentialmultivariable-calculusreal-analysis

I'm having trouble with this definition of the higher order differential that I'm presented:

If $f: U \subset \mathbb{R}^n \rightarrow \mathbb{R}^m$ is k-times continuously differentiable in a neighbourhood of $x_0 \in U$, then the differential of order k

$d^{(k)}f(x_0):\mathbb{R}^n \times \mathbb{R}^n \times … \times \mathbb{R}^n \rightarrow \mathbb{R}^m$

is explained as symmetric k-linear mapping through:

$d^{(k)}f(x_0)(v_1,…,v_k) = \partial_{v_1},…,\partial_{v_k}f(x_0), (v_1,…,v_k \in \mathbb{R}^n)$

The definition continues by providing examples for different orders:

$d^{(1)}f(x_0)v = \partial_vf(x_0) = lim_{t \to 0} \frac{f(x_0+tv)-f(x_0)}{t} = \sum_{i=1}^n \frac{\partial f}{\partial x_i}(x_0) v^i$ for $v = \left(
\begin{array}{c}
v^1\\
\vdots\\
v^n\\
\end{array}
\right) \in \mathbb{R}^n$
.

finally arriving at:

$d^{(k)}f(x_0)(v_1,…,v_k) = \sum_{i_1,…,i_k = 1}^n \frac{\partial^kf(x_0)}{\partial x_{i1}…\partial x_{ik}} v_1^{(i_1)}…v_k^{(i_k)}$ for $v_i = \left(
\begin{array}{c}
v_i^1\\
\vdots\\
v_i^n\\
\end{array}
\right), 1 \leq i \leq k$
.

Im confused by the very first definition, as I can't imagine what $d^{(k)}f(x_0)(v_1,…,v_k)$ is even aiming for. I know the following lines look like the directional derivatives for different $v$, but why would we bring them up in the definition of the higher order differential? Any explanation of the definition is highly appreciated. Also, I think an example (or a link to an example) would really help me.

Best Answer

If someone is interested I can also translate this german answer below into english (later)

$\newcommand{\R}{\mathbb{R}}$ Nimm dir mal einen Vektoren (oder Richtung) $v\in\R^2$, und eine Abbildung $f : \R^2 \to \R$, die du gerne verstehen möchtest. Dann ist $\nabla f : \R^2 \times \R^2 \to \R$, warum? Weil einmal können die partiellen Ableitungen $\frac{\partial}{\partial 1} f : \R^2 \to \R$ und $\frac{\partial}{\partial 2} f : \R^2 \to \R$ an einem Punkt im $\R^2$ ausgewertet werden, z.B. am Punkt $x_0 \in \R^2$ und dann kann noch die lineare Abbildung $\nabla f(x) : \R^2 \to \R$. So das man Ende durch $$ \nabla f(x) \cdot h = \begin{pmatrix} \frac{\partial}{\partial 1} f(x) & \frac{\partial}{\partial 2} f) \end{pmatrix} \cdot \begin{pmatrix} v_1 \\ v_2 \end{pmatrix} $$ in $\R$ landet. Nun kann ich solche Abbildung aber verschieden interpretieren und während $\nabla f(x)$ stets eine lineare Abbildung ist, muss $\nabla f (\cdot) v :\R^2 \to \R$ keine lineare Abbildung sein, sondern ist wieder eine neue Funktion! Lass und also setzen $g(x) := \nabla f(x)v$. Dann können wir wieder das Differential von $g$ berechnen und erhalten und in der gleichen Richtung $v$ auswerten: $$ \nabla g(x) = \begin{pmatrix} \frac{\partial}{\partial 1} g(x) & \frac{\partial}{\partial 2} g(x) \end{pmatrix} = \begin{pmatrix} \frac{\partial}{\partial 1} (\nabla f(x)v) & \frac{\partial}{\partial 2} (\nabla f(x)v). \end{pmatrix} $$ Wie du siehst ist $\nabla g(x)$ also auch eine lineare Abbildung von $\R^2 \to \R$, also können wir auch diese lineare Abbildung an $v \in \R^2$ auswerten: $\nabla g(x) v$ um wieder in $\R$ zu landen. Nun ist aber genauso wie oben $\nabla g(\cdot) v : \R^2 \to \R$ wieder eine ganz normale Funktion, die wir ableiten können. Setze also $h(x) := \nabla g(x) v$ und berechne $\nabla h$. Wie du nun siehst hast du dann $$ \nabla h(x)v = \nabla (\nabla g(x)v) v = \nabla \Big(\nabla \big(\nabla f(x)v\big)v\Big)v $$ und wie du siehst braucht es 3 $v$s, um diese Abbildung nach $\R$ zu schicken. Nun ist natürlich diese Schreibweise da oben, alles andere als leserfreundlich und daher haben wir uns soetwas ausgedacht wie eine multilineare Abbildung, so dass ich auch schreiben kann: $$ d^{(3)} f (x) (v,v,v) = \nabla \Big(\nabla \big(\nabla f(x)v\big)v\Big)v. $$

Ich hoffe, das macht es etwas klarer?

Related Question