LineareAlgebra2/12-Anwendungen.tex

% spell checker language
\selectlanguage{german}

\chapter{Anwendungen}

\sideremark{Vorlesung 17}Haben Sie schon einmal nachts wach im Bett gelegen,
weil Sie unbedingt eine symmetrische Matrix mit Hilfe eines orthogonalen
Basiswechsels diagonalisieren wollten?  Drängt es Sie, die Koeffizienten von
Linearkombinationen mit Hilfe von Skalarprodukten auszurechnen?

Die Begriffe und Methoden des laufenden Kapitels über ``Euklidische und
Hermitesche Vektorräume'' haben enorm viele Anwendungen.  Tatsächlich handelt es
sich bei vielen der heißen Themen zu ``Machine Learning'', ``Collective
Intelligence'' oder ``Artificial Intelligence'' um relativ einfache Methoden der
linearen Algebra, die bei unserem Stand der Debatte sehr gut verstehen können --
schauen Sie sich bei \href{https://www.kaggle.com}{kaggle} um, wo es eine
unendliche Menge von hervorragenden Tutorials, Erklärvideos, Projektvorschlägen
und kleinen Wettbewerben gibt.  Es gilt der alte Satz, dass Mathematik nicht
notwendig kompliziert sein muss, um Nützlich zu sein.  Ich reiße in diesem
Kapitel einige Anwendungen oberflächlich an

Der Abschnitt über die Klassifikation der reellen Quadriken ist klassischer
Lehrstoff und prüfungsrelevant.  Die anderen Kapitel sollen Sie neugierig
machen, können aber nicht sinnvoll geprüft werden.


\section{Reelle Quadriken}

Die erste ``Anwendung'' ist immer noch ziemlich theoretisch und stammt
mindestens aus der hellenistischen Antike, also etwa der Zeit Alexander des
Großen.  Vielleicht war die Sache aber auch schon zu babylonischer Zeit bekannt,
\href{https://www.ams.org/notices/200809/tx080901076p.pdf}{wo Mathematik eine
  große Rolle spielte}.  Es geht um folgende Situation.

\begin{situation}[Quadrik im $ℝ^n$]\label{sit:12-1-1}
  Gegeben sei der $ℝ^n$ mit Koordinatenfunktionen $x_1, …, x_n$ und ein
  Polynom $f(x_1, …, x_n)$ vom Grad $=2$
  \[
    f(x_1, …, x_n) = \sum_{j=1}^n\sum_{i=1}^j f_{ij}·x_i x_j + \sum_{i=1}^n f_i x_i + f_0
  \]
  mit der Nullstellenmenge
  $Q := \{ \vec{x} ∈ ℝ^n \:|\: f(x_1, …, x_n) = 0 \}$.  Dabei sind die
  Koeffizienten $f_{••}$ und $f_{•}$ reelle Zahlen.
\end{situation}

\begin{defn}[Quadrik]
  Die Nullstellenmenge eines Polynoms vom Grad $2$ heißt
  \emph{Quadrik}\index{Quadrik}.
\end{defn}

Wir stellen in diesem Kapitel die Frage, was wir über die Geometrie von reellen
Quadriken sagen können.  Es ist klar, dass das Bild einer Quadrik unter einer
lineare Abbildung oder Translation wieder eine Quadrik ist.  Deshalb fragen wir
genauer: Wie sieht $Q$ aus nach geeigneter Wahl von Koordinaten und nach
Translationen?  Wir formulieren die Frage präziser und führen die folgende
Notation ein.

\begin{defn}[Affine Abbildung]\label{def:12-1-3}
  Es sei $k$ ein Körper und $V, W$ zwei $k$-Vektorräume.  Eine Abbildung
  $Φ : V → W$ heißt \emph{affin}\index{affine Abbildung}, falls es eine lineare
  Abbildung $φ : V → W$ und einen Vektor $\vec{w} ∈ W$ gibt, so dass für alle
  $\vec{v} ∈ V$ die Gleichung $Φ(\vec{v}) = φ(\vec{v}) + \vec{w}$ gilt.
\end{defn}

\begin{beobachtung}
  Die Verkettung von affinen Abbildungen ist wieder affin.  Wenn eine affine
  Abbildung bijektiv ist, dann ist die Umkehrabbildung ebenfalls affin.  Die
  bijektiven, affinen Selbstabbildung eines Vektorraumes bilden daher eine
  Untergruppe der Gruppe der bijektiven Selbstabbildungen.
\end{beobachtung}

Damit können wir unsere Frage präzise formulieren.

\begin{frage}
  Gegeben sei Situation~\ref{sit:12-1-1}.  Gibt es dann eine bijektive, affine
  Abbildung $Φ : ℝ^n → ℝ^n$, so dass das Bild von $Q$ unter der
  Abbildung $Φ$ eine Quadrik von besonders einfacher Gestalt ist?  Gibt es
  eine (kleine) Mengen von ``Grund-Quadriken'' aus denen alle anderen durch
  affine Transformation (wie zum Beispiel: Translation, Drehung, Streckung,
  Verschiebung, …) entstehen?
\end{frage}


Die Antwort ist natürlich ``ja'', aber Sie haben ja zum Glück noch nicht weiter
nach vorn geblättert.  Sie kennen ähnliche Fragen aus der Schule.  Bei der
Diskussion der Kongruenz von Dreiecken betrachtet man Dreiecke statt Quadriken
und abstandserhaltende Abbildungen statt affiner Abbildungen.


\subsection{Vereinfachung von Quadratischen Gleichungen}

Wir bleibe in Situation~\ref{sit:12-1-1} und werden jetzt eine Reihe von
bijektiven, affinen Abbildungen finden, so dass die Gleichung (der Bilder von)
$Q$ immer einfacher wird.  Wie immer gibt es viel Material im Internet; ein
Student wies mich auf
\href{https://www.youtube.com/watch?v=wYJAggfstyI}{folgendes Video} hin.


\subsubsection{Schritt 1: Darstellung von $f$ durch Matrizen}

Wir betrachten die folgende, symmetrische $n⨯n$-Matrix
\[
  A =
  \begin{pmatrix}
    f_{11} & \frac{1}{2}·f_{12} & & ⋯ & \frac{1}{2}·f_{1n} \\
    \frac{1}{2}·f_{12} & f_{22} & \ddots & & \vdots \\
    \vdots & \ddots & \ddots \\
    & & & f_{n-1,n-1} & \frac{1}{2}·f_{n-1,n} \\
    \frac{1}{2}·f_{1n} & ⋯ & & \frac{1}{2}·f_{n-1,n} & f_{nn}
  \end{pmatrix}
\]
und den Vektor
\[
  \vec{b} = \left(\frac{1}{2}·f_1, …, \frac{1}{2}·f_n \right).
\]
Dann gilt für jeden Vektor $\vec{x} ∈ ℝ^n$ die Gleichung
\begin{equation}\label{eq:12-1-3-1}
  f(\vec{x}) = \vec{x}^{\:t}·A·\vec{x} + 2\vec{b}·\vec{x} + f_0.
\end{equation}

Vielleicht ist Ihnen im Moment noch nicht klar, warum Gleichung
\eqref{eq:12-1-3-1} jetzt helfen soll, die Quadriken besser zu verstehen.  Der
Witz ist aber, dass wir die symmetrische Matrix $A$ diagonalisieren können!
\clearpage

\subsubsection{Schritt 2: Eliminierung der gemischten Terme}

Wir wissen: es existiert eine orthogonale $n⨯n$-Matrix $W$, so dass die
Produktmatrix $W^t·A·W$ diagonal ist.  Es sei $Q^{(1)}$ das Bild von $Q$ unter
der bijektiven linearen Abbildung $\vec{x} ↦ W^{-1}·\vec{x}$.  Dann gilt
für alle $\vec{x} ∈ ℝ^n$:
\begin{align*}
  \vec{x} ∈ Q^{(1)} & ⇔ W·\vec{x} ∈ Q \\
                      & ⇔ f(W·\vec{x}) = 0 \\
                      & ⇔ (W·\vec{x})^t·A·(W·\vec{x}) + 2 \vec{b} · (W·\vec{x}) + f_0 = 0 \\
                      & ⇔ \vec{x}^{\:t}·(W^t·A·W)·\vec{x} + 2 (\vec{b}·W)·\vec{x} + f_0 = 0
\end{align*}
Wir erkennen zum einen, dass die Bildmenge $Q^{(1)}$ wieder eine Quadrik ist.
Die Gleichung $f^{(1)}$ der Quadrik $Q^{(1)}$ ist besonders einfach, weil es
keinen gemischten Terme mehr gibt.  Das Polynom $f^{(1)}$ sieht also aus wie
\[
  f^{(1)}(\vec{x}) = \sum_{i=1}^n a^{(1)}_i·x_i² + 2·\sum_{i=1}^n b^{(1)}_i·x_i + c^{(1)}
\]
Einige (aber nicht alle!) der Koeffizienten $a_i$ könnten gleich Null sein.
Durch Umnummerierung kann man aber gleich noch erreichen, dass $a_1, …, a_r$
ungleich Null sind und $a_{r+1}, …, a_n$ gleich Null, also insbesondere
\[
  f^{(1)}(\vec{x}) = \sum_{i=1}^r a^{(1)}_i·x_i² + 2·\sum_{i=1}^n b^{(1)}_i·x_i + c^{(1)}
\]
\clearpage


\subsubsection{Schritt 3: Eliminierung der linearen Terme für $i≤ r$}

Betrachte die Translation
\[
  φ : ℝ^n → ℝ^n, \quad
  \begin{pmatrix}
    x_1 \\ \vdots \\ x_r \\ x_{r+1} \\ \vdots \\ x_n
  \end{pmatrix}
  ↦
  \begin{pmatrix}
    x_1+\frac{b^{(1)}_1}{a^{(1)}_1} \\ \vdots \\ x_r+\frac{b^{(1)}_r}{a^{(1)}_r} \\ x_{r+1} \\ \vdots \\x_n
  \end{pmatrix}
\]
und definiere $Q^{(2)}$ als das Bild von $Q^{(1)}$ unter dieser Abbildung.  Dann
gilt für alle $\vec{x} ∈ ℝ^n$:
\begin{align*}
  \vec{x} ∈ Q^{(2)} & ⇔ φ^{-1}(\vec{x}) ∈ Q^{(1)} \\
                  & ⇔ \sum_{i=1}^r
                    a^{(1)}_i·\left(x_i-\frac{b^{(1)}_i}{a^{(1)}_i}
                    \right)² + 2 · \sum_{i=1}^r b^{(1)}_i·\left(x_i-\frac{b^{(1)}_i}{a^{(1)}_i} \right) + 2·\sum_{i=r+1}^n b^{(1)}_i·x_i + c^{(1)} = 0 \\
                  & ⇔ \sum_{i=1}^r a^{(1)}_i·x_i² + 2·\sum_{i=r+1}^n b^{(1)}_i·x_i + d^{(1)} = 0
\end{align*}
Die Bildmenge $Q^{(2)}$ ist also wieder eine Quadrik, gegeben durch ein Polynom
\[
  g(\vec{x}) = \sum_{i=1}^r a^{(1)}_i·x_i² + 2·\sum_{i=r+1}^n b^{(1)}_i·x_i + d^{(1)}
\]
Falls die Zahl $d^{(1)}$ ungleich Null ist, können wir die Gleichung durch
$-d^{(1)}$ dividieren (das ändert die Nullstellenmenge nicht).  In jedem Fall
ist die Bildmenge $Q^{(2)}$ gegeben durch ein Polynom
\[
  f^{(2)}(\vec{x}) = \sum_{i=1}^r a^{(2)}_i·x_i² + 2·\sum_{i=r+1}^n
  b^{(2)}_i·x_i + c^{(2)}
\]
wobei $c^{(2)} ∈ \{0, -1\}$ ist.
\clearpage


\subsubsection{Schritt 4: Eliminierung weiterer linearer Terme}

Diese Konstruktion ist nur relevant, falls mindestens eines der $b^{(2)}_i$
ungleich Null ist.  Falls alle $b^{(2)}_i$ verschwinden, machen wir in diesem
Schritt nichts und setzen
\[
  Q^{(3)} := Q^{(2)}, \quad f^{(3)} := f^{(2)}, \quad a^{(3)}_i := a^{(2)}_i, \quad b^{(3)}_i := b^{(2)}_i, \quad c^{(3)} := c^{(2)}
\]
Ansonsten können wir nach umnummerieren der Variable annehmen, dass
$b^{(2)}_{r+1} \ne 0$ ist.  Betrachte dann die affine Bijektion
\[
  φ : ℝ^n → ℝ^n, \quad
  \begin{pmatrix}
    x_1 \\ \vdots \\ x_r \\ x_{r+1} \\ x_{r+2} \\ \vdots \\ x_n
  \end{pmatrix}
  ↦
  \begin{pmatrix}
    x_1 \\ \vdots \\ x_r \\ \frac{-c^{(2)}}{2}-\sum_{j=r+1}^n b^{(2)}_j·x_j \\ x_{r+2} \\ \vdots \\x_n
  \end{pmatrix}
\]
und definiere $Q^{(3)}$ als das Bild von $Q^{(2)}$ unter dieser Abbildung.  Dann
gilt für alle $\vec{x} ∈ ℝ^n$:
\begin{align*}
  \vec{x} ∈ Q^{(3)} & ⇔ φ^{-1}(\vec{x}) ∈ Q^{(2)} \\
                      & ⇔ \sum_{i=1}^r a^{(2)}_i·x²_i + 2·b^{(2)}_{r+1}·X + 2·\sum_{i=r+2}^n b^{(2)}_i·x_i + c^{(2)} = 0 \\
                      & \qquad\qquad\qquad \text{wobei } X = \left(\frac{-c^{(2)}}{2·b^{(2)}_{r+1}} - \frac{1}{b^{(2)}_{r+1}}·x_{r+1} - \sum_{j=r+2}^n \frac{b^{(2)}_j}{b^{(2)}_{r+1}}·x_j \right) \\
                      & ⇔ \sum_{i=1}^r a^{(2)}_i·x²_i - 2·x_{r+1} = 0
\end{align*}
In jedem Fall gilt: die Bildmenge $Q^{(3)}$ ist also wieder eine Quadrik,
gegeben durch ein Polynom
\[
  f^{(3)}(\vec{x}) = \sum_{i=1}^r a^{(3)}_i·x_i² + b^{(3)}_{r+1}·x_{r+1} + c^{(3)}
\]
wobei $b^{(3)}_{r+1} ∈ \{0,-2\}$ und $c^{(3)} ∈ \{0, -1\}$ ist.  Weiterhin
gilt: $b^{(3)}_{r+1} \ne 0 ⇒ c^{(3)} = 0$.


\subsubsection{Schritt 5: Skalierung}

Jetzt betrachte die Skalierung
\[
  φ : ℝ^n → ℝ^n, \quad
  \begin{pmatrix}
    x_1 \\ \vdots \\ x_r \\ x_{r+1} \\ \vdots \\ x_n
  \end{pmatrix}
  ↦
  \begin{pmatrix}
    x_1·\sqrt{|a^{(3)}_1|} \\ \vdots \\ x_r·\sqrt{|a^{(3)}_r|} \\ x_{r+1} \\ \vdots \\x_n
  \end{pmatrix}
\]
und definiere $Q^{(4)}$ als das Bild von $Q^{(4)}$ unter dieser Abbildung.  Dann
gilt für alle $\vec{x} ∈ ℝ^n$:
\begin{align*}
  \vec{x} ∈ Q^{(4)} & ⇔ φ^{-1}(\vec{x}) ∈ Q^{(3)} \\
                      & ⇔ \sum_{i=1}^r a^{(3)}_i·\left(\frac{x_i}{\sqrt{|a^{(3)}_i|}} \right)² + b^{(3)}_{r+1}·x_{r+1} + c^{(3)} = 0.
\end{align*}
Also ist Bildmenge $Q^{(4)}$ ist also wieder eine Quadrik, gegeben durch ein
Polynom
\[
  f^{(4)}(\vec{x}) = \sum_{i=1}^r a^{(4)}_i·x_i² + b^{(4)}_{r+1}·x_{r+1} + c^{(4)}
\]
wobei $a^{(4)}_{•} ∈ \{-1, 1\}$, $b^{(4)}_{r+1} ∈ \{0, -2\}$ und
$c^{(4)} ∈ \{0, -1\}$ ist.  Weiterhin gilt:
$b^{(4)}_{r+1} \ne 0 ⇒ c^{(4)} = 0$.
\clearpage


\subsection{Zusammenfassung der Vereinfachungen}

Insgesamt haben wir mit den oben genannten Vereinfachungsschritten jetzt
folgenden Satz bewiesen.

\begin{satz}[Klassifikation der Quadriken]\label{satz:12-1-6}
  In Situation~\ref{sit:12-1-1} gibt es Zahlen $r$, $k$ gibt es eine bijektive,
  affine Abbildung $Φ : ℝ^n → ℝ^n$, so dass das Bild von $Q$
  Nullstellenmenge einer der folgenden Gleichungen ist
  \begin{enumerate}
  \item $x_1² + x_2² + … + x_r² - x_{r+1}² - … - x_k²$

  \item $x_1² + x_2² + … + x_r² - x_{r+1}² - … - x_k² - 1$

  \item $x_1² + x_2² + … + x_r² - x_{r+1}² - … - x_k² - 2·x_{k+1}$
    \qed
  \end{enumerate}
\end{satz}


\subsection{Klassifikation von Koniken}

Im Falle $n = 2$ nennt man Quadriken auch \emph{Koniken}\index{Konik}; diese
treten in der Elementargeometrie als
\href{https://de.wikipedia.org/wiki/Kegelschnitt}{Kegelschnitte}\index{Kegelschnitte}
-- sie finden zu diesem Thema jede Menge Videos, zum Beispiel
\href{https://www.youtube.com/watch?v=-kVHDqf4tDk}{dieses hier}.  Koniken sind
seit der Antike ganz gut verstanden.  Als Spezialfall des
Satzes~\ref{satz:12-1-6} erhalten wir eine Klassifikation der Koniken.

\begin{kor}[Klassifikation der Koniken des Appollonius von
  Perge\footnote{\href{https://de.wikipedia.org/wiki/Apollonios_von_Perge}{Appollonius
      von Perge} (* ca.  265 v.  Chr.  in Perge; † ca.  190 v.  Chr.  in Alexandria)
    war ein antiker griechischer Mathematiker, bekannt für sein Buch über
    Kegelschnitte.}]
  Betrachte Situation~\ref{sit:12-1-1} im Falle $n = 2$.  Dann gibt es eine
  bijektive, affine Abbildung $Φ : ℝ^n → ℝ^n$, so dass das Bild von $Q$
  Nullstellenmenge einer der folgenden Gleichungen ist
  \begin{enumerate}
  \item $x² = 0:$ Doppelgerade \label{Q.1}

    \begin{center}
      \begin{tikzpicture}[domain =-2.5:2.5]
        \draw[very thin, gray!70] (-2.5,-2.5) grid (2.5,2.5);
        \draw[->] (-2.5,0) -- (2.5,0) node[right] {$x$};
        \draw[->] (0,-2.5) -- (0,2.5) node[above] {$y$};
        \foreach \x in {-2,...,2}
        \draw (\x,1mm) -- (\x,-1mm) node[below, fill=white] {\x};
        \foreach \y in {-2,...,2}
        \draw (1mm,\y) -- (-1mm,\y) node[left, fill=white] {\y};
        \draw[red, very thick] (0,-2.5) -- (0,2.5);
      \end{tikzpicture}
    \end{center}

  \item $x² + y² = 0:$ Punkt \label{Q.2}

    \begin{center}
      \begin{tikzpicture}[domain =-2.5:2.5]
        \draw[very thin, gray!70] (-2.5,-2.5) grid (2.5,2.5);
        \draw[->] (-2.5,0) -- (2.5,0) node[right] {$x$};
        \draw[->] (0,-2.5) -- (0,2.5) node[above] {$y$};
        \foreach \x in {-2,...,2}
        \draw (\x,1mm) -- (\x,-1mm) node[below, fill=white] {\x};
        \foreach \y in {-2,...,2}
        \draw (1mm,\y) -- (-1mm,\y) node[left, fill=white] {\y};
        \draw[red, very thick] (0,0) circle (1.5pt);
      \end{tikzpicture}
    \end{center}

  \item $x² - y² = 0:$ zwei Geraden, die sich schneiden \label{Q.3}

    \begin{center}
      \begin{tikzpicture}[domain =-2.5:2.5]
        \draw[very thin, gray!70] (-2.5,-2.5) grid (2.5,2.5);
        \draw[->] (-2.5,0) -- (2.5,0) node[right] {$x$};
        \draw[->] (0,-2.5) -- (0,2.5) node[above] {$y$};
        \foreach \x in {-2,...,2}
        \draw (\x,1mm) -- (\x,-1mm) node[below, fill=white] {\x};
        \foreach \y in {-2,...,2}
        \draw (1mm,\y) -- (-1mm,\y) node[left, fill=white] {\y};
        \draw[red, very thick] plot (\x,\x);
        \draw[red, very thick] plot (\x,-\x);
      \end{tikzpicture}
    \end{center}

  \item $-x² - y² = 0:$ wie Fall \ref{Q.2} \label{Q.4} % kommt nicht vor unten

  \item $x² = 1:$ zwei parallele Geraden \label{Q.5}

    \begin{center}
      \begin{tikzpicture}[domain =-2.5:2.5]
        \draw[very thin, gray!70] (-2.5,-2.5) grid (2.5,2.5);
        \draw[->] (-2.5,0) -- (2.5,0) node[right] {$x$};
        \draw[->] (0,-2.5) -- (0,2.5) node[above] {$y$};
        \foreach \x in {-2,...,2}
        \draw (\x,1mm) -- (\x,-1mm) node[below, fill=white] {\x};
        \foreach \y in {-2,...,2}
        \draw (1mm,\y) -- (-1mm,\y) node[left, fill=white] {\y};
        \draw[red, very thick] (-1,-2.5) -- (-1,2.5);
        \draw[red, very thick] (1,-2.5) -- (1,2.5);
      \end{tikzpicture}
    \end{center}

  \item $x² + y² = 1:$ Kreis \label{Q.6}

    \begin{center}
      \begin{tikzpicture}[domain =-2.5:2.5]
        \draw[very thin, gray!70] (-2.5,-2.5) grid (2.5,2.5);
        \draw[->] (-2.5,0) -- (2.5,0) node[right] {$x$};
        \draw[->] (0,-2.5) -- (0,2.5) node[above] {$y$};
        \foreach \x in {-2,...,2}
        \draw (\x,1mm) -- (\x,-1mm) node[below, fill=white] {\x};
        \foreach \y in {-2,...,2}
        \draw (1mm,\y) -- (-1mm,\y) node[left, fill=white] {\y};
        \draw[red, very thick] (0,0) circle (1cm);
      \end{tikzpicture}
    \end{center}

  \item $x² - y² = 1:$ Hyperbel \label{Q.7}

    \begin{center}
      \begin{tikzpicture}
        \draw[very thin, gray!70] (-2.5,-2.5) grid (2.5,2.5);
        \draw[->] (-2.5,0) -- (2.5,0) node[right] {$x$};
        \draw[->] (0,-2.5) -- (0,2.5) node[above] {$y$};
        \foreach \x in {-2,...,2}
        \draw (\x,1mm) -- (\x,-1mm) node[below, fill=white] {\x};
        \foreach \y in {-2,...,2}
        \draw (1mm,\y) -- (-1mm,\y) node[left, fill=white] {\y};
        \draw[red, very thick, domain =1:2.5] plot (\x, {-sqrt((\x)^(2)-1)});
        \draw[red, very thick, domain =1:2.5] plot (\x,{sqrt((\x)^(2)-1)});
        \draw[red, very thick, domain =-2.5:-1] plot (\x, {-sqrt((\x)^(2)-1)});
        \draw[red, very thick, domain =-2.5:-1] plot (\x,{sqrt((\x)^(2)-1)});
        % hier muss man Fallunterscheidungen und schauen, dass sqrt nichts Negatives
        % zum Auswerten bekommt
      \end{tikzpicture}
    \end{center}

  \item $- x² - y² = 1:$ (leere Menge) \label{Q.8}

    \begin{center}
      \begin{tikzpicture}[domain =-2.5:2.5]
        \draw[very thin, gray!70] (-2.5,-2.5) grid (2.5,2.5);
        \draw[->] (-2.5,0) -- (2.5,0) node[right] {$x$};
        \draw[->] (0,-2.5) -- (0,2.5) node[above] {$y$};
        \foreach \x in {-2,...,2}
        \draw (\x,1mm) -- (\x,-1mm) node[below, fill=white] {\x};
        \foreach \y in {-2,...,2}
        \draw (1mm,\y) -- (-1mm,\y) node[left, fill=white] {\y};
        % leere Menge
      \end{tikzpicture}
    \end{center}

  \item $x² - 2y = 0:$ Parabel \label{Q.9}

    \begin{center}
      \begin{tikzpicture}[domain =-sqrt(5):sqrt(5)] %richtige Domain wählen
        \draw[very thin, gray!70] (-2.5,-2.5) grid (2.5,2.5);
        \draw[->] (-2.5,0) -- (2.5,0) node[right] {$x$};
        \draw[->] (0,-2.5) -- (0,2.5) node[above] {$y$};
        \foreach \x in {-2,...,2}
        \draw (\x,1mm) -- (\x,-1mm) node[below, fill=white] {\x};
        \foreach \y in {-2,...,2}
        \draw (1mm,\y) -- (-1mm,\y) node[left, fill=white] {\y};
        \draw[red, very thick] plot (\x, {0.5*(\x)^(2)});
      \end{tikzpicture}
    \end{center}

  \item $- x² - 2y = 0:$ Parabel \label{Q.10}

    \begin{center}
      \begin{tikzpicture}[domain =-sqrt(5):sqrt(5)]
        \draw[very thin, gray!70] (-2.5,-2.5) grid (2.5,2.5);
        \draw[->] (-2.5,0) -- (2.5,0) node[right] {$x$};
        \draw[->] (0,-2.5) -- (0,2.5) node[above] {$y$};
        \foreach \x in {-2,...,2}
        \draw (\x,1mm) -- (\x,-1mm) node[below, fill=white] {\x};
        \foreach \y in {-2,...,2}
        \draw (1mm,\y) -- (-1mm,\y) node[left, fill=white] {\y};
        \draw[red, very thick] plot (\x, {-0.5*(\x)^(2)});
      \end{tikzpicture}
    \end{center}
  \end{enumerate}
\end{kor}


\subsection{Fragen}

\begin{itemize}
\item In der Schule haben wir gelernt, das Koniken auftreten, wenn sich Körper
  im Schwerefeld bewegen.  Wir kenne die Wurfparabel, die elliptischen
  Umlaufbahnen von Planeten um die Sonne und die Hyperbelbahnen von die
  Satelliten beim Vorbeiflug an einem Himmelskörper.  Wieso treten hier
  eigentlich Koniken auf?

\item Wir diskutieren in diesem Abschnitt reelle Quadriken.  Ich behaupte, dass
  ähnliche Konstruktionen über den komplexen Zahlen die Gleichungen noch weiter
  vereinfachen; es gibt also insgesamt weniger Fälle.  Wie viele Typen von
  komplexen Koniken gibt es?
\end{itemize}


\subsection{Projekte}

Schreiben Sie ein Computerprogramm, das für eine gegebene Konik sofort eine
vereinfachende affine Transformation liefert.  Stellen Sie die Transformation
graphisch dar, vielleicht mit automatisch generierten Videos die zeigen, wie es
zu den Vereinfachungen kommt.


\section{Die fünf Grundrechenarten}

\sideremark{Vorlesung 18}Ich erkläre in diesem Abschnitt die
Fourier-Transformation\footnote{\href{https://de.wikipedia.org/wiki/Joseph_Fourier}{Jean
    Baptiste Joseph Fourier} (* 21.  März 1768 bei Auxerre; † 16.  Mai 1830 in
  Paris) war ein französischer Mathematiker und Physiker.} und nenne einige
Anwendungen.  Die Fourier-Transformation ist für die Praxis vielleicht das
wichtigste Stück Mathematik überhaupt\footnote{Sie selbst verwenden solche
  Transformationen ununterbrochen -- haben Sie schon einmal ein Mobiltelefon
  benutzt?  Oder sind Sie vielleicht in einem Auto gefahren?  Oder haben Sie einen
  Klang gehört?}.  Manche Kollegen sprechen sogar von der ``fünften
Grundrechenart''.  Ich komme im Abschnitt~\ref{ssec:Rechen} darauf zurück.

In Internet finden Sie sehr viel Material zum Thema.  Ich empfehle dieses
\href{https://www.youtube.com/watch?v=vA9dfINW4Rg}{Video vom MIT}.  Die
Fachhochschule Hamburg hat ebenfalls ein nettes
\href{https://www.youtube.com/watch?v=oKWW8aWAdag}{Video} (``Warum die
Fourier-Analysis in den Anwendungen so wichtig ist und welche grundlegende Idee
dahinter steht'').  Jörn Loviscach, mein persönlicher Held, hat natürlich auch
ein \href{https://av.tib.eu/media/10335}{Video}, ebenso auch Daniel Jung
(\href{https://www.youtube.com/watch?v=mMsa1uBHd9k}{$→$Link}).  Wenn Sie ein
wenig im Internet suchen, finden Sie noch sehr viel mehr Material.


\subsection{Integration als Skalarprodukt}

Ich komme noch einmal auf das Beispiel~\vref{bsp:Integration} zurück.  Ich
betrachte den der Vektorraum $V = \cC⁰([-π,π], ℝ)$ der reellwertigen stetigen
Funktionen auf dem Intervall $[-π,π] ⊂ ℝ$.  Wir haben schon gesehen, dass die
Abbildung
\[
  \langle •, • \rangle : V ⨯ V → ℝ, \quad (f, g) ↦ \frac{1}{π}·\int^{π}_{-π} f(t) · g(t) dt.
\]
ein Skalarprodukt ist.  Rechnen Sie sofort mit Hilfe der bekannten
Additionstheoreme für Sinus und Kosinus nach, dass für alle positiven Zahlen $n$
und $m$ aus $ℕ$ die folgenden Gleichungen gelten:
\[
  \bigl\langle \sin(n·x), \sin(m·x) \bigr\rangle = δ_{nm}, \quad
  \bigl\langle \cos(n·x), \cos(m·x) \bigr\rangle = δ_{nm}, \quad
  \bigl\langle \sin(n·x), \cos(m·x) \bigr\rangle = 0.
\]
Zusätzlich gilt für die konstante Funktion $\frac{1}{\sqrt{2}}$ noch Folgendes:
\[
  \left\langle \frac{1}{\sqrt{2}}, \frac{1}{\sqrt{2}} \right\rangle = 1, \quad
  \left\langle \cos(n·x), \frac{1}{\sqrt{2}} \right\rangle = 0, \quad
  \left\langle \sin(n·x), \frac{1}{\sqrt{2}} \right\rangle = 0.
\]
Insgesamt sehen wir, dass die Menge
\[
  \mathcal{F} := \left\{ \frac{1}{\sqrt{2}}, \sin(x), \cos(x), \sin(2·x), \cos(2·x), … \right\}
\]
eine orthonormale Teilmengen des Euklidischen Vektorraumes
$\bigl( V, \langle •,• \rangle\bigr)$ ist.


\subsubsection{Rekonstruktion von Funktionen}

Es sei jetzt $F := \langle \mathcal{F} \rangle ⊆ V$ der von
$\mathcal{F}$ erzeugte Untervektorraum.  Wenn ich jetzt irgendeine Funktion
$f ∈ F$ habe, dann kann ich die Zahlen
\begin{equation}\label{eq:12-2-0-1}
  a_n := \left\langle f, \sin(n·x) \right\rangle, \quad
  b_n := \left\langle f, \cos(n·x) \right\rangle, \quad
  c := \left\langle f, \frac{1}{\sqrt{2}} \right\rangle
\end{equation}
ausrechnen und erhalte die Gleichung:
\begin{equation}\label{eq:12-2-0-2}
  f = \frac{c}{\sqrt{2}} + \sum_{n=1}^∞ \bigl( a_n·\sin(n·x) + b_n·\sin(n·x) \bigr)
\end{equation}
Beachte dabei, dass nur endlich viele der Zahlen $a_n$, $b_n$ von Null
verschieden sind, so dass auf der rechten Seite der
Gleichung~\eqref{eq:12-2-0-2} tatsächlich nur eine endliche Summe steht.


\subsection{Fourier-Reihen}

Dies ist ein Kapitel über Anwendungen.  Es stellt sich also die Frage, welche
relevanten Funktionen in dem Vektorraum $F$ liegen?  Die Antwort ist: praktisch
alle.  Es gilt der folgende Satz der Analysis.

\begin{satz}
  Es sei $f : [-π,π] → ℝ$ stetig und abschnittsweise stetig differenzierbar.
  Definiere Zahlen $a_n$, $b_n$ und $c$ wie in \eqref{eq:12-2-0-1}.  Dann
  konvergiert die Funktionenreihe
  \begin{equation}\label{eq:12}
    \frac{c}{\sqrt{2}} + \sum_{n=1}^∞ \bigl( a_n·\sin(n·x) + b_n·\sin(n·x) \bigr)
  \end{equation}
  gleichmäßig (und damit punktweise) gegen $f$.
\end{satz}

\begin{defn}[Fourierkoeffizienten, Fouriereihe]
  Man nennt die Zahlen $a_n$, $b_n$ und $c$ die
  \emph{Fourierkoeffizienten}\index{Fourierkoeffizient} von $f$.  Die
  unendliche Summe \eqref{eq:12} heißt \emph{Fourierreihe}\index{Fourierreihe}
  von $f$.
\end{defn}

In der Praxis ist es für die Untersuchung einer gegebenen Funktion $f$ meist gar
nicht nötig, die unendliche Fourierreihe zu betrachten.  Oft liefert eine
endliche Summe wie etwa
\[
  f \approx \frac{c}{\sqrt{2}} + \sum_{n=1}⁵ \bigl( a_n·\sin(n·x) + b_n·\sin(n·x) \bigr)
\]
bereits eine absolut brauchbare Näherung.  Abbildung~\ref{fig:app}, die ich bei
\href{https://de.wikipedia.org/wiki/Fourierreihe}{Wikipedia} gestohlen habe,
zeigt wie man eine Sprungfunktion annähert.


\subsubsection{Beispiele und Erklärvideos}

Weitere Beispiele gibt es bei
\href{https://de.wikipedia.org/wiki/Fourierreihe#Beispiele}{Wikipedia} und in
diesem phantastischem
\href{https://www.youtube.com/watch?v=lL0oUZGMhXc}{Erklärvideo vom MIT}.
Vielleicht schauen sie auch einmal in
\href{https://av.tib.eu/media/10336}{dieses Video} oder in
\href{https://www.youtube.com/watch?v=spUNpyF58BY}{dieses}.  Sie finden im
Internet auch eine \href{https://www.google.com/search?q=fourier+applet}{große
  Zahl von Applets}, bei denen man direkt mit den Näherungen spielen kann.

\begin{figure}
  \centering

  \includegraphics[width=150pt]{images/RechteckFourier.pdf}

  \caption{Approximation einer Sprungfunktion}
  \label{fig:app}
\end{figure}


\subsection{Fourier-Transformation}

Die Fourier-Reihen, die wir oben besprachen, werden verwendet, um Funktionen auf
dem Intervall $[-π,π]$ zu beschreiben, oder äquivalent gesagt: periodische
Funktionen mit Periode $2π$.  Man kann ähnliche Konstruktionen auch für nahezu
beliebige Funktionen machen.  Allerdings erhält man statt der
Fourier-Koeffizienten
\[
  a_n := \frac{1}{π}·\int^{π}_{-π} f(t) · \sin(n·t) dt.
\]
dann eine Fourier-Transformierte, die man sinnvollerweise in komplexen Zahlen
schreibt
\[
  F(t) = \frac{1}{\sqrt{2π}}·\int_{-∞}^{∞} f(x)·e^{-itx}dx.
\]
Aus der Reihendarstellung
\[
  f = \frac{c}{\sqrt{2}} + \sum_{n=1}^{∞} \bigl( a_n·\sin(n·x) + b_n·\sin(n·x) \bigr)
\]
wird dann die Formel
\[
  f(x) = \frac{1}{\sqrt{2π}}·\int_{-∞}^{∞} F(t)·e^{-itx}dt.
\]
Die Funktion $F$ nennt man ``Fourier-Transformierte'' oder
``Spektrum''.  Spektren gibt es in der reellen Welt überall zum Beispiel in
unserem Ohr.  Das Ohr ist ein ``Spektralapparat'', der auf mechanische Weise die
Fourier-Transformation der eingehenden Schallwelle berechnet und zum Gehirn
weiterleitet.  Wenn man Akustik verstehen will, muss man Fourier-Transformation
verstehen.  Dann kann man super-interessante Sachen machen.
\begin{itemize}
\item Um Klangdaten zu analysieren (etwa um mit dem Computer Sprache zu
  analysieren), schaue man sich die Fourier-Transformation an.  Es ist mit
  diesen Methoden nicht schwierig, ein kleine Computerprogramm zu bauen, dass
  ein gesprochenes ``e'' von einem ``a'' unterscheidet.  Suchen Sie im Internet
  nach ``Python'' und ``SciKit'', dann finden Sie alles, was sie brauchen.

\item Wenn ich das Spektrum eines Klanges berechnen kann, ist es super-einfach,
  interessante Sound-Effekte zu programmieren.  Zum Beispiel kann ich ein
  Programm machen, das ein Musikstück schneller abspielt ohne die Tonhöhe zu
  verändern.

\item Da sich das Gehirn nur für das Spektrum interessiert, muss ich mir das
  Spektrum anschauen, wenn ich erkennen will, welche Teile eines Klanges für das
  Gehirn interessant sind.  Das bekannte Dateiformat MP3 funktioniert so: schaue
  das Spektrum an, verwende ein mathematisch beschriebenes Modell der
  akustischen Wahrnehmung von Tonsignalen (``psycho-akustisches Modell'') und
  erkenne die Teile des Spektrums die für das Gehirn uninteressant sind.  Lasse
  diese Teile des Spektrums weg, um die Dateigröße zu verkleinern ohne den Klang
  wesentlich zu verschlechtern.
\end{itemize}

Die Fourier-Transformation tritt aber noch an vielen anderen Stellen auf:
Signaltechnik, Analyse von Schwingungen in den Ingenieurswissenschaften, und in
der Elektronik.  Sie ist aber auch die Grundlage der Quantenmechanik.  Die
``Heisenbergsche Unschärferelation'', über die Philosophen viel schreiben, ist
eine simple Funktionalgleichung, die zwischen den Funktionen $f$ und $F$ gilt!


\subsection{Die fünf Grundrechenarten}
\label{ssec:Rechen}

Ich habe von Kollegen aus der Physik gehört, die Fourier-Transformation sei
wegen ihrer Wichtigkeit die ``fünfte Grundrechenart''.  Das ist natürlich
falsch.  Tatsache ist, dass moderne Prozessoren die
``\href{https://en.wikipedia.org/wiki/Fast_Fourier_transform}{schnelle
  Fouriertransformation}'' extrem effizient ausführen können.  Sehr viele
elektronischen Geräten enthalten zusätzlich Spezialchips zur
Fouriertransformation.  Damit lässt sie die Fourier-Transformation so effizient
implementieren, dass Computer die Multiplikation ganzer Zahlen mit Hilfe von
Fourier-Transformation durchführen; Multiplikation ist also nur noch eine
Anwendung der schnellen Fouriertransformation.

\begin{quote}
  Der Schönhage-Strassen-Algorithmus ist ein Algorithmus zur Multiplikation
  zweier großer ganzer Zahlen.  Er wurde 1971 von Arnold Schönhage und Volker
  Strassen entwickelt.  Der Algorithmus basiert auf einer sehr schnellen Variante
  der diskreten schnellen Fourier-Transformation sowie einem geschickten Wechsel
  zwischen der Restklassen- und der zyklischen Arithmetik in endlichen
  Zahlenringen.

  -- \href{https://en.wikipedia.org/wiki/Sch%C3%B6nhage%E2%80%93Strassen_algorithm}{Wikipedia}
\end{quote}

Schauen Sie sich auch einmal
\href{https://aimath.org/news/congruentnumbers/howtomultiply.html}{diesen
  Artikel} an.  Die Grundrechenarten im 21 Jahrhundert sind also nicht ``plus,
minus, mal, geteilt'' sondern ``plus, minus, Fourier-Transformation''.


\subsection{Warum Sinus und Kosinus}

Sie fragen sich vielleicht, was das besondere an Sinus und Kosinus ist?  Warum
sind diese beiden Funktionen so wichtig?  Eine Antwort ist: weil viele
natürliche Prozesse (wie etwa unser Gehör) aus Sinus und Kosinus basieren.  Es
gibt aber noch andere Funktionen, mit denen man etwas ähnliches machen kann, zum
Beispiel die
\href{https://de.wikipedia.org/wiki/Kugelfl%C3%A4chenfunktionen}{Kugelflächenfunktionen},
  die die quantenmechanischen Gleichungen zur Beschreibung von
  wasserstoffähnlichen Atomen in besonders einfache Form bringen.  Haben Sie
  sich im Chemie-Unterricht schon einmal gefragt, warum die
  \href{https://de.wikipedia.org/wiki/Atomorbital}{Atomorbitale} eigentlich
  genau diese komischen Formen haben?  Schauen Sie sich die
  Kugelflächenfunktionen einmal an!


\section{Hauptkomponentenanalyse}

\sideremark{Vorlesung 19}Wussten Sie, dass der Raum der Persönlichkeitsmerkmale
von Menschen fünf-dimensional ist?

\begin{quote}
  Bei den Big Five (auch Fünf-Faktoren-Modell, FFM) handelt es sich um ein
  Modell der Persönlichkeitspsychologie.  Im Englischen wird es auch als
  OCEAN-Modell bezeichnet (nach den entsprechenden Anfangsbuchstaben Openness,
  Conscientiousness, Extraversion, Agreeableness, Neuroticism).

  Ihm zufolge existieren fünf Hauptdimensionen der Persönlichkeit und jeder
  Mensch lässt sich auf folgenden Skalen einordnen:

  \begin{itemize}
  \item Offenheit für Erfahrungen (Aufgeschlossenheit),
  \item Gewissenhaftigkeit (Perfektionismus),
  \item Extraversion (Geselligkeit),
  \item Verträglichkeit (Rücksichtnahme, Kooperationsbereitschaft, Empathie) und
  \item Neurotizismus (emotionale Labilität und Verletzlichkeit).
  \end{itemize}

  Die Entwicklung der Big Five begann bereits in den 1930er Jahren mit dem
  lexikalischen Ansatz, den Louis Thurstone, Gordon Allport und Henry Sebastian
  Odbert verfolgten.  Diesem liegt die Auffassung zugrunde, dass sich
  Persönlichkeitsmerkmale in der Sprache niederschlagen; d.  h.  es wird
  angenommen, dass alle wesentlichen Unterschiede zwischen Personen bereits im
  Wörterbuch durch entsprechende Begriffe repräsentiert sind.  Auf der Basis von
  Listen mit über 18.000 Begriffen wurden durch Faktorenanalyse fünf sehr
  stabile, unabhängige und weitgehend kulturstabile Faktoren gefunden: die Big
  Five.

  Die Big Five wurden später durch eine Vielzahl von Studien belegt und gelten
  heute international als das universelle Standardmodell in der
  Persönlichkeitsforschung.  Sie wurden innerhalb der letzten zwanzig Jahre in
  über 3.000 wissenschaftlichen Studien verwendet.

  --- \href{https://de.wikipedia.org/wiki/Big_Five_(Psychologie)}{Wikipedia}
\end{quote}

Die Frage nach der Persönlichkeit mag ein bischen theoretisch vorkommen, ist
aber für Sie von großem praktischen Belang; Datenanalyse-Firmen verdienen viel
Geld damit, die fünf Koordinaten Ihrer Persönlichkeit für zahlende Kundschaft zu
ermitteln --- suchen Sie im Internet nach den Worten ``Stryker'',
``Bewerbungsgespräch'' und ``Gallup-Test'' um zu sehen, was ich meine.


\subsection{Wie kommt man auf die Zahl ``fünf''?}

Bis über die Schmerzgrenze hinaus übermäßig vereinfacht gesagt, so.

\begin{itemize}
\item Nimm eine Liste aller möglichen Adjektive der Englischen Sprache, die sich
  auf ``Persönlichkeit'' beziehen -- bei Wikipedia ist von 18.000 Begriffen die
  Rede.

\item Nimm eine möglichst große Gruppe von $P$ Probanden und messe für jeden
  Probanden, wie stark die einzelnen Adjektive ausgeprägt sind.  Wir erhalten
  für jeden Probanden $p ∈ P$ einen Vektor im $\vec{v}_p ∈ ℝ^{18000}$.

\item Stelle fest, dass es einen fünf-dimensionalen Vektorraum
  $V ⊂ ℝ^{18000}$ gibt, so dass die Vektoren $(\vec{v}_p)_{p ∈ P}$ im
  Wesentlichen alle in $V$ liegen.

\item Stelle auch fest, dass es keinen vier-dimensionalen Untervektorraum mit
  diesen Eigenschaften gibt.
\end{itemize}

Die Frage ist, wie man den Vektorraum $V$ jetzt praktisch findet; das ist die
Aufgabe der ``Hauptkomponentenanalyse''.  Kurz gesagt berechnet man für je zwei
Adjektive $a_i$ und $a_j$ die Kovarianz $a_{ij}$.

\begin{quote}
  Kovarianz: Der Wert dieser Kenngröße macht tendenzielle Aussagen darüber, ob
  hohe Werte der einen Zufallsvariablen eher mit hohen oder eher mit niedrigen
  Werten der anderen Zufallsvariablen einhergehen.  Die Kovarianz ist ein Maß für
  die Assoziation zwischen zwei Zufallsvariablen.

  --- \href{https://de.wikipedia.org/wiki/Kovarianz_(Stochastik)}{Wikipedia}
\end{quote}

Wir erhalten so eine Kovarianzmatrix $A = (a_{ij})$.  Der Witz ist jetzt, dass
diese Matrix symmetrisch ist und deshalb durch orthogonale Transformation
diagonalisiert werden kann.  Jetzt kann ich mir die Einträge auf der Diagonalen
anschauen und stelle fest, dass auf der Diagonalen fünf betragsmäßig große
Zahlen stehen; alle anderen Zahlen sind vom Betrag recht klein.

\begin{aufgabe}
  Lesen Sie das folgende \href{https://arxiv.org/pdf/1404.1100.pdf}{exzellente
    Tutorial} zur Hauptkomponentenanalyse durch.  Stellen Sie fest, dass der
  wesentliche Punkt der Methode die Aussage ist, dass jede symmetrische Matrix
  durch orthogonale Transformation diagonalisiert werden kann.  Vielleicht
  möchten Sie auch in
  \href{https://ourarchive.otago.ac.nz/bitstream/handle/10523/7534/OUCS-2002-12.pdf}{diesen
    Text} schauen.
\end{aufgabe}


\subsection{… und weiter?}

Hauptkomponentenanalyse wird in fast jedem Bereich der empirischen
Wissenschaften verwendet.  Suchen Sie im Internet nach ``Hauptkomponentenanalyse
und Sportwissenschaft''.  Wikipedia nennt unter anderem noch folgende Beispiele.
\begin{itemize}
\item Wendet man die Hauptkomponentenanalyse auf das Kaufverhalten von
  Konsumenten an, gibt es möglicherweise latente Faktoren wie sozialer Status,
  Alter oder Familienstand, die bestimmte Käufe motivieren.  Hier könnte man
  durch gezielte Werbung die Kauflust entsprechend kanalisieren.

\item Hat man ein statistisches Modell mit sehr vielen Merkmalen, könnte mit
  Hilfe der Hauptkomponentenanalyse gegebenenfalls die Zahl der Variablen im
  Modell reduziert werden, was meistens die Modellqualität steigert.

\item Anwendung findet die Hauptkomponentenanalyse auch in der Bildverarbeitung
  – insbesondere bei der Fernerkundung.  Dabei kann man Satellitenbilder
  analysieren und Rückschlüsse daraus ziehen.

\item Ein weiteres Gebiet ist die Künstliche Intelligenz, zusammen mit den
  Neuronalen Netzen.  Dort dient die PCA zur Merkmalstrennung im Rahmen der
  automatischen Klassifizierung bzw.  in der Mustererkennung.

\item In quantitative finance, principal component analysis can be directly
  applied to the risk management of interest rate derivative portfolios.  Trading
  multiple swap instruments which are usually a function of 30-500 other market
  quotable swap instruments is sought to be reduced to usually 3 or 4 principal
  components, representing the path of interest rates on a macro
  basis.  Converting risks to be represented as those to factor loadings (or
  multipliers) provides assessments and understanding beyond that available to
  simply collectively viewing risks to individual 30-500 buckets.
\end{itemize}

% !TEX root = LineareAlgebra2