% spell checker language \selectlanguage{german} \chapter{Anwendungen} \sideremark{Vorlesung 17}Haben Sie schon einmal nachts wach im Bett gelegen, weil Sie unbedingt eine symmetrische Matrix mit Hilfe eines orthogonalen Basiswechsels diagonalisieren wollten? Drängt es Sie, die Koeffizienten von Linearkombinationen mit Hilfe von Skalarprodukten auszurechnen? Die Begriffe und Methoden des laufenden Kapitels über ``Euklidische und Hermitesche Vektorräume'' haben enorm viele Anwendungen. Tatsächlich handelt es sich bei vielen der heißen Themen zu ``Machine Learning'', ``Collective Intelligence'' oder ``Artificial Intelligence'' um relativ einfache Methoden der linearen Algebra, die bei unserem Stand der Debatte sehr gut verstehen können -- schauen Sie sich bei \href{https://www.kaggle.com}{kaggle} um, wo es eine unendliche Menge von hervorragenden Tutorials, Erklärvideos, Projektvorschlägen und kleinen Wettbewerben gibt. Es gilt der alte Satz, dass Mathematik nicht notwendig kompliziert sein muss, um Nützlich zu sein. Ich reiße in diesem Kapitel einige Anwendungen oberflächlich an Der Abschnitt über die Klassifikation der reellen Quadriken ist klassischer Lehrstoff und prüfungsrelevant. Die anderen Kapitel sollen Sie neugierig machen, können aber nicht sinnvoll geprüft werden. \section{Reelle Quadriken} Die erste ``Anwendung'' ist immer noch ziemlich theoretisch und stammt mindestens aus der hellenistischen Antike, also etwa der Zeit Alexander des Großen. Vielleicht war die Sache aber auch schon zu babylonischer Zeit bekannt, \href{https://www.ams.org/notices/200809/tx080901076p.pdf}{wo Mathematik eine große Rolle spielte}. Es geht um folgende Situation. \begin{situation}[Quadrik im $ℝ^n$]\label{sit:12-1-1} Gegeben sei der $ℝ^n$ mit Koordinatenfunktionen $x_1, …, x_n$ und ein Polynom $f(x_1, …, x_n)$ vom Grad $=2$ \[ f(x_1, …, x_n) = \sum_{j=1}^n\sum_{i=1}^j f_{ij}·x_i x_j + \sum_{i=1}^n f_i x_i + f_0 \] mit der Nullstellenmenge $Q := \{ \vec{x} ∈ ℝ^n \:|\: f(x_1, …, x_n) = 0 \}$. Dabei sind die Koeffizienten $f_{••}$ und $f_{•}$ reelle Zahlen. \end{situation} \begin{defn}[Quadrik] Die Nullstellenmenge eines Polynoms vom Grad $2$ heißt \emph{Quadrik}\index{Quadrik}. \end{defn} Wir stellen in diesem Kapitel die Frage, was wir über die Geometrie von reellen Quadriken sagen können. Es ist klar, dass das Bild einer Quadrik unter einer lineare Abbildung oder Translation wieder eine Quadrik ist. Deshalb fragen wir genauer: Wie sieht $Q$ aus nach geeigneter Wahl von Koordinaten und nach Translationen? Wir formulieren die Frage präziser und führen die folgende Notation ein. \begin{defn}[Affine Abbildung]\label{def:12-1-3} Es sei $k$ ein Körper und $V, W$ zwei $k$-Vektorräume. Eine Abbildung $Φ : V → W$ heißt \emph{affin}\index{affine Abbildung}, falls es eine lineare Abbildung $φ : V → W$ und einen Vektor $\vec{w} ∈ W$ gibt, so dass für alle $\vec{v} ∈ V$ die Gleichung $Φ(\vec{v}) = φ(\vec{v}) + \vec{w}$ gilt. \end{defn} \begin{beobachtung} Die Verkettung von affinen Abbildungen ist wieder affin. Wenn eine affine Abbildung bijektiv ist, dann ist die Umkehrabbildung ebenfalls affin. Die bijektiven, affinen Selbstabbildung eines Vektorraumes bilden daher eine Untergruppe der Gruppe der bijektiven Selbstabbildungen. \end{beobachtung} Damit können wir unsere Frage präzise formulieren. \begin{frage} Gegeben sei Situation~\ref{sit:12-1-1}. Gibt es dann eine bijektive, affine Abbildung $Φ : ℝ^n → ℝ^n$, so dass das Bild von $Q$ unter der Abbildung $Φ$ eine Quadrik von besonders einfacher Gestalt ist? Gibt es eine (kleine) Mengen von ``Grund-Quadriken'' aus denen alle anderen durch affine Transformation (wie zum Beispiel: Translation, Drehung, Streckung, Verschiebung, …) entstehen? \end{frage} Die Antwort ist natürlich ``ja'', aber Sie haben ja zum Glück noch nicht weiter nach vorn geblättert. Sie kennen ähnliche Fragen aus der Schule. Bei der Diskussion der Kongruenz von Dreiecken betrachtet man Dreiecke statt Quadriken und abstandserhaltende Abbildungen statt affiner Abbildungen. \subsection{Vereinfachung von Quadratischen Gleichungen} Wir bleibe in Situation~\ref{sit:12-1-1} und werden jetzt eine Reihe von bijektiven, affinen Abbildungen finden, so dass die Gleichung (der Bilder von) $Q$ immer einfacher wird. Wie immer gibt es viel Material im Internet; ein Student wies mich auf \href{https://www.youtube.com/watch?v=wYJAggfstyI}{folgendes Video} hin. \subsubsection{Schritt 1: Darstellung von $f$ durch Matrizen} Wir betrachten die folgende, symmetrische $n⨯n$-Matrix \[ A = \begin{pmatrix} f_{11} & \frac{1}{2}·f_{12} & & ⋯ & \frac{1}{2}·f_{1n} \\ \frac{1}{2}·f_{12} & f_{22} & \ddots & & \vdots \\ \vdots & \ddots & \ddots \\ & & & f_{n-1,n-1} & \frac{1}{2}·f_{n-1,n} \\ \frac{1}{2}·f_{1n} & ⋯ & & \frac{1}{2}·f_{n-1,n} & f_{nn} \end{pmatrix} \] und den Vektor \[ \vec{b} = \left(\frac{1}{2}·f_1, …, \frac{1}{2}·f_n \right). \] Dann gilt für jeden Vektor $\vec{x} ∈ ℝ^n$ die Gleichung \begin{equation}\label{eq:12-1-3-1} f(\vec{x}) = \vec{x}^{\:t}·A·\vec{x} + 2\vec{b}·\vec{x} + f_0. \end{equation} Vielleicht ist Ihnen im Moment noch nicht klar, warum Gleichung \eqref{eq:12-1-3-1} jetzt helfen soll, die Quadriken besser zu verstehen. Der Witz ist aber, dass wir die symmetrische Matrix $A$ diagonalisieren können! \clearpage \subsubsection{Schritt 2: Eliminierung der gemischten Terme} Wir wissen: es existiert eine orthogonale $n⨯n$-Matrix $W$, so dass die Produktmatrix $W^t·A·W$ diagonal ist. Es sei $Q^{(1)}$ das Bild von $Q$ unter der bijektiven linearen Abbildung $\vec{x} ↦ W^{-1}·\vec{x}$. Dann gilt für alle $\vec{x} ∈ ℝ^n$: \begin{align*} \vec{x} ∈ Q^{(1)} & ⇔ W·\vec{x} ∈ Q \\ & ⇔ f(W·\vec{x}) = 0 \\ & ⇔ (W·\vec{x})^t·A·(W·\vec{x}) + 2 \vec{b} · (W·\vec{x}) + f_0 = 0 \\ & ⇔ \vec{x}^{\:t}·(W^t·A·W)·\vec{x} + 2 (\vec{b}·W)·\vec{x} + f_0 = 0 \end{align*} Wir erkennen zum einen, dass die Bildmenge $Q^{(1)}$ wieder eine Quadrik ist. Die Gleichung $f^{(1)}$ der Quadrik $Q^{(1)}$ ist besonders einfach, weil es keinen gemischten Terme mehr gibt. Das Polynom $f^{(1)}$ sieht also aus wie \[ f^{(1)}(\vec{x}) = \sum_{i=1}^n a^{(1)}_i·x_i² + 2·\sum_{i=1}^n b^{(1)}_i·x_i + c^{(1)} \] Einige (aber nicht alle!) der Koeffizienten $a_i$ könnten gleich Null sein. Durch Umnummerierung kann man aber gleich noch erreichen, dass $a_1, …, a_r$ ungleich Null sind und $a_{r+1}, …, a_n$ gleich Null, also insbesondere \[ f^{(1)}(\vec{x}) = \sum_{i=1}^r a^{(1)}_i·x_i² + 2·\sum_{i=1}^n b^{(1)}_i·x_i + c^{(1)} \] \clearpage \subsubsection{Schritt 3: Eliminierung der linearen Terme für $i≤ r$} Betrachte die Translation \[ φ : ℝ^n → ℝ^n, \quad \begin{pmatrix} x_1 \\ \vdots \\ x_r \\ x_{r+1} \\ \vdots \\ x_n \end{pmatrix} ↦ \begin{pmatrix} x_1+\frac{b^{(1)}_1}{a^{(1)}_1} \\ \vdots \\ x_r+\frac{b^{(1)}_r}{a^{(1)}_r} \\ x_{r+1} \\ \vdots \\x_n \end{pmatrix} \] und definiere $Q^{(2)}$ als das Bild von $Q^{(1)}$ unter dieser Abbildung. Dann gilt für alle $\vec{x} ∈ ℝ^n$: \begin{align*} \vec{x} ∈ Q^{(2)} & ⇔ φ^{-1}(\vec{x}) ∈ Q^{(1)} \\ & ⇔ \sum_{i=1}^r a^{(1)}_i·\left(x_i-\frac{b^{(1)}_i}{a^{(1)}_i} \right)² + 2 · \sum_{i=1}^r b^{(1)}_i·\left(x_i-\frac{b^{(1)}_i}{a^{(1)}_i} \right) + 2·\sum_{i=r+1}^n b^{(1)}_i·x_i + c^{(1)} = 0 \\ & ⇔ \sum_{i=1}^r a^{(1)}_i·x_i² + 2·\sum_{i=r+1}^n b^{(1)}_i·x_i + d^{(1)} = 0 \end{align*} Die Bildmenge $Q^{(2)}$ ist also wieder eine Quadrik, gegeben durch ein Polynom \[ g(\vec{x}) = \sum_{i=1}^r a^{(1)}_i·x_i² + 2·\sum_{i=r+1}^n b^{(1)}_i·x_i + d^{(1)} \] Falls die Zahl $d^{(1)}$ ungleich Null ist, können wir die Gleichung durch $-d^{(1)}$ dividieren (das ändert die Nullstellenmenge nicht). In jedem Fall ist die Bildmenge $Q^{(2)}$ gegeben durch ein Polynom \[ f^{(2)}(\vec{x}) = \sum_{i=1}^r a^{(2)}_i·x_i² + 2·\sum_{i=r+1}^n b^{(2)}_i·x_i + c^{(2)} \] wobei $c^{(2)} ∈ \{0, -1\}$ ist. \clearpage \subsubsection{Schritt 4: Eliminierung weiterer linearer Terme} Diese Konstruktion ist nur relevant, falls mindestens eines der $b^{(2)}_i$ ungleich Null ist. Falls alle $b^{(2)}_i$ verschwinden, machen wir in diesem Schritt nichts und setzen \[ Q^{(3)} := Q^{(2)}, \quad f^{(3)} := f^{(2)}, \quad a^{(3)}_i := a^{(2)}_i, \quad b^{(3)}_i := b^{(2)}_i, \quad c^{(3)} := c^{(2)} \] Ansonsten können wir nach umnummerieren der Variable annehmen, dass $b^{(2)}_{r+1} \ne 0$ ist. Betrachte dann die affine Bijektion \[ φ : ℝ^n → ℝ^n, \quad \begin{pmatrix} x_1 \\ \vdots \\ x_r \\ x_{r+1} \\ x_{r+2} \\ \vdots \\ x_n \end{pmatrix} ↦ \begin{pmatrix} x_1 \\ \vdots \\ x_r \\ \frac{-c^{(2)}}{2}-\sum_{j=r+1}^n b^{(2)}_j·x_j \\ x_{r+2} \\ \vdots \\x_n \end{pmatrix} \] und definiere $Q^{(3)}$ als das Bild von $Q^{(2)}$ unter dieser Abbildung. Dann gilt für alle $\vec{x} ∈ ℝ^n$: \begin{align*} \vec{x} ∈ Q^{(3)} & ⇔ φ^{-1}(\vec{x}) ∈ Q^{(2)} \\ & ⇔ \sum_{i=1}^r a^{(2)}_i·x²_i + 2·b^{(2)}_{r+1}·X + 2·\sum_{i=r+2}^n b^{(2)}_i·x_i + c^{(2)} = 0 \\ & \qquad\qquad\qquad \text{wobei } X = \left(\frac{-c^{(2)}}{2·b^{(2)}_{r+1}} - \frac{1}{b^{(2)}_{r+1}}·x_{r+1} - \sum_{j=r+2}^n \frac{b^{(2)}_j}{b^{(2)}_{r+1}}·x_j \right) \\ & ⇔ \sum_{i=1}^r a^{(2)}_i·x²_i - 2·x_{r+1} = 0 \end{align*} In jedem Fall gilt: die Bildmenge $Q^{(3)}$ ist also wieder eine Quadrik, gegeben durch ein Polynom \[ f^{(3)}(\vec{x}) = \sum_{i=1}^r a^{(3)}_i·x_i² + b^{(3)}_{r+1}·x_{r+1} + c^{(3)} \] wobei $b^{(3)}_{r+1} ∈ \{0,-2\}$ und $c^{(3)} ∈ \{0, -1\}$ ist. Weiterhin gilt: $b^{(3)}_{r+1} \ne 0 ⇒ c^{(3)} = 0$. \subsubsection{Schritt 5: Skalierung} Jetzt betrachte die Skalierung \[ φ : ℝ^n → ℝ^n, \quad \begin{pmatrix} x_1 \\ \vdots \\ x_r \\ x_{r+1} \\ \vdots \\ x_n \end{pmatrix} ↦ \begin{pmatrix} x_1·\sqrt{|a^{(3)}_1|} \\ \vdots \\ x_r·\sqrt{|a^{(3)}_r|} \\ x_{r+1} \\ \vdots \\x_n \end{pmatrix} \] und definiere $Q^{(4)}$ als das Bild von $Q^{(4)}$ unter dieser Abbildung. Dann gilt für alle $\vec{x} ∈ ℝ^n$: \begin{align*} \vec{x} ∈ Q^{(4)} & ⇔ φ^{-1}(\vec{x}) ∈ Q^{(3)} \\ & ⇔ \sum_{i=1}^r a^{(3)}_i·\left(\frac{x_i}{\sqrt{|a^{(3)}_i|}} \right)² + b^{(3)}_{r+1}·x_{r+1} + c^{(3)} = 0. \end{align*} Also ist Bildmenge $Q^{(4)}$ ist also wieder eine Quadrik, gegeben durch ein Polynom \[ f^{(4)}(\vec{x}) = \sum_{i=1}^r a^{(4)}_i·x_i² + b^{(4)}_{r+1}·x_{r+1} + c^{(4)} \] wobei $a^{(4)}_{•} ∈ \{-1, 1\}$, $b^{(4)}_{r+1} ∈ \{0, -2\}$ und $c^{(4)} ∈ \{0, -1\}$ ist. Weiterhin gilt: $b^{(4)}_{r+1} \ne 0 ⇒ c^{(4)} = 0$. \clearpage \subsection{Zusammenfassung der Vereinfachungen} Insgesamt haben wir mit den oben genannten Vereinfachungsschritten jetzt folgenden Satz bewiesen. \begin{satz}[Klassifikation der Quadriken]\label{satz:12-1-6} In Situation~\ref{sit:12-1-1} gibt es Zahlen $r$, $k$ gibt es eine bijektive, affine Abbildung $Φ : ℝ^n → ℝ^n$, so dass das Bild von $Q$ Nullstellenmenge einer der folgenden Gleichungen ist \begin{enumerate} \item $x_1² + x_2² + … + x_r² - x_{r+1}² - … - x_k²$ \item $x_1² + x_2² + … + x_r² - x_{r+1}² - … - x_k² - 1$ \item $x_1² + x_2² + … + x_r² - x_{r+1}² - … - x_k² - 2·x_{k+1}$ \qed \end{enumerate} \end{satz} \subsection{Klassifikation von Koniken} Im Falle $n = 2$ nennt man Quadriken auch \emph{Koniken}\index{Konik}; diese treten in der Elementargeometrie als \href{https://de.wikipedia.org/wiki/Kegelschnitt}{Kegelschnitte}\index{Kegelschnitte} -- sie finden zu diesem Thema jede Menge Videos, zum Beispiel \href{https://www.youtube.com/watch?v=-kVHDqf4tDk}{dieses hier}. Koniken sind seit der Antike ganz gut verstanden. Als Spezialfall des Satzes~\ref{satz:12-1-6} erhalten wir eine Klassifikation der Koniken. \begin{kor}[Klassifikation der Koniken des Appollonius von Perge\footnote{\href{https://de.wikipedia.org/wiki/Apollonios_von_Perge}{Appollonius von Perge} (* ca. 265 v. Chr. in Perge; † ca. 190 v. Chr. in Alexandria) war ein antiker griechischer Mathematiker, bekannt für sein Buch über Kegelschnitte.}] Betrachte Situation~\ref{sit:12-1-1} im Falle $n = 2$. Dann gibt es eine bijektive, affine Abbildung $Φ : ℝ^n → ℝ^n$, so dass das Bild von $Q$ Nullstellenmenge einer der folgenden Gleichungen ist \begin{enumerate} \item $x² = 0:$ Doppelgerade \label{Q.1} \begin{center} \begin{tikzpicture}[domain =-2.5:2.5] \draw[very thin, gray!70] (-2.5,-2.5) grid (2.5,2.5); \draw[->] (-2.5,0) -- (2.5,0) node[right] {$x$}; \draw[->] (0,-2.5) -- (0,2.5) node[above] {$y$}; \foreach \x in {-2,...,2} \draw (\x,1mm) -- (\x,-1mm) node[below, fill=white] {\x}; \foreach \y in {-2,...,2} \draw (1mm,\y) -- (-1mm,\y) node[left, fill=white] {\y}; \draw[red, very thick] (0,-2.5) -- (0,2.5); \end{tikzpicture} \end{center} \item $x² + y² = 0:$ Punkt \label{Q.2} \begin{center} \begin{tikzpicture}[domain =-2.5:2.5] \draw[very thin, gray!70] (-2.5,-2.5) grid (2.5,2.5); \draw[->] (-2.5,0) -- (2.5,0) node[right] {$x$}; \draw[->] (0,-2.5) -- (0,2.5) node[above] {$y$}; \foreach \x in {-2,...,2} \draw (\x,1mm) -- (\x,-1mm) node[below, fill=white] {\x}; \foreach \y in {-2,...,2} \draw (1mm,\y) -- (-1mm,\y) node[left, fill=white] {\y}; \draw[red, very thick] (0,0) circle (1.5pt); \end{tikzpicture} \end{center} \item $x² - y² = 0:$ zwei Geraden, die sich schneiden \label{Q.3} \begin{center} \begin{tikzpicture}[domain =-2.5:2.5] \draw[very thin, gray!70] (-2.5,-2.5) grid (2.5,2.5); \draw[->] (-2.5,0) -- (2.5,0) node[right] {$x$}; \draw[->] (0,-2.5) -- (0,2.5) node[above] {$y$}; \foreach \x in {-2,...,2} \draw (\x,1mm) -- (\x,-1mm) node[below, fill=white] {\x}; \foreach \y in {-2,...,2} \draw (1mm,\y) -- (-1mm,\y) node[left, fill=white] {\y}; \draw[red, very thick] plot (\x,\x); \draw[red, very thick] plot (\x,-\x); \end{tikzpicture} \end{center} \item $-x² - y² = 0:$ wie Fall \ref{Q.2} \label{Q.4} % kommt nicht vor unten \item $x² = 1:$ zwei parallele Geraden \label{Q.5} \begin{center} \begin{tikzpicture}[domain =-2.5:2.5] \draw[very thin, gray!70] (-2.5,-2.5) grid (2.5,2.5); \draw[->] (-2.5,0) -- (2.5,0) node[right] {$x$}; \draw[->] (0,-2.5) -- (0,2.5) node[above] {$y$}; \foreach \x in {-2,...,2} \draw (\x,1mm) -- (\x,-1mm) node[below, fill=white] {\x}; \foreach \y in {-2,...,2} \draw (1mm,\y) -- (-1mm,\y) node[left, fill=white] {\y}; \draw[red, very thick] (-1,-2.5) -- (-1,2.5); \draw[red, very thick] (1,-2.5) -- (1,2.5); \end{tikzpicture} \end{center} \item $x² + y² = 1:$ Kreis \label{Q.6} \begin{center} \begin{tikzpicture}[domain =-2.5:2.5] \draw[very thin, gray!70] (-2.5,-2.5) grid (2.5,2.5); \draw[->] (-2.5,0) -- (2.5,0) node[right] {$x$}; \draw[->] (0,-2.5) -- (0,2.5) node[above] {$y$}; \foreach \x in {-2,...,2} \draw (\x,1mm) -- (\x,-1mm) node[below, fill=white] {\x}; \foreach \y in {-2,...,2} \draw (1mm,\y) -- (-1mm,\y) node[left, fill=white] {\y}; \draw[red, very thick] (0,0) circle (1cm); \end{tikzpicture} \end{center} \item $x² - y² = 1:$ Hyperbel \label{Q.7} \begin{center} \begin{tikzpicture} \draw[very thin, gray!70] (-2.5,-2.5) grid (2.5,2.5); \draw[->] (-2.5,0) -- (2.5,0) node[right] {$x$}; \draw[->] (0,-2.5) -- (0,2.5) node[above] {$y$}; \foreach \x in {-2,...,2} \draw (\x,1mm) -- (\x,-1mm) node[below, fill=white] {\x}; \foreach \y in {-2,...,2} \draw (1mm,\y) -- (-1mm,\y) node[left, fill=white] {\y}; \draw[red, very thick, domain =1:2.5] plot (\x, {-sqrt((\x)^(2)-1)}); \draw[red, very thick, domain =1:2.5] plot (\x,{sqrt((\x)^(2)-1)}); \draw[red, very thick, domain =-2.5:-1] plot (\x, {-sqrt((\x)^(2)-1)}); \draw[red, very thick, domain =-2.5:-1] plot (\x,{sqrt((\x)^(2)-1)}); % hier muss man Fallunterscheidungen und schauen, dass sqrt nichts Negatives % zum Auswerten bekommt \end{tikzpicture} \end{center} \item $- x² - y² = 1:$ (leere Menge) \label{Q.8} \begin{center} \begin{tikzpicture}[domain =-2.5:2.5] \draw[very thin, gray!70] (-2.5,-2.5) grid (2.5,2.5); \draw[->] (-2.5,0) -- (2.5,0) node[right] {$x$}; \draw[->] (0,-2.5) -- (0,2.5) node[above] {$y$}; \foreach \x in {-2,...,2} \draw (\x,1mm) -- (\x,-1mm) node[below, fill=white] {\x}; \foreach \y in {-2,...,2} \draw (1mm,\y) -- (-1mm,\y) node[left, fill=white] {\y}; % leere Menge \end{tikzpicture} \end{center} \item $x² - 2y = 0:$ Parabel \label{Q.9} \begin{center} \begin{tikzpicture}[domain =-sqrt(5):sqrt(5)] %richtige Domain wählen \draw[very thin, gray!70] (-2.5,-2.5) grid (2.5,2.5); \draw[->] (-2.5,0) -- (2.5,0) node[right] {$x$}; \draw[->] (0,-2.5) -- (0,2.5) node[above] {$y$}; \foreach \x in {-2,...,2} \draw (\x,1mm) -- (\x,-1mm) node[below, fill=white] {\x}; \foreach \y in {-2,...,2} \draw (1mm,\y) -- (-1mm,\y) node[left, fill=white] {\y}; \draw[red, very thick] plot (\x, {0.5*(\x)^(2)}); \end{tikzpicture} \end{center} \item $- x² - 2y = 0:$ Parabel \label{Q.10} \begin{center} \begin{tikzpicture}[domain =-sqrt(5):sqrt(5)] \draw[very thin, gray!70] (-2.5,-2.5) grid (2.5,2.5); \draw[->] (-2.5,0) -- (2.5,0) node[right] {$x$}; \draw[->] (0,-2.5) -- (0,2.5) node[above] {$y$}; \foreach \x in {-2,...,2} \draw (\x,1mm) -- (\x,-1mm) node[below, fill=white] {\x}; \foreach \y in {-2,...,2} \draw (1mm,\y) -- (-1mm,\y) node[left, fill=white] {\y}; \draw[red, very thick] plot (\x, {-0.5*(\x)^(2)}); \end{tikzpicture} \end{center} \end{enumerate} \end{kor} \subsection{Fragen} \begin{itemize} \item In der Schule haben wir gelernt, das Koniken auftreten, wenn sich Körper im Schwerefeld bewegen. Wir kenne die Wurfparabel, die elliptischen Umlaufbahnen von Planeten um die Sonne und die Hyperbelbahnen von die Satelliten beim Vorbeiflug an einem Himmelskörper. Wieso treten hier eigentlich Koniken auf? \item Wir diskutieren in diesem Abschnitt reelle Quadriken. Ich behaupte, dass ähnliche Konstruktionen über den komplexen Zahlen die Gleichungen noch weiter vereinfachen; es gibt also insgesamt weniger Fälle. Wie viele Typen von komplexen Koniken gibt es? \end{itemize} \subsection{Projekte} Schreiben Sie ein Computerprogramm, das für eine gegebene Konik sofort eine vereinfachende affine Transformation liefert. Stellen Sie die Transformation graphisch dar, vielleicht mit automatisch generierten Videos die zeigen, wie es zu den Vereinfachungen kommt. \section{Die fünf Grundrechenarten} \sideremark{Vorlesung 18}Ich erkläre in diesem Abschnitt die Fourier-Transformation\footnote{\href{https://de.wikipedia.org/wiki/Joseph_Fourier}{Jean Baptiste Joseph Fourier} (* 21. März 1768 bei Auxerre; † 16. Mai 1830 in Paris) war ein französischer Mathematiker und Physiker.} und nenne einige Anwendungen. Die Fourier-Transformation ist für die Praxis vielleicht das wichtigste Stück Mathematik überhaupt\footnote{Sie selbst verwenden solche Transformationen ununterbrochen -- haben Sie schon einmal ein Mobiltelefon benutzt? Oder sind Sie vielleicht in einem Auto gefahren? Oder haben Sie einen Klang gehört?}. Manche Kollegen sprechen sogar von der ``fünften Grundrechenart''. Ich komme im Abschnitt~\ref{ssec:Rechen} darauf zurück. In Internet finden Sie sehr viel Material zum Thema. Ich empfehle dieses \href{https://www.youtube.com/watch?v=vA9dfINW4Rg}{Video vom MIT}. Die Fachhochschule Hamburg hat ebenfalls ein nettes \href{https://www.youtube.com/watch?v=oKWW8aWAdag}{Video} (``Warum die Fourier-Analysis in den Anwendungen so wichtig ist und welche grundlegende Idee dahinter steht''). Jörn Loviscach, mein persönlicher Held, hat natürlich auch ein \href{https://av.tib.eu/media/10335}{Video}, ebenso auch Daniel Jung (\href{https://www.youtube.com/watch?v=mMsa1uBHd9k}{$→$Link}). Wenn Sie ein wenig im Internet suchen, finden Sie noch sehr viel mehr Material. \subsection{Integration als Skalarprodukt} Ich komme noch einmal auf das Beispiel~\vref{bsp:Integration} zurück. Ich betrachte den der Vektorraum $V = \cC⁰([-π,π], ℝ)$ der reellwertigen stetigen Funktionen auf dem Intervall $[-π,π] ⊂ ℝ$. Wir haben schon gesehen, dass die Abbildung \[ \langle •, • \rangle : V ⨯ V → ℝ, \quad (f, g) ↦ \frac{1}{π}·\int^{π}_{-π} f(t) · g(t) dt. \] ein Skalarprodukt ist. Rechnen Sie sofort mit Hilfe der bekannten Additionstheoreme für Sinus und Kosinus nach, dass für alle positiven Zahlen $n$ und $m$ aus $ℕ$ die folgenden Gleichungen gelten: \[ \bigl\langle \sin(n·x), \sin(m·x) \bigr\rangle = δ_{nm}, \quad \bigl\langle \cos(n·x), \cos(m·x) \bigr\rangle = δ_{nm}, \quad \bigl\langle \sin(n·x), \cos(m·x) \bigr\rangle = 0. \] Zusätzlich gilt für die konstante Funktion $\frac{1}{\sqrt{2}}$ noch Folgendes: \[ \left\langle \frac{1}{\sqrt{2}}, \frac{1}{\sqrt{2}} \right\rangle = 1, \quad \left\langle \cos(n·x), \frac{1}{\sqrt{2}} \right\rangle = 0, \quad \left\langle \sin(n·x), \frac{1}{\sqrt{2}} \right\rangle = 0. \] Insgesamt sehen wir, dass die Menge \[ \mathcal{F} := \left\{ \frac{1}{\sqrt{2}}, \sin(x), \cos(x), \sin(2·x), \cos(2·x), … \right\} \] eine orthonormale Teilmengen des Euklidischen Vektorraumes $\bigl( V, \langle •,• \rangle\bigr)$ ist. \subsubsection{Rekonstruktion von Funktionen} Es sei jetzt $F := \langle \mathcal{F} \rangle ⊆ V$ der von $\mathcal{F}$ erzeugte Untervektorraum. Wenn ich jetzt irgendeine Funktion $f ∈ F$ habe, dann kann ich die Zahlen \begin{equation}\label{eq:12-2-0-1} a_n := \left\langle f, \sin(n·x) \right\rangle, \quad b_n := \left\langle f, \cos(n·x) \right\rangle, \quad c := \left\langle f, \frac{1}{\sqrt{2}} \right\rangle \end{equation} ausrechnen und erhalte die Gleichung: \begin{equation}\label{eq:12-2-0-2} f = \frac{c}{\sqrt{2}} + \sum_{n=1}^∞ \bigl( a_n·\sin(n·x) + b_n·\sin(n·x) \bigr) \end{equation} Beachte dabei, dass nur endlich viele der Zahlen $a_n$, $b_n$ von Null verschieden sind, so dass auf der rechten Seite der Gleichung~\eqref{eq:12-2-0-2} tatsächlich nur eine endliche Summe steht. \subsection{Fourier-Reihen} Dies ist ein Kapitel über Anwendungen. Es stellt sich also die Frage, welche relevanten Funktionen in dem Vektorraum $F$ liegen? Die Antwort ist: praktisch alle. Es gilt der folgende Satz der Analysis. \begin{satz} Es sei $f : [-π,π] → ℝ$ stetig und abschnittsweise stetig differenzierbar. Definiere Zahlen $a_n$, $b_n$ und $c$ wie in \eqref{eq:12-2-0-1}. Dann konvergiert die Funktionenreihe \begin{equation}\label{eq:12} \frac{c}{\sqrt{2}} + \sum_{n=1}^∞ \bigl( a_n·\sin(n·x) + b_n·\sin(n·x) \bigr) \end{equation} gleichmäßig (und damit punktweise) gegen $f$. \end{satz} \begin{defn}[Fourierkoeffizienten, Fouriereihe] Man nennt die Zahlen $a_n$, $b_n$ und $c$ die \emph{Fourierkoeffizienten}\index{Fourierkoeffizient} von $f$. Die unendliche Summe \eqref{eq:12} heißt \emph{Fourierreihe}\index{Fourierreihe} von $f$. \end{defn} In der Praxis ist es für die Untersuchung einer gegebenen Funktion $f$ meist gar nicht nötig, die unendliche Fourierreihe zu betrachten. Oft liefert eine endliche Summe wie etwa \[ f \approx \frac{c}{\sqrt{2}} + \sum_{n=1}⁵ \bigl( a_n·\sin(n·x) + b_n·\sin(n·x) \bigr) \] bereits eine absolut brauchbare Näherung. Abbildung~\ref{fig:app}, die ich bei \href{https://de.wikipedia.org/wiki/Fourierreihe}{Wikipedia} gestohlen habe, zeigt wie man eine Sprungfunktion annähert. \subsubsection{Beispiele und Erklärvideos} Weitere Beispiele gibt es bei \href{https://de.wikipedia.org/wiki/Fourierreihe#Beispiele}{Wikipedia} und in diesem phantastischem \href{https://www.youtube.com/watch?v=lL0oUZGMhXc}{Erklärvideo vom MIT}. Vielleicht schauen sie auch einmal in \href{https://av.tib.eu/media/10336}{dieses Video} oder in \href{https://www.youtube.com/watch?v=spUNpyF58BY}{dieses}. Sie finden im Internet auch eine \href{https://www.google.com/search?q=fourier+applet}{große Zahl von Applets}, bei denen man direkt mit den Näherungen spielen kann. \begin{figure} \centering \includegraphics[width=150pt]{images/RechteckFourier.pdf} \caption{Approximation einer Sprungfunktion} \label{fig:app} \end{figure} \subsection{Fourier-Transformation} Die Fourier-Reihen, die wir oben besprachen, werden verwendet, um Funktionen auf dem Intervall $[-π,π]$ zu beschreiben, oder äquivalent gesagt: periodische Funktionen mit Periode $2π$. Man kann ähnliche Konstruktionen auch für nahezu beliebige Funktionen machen. Allerdings erhält man statt der Fourier-Koeffizienten \[ a_n := \frac{1}{π}·\int^{π}_{-π} f(t) · \sin(n·t) dt. \] dann eine Fourier-Transformierte, die man sinnvollerweise in komplexen Zahlen schreibt \[ F(t) = \frac{1}{\sqrt{2π}}·\int_{-∞}^{∞} f(x)·e^{-itx}dx. \] Aus der Reihendarstellung \[ f = \frac{c}{\sqrt{2}} + \sum_{n=1}^{∞} \bigl( a_n·\sin(n·x) + b_n·\sin(n·x) \bigr) \] wird dann die Formel \[ f(x) = \frac{1}{\sqrt{2π}}·\int_{-∞}^{∞} F(t)·e^{-itx}dt. \] Die Funktion $F$ nennt man ``Fourier-Transformierte'' oder ``Spektrum''. Spektren gibt es in der reellen Welt überall zum Beispiel in unserem Ohr. Das Ohr ist ein ``Spektralapparat'', der auf mechanische Weise die Fourier-Transformation der eingehenden Schallwelle berechnet und zum Gehirn weiterleitet. Wenn man Akustik verstehen will, muss man Fourier-Transformation verstehen. Dann kann man super-interessante Sachen machen. \begin{itemize} \item Um Klangdaten zu analysieren (etwa um mit dem Computer Sprache zu analysieren), schaue man sich die Fourier-Transformation an. Es ist mit diesen Methoden nicht schwierig, ein kleine Computerprogramm zu bauen, dass ein gesprochenes ``e'' von einem ``a'' unterscheidet. Suchen Sie im Internet nach ``Python'' und ``SciKit'', dann finden Sie alles, was sie brauchen. \item Wenn ich das Spektrum eines Klanges berechnen kann, ist es super-einfach, interessante Sound-Effekte zu programmieren. Zum Beispiel kann ich ein Programm machen, das ein Musikstück schneller abspielt ohne die Tonhöhe zu verändern. \item Da sich das Gehirn nur für das Spektrum interessiert, muss ich mir das Spektrum anschauen, wenn ich erkennen will, welche Teile eines Klanges für das Gehirn interessant sind. Das bekannte Dateiformat MP3 funktioniert so: schaue das Spektrum an, verwende ein mathematisch beschriebenes Modell der akustischen Wahrnehmung von Tonsignalen (``psycho-akustisches Modell'') und erkenne die Teile des Spektrums die für das Gehirn uninteressant sind. Lasse diese Teile des Spektrums weg, um die Dateigröße zu verkleinern ohne den Klang wesentlich zu verschlechtern. \end{itemize} Die Fourier-Transformation tritt aber noch an vielen anderen Stellen auf: Signaltechnik, Analyse von Schwingungen in den Ingenieurswissenschaften, und in der Elektronik. Sie ist aber auch die Grundlage der Quantenmechanik. Die ``Heisenbergsche Unschärferelation'', über die Philosophen viel schreiben, ist eine simple Funktionalgleichung, die zwischen den Funktionen $f$ und $F$ gilt! \subsection{Die fünf Grundrechenarten} \label{ssec:Rechen} Ich habe von Kollegen aus der Physik gehört, die Fourier-Transformation sei wegen ihrer Wichtigkeit die ``fünfte Grundrechenart''. Das ist natürlich falsch. Tatsache ist, dass moderne Prozessoren die ``\href{https://en.wikipedia.org/wiki/Fast_Fourier_transform}{schnelle Fouriertransformation}'' extrem effizient ausführen können. Sehr viele elektronischen Geräten enthalten zusätzlich Spezialchips zur Fouriertransformation. Damit lässt sie die Fourier-Transformation so effizient implementieren, dass Computer die Multiplikation ganzer Zahlen mit Hilfe von Fourier-Transformation durchführen; Multiplikation ist also nur noch eine Anwendung der schnellen Fouriertransformation. \begin{quote} Der Schönhage-Strassen-Algorithmus ist ein Algorithmus zur Multiplikation zweier großer ganzer Zahlen. Er wurde 1971 von Arnold Schönhage und Volker Strassen entwickelt. Der Algorithmus basiert auf einer sehr schnellen Variante der diskreten schnellen Fourier-Transformation sowie einem geschickten Wechsel zwischen der Restklassen- und der zyklischen Arithmetik in endlichen Zahlenringen. -- \href{https://en.wikipedia.org/wiki/Sch%C3%B6nhage%E2%80%93Strassen_algorithm}{Wikipedia} \end{quote} Schauen Sie sich auch einmal \href{https://aimath.org/news/congruentnumbers/howtomultiply.html}{diesen Artikel} an. Die Grundrechenarten im 21 Jahrhundert sind also nicht ``plus, minus, mal, geteilt'' sondern ``plus, minus, Fourier-Transformation''. \subsection{Warum Sinus und Kosinus} Sie fragen sich vielleicht, was das besondere an Sinus und Kosinus ist? Warum sind diese beiden Funktionen so wichtig? Eine Antwort ist: weil viele natürliche Prozesse (wie etwa unser Gehör) aus Sinus und Kosinus basieren. Es gibt aber noch andere Funktionen, mit denen man etwas ähnliches machen kann, zum Beispiel die \href{https://de.wikipedia.org/wiki/Kugelfl%C3%A4chenfunktionen}{Kugelflächenfunktionen}, die die quantenmechanischen Gleichungen zur Beschreibung von wasserstoffähnlichen Atomen in besonders einfache Form bringen. Haben Sie sich im Chemie-Unterricht schon einmal gefragt, warum die \href{https://de.wikipedia.org/wiki/Atomorbital}{Atomorbitale} eigentlich genau diese komischen Formen haben? Schauen Sie sich die Kugelflächenfunktionen einmal an! \section{Hauptkomponentenanalyse} \sideremark{Vorlesung 19}Wussten Sie, dass der Raum der Persönlichkeitsmerkmale von Menschen fünf-dimensional ist? \begin{quote} Bei den Big Five (auch Fünf-Faktoren-Modell, FFM) handelt es sich um ein Modell der Persönlichkeitspsychologie. Im Englischen wird es auch als OCEAN-Modell bezeichnet (nach den entsprechenden Anfangsbuchstaben Openness, Conscientiousness, Extraversion, Agreeableness, Neuroticism). Ihm zufolge existieren fünf Hauptdimensionen der Persönlichkeit und jeder Mensch lässt sich auf folgenden Skalen einordnen: \begin{itemize} \item Offenheit für Erfahrungen (Aufgeschlossenheit), \item Gewissenhaftigkeit (Perfektionismus), \item Extraversion (Geselligkeit), \item Verträglichkeit (Rücksichtnahme, Kooperationsbereitschaft, Empathie) und \item Neurotizismus (emotionale Labilität und Verletzlichkeit). \end{itemize} Die Entwicklung der Big Five begann bereits in den 1930er Jahren mit dem lexikalischen Ansatz, den Louis Thurstone, Gordon Allport und Henry Sebastian Odbert verfolgten. Diesem liegt die Auffassung zugrunde, dass sich Persönlichkeitsmerkmale in der Sprache niederschlagen; d. h. es wird angenommen, dass alle wesentlichen Unterschiede zwischen Personen bereits im Wörterbuch durch entsprechende Begriffe repräsentiert sind. Auf der Basis von Listen mit über 18.000 Begriffen wurden durch Faktorenanalyse fünf sehr stabile, unabhängige und weitgehend kulturstabile Faktoren gefunden: die Big Five. Die Big Five wurden später durch eine Vielzahl von Studien belegt und gelten heute international als das universelle Standardmodell in der Persönlichkeitsforschung. Sie wurden innerhalb der letzten zwanzig Jahre in über 3.000 wissenschaftlichen Studien verwendet. --- \href{https://de.wikipedia.org/wiki/Big_Five_(Psychologie)}{Wikipedia} \end{quote} Die Frage nach der Persönlichkeit mag ein bischen theoretisch vorkommen, ist aber für Sie von großem praktischen Belang; Datenanalyse-Firmen verdienen viel Geld damit, die fünf Koordinaten Ihrer Persönlichkeit für zahlende Kundschaft zu ermitteln --- suchen Sie im Internet nach den Worten ``Stryker'', ``Bewerbungsgespräch'' und ``Gallup-Test'' um zu sehen, was ich meine. \subsection{Wie kommt man auf die Zahl ``fünf''?} Bis über die Schmerzgrenze hinaus übermäßig vereinfacht gesagt, so. \begin{itemize} \item Nimm eine Liste aller möglichen Adjektive der Englischen Sprache, die sich auf ``Persönlichkeit'' beziehen -- bei Wikipedia ist von 18.000 Begriffen die Rede. \item Nimm eine möglichst große Gruppe von $P$ Probanden und messe für jeden Probanden, wie stark die einzelnen Adjektive ausgeprägt sind. Wir erhalten für jeden Probanden $p ∈ P$ einen Vektor im $\vec{v}_p ∈ ℝ^{18000}$. \item Stelle fest, dass es einen fünf-dimensionalen Vektorraum $V ⊂ ℝ^{18000}$ gibt, so dass die Vektoren $(\vec{v}_p)_{p ∈ P}$ im Wesentlichen alle in $V$ liegen. \item Stelle auch fest, dass es keinen vier-dimensionalen Untervektorraum mit diesen Eigenschaften gibt. \end{itemize} Die Frage ist, wie man den Vektorraum $V$ jetzt praktisch findet; das ist die Aufgabe der ``Hauptkomponentenanalyse''. Kurz gesagt berechnet man für je zwei Adjektive $a_i$ und $a_j$ die Kovarianz $a_{ij}$. \begin{quote} Kovarianz: Der Wert dieser Kenngröße macht tendenzielle Aussagen darüber, ob hohe Werte der einen Zufallsvariablen eher mit hohen oder eher mit niedrigen Werten der anderen Zufallsvariablen einhergehen. Die Kovarianz ist ein Maß für die Assoziation zwischen zwei Zufallsvariablen. --- \href{https://de.wikipedia.org/wiki/Kovarianz_(Stochastik)}{Wikipedia} \end{quote} Wir erhalten so eine Kovarianzmatrix $A = (a_{ij})$. Der Witz ist jetzt, dass diese Matrix symmetrisch ist und deshalb durch orthogonale Transformation diagonalisiert werden kann. Jetzt kann ich mir die Einträge auf der Diagonalen anschauen und stelle fest, dass auf der Diagonalen fünf betragsmäßig große Zahlen stehen; alle anderen Zahlen sind vom Betrag recht klein. \begin{aufgabe} Lesen Sie das folgende \href{https://arxiv.org/pdf/1404.1100.pdf}{exzellente Tutorial} zur Hauptkomponentenanalyse durch. Stellen Sie fest, dass der wesentliche Punkt der Methode die Aussage ist, dass jede symmetrische Matrix durch orthogonale Transformation diagonalisiert werden kann. Vielleicht möchten Sie auch in \href{https://ourarchive.otago.ac.nz/bitstream/handle/10523/7534/OUCS-2002-12.pdf}{diesen Text} schauen. \end{aufgabe} \subsection{… und weiter?} Hauptkomponentenanalyse wird in fast jedem Bereich der empirischen Wissenschaften verwendet. Suchen Sie im Internet nach ``Hauptkomponentenanalyse und Sportwissenschaft''. Wikipedia nennt unter anderem noch folgende Beispiele. \begin{itemize} \item Wendet man die Hauptkomponentenanalyse auf das Kaufverhalten von Konsumenten an, gibt es möglicherweise latente Faktoren wie sozialer Status, Alter oder Familienstand, die bestimmte Käufe motivieren. Hier könnte man durch gezielte Werbung die Kauflust entsprechend kanalisieren. \item Hat man ein statistisches Modell mit sehr vielen Merkmalen, könnte mit Hilfe der Hauptkomponentenanalyse gegebenenfalls die Zahl der Variablen im Modell reduziert werden, was meistens die Modellqualität steigert. \item Anwendung findet die Hauptkomponentenanalyse auch in der Bildverarbeitung – insbesondere bei der Fernerkundung. Dabei kann man Satellitenbilder analysieren und Rückschlüsse daraus ziehen. \item Ein weiteres Gebiet ist die Künstliche Intelligenz, zusammen mit den Neuronalen Netzen. Dort dient die PCA zur Merkmalstrennung im Rahmen der automatischen Klassifizierung bzw. in der Mustererkennung. \item In quantitative finance, principal component analysis can be directly applied to the risk management of interest rate derivative portfolios. Trading multiple swap instruments which are usually a function of 30-500 other market quotable swap instruments is sought to be reduced to usually 3 or 4 principal components, representing the path of interest rates on a macro basis. Converting risks to be represented as those to factor loadings (or multipliers) provides assessments and understanding beyond that available to simply collectively viewing risks to individual 30-500 buckets. \end{itemize} % !TEX root = LineareAlgebra2