952 lines
39 KiB
TeX
952 lines
39 KiB
TeX
|
% spell checker language
|
|||
|
\selectlanguage{german}
|
|||
|
|
|||
|
\chapter{Gröbnerbasen}
|
|||
|
|
|||
|
Der Inhalt dieses Kapitels ist auch in vielen anderen Quellen gut erklärt.
|
|||
|
Werfen Sie einen Blick in das
|
|||
|
\href{http://hilbert.math.uni-mannheim.de/~seiler/CA17/CASkript17.pdf}{Skript
|
|||
|
des Mannheimer Kollegen Seiler}, das
|
|||
|
\href{https://www.mathematik.tu-dortmund.de/sites/daniel-plaumann/download/AG.pdf}{Skript
|
|||
|
des Dortmunder Kollegen Plaumann} und schauen Sie sich das Buch
|
|||
|
\cite{MR3330490} an, das Sie kostenlos im Universitätsnetz herunterladen können.
|
|||
|
|
|||
|
|
|||
|
\section{Liegt mein Element im Ideal?}
|
|||
|
|
|||
|
\sideremark{Vorlesung 8}Gegeben einen algebraisch abgeschlossenen Körper $k$ und
|
|||
|
eine algebraische Menge $V(I) ∈ 𝔸^n_k$, dann ist die einfachste Frage, die ich
|
|||
|
stellen kann: ist die Menge $V(I)$ leer? Nach dem Hilbertschen Nullstellensatz
|
|||
|
äquivalent zu der Frage, ob $1 ∈ I$ ist. In diesem Kapitel möchte ich erklären,
|
|||
|
wie man diese Frage beantworten kann. Ich beantworte sogar die folgende, etwas
|
|||
|
allgemeinere Frage~\ref{frage:8-0-1}. Die folgende Notation wird durchweg
|
|||
|
verwendet.
|
|||
|
|
|||
|
\begin{situation}\label{sit:8-1-1}
|
|||
|
Es sei $k$ ein Körper und es seien Polynome $f_1, …, f_m ∈ k[x_1, …, x_n]$
|
|||
|
gegeben. Wir betrachten das Ideal $I := (f_1, …, f_m)$.
|
|||
|
\end{situation}
|
|||
|
|
|||
|
\begin{frage}[Ideal Membership Problem]\label{frage:8-0-1}
|
|||
|
Wie kann ich in Situation~\ref{sit:8-1-1} entscheiden kann, ob ein gegebenes
|
|||
|
Polynom $f ∈ k[x_1, …, x_n]$ im Ideal $I$ liegt? Mit anderen Worten: Wie kann
|
|||
|
ich entscheiden, ob Polynome $g_1, …, g_m ∈ k[x_1, …, x_n]$ existieren, sodass
|
|||
|
die Gleichung
|
|||
|
\begin{equation}\label{eq:8-0-0-1}
|
|||
|
f = \sum_{i=1}^m g_i· f_i
|
|||
|
\end{equation}
|
|||
|
erfüllt ist?
|
|||
|
\end{frage}
|
|||
|
|
|||
|
\begin{beobachtung}
|
|||
|
Wenn man von vornherein sagen könnte, wie groß der Grad der Polynome $g_i$
|
|||
|
maximal ist, könnte man Gleichung~\eqref{eq:8-0-0-1} als lineares
|
|||
|
Gleichungssystem an die Koeffizienten der $g_i$ verstehen und lösen.
|
|||
|
\end{beobachtung}
|
|||
|
|
|||
|
Gradabschätzungen für potenzielle Polynome $g_i$ gibt es. Sie wurden meines
|
|||
|
Wissens nach zuerst 1926 von Grete
|
|||
|
Hermann\footnote{\href{https://de.wikipedia.org/wiki/Grete_Hermann}{Grete
|
|||
|
Hermann} oder Grete Henry oder Grete Henry-Hermann (* 2. März 1901 in
|
|||
|
Bremen; † 15. April 1984 in Bremen) war eine deutsche Mathematikerin,
|
|||
|
Physikerin, Philosophin und Pädagogin, die mit Physikern wie Werner Heisenberg
|
|||
|
und anderen Wissenschaftlern ihrer Zeit in Diskussion über die Entwicklung vor
|
|||
|
allem der modernen Quantenphysik stand.} bewiesen, die in Freiburg studierte,
|
|||
|
\cite{MR1512302}. Inzwischen wurden die Abschätzung zwar dramatisch verbessert,
|
|||
|
\cite{MR944576}, liefern aber nach wie vor kein praktisch brauchbares Verfahren.
|
|||
|
In dieser Vorlesung soll daher eine andere Methode vorgestellt werden, die sich
|
|||
|
gut für die Implementierung auf Computern eignet. Dazu ändere ich
|
|||
|
Frage~\ref{frage:8-0-1} etwas ab.
|
|||
|
|
|||
|
\begin{frage}\label{frage:8-1-3}
|
|||
|
In der Situation aus Frage~\ref{frage:8-0-1}, kann ich für jedes Polynom
|
|||
|
$f ∈ k[x_1, …, x_n]$ einen ``kanonischen Repräsentanten'' der Restklasse
|
|||
|
\[
|
|||
|
[f] ∈ \factor{k[x_1, …, x_n]}{I}
|
|||
|
\]
|
|||
|
finden, der idealerweise in der Praxis auch noch gut berechenbar ist?
|
|||
|
\end{frage}
|
|||
|
|
|||
|
Falls ich Frage~\ref{frage:8-1-3} positiv beantworten kann, kann ich das Ideal
|
|||
|
Membership Problem lösen. Gegeben ein Polynom $f$, dann berechne ich einfach
|
|||
|
die kanonischen Repräsentanten für die Restklassen $[f]$ und $[0]$ und
|
|||
|
vergleiche diese. Dann gilt offenbar: Das Polynom $f$ ist genau dann in $I$,
|
|||
|
wenn die kanonischen Repräsentanten gleich sind. So einfach ist das.
|
|||
|
|
|||
|
|
|||
|
\section{Monomiale Ideale}
|
|||
|
|
|||
|
Um nicht sofort ins kalte Wasser zu springen, beantworten wir
|
|||
|
Frage~\ref{frage:8-1-3} zuerst im einfachen Fall von ``monomialen Idealen''.
|
|||
|
Was das sein soll, erkläre ich jetzt.
|
|||
|
|
|||
|
\begin{definition}[Monome, Terme]
|
|||
|
Es sei $k$ ein Körper. Ein \emph{Monom}\index{Monom!im Polynomring} ist ein
|
|||
|
normiertes Polynom in $k[x_1, …, x_n]$, welches nur aus einem Summanden
|
|||
|
besteht. Elemente der Menge
|
|||
|
\[
|
|||
|
\{ λ·m ∈ k[x_1, …, x_n] \:: λ ∈ k^*, m \text{ ein Monom}\}
|
|||
|
\]
|
|||
|
nennt man \emph{Terme}\index{Term!im Polynomring}.
|
|||
|
\end{definition}
|
|||
|
|
|||
|
\begin{bemerkung}
|
|||
|
Die $0$ ist per Definition kein Monom und kein Term.
|
|||
|
\end{bemerkung}
|
|||
|
|
|||
|
\begin{bsp}
|
|||
|
Die Polynome $x²$, $y³$ und $x·y²$ sind Monome auf $ℂ[x,y]$. Das Polynom
|
|||
|
$14·x²·y$ ist ein Term. Das Polynom $x²-y³$ ist kein Monom und kein Term.
|
|||
|
Jedes Polynom kann auf eindeutige Weise als Summe von Termen geschrieben
|
|||
|
werden.
|
|||
|
\end{bsp}
|
|||
|
|
|||
|
\begin{notation}[Multi-Index-Schreibweise]
|
|||
|
Beim Umgang mit Monomen verwenden wir oft Multi-Index-Schreibweise: Statt
|
|||
|
$x_1^{α_1}·x_2^{α_2}⋯ x_n^{α_m}$ schreibe ich kurz $x^A$. Dabei soll
|
|||
|
$A =(α_1, …, α_m)$ und $x = (x_1, …, x_n)$ sein. Manchmal schreibe ich
|
|||
|
vielleicht auch $\vec{A}$ und $\vec{x}$.
|
|||
|
\end{notation}
|
|||
|
|
|||
|
\begin{beobachtung}
|
|||
|
Es sei $k$ ein Körper und es seien $A =(α_1, …, α_m)$ und
|
|||
|
$B =(β_1, …, β_m) ∈ ℕ^m$, mit zugehörigen Monomen $x^A$ und
|
|||
|
$x^B ∈ k[x_1, …, x_n]$. Dann gilt Folgendes.
|
|||
|
\begin{enumerate}
|
|||
|
\item Es ist $x^A · x^B = x^{A+B}$
|
|||
|
|
|||
|
\item Das Monom $x^A$ teilt $x^B$ genau dann, wenn für alle Indizes $i$ die
|
|||
|
Ungleichung $a_i ≤ b_i$ gilt.
|
|||
|
|
|||
|
\item Es ist $\kgV(x^A,x^B) = x_1^{\max(α_1, β_1)} ⋯ x_n^{\max(α_m, β_m)}$.
|
|||
|
|
|||
|
\item Es ist $\ggT(x^A,x^B) = x_1^{\min(α_1,β_1)} ⋯ x_n^{\min(α_m, β_m)}$.
|
|||
|
\end{enumerate}
|
|||
|
\end{beobachtung}
|
|||
|
|
|||
|
\begin{definition}[Monimiales Ideal]
|
|||
|
Es sei $k$ ein Körper. Ein Ideal $J ⊂ k[x_1, …, x_n]$ heißt
|
|||
|
\emph{monomial}\index{monomiales Ideal}, wenn es Monome $M_1, …, M_a$ gibt,
|
|||
|
sodass die Gleichheit $J = (M_1, …, M_a)$ gilt.
|
|||
|
\end{definition}
|
|||
|
|
|||
|
Für monomiale Ideale mit gegebenem Satz von Erzeugern löst das folgende Lemma
|
|||
|
die Aufgabe ``finde einen möglichst kanonischen Repräsentanten'' vollständig.
|
|||
|
|
|||
|
\begin{lem}[Division mit Rest für monomiale Ideale]\label{lem:8-1-6}
|
|||
|
In Situation~\ref{sit:8-1-1} seien die $f_1, …, f_m$ Monome. Dann gibt es zu
|
|||
|
jedem Polynom $f ∈ k[x_1, …, x_n]$ genau ein $h ∈ k[x_1, …, x_n]$, sodass
|
|||
|
Folgendes gilt.
|
|||
|
\begin{enumerate}
|
|||
|
\item\label{il:8-1-6-1} Die Restklassen der Polynome $f$ und $h$ im
|
|||
|
Quotientenring $\factor{k[x_1, …, x_n]}{I}$ sind gleich.
|
|||
|
|
|||
|
\item\label{il:8-1-6-2} Kein Term von $h$ wird von einem der Monome
|
|||
|
$f_•$ geteilt.
|
|||
|
\end{enumerate}
|
|||
|
\end{lem}
|
|||
|
\begin{proof}
|
|||
|
Das ist eine Übungsaufgabe, die sie selbst machen müssen. Rechnen Sie ein
|
|||
|
paar Beispiele, um zu sehen, was hier passiert. Lesen Sie erst danach weiter.
|
|||
|
\end{proof}
|
|||
|
|
|||
|
\begin{bemerkung}
|
|||
|
In Aussage~\ref{il:8-1-6-1} von Lemma~\ref{lem:8-1-6} bedeutet, dass es
|
|||
|
Polynome $g_i ∈ k[x_1, …, x_n]$ gibt, sodass die Gleichung
|
|||
|
\[
|
|||
|
h = f - \sum_{i=1}^m g_i·f_i
|
|||
|
\]
|
|||
|
gilt. Die Polynome $g_i$ sind aber kein bisschen eindeutig, denn selbst für
|
|||
|
das Nullpolynom gibt es immer die Darstellungen
|
|||
|
\[
|
|||
|
0 = 0 · f_1 + 0 · f_2 = f_2·f_1 - f_1·f_2.
|
|||
|
\]
|
|||
|
Überlegen Sie sich, dass die $g_i$ eindeutig festgelegt sind, wenn man
|
|||
|
zusätzlich verlangt, dass für jeden Index $j$ kein Term von $g_j·f_j$ ein
|
|||
|
Vielfaches von einem der Monome $f_1, …, f_{j-1}$ ist.
|
|||
|
\end{bemerkung}
|
|||
|
|
|||
|
\begin{bemerkung}\label{bem:8-2-9}
|
|||
|
Aussage~\ref{il:8-1-6-2} kann man auch anders schreiben. Überlegen Sie sich,
|
|||
|
dass für jeden Term $t ∈ k[x_1, …, x_n]$ die folgenden Aussage äquivalent
|
|||
|
sind.
|
|||
|
\begin{enumerate}
|
|||
|
\item Der Term $t$ ist Vielfaches eines der Monome $f_•$.
|
|||
|
|
|||
|
\item Der Term $t$ liegt im (monomialen!) Ideal $(f_1, …, f_m)$.
|
|||
|
\end{enumerate}
|
|||
|
\end{bemerkung}
|
|||
|
|
|||
|
\begin{bemerkung}
|
|||
|
Lemma~\ref{lem:8-1-6} zeigt unter anderem, dass die endlich vielen Monome
|
|||
|
\[
|
|||
|
\{ x^A \::\: x^A \text{ wird von keinem der $f_•$ geteilt } \}
|
|||
|
\]
|
|||
|
eine $k$-Vektorraumbasis des Quotientenringes $\factor{k[x_1, …, x_n]}{I}$
|
|||
|
bilden.
|
|||
|
\end{bemerkung}
|
|||
|
|
|||
|
|
|||
|
\section{Leitterme und Monomordnungen}
|
|||
|
|
|||
|
\subsection{Elimination von Termen}
|
|||
|
|
|||
|
Unser nächstes Ziel wird sein, Lemma~\ref{lem:8-1-6} auf den Fall von beliebigen
|
|||
|
Idealen zu verallgemeinern. Die Grundidee ist einfach: von jedem der $f_i$
|
|||
|
wählen wir einen Term aus (dieser wird später ``Leitterm'' genannt werden).
|
|||
|
Gegeben einen Index $i$, dann addieren ein geeignetes Vielfaches von $f_i$ zu
|
|||
|
$f$ und entfernen so alle Terme, die von dem Leitterm geteilt werden. Ich werde
|
|||
|
dieses Vorgehen demnächst präzisieren; zuerst möchte ich einfach nur einige
|
|||
|
Beispiele diskutieren.
|
|||
|
|
|||
|
\begin{bsp}[Elimination von $x²$]\label{bsp:8-2-2}
|
|||
|
Es sei $k$ ein Körper und es sei
|
|||
|
\[
|
|||
|
f_1 := x² + xy = x(x+y) ∈ k[x,y].
|
|||
|
\]
|
|||
|
Ich wähle den Term $x²$ von $f_1$. Rechnen Sie an Beispielen nach, dass ich
|
|||
|
dann jedes Polynom $f ∈ k[x,y]$ in der Form $f = g_1·f_1 + h$ schreiben kann,
|
|||
|
wobei kein Term des Polynoms $h$ ein Vielfaches von $x²$ ist\footnote{Das
|
|||
|
Polynom $h$ ist also von der Form $h(x,y) = h_0(y) + h_1(y)·x$.}. Der
|
|||
|
Algebraiker schreibt
|
|||
|
\[
|
|||
|
h = f - g_1·f_1
|
|||
|
\]
|
|||
|
und erklärt seiner Familie stolz, er habe ``aus $f$ alle Terme eliminiert, die
|
|||
|
Vielfache von $x²$ sind''.
|
|||
|
\end{bsp}
|
|||
|
|
|||
|
\begin{bsp}[Elimination von $y²$]\label{bsp:8-2-3}
|
|||
|
Es sei $k$ ein Körper und es sei
|
|||
|
\[
|
|||
|
f_2 = y² + xy=y(y+x)
|
|||
|
\]
|
|||
|
Ich wähle den Term $y²$ von $f_2$. Jetzt kann ich jedes Polynom $f ∈ k[x,y]$
|
|||
|
in der Form $f = g_2·f_2 + h$ schreiben kann, wobei kein Term des Polynoms $h$
|
|||
|
ein Vielfaches von $y²$ ist. Mit anderen Worten: ich kann aus $f$ alle Terme
|
|||
|
eliminieren, die Vielfache von $y²$ sind.
|
|||
|
\end{bsp}
|
|||
|
|
|||
|
\begin{beobachtung}\label{beo:8-3-4}
|
|||
|
Man könnte sich jetzt fragen, ob es möglich ist, durch Kombination der
|
|||
|
Beispiele~\ref{bsp:8-2-2} und \ref{bsp:8-2-3} aus gegebenen Polynomen
|
|||
|
gleichzeitig alle Terme mit $x²$ und alle Termine mit $y²$ zu eliminieren.
|
|||
|
Mit anderen Worten: kann ich jedes Polynom $f$ in der Form
|
|||
|
\[
|
|||
|
f = g_1·f_1 + g_2·f_2 + h
|
|||
|
\]
|
|||
|
schreiben, sodass $h$ keine Terme mit $x²$ und gleichzeitig auch keine Terme
|
|||
|
mit $y²$ enthält? Die Antwort ist ``nein'', denn ansonsten wäre
|
|||
|
\[
|
|||
|
\bigl\{ [1],[x],[y],[xy] \bigr\} ⊂ \factor{k[x, y]}{(f_1, f_2)}
|
|||
|
\]
|
|||
|
ein vierelementiges Erzeugendensystem von $\factor{k[x, y]}{(f_1, f_2)}$ als
|
|||
|
$k$-Vektorraum. Es ist aber $(f_1, f_2) ⊊ (x+y)$. Also gibt es eine
|
|||
|
Surjektion
|
|||
|
\begin{equation}\label{eq:8-2-4-1}
|
|||
|
\factor{k[x, y]}{(f_1, f_2)} → \factor{k[x, y]}{(x+y)} ≅ k[x]
|
|||
|
\end{equation}
|
|||
|
und der letztere Raum ist als $k$-Vektorraum unendlich-dimensional.
|
|||
|
\end{beobachtung}
|
|||
|
|
|||
|
\begin{frage}
|
|||
|
Können Sie die Abbildung~\eqref{eq:8-2-4-1} geometrisch interpretieren? Was
|
|||
|
geht hier vor?
|
|||
|
\end{frage}
|
|||
|
|
|||
|
|
|||
|
\subsection{Monomordnungen}
|
|||
|
|
|||
|
|
|||
|
Was ist der Grund, dass ich in Beobachtung~\ref{beo:8-3-4} nicht beide Leitterme
|
|||
|
eliminieren konnte? Antwort: Die Leitterme waren schlecht gewählt. Man sollte
|
|||
|
die Terme ($x²$, $y²$) nicht wahllos festlegen, sondern muss sie gemäß einer
|
|||
|
``Monomordnung'' wählen.
|
|||
|
|
|||
|
\begin{defn}[Monomordnung]
|
|||
|
Es sei $k$ ein Körper. Eine \emph{Monomordnung}\index{Monomordnung} auf
|
|||
|
$k[x_1, …, x_n]$ ist eine Wohlordnung ``$≤$'' auf der Menge der Monome, sodass
|
|||
|
für alle Monome $x^A, x^B$ und $x^C ∈ k[x_1, …, x_n]$ die folgenden
|
|||
|
Eigenschaften gelten.
|
|||
|
\begin{enumerate}
|
|||
|
\item Es ist $x^A ≤ x^C·x^A$.
|
|||
|
|
|||
|
\item Aus $x^A ≤ x^B$ folgt $x^C·x^A ≤ x^C·x^B$.
|
|||
|
\end{enumerate}
|
|||
|
\end{defn}
|
|||
|
|
|||
|
\begin{erinnerung}
|
|||
|
Eine \href{https://de.wikipedia.org/wiki/Wohlordnung}{Wohlordnung} auf einer
|
|||
|
Menge $M$ ist eine Totalordnung, sodass jede nicht-leere Teilmenge ein
|
|||
|
kleinstes Element hat. Insbesondere gibt es keine unendliche streng monoton
|
|||
|
fallende Folge von Elementen aus $M$.
|
|||
|
\end{erinnerung}
|
|||
|
|
|||
|
\begin{erinnerung}
|
|||
|
Eine
|
|||
|
\href{https://de.wikipedia.org/wiki/Ordnungsrelation#Totalordnung}{Totalordnung}
|
|||
|
ist eine Relation ``$≤$'' auf $M$, die reflexiv, antisymmetrisch, transitiv
|
|||
|
und total ist.
|
|||
|
\end{erinnerung}
|
|||
|
|
|||
|
\begin{defn}[Leitterm]
|
|||
|
Es sei $k$ ein Körper und es sei eine Monomordnung $≤$ auf dem Polynomring
|
|||
|
$k[x_1, …, x_n]$ gewählt. Gegeben $f ∈ k[x_1, …, x_n]$, dann nenne den Term
|
|||
|
mit dem größten Monom den \emph{Leitterm von $f$ bezüglich der Monomordnung
|
|||
|
$≤$}\index{Leitterm}. Der Leitterm des Nullpolynoms ist per Definition
|
|||
|
gleich $0$. Die Schreibweise $\ini f$ ist üblich, in der Literatur findet
|
|||
|
sich auch die Bezeichnung \emph{Initialterm}\index{Initialterm}.
|
|||
|
\end{defn}
|
|||
|
|
|||
|
\sideremark{Vorlesung 9}Wir werden gleich ganz viele konkrete Beispiele sehen.
|
|||
|
Zuerst aber noch einmal zurück zur Bemerkung, dass die Terme in den
|
|||
|
Beispielen~\ref{bsp:8-2-2} und \ref{bsp:8-2-3} nicht gemäß einer Monomordnung
|
|||
|
gewählt waren.
|
|||
|
|
|||
|
\begin{beobachtung}
|
|||
|
Es gibt keine Monomordnung auf $k[x,y]$, sodass
|
|||
|
\[
|
|||
|
\ini(x² + xy) = x² \quad\text{und}\quad \ini(y² + xy) = y²
|
|||
|
\]
|
|||
|
ist. Falls es eine solche Ordnung gäbe, dann muss nämlich $y < x$ sein, denn
|
|||
|
sonst wäre $xy > x²$ und der Leitterm von $x² + xy$ wäre nicht $x²$. Dann ist
|
|||
|
aber $y² < xy$, also ist der Leitterm von $y² + xy$ gleich $xy$ und nicht
|
|||
|
gleich $y²$.
|
|||
|
\end{beobachtung}
|
|||
|
|
|||
|
\begin{bsp}[Lexikografische Ordnung]
|
|||
|
Bei der \emph{lexikografischen Monomordnung}\index{lexikografische
|
|||
|
Monomordnung} auf dem Polynomring $k[x_1, …, x_n]$ gilt
|
|||
|
$x_1^{α_1} ⋯ x_n^{α_n} > x_1^{β_1} ⋯ x_n^{β_n}$ genau dann, wenn ein Index $i$
|
|||
|
existiert, sodass $α_i > β_i$ gilt und gleichzeitig für alle Indizes $j < i$
|
|||
|
die Gleichheit $α_j = β_j$ gilt. Kurz gesagt: Der erste Index $i$, bei dem
|
|||
|
sich die Exponenten $α_i$ und $β_i$ unterscheiden, entscheidet. Rechnen Sie
|
|||
|
nach, dass dies tatsächlich eine Monomordnung ist! Die quadratischen Polynome
|
|||
|
in $k[x_1, x_2, x_3]$ werden durch die lexikografischen Monomordnung wie folgt
|
|||
|
sortiert
|
|||
|
\[
|
|||
|
x²_1 > x_1 x_2 > x_1 x_3 > x²_2 > x_2x_3 > x²_3.
|
|||
|
\]
|
|||
|
Vielleicht haben Ihnen ihre Großeltern schon einmal erzählt, dass es früher
|
|||
|
statt Wikipedia dicke Bücher gab, die auf Wohnzimmerregalen verstaubten und
|
|||
|
für das Haus eine erhebliche Brandlast darstellten. In diesen ``Lexika''
|
|||
|
waren die Stichworte in ähnlicher Weise sortiert.
|
|||
|
\end{bsp}
|
|||
|
|
|||
|
\begin{bsp}[Graduiert-lexikografische Ordnung]
|
|||
|
Bei der \emph{graduiert-lexikografischen
|
|||
|
Monomordnung}\index{graduiert.-lexikografische Monomordnung} auf dem
|
|||
|
Polynomring $k[x_1, …, x_n]$ gilt
|
|||
|
$x_1^{α_1} ⋯ x_n^{α_n} > x_1^{β_1} ⋯ x_n^{β_n}$ genau dann, wenn eine der folgenden Bedingungen gilt:
|
|||
|
\begin{enumerate}
|
|||
|
\item Es ist $\sum α_i > \sum β_i$.
|
|||
|
\item Es ist $\sum α_i = \sum β_i$ und $x_1^{α_1} ⋯ x_n^{α_n}$ ist bezüglich
|
|||
|
der lexikografischen Monomordnung größer als $x_1^{β_1} ⋯ x_n^{β_n}$.
|
|||
|
\end{enumerate}
|
|||
|
Bei der graduiert-lexikografischen Ordnung entscheidet also zuerst der Grad
|
|||
|
der Monome, dann die lexikografische Ordnung.
|
|||
|
\end{bsp}
|
|||
|
|
|||
|
\begin{bsp}[Graduiert-rückwärtslexikografische Ordnung]\label{bsp:8-3-12}
|
|||
|
Bei der \emph{graduiert-rückwärtslexikografischen
|
|||
|
Monomordnung}\index{graduiert-rückwärtslexikografische Monomordnung} auf dem
|
|||
|
Polynomring $k[x_1, …, x_n]$ gilt
|
|||
|
$x_1^{α_1} ⋯ x_n^{α_n} > x_1^{β_1} ⋯ x_n^{β_n}$ genau dann, wenn eine der
|
|||
|
beiden folgenden Bedingungen gilt.
|
|||
|
\begin{itemize}
|
|||
|
\item Es ist $\sum α_i > \sum β_i$.
|
|||
|
|
|||
|
\item Es ist $\sum α_i = \sum β_i$ und der letzte
|
|||
|
nicht-verschwindende Eintrag von
|
|||
|
\[
|
|||
|
(α_1-β_1, …, α_n-β_n) ∈ ℤ^n
|
|||
|
\]
|
|||
|
ist negativ.
|
|||
|
\end{itemize}
|
|||
|
Rechnen Sie nach, dass dies tatsächlich eine Monomordnung ist! Die
|
|||
|
quadratischen Polynome in $k[x_1, x_2, x_3]$ werden durch die
|
|||
|
rückwärtslexikografische Monomordnung wie folgt sortiert
|
|||
|
\[
|
|||
|
x²_1 > x_1x_2 > x²_2 > x_1x_3 > x_2x_3 > x²_3.
|
|||
|
\]
|
|||
|
Der Unterschied zur lexikografischen Ordnung besteht also darin, welches der
|
|||
|
Monome $x_2²$ oder $x_1x_3$ bevorzugt wird. Bei den Antipoden gab es früher
|
|||
|
graduierte Rückwärtslexika, bei denen die Stichworte auf diese Weise sortiert
|
|||
|
waren.
|
|||
|
\end{bsp}
|
|||
|
|
|||
|
\begin{bsp}[Gewichtsordnung]
|
|||
|
Es sei $\vec{w} = (w_1, …, w_n) ∈ ℝ^n$ ein Vektor $ℚ$-linear-unabhängiger
|
|||
|
reeller Zahlen; wähle zum Beispiel $w_i := \log(p_i)$, wobei die $p_i$
|
|||
|
unterschiedlichen Primzahlen sind. Bei der
|
|||
|
\emph{Gewichtsordnung}\index{Gewichtsordnung} auf dem Polynomring
|
|||
|
$k[x_1, …, x_n]$ gilt $x_1^{α_1} ⋯ x_n^{α_n} > x_1^{β_1} ⋯ x_n^{β_n}$ genau
|
|||
|
dann, wenn
|
|||
|
\[
|
|||
|
\sum_{i=1}^n w_i·α_i ≤ \sum_{i=1}^n w_i·β_i
|
|||
|
\]
|
|||
|
ist. Die Unabhängigkeit über $ℚ$ garantiert, dass die Gleichheit
|
|||
|
$\sum w_i α_i = \sum w_i β_i$ nur dann eintritt, wenn für alle Indizes $i$ die
|
|||
|
Gleichung $α_i = β_i$ gilt.
|
|||
|
\end{bsp}
|
|||
|
|
|||
|
\begin{bemerkung}
|
|||
|
Weitere Beispiele für coole Monomordnungen gibt es
|
|||
|
\href{http://hilbert.math.uni-mannheim.de/~seiler/CA17/CASkript17.pdf}{im
|
|||
|
Internet}. Es ist aber eine gute Übung, sich selber ein paar interessante
|
|||
|
Beispiele für Monomordnungen zu überlegen.
|
|||
|
\end{bemerkung}
|
|||
|
|
|||
|
|
|||
|
\section{Division mit Rest}
|
|||
|
|
|||
|
Ich hatte angekündigt, das wir Lemma~\ref{lem:8-1-6} auf den Fall von beliebigen
|
|||
|
Idealen verallgemeinern werden. Damit war der folgende Satz gemeint. Im
|
|||
|
Unterschied zur klassischen ``Polynomdivision mit Rest'' wird in diesem Satz
|
|||
|
gleichzeitig durch mehrere Polynome geteilt! Sie finden einen ähnlichen Beweis
|
|||
|
und sehr viele Beispiele im Buch \cite[Kapitel~2.3]{MR3330490}, das Sie aus dem
|
|||
|
Universitätsnetz kostenlos herunterladen können.
|
|||
|
|
|||
|
\begin{satz}[Schwache Division mit Rest]\label{satz:8-4-6}
|
|||
|
In Situation~\ref{sit:8-1-1} sei eine Monomordnung $≤$ auf $k[x_1, …, x_n]$
|
|||
|
gewählt. Dann gibt es für jedes $f ∈ k[x_1, …, x_n]$ Polynome $g_1, …, g_m$
|
|||
|
und $h ∈ k[x_1, …, x_n]$, sodass
|
|||
|
\begin{equation}\label{eq:8-4-6-1}
|
|||
|
f = \sum_{i=1}^m g_i·f_i + h
|
|||
|
\end{equation}
|
|||
|
ist und sodass folgende Bedingungen erfüllt sind.
|
|||
|
\begin{enumerate}
|
|||
|
\item\label{il:8-4-6-2} Für jeden Index $i$ mit $g_i·f_i ≠ 0$ gilt die
|
|||
|
Ungleichung $\ini f ≥ \ini (g_i·f_i)$.
|
|||
|
|
|||
|
\item\label{il:8-4-6-3} Kein Term von $h$ ist Vielfaches von einem der Terme
|
|||
|
$\ini f_•$. \qed
|
|||
|
\end{enumerate}
|
|||
|
\end{satz}
|
|||
|
\begin{proof}
|
|||
|
\begin{algorithm}[t]
|
|||
|
\KwData{Situation~\ref{sit:8-1-1} und $f ∈ k[x_1, …, x_n]$}
|
|||
|
\KwResult{Polynome $g_1, …, g_m$ und $h ∈ k[x_1, …, x_n]$, sodass \eqref{eq:8-4-6-1}--\ref{il:8-4-6-3} gelten}
|
|||
|
|
|||
|
\BlankLine
|
|||
|
Setze $g_1 := 0$, …, $g_m := 0$\;
|
|||
|
Setze $h := 0$\;
|
|||
|
Setze $p := f$\;
|
|||
|
|
|||
|
\BlankLine
|
|||
|
\While{$p ≠ 0$}{
|
|||
|
\BlankLine
|
|||
|
Setze $S := \{ j : \ini f_j \mid \ini p \}$\;
|
|||
|
\BlankLine
|
|||
|
\eIf{$S = ∅$}{
|
|||
|
Setze $h := h + \ini p$ \;
|
|||
|
Setze $p := p - \ini p$ \;
|
|||
|
}{
|
|||
|
Setze $i := \min S$ \;
|
|||
|
Setze $q := (\ini p)/(\ini f_i)$ \;
|
|||
|
Setze $g_i := g_i + q$ \;
|
|||
|
Setze $p := p - q·f_i$ \;
|
|||
|
}
|
|||
|
}
|
|||
|
|
|||
|
\caption{Schwache Division mit Rest}
|
|||
|
\label{alg:8-4-6}
|
|||
|
\end{algorithm}
|
|||
|
Statt eines abstrakten Existenzsatzes finden Sie in
|
|||
|
Algorithmus~\ref{alg:8-4-6} eine konkrete Vorschrift zur Berechnung der
|
|||
|
Polynome $g_•$ und $h$. \video{9-1} zeigt, dass der Algorithmus terminiert
|
|||
|
und das gewünschte Ergebnis liefert.
|
|||
|
\end{proof}
|
|||
|
|
|||
|
|
|||
|
|
|||
|
\begin{bemerkung}
|
|||
|
Im Satz~\ref{satz:8-4-6} sind die Polynome $g_1, …, g_m$ und $h$ kein bisschen
|
|||
|
eindeutig. Falls es Sie interessiert: Es gibt einen ``Starken Divisionssatz''
|
|||
|
mit Existenz- und Eindeutigkeitsaussage, bei dem \ref{il:8-4-6-2} durch die
|
|||
|
folgende Forderung ersetzt ist.
|
|||
|
\begin{enumerate}
|
|||
|
\item Für jedes Paar $j < i$ von Indizes gilt: Kein Term von $g_i·\ini f_i$
|
|||
|
ist Vielfaches von $\ini f_j$.
|
|||
|
\end{enumerate}
|
|||
|
Wir werden diesen stärkeren Divisionssatz im Folgenden aber nicht benötigen.
|
|||
|
\end{bemerkung}
|
|||
|
|
|||
|
\begin{defn}[Divisionsrest]\label{def:8-4-6}
|
|||
|
In der Situation von Satz~\ref{satz:8-4-6} nennen wir jedes Element
|
|||
|
$h ∈ k[x_1, …, x_n]$, für dass es $g_• ∈ k[x_1, …, x_n]$ gibt, die den
|
|||
|
Bedingungen \eqref{eq:8-4-6-1}, \ref{il:8-4-6-2} und \ref{il:8-4-6-3} genügen,
|
|||
|
einen \emph{Rest von $f$ dividiert durch $f_1, …, f_m$}.
|
|||
|
\end{defn}
|
|||
|
|
|||
|
\href{https://sage.cplx.vm.uni-freiburg.de/share/ba8562a5ddff2655831b5d3bca006fbb06de626f/Divisionsreste.ipynb?viewer=share}{Hier}
|
|||
|
zeige ich Ihnen, wie man Divisionsreste bequem mit dem Programm ``Sage'' am
|
|||
|
Computer ausrechnet.
|
|||
|
|
|||
|
|
|||
|
\section{Gröbner-Basen}
|
|||
|
|
|||
|
\sideremark{Vorlesung 10}Ich erinnere noch einmal daran, warum wir den
|
|||
|
Divisionssatz überhaupt betrachtet haben. In Situation~\ref{sit:8-1-1} wollen
|
|||
|
wir für gegebene Polynome $f ∈ k[x_1, …, x_n]$ entscheiden, ob $f$ im Ideal $I$
|
|||
|
liegt. Dazu versuchten wir, eindeutig bestimmte Repräsentanten für die
|
|||
|
Restklasse von $[f] ∈ k[x_1, …, x_n]/I$ zu finden --- wenn das funktioniert,
|
|||
|
dann brauche ich nur die eindeutig bestimmte Repräsentanten von $[f]$ und $[0]$
|
|||
|
zu vergleichen. Die Grundidee ist, als Repräsentanten den Rest von $f$ bei der
|
|||
|
Division durch $f_1, …, f_m$ zu nehmen. Funktioniert diese Idee? Nein!
|
|||
|
|
|||
|
\begin{bsp}\label{bsp:8-4-2}
|
|||
|
Divisionsreste sind nicht eindeutig. Es kommt aber noch schlimmer: Wir
|
|||
|
betrachten einen Körper $k$ und die lexikografische Ordnung auf $k[x_1, x_2]$
|
|||
|
und die Polynome $f_1 := x²_1 x_2 - x²_2$ und $f_2 := x³_1$. Dann ist
|
|||
|
\[
|
|||
|
\ini f_1 = x²_1x_2 \quad\text{und}\quad \ini f_2 = x³_1.
|
|||
|
\]
|
|||
|
Für $f = x³_1x_2$ erhalten wir die Darstellung
|
|||
|
\[
|
|||
|
f = x_1·f_1 + 0·f_2 + x_1x²_2.
|
|||
|
\]
|
|||
|
Also: das Polynom $f$ liegt in $I$. Der Divisionsrest ist aber nicht Null.
|
|||
|
\end{bsp}
|
|||
|
|
|||
|
Was geht in Beispiel~\ref{bsp:8-4-2} schief? Der Grund für das Versagen der
|
|||
|
Idee ist, dass die Leitterme $\ini f_1$ und $\ini f_2$ nicht das Ideal
|
|||
|
$\bigl( \ini f \::\: f ∈ M \bigr)$ erzeugen. Das motiviert die folgende
|
|||
|
Definition.
|
|||
|
|
|||
|
\begin{defn}[Gröbnerbasis]\label{def:8-5-3}
|
|||
|
In Situation~\ref{sit:8-1-1} nennt man $f_1, …,f_m$ eine \emph{Gröbnerbasis
|
|||
|
oder Standardbasis von $M$}\index{Gröbnerbasis}\index{Standardbasis}, wenn
|
|||
|
für jedes Element $f ∈ M$ die folgende Inklusion gilt,
|
|||
|
\[
|
|||
|
\ini f ∈ \bigl(\ini f_1, …, \ini f_m \bigr).
|
|||
|
\]
|
|||
|
\end{defn}
|
|||
|
|
|||
|
\begin{bemerkung}
|
|||
|
Erinnern Sie sich an Bemerkung~\vref{bem:8-2-9}. Genau wie dort kann man
|
|||
|
Definition~\ref{def:8-5-3} auch anders formulieren: $f_1, …,f_m$ ist eine
|
|||
|
Gröbnerbasis, wenn für jedes Element $f ∈ M$ ein Index $i$ existiert, sodass
|
|||
|
$\ini f_i \mid \ini f$ ist.
|
|||
|
\end{bemerkung}
|
|||
|
|
|||
|
\begin{bemerkung}
|
|||
|
Die Frage, ob $f_1, …,f_m$ eine Gröbnerbasis ist, hängt massiv von der Wahl
|
|||
|
der Monomordnung ab, aber nicht von der Reihenfolge der $f_•$.
|
|||
|
\end{bemerkung}
|
|||
|
|
|||
|
\begin{beobachtung}[Vektorraumbasis für den Quotienten]
|
|||
|
In Situation~\ref{sit:8-1-1} sei $f_1, …,f_m$ eine Gröbnerbasis von $M$. Dann
|
|||
|
bildet die folgende Menge von Monomen,
|
|||
|
\[
|
|||
|
\left\{ m ∈ F \text{ein Monom} \::\: m \not∈ (\ini f_1, …, \ini f_m)
|
|||
|
\right\},
|
|||
|
\]
|
|||
|
eine $k$-Vektorraumbasis des Quotienten $F/M$. Mit dieser Beobachtung lässt
|
|||
|
sich in der Praxis schnell entscheiden, ob der Quotient $F/M$ endlich- oder
|
|||
|
unendlich-dimensional ist.
|
|||
|
\end{beobachtung}
|
|||
|
|
|||
|
Gröbnerbasen wurden 1965 von Bruno
|
|||
|
Buchberger\footnote{\href{https://de.wikipedia.org/wiki/Bruno_Buchberger}{Bruno
|
|||
|
Buchberger} (* 22. Oktober 1942 in Innsbruck) ist ein österreichischer
|
|||
|
Mathematiker.} eingeführt, der sie nach seinem Doktorvater Wolfgang
|
|||
|
Gröbner\footnote{\href{https://de.wikipedia.org/wiki/Wolfgang_Gr\%C3\%B6bner}{Wolfgang
|
|||
|
Gröbner} (2. Februar 1899 in Gossensaß – 20. August 1980) war ein
|
|||
|
österreichischer Mathematiker und Freidenker, der vor allem auf dem Gebiet der
|
|||
|
kommutativen Algebra und algebraischen Geometrie arbeitete. Sein Name ist
|
|||
|
bekannt durch die Gröbnerbasis und die Gröbner-Dualität.} benannte. Ähnliche
|
|||
|
Ideen tauchten etwa um dieselbe Zeit auch in den geometrischen Arbeiten von
|
|||
|
Heisuke
|
|||
|
Hironaka\footnote{\href{https://de.wikipedia.org/wiki/Heisuke_Hironaka}{Heisuke
|
|||
|
Hironaka} (Hironaka Heisuke; * 9. April 1931 in Yuu, Kuga-gun (heute:
|
|||
|
Iwakuni), Präfektur Yamaguchi, Japan) ist ein japanischer Mathematiker und
|
|||
|
Träger der Fields-Medaille.} auf.
|
|||
|
|
|||
|
|
|||
|
\subsection{Vom Nutzen der Gröbnerbasen}
|
|||
|
|
|||
|
Das folgende Lemma zeigt, dass Gröbnerbasen unsere Probleme lösen: Haben wir
|
|||
|
eine Gröbnerbasis von $M$ dann kann die Frage, ob $f ∈ M$ ist, mit einer
|
|||
|
einzigen Division beantwortet werden.
|
|||
|
|
|||
|
\begin{lem}[Divisionsreste für Elemente des Untermoduls]\label{lem:8-5-6}
|
|||
|
In Situation~\ref{sit:8-1-1} sei $f_1,…,f_m$ eine Gröbnerbasis. Gegeben ein
|
|||
|
Element $f ∈ M$, dann ist jeder Rest von $f$ bei Division durch $f_1, …, f_m$
|
|||
|
gleich $0$.
|
|||
|
\end{lem}
|
|||
|
\begin{proof}
|
|||
|
Es sei $h$ ein Divisionsrest. Per Definition bedeutet das, dass wir eine
|
|||
|
Darstellung
|
|||
|
\[
|
|||
|
f = \sum g_i·f_i + h
|
|||
|
\]
|
|||
|
haben, sodass die Bedingungen \ref{il:8-4-6-2} und \ref{il:8-4-6-3} gelten.
|
|||
|
Wegen der Annahme $f ∈ M$ wissen dann auf der einen Seite, dass $h ∈ M$. Auf
|
|||
|
der anderen Seite ist nach Bedingung~\ref{il:8-4-6-3} kein Term von $h$ ein
|
|||
|
Vielfaches der Leitterme $\ini f_i$. Wegen der Annahme, dass $f_1,…,f_m$
|
|||
|
eine Gröbnerbasis ist, ist das aber offenbar nur möglich, wenn $h = 0$ ist.
|
|||
|
\end{proof}
|
|||
|
|
|||
|
\begin{kor}[Eindeutigkeit von Divisionsresten]\label{kor:8-5-8}
|
|||
|
In Situation~\ref{sit:8-1-1} sei $f_1,…,f_m$ eine Gröbnerbasis. Gegeben sei
|
|||
|
ein Element $f ∈ k[x_1, …, x_n]$ und zwei Reste $h_1$, $h_2$ von $f$ bei
|
|||
|
Division durch $f_1, …, f_m$. Dann ist $h_1 = h_2$. \qed
|
|||
|
\end{kor}
|
|||
|
|
|||
|
\begin{lem}[Unabhängigkeit von der Wahl der Gröbnerbasis]\label{lem:8-5-9}
|
|||
|
In Situation~\ref{sit:8-1-1} seien $f_{1,1}, …, f_{1,m_1}$ und
|
|||
|
$f_{2,1}, …, f_{2, m_2}$ zwei Gröbnerbasen von $M$. Gegeben ein Element
|
|||
|
$f ∈ k[x_1, …, x_n]$, sei $h_•$ der (nach Korollar~\ref{kor:8-5-8} eindeutige)
|
|||
|
Rest von $f$ bei Division durch $f_{•,1}, …, f_{•, m_•}$. Dann ist
|
|||
|
$h_1 = h_2$.
|
|||
|
\end{lem}
|
|||
|
\begin{proof}
|
|||
|
Nach Definition von ``Divisionsrest'' in Definition~\vref{def:8-4-6} haben die
|
|||
|
Elemente $h_1$ und $h_2$ (soweit sie ungleich Null sind) nur Terme, die
|
|||
|
\emph{nicht} in
|
|||
|
\[
|
|||
|
\bigl( \ini f_{1,1}, …, \ini f_{1,m_1} \bigr) = \bigl( \ini f_{2,1}, …, \ini
|
|||
|
f_{2,m_2} \bigr)
|
|||
|
\]
|
|||
|
enthalten sind. Dasselbe gilt dann auch für die Differenz $h_1 - h_2$, die in
|
|||
|
$M$ liegt. Nach Definition~\ref{def:8-5-3} von ``Gröbnerbasis'' bedeutet das
|
|||
|
aber, dass $\ini (h_1 - h_2)=0$ ist. Also ist $h_1 - h_2 = 0$ und deshalb
|
|||
|
$h_1 = h_2$.
|
|||
|
\end{proof}
|
|||
|
|
|||
|
Lemma~\ref{lem:8-5-9} zeigt insbesondere, dass Divisionsreste unabhängig von der
|
|||
|
Reihenfolge der Elemente in der Gröbnerbasis sind.
|
|||
|
|
|||
|
|
|||
|
\subsection{Existenz von Gröbnerbasen}
|
|||
|
|
|||
|
Es fragt sich, ob Gröbnerbasen immer existieren. Die Antwort ist natürlich
|
|||
|
``ja'', denn Computer-Algebra-Systeme können Gröbnerbasen ausrechnen.
|
|||
|
\href{https://sage.cplx.vm.uni-freiburg.de/share/51e021b2ea6647e808203996d4a6d70f76d829d1/Gr\%C3\%B6bnerbasen.ipynb?viewer=share}{Hier
|
|||
|
zeige ich an einem Beispiel}, wie man das macht. Vielleicht hätten wir aber
|
|||
|
auch gern ein theoretisches Argument.
|
|||
|
|
|||
|
\begin{lem}[Existenz von Gröbnerbasen]\label{lem:8-5-7}
|
|||
|
In Situation~\ref{sit:8-1-1} existiert eine Gröbnerbasis von $I$.
|
|||
|
\end{lem}
|
|||
|
\begin{proof}
|
|||
|
Der Beweis ist relativ einfach.
|
|||
|
\begin{itemize}
|
|||
|
\item Falls $f_1, …, f_m$ bereits eine Gröbnerbasis ist, sind wir schon
|
|||
|
fertig.
|
|||
|
|
|||
|
\item Falls $f_1, …, f_m$ keine Gröbnerbasis ist, dann gibt es per Annahme ein
|
|||
|
Element $f_{m+1} ∈ I$ mit
|
|||
|
$\ini f_{m+1} \not ∈ \bigl( \ini f_1, …, \ini f_m \bigr)$. Nehme $f_{m+1}$
|
|||
|
als Erzeuger mit hinzu, fange noch einmal von vorn an.
|
|||
|
\end{itemize}
|
|||
|
Wir erhalten auf diese Weise eine aufsteigende Folge von monomialen Idealen
|
|||
|
des Polynomrings $k[x_1, …, x_n]$. Weil der Polynomring aber Noethersch ist,
|
|||
|
wird diese Folge nach endlich vielen Schritten stationär. Spätestens an
|
|||
|
dieser Stelle ist eine Gröbnerbasis erreicht.
|
|||
|
\end{proof}
|
|||
|
|
|||
|
|
|||
|
\section{Das Buchberger-Kriterium}
|
|||
|
|
|||
|
Lemma~\ref{lem:8-5-7} ist theoretisch beruhigend, aber im Moment praktisch
|
|||
|
wertlos. Wir können nicht entscheiden, ob eine gegebene Menge von Erzeugern
|
|||
|
eine Gröbnerbasis ist. Schlimmer noch: selbst wenn wissen, dass $f_1, …, f_m$
|
|||
|
\emph{keine} Gröbnerbasis ist, dann haben wir in der Praxis immer noch kein
|
|||
|
Verfahren, ein neues Element $f_{m+1}$ zu finden. Das Buchberger-Kriterium löst
|
|||
|
diese Probleme für uns. Zuerst müssen wir aber noch kurz über $S$-Polynome
|
|||
|
sprechen.
|
|||
|
|
|||
|
\begin{notation}[$S$-Polynom]\label{not:8-6-1}
|
|||
|
Es sei $k$ ein Körper und es seien Polynome $f, g ∈ k[x_1, …, x_n]$ gegeben.
|
|||
|
Schreibe
|
|||
|
\[
|
|||
|
\ini f = c· x^{A_i} \quad \text{und} \quad \ini g = d·x^{A_j}
|
|||
|
\]
|
|||
|
und definiere das \emph{$S$-Polynom von $f$ und $g$}\index{$S$-Polynom} als
|
|||
|
\[
|
|||
|
S(f,g) := \frac{\kgV(x^{A_i}, x^{A_j})}{c·x^{A_i}}·f - \frac{\kgV(x^{A_i},
|
|||
|
x^{A_j})}{d·x^{A_j}}·g
|
|||
|
\]
|
|||
|
\end{notation}
|
|||
|
|
|||
|
\begin{beobachtung}
|
|||
|
Die $S$-Polynome aus Notation~\ref{not:8-6-1} sind so definiert, dass stets
|
|||
|
die Ungleichung $\ini S(f,g) < \kgV( \ini f, \ini g)$ gilt.
|
|||
|
\end{beobachtung}
|
|||
|
|
|||
|
Die relevante Eigenschaft von $S$-Polynomen ist die Folgende.
|
|||
|
|
|||
|
\begin{lem}\label{lem:8-6-2}
|
|||
|
In Situation~\ref{sit:8-1-1} seien Polynome
|
|||
|
$g_1, … g_r ∈ k[x_1, …, x_n] ∖ \{ 0 \}$ gegeben. Wir nehmen an, dass
|
|||
|
es einen Vektor $A =(α_1, …, α_m)$ gibt, so dass die Leitterme der
|
|||
|
$g_{•}$ alle von der Form
|
|||
|
\[
|
|||
|
\ini g_{•} = b_{•}·x^A
|
|||
|
\]
|
|||
|
sind, mit $b_{•} ∈ k$. Weiter seien Skalare $a_1, …, a_r ∈ k$
|
|||
|
gegeben, sodass bezüglich der Monomordnung die Ungleichung
|
|||
|
\begin{equation}\label{eq:8-6-2-1}
|
|||
|
\ini \left(\sum_{i=1}^{r} a_i·g_i\right)< x^A
|
|||
|
\end{equation}
|
|||
|
gilt. Dann ist $\sum_{i=1}^{r} a_{i} g_{i}$ eine Linearkombination der
|
|||
|
$S$-Polynome $S(g_1, g_2)$, $S(g_2, g_3)$, …, $S(g_{r-1}, g_r)$.
|
|||
|
\end{lem}
|
|||
|
\begin{proof}
|
|||
|
Damit die Notation nicht zu aufwändig wird betrachten wir die Polynome
|
|||
|
\[
|
|||
|
p_i :=
|
|||
|
\begin{cases}
|
|||
|
\frac{1}{b_i}·g_i & \text{falls } 1 ≤ i ≤ r \\
|
|||
|
0 & \text{sonst.}
|
|||
|
\end{cases}
|
|||
|
\]
|
|||
|
Die Ungleichung~\eqref{eq:8-6-2-1} bedeutet, dass sich die Leitterme der
|
|||
|
Polynome $a_i·g_i$ in der Summe $\sum a_i·g_i$ gerade wegheben. Es gilt also
|
|||
|
\begin{equation}\label{eq:8-6-2-2}
|
|||
|
\sum_{i=1}^r a_{i} b_{i}=0.
|
|||
|
\end{equation}
|
|||
|
Damit folgt
|
|||
|
\begin{align*}
|
|||
|
\sum_{i=1}^r a_i·g_i & = \sum_{i=1}^r a_ib_i·p_{i} \\
|
|||
|
& = \sum_{i=1}^{r}\left(\sum_{j=1}ⁱ a_j b_j\right)\left(p_i-p_{i+1}\right) && \text{Teleskopsumme}\\
|
|||
|
&=\sum_{i=1}^{r-1}\left(\sum_{j=1}ⁱ a_j b_j\right)\left(p_i-p_{i+1}\right) && \text{Gleichung~\eqref{eq:8-6-2-2}}
|
|||
|
\end{align*}
|
|||
|
Die $S$-Polynome sind aber per Definition gerade
|
|||
|
\[
|
|||
|
S(g_i,g_j) = \frac{\kgV(x^A, x^A)}{b_i·x^A}·g_i - \frac{\kgV(x^A,
|
|||
|
x^A)}{b_j·x^A}·g_j = p_i - p_j,
|
|||
|
\]
|
|||
|
womit Lemma~\ref{lem:8-6-2} bewiesen ist.
|
|||
|
\end{proof}
|
|||
|
|
|||
|
|
|||
|
\begin{satz}[Buchberger-Kriterium]\label{satz:8-6-1}
|
|||
|
In Situation~\ref{sit:8-1-1} sind folgende Aussagen äquivalent.
|
|||
|
\begin{enumerate}
|
|||
|
\item\label{il:8-5-8-1} Die Elemente $f_1, …, f_m$ bilden eine Gröbnerbasis
|
|||
|
von $M$.
|
|||
|
|
|||
|
\item\label{il:8-5-8-2} Für alle $f ∈ M$ ist jeder Rest von $f$ bei Division
|
|||
|
durch $f_1, …, f_m$ gleich $0$.
|
|||
|
|
|||
|
\item\label{il:8-5-8-3} Für jedes Paar $(i,j)$ von Indizes ist $0$ ein Rest
|
|||
|
des $S$-Polynoms $S(f_i, f_j)$ bei Division durch $f_1, …, f_m$.
|
|||
|
\end{enumerate}
|
|||
|
\end{satz}
|
|||
|
|
|||
|
|
|||
|
|
|||
|
\begin{proof}[Beweis des Buchberger-Kriteriums]
|
|||
|
---
|
|||
|
|
|||
|
\begin{itemize}
|
|||
|
\item Die Implikation ``\ref{il:8-5-8-1} $⇒$ \ref{il:8-5-8-2}'' wurde in
|
|||
|
Lemma~\ref{lem:8-5-6} bewiesen.
|
|||
|
|
|||
|
\item Die Implikation ``\ref{il:8-5-8-2} $⇒$ \ref{il:8-5-8-3}'' ist leicht,
|
|||
|
denn es ist $S_{ij} ∈ M$, so dass es immer eine Darstellung von $S_{ij}$ als
|
|||
|
Linearkombination der $f_•$ gibt.
|
|||
|
|
|||
|
\item Die Implikation ``\ref{il:8-5-8-3} $⇒$ \ref{il:8-5-8-1}'' ist der
|
|||
|
wesentliche Punkt des Beweises. Details gibt es im (sehr langen)
|
|||
|
\video{10-1}. Der Beweis ist mit einigen Anpassungen aus dem Skript von
|
|||
|
\href{https://www.mathematik.tu-dortmund.de/sites/daniel-plaumann/download/AG.pdf}{Skript
|
|||
|
von Daniel Plaumann} übernommen. \qedhere
|
|||
|
\end{itemize}
|
|||
|
\end{proof}
|
|||
|
|
|||
|
\begin{bemerkung}
|
|||
|
Bei der praktischen Implementierung des Buchberger-Kriteriums gibt es viel
|
|||
|
Spielraum für Optimierungen; so es ist meist nicht unbedingt nötig, wirklich
|
|||
|
\emph{alle} Elemente $S_{••}$ zu betrachten.
|
|||
|
\end{bemerkung}
|
|||
|
|
|||
|
|
|||
|
\section{Der Buchberger-Algorithmus}
|
|||
|
|
|||
|
Mithilfe des Buchberger-Kriteriums können wir sehr schnell das im
|
|||
|
Algorithmus~\vref{alg:buchberger} angegebene Verfahren zur Bestimmung von
|
|||
|
Gröbnerbasen formulieren. Wir beweisen, dass der Algorithmus terminiert und das
|
|||
|
gewünschte liefert.
|
|||
|
|
|||
|
\begin{algorithm}[t]
|
|||
|
\SetAlgoLined
|
|||
|
\KwData{Situation~\ref{sit:8-1-1}}
|
|||
|
\KwResult{Gröbnerbasis $G$ von $I$}
|
|||
|
|
|||
|
\BlankLine
|
|||
|
Setze $G := (f_1, …, f_m)$ \;
|
|||
|
Setze $S := ∅$ \;
|
|||
|
|
|||
|
\BlankLine
|
|||
|
\Repeat{$S = ∅$}{
|
|||
|
Setze $S := ∅$ \;
|
|||
|
\ForEach{$1 ≤ i ≤ a$}{
|
|||
|
\ForEach{$1 ≤ j < i$}{
|
|||
|
Berechne das Polynom $S_{i,j}$ aus dem Buchberger-Kriterium für die Liste $G$\;
|
|||
|
Setze $h := $ Rest von $S_{i,j}$ bei Division durch $G$\;
|
|||
|
\If{$h ≠ 0$}{
|
|||
|
Setze $S := S ∪ \{ h\}$\;
|
|||
|
}
|
|||
|
}
|
|||
|
}
|
|||
|
Setze $G := G ∪ S$\;\label{lin:buchberger-12}
|
|||
|
}
|
|||
|
|
|||
|
\caption{Buchberger-Algorithmus}
|
|||
|
\label{alg:buchberger}
|
|||
|
\end{algorithm}
|
|||
|
|
|||
|
\begin{proof}[Terminierung des Buchberger-Algorithmus]
|
|||
|
Der Schlüssel liegt in Zeile~\ref{lin:buchberger-12}. Wenn es nämlich ein
|
|||
|
Element $h ∈ S$ gibt, dann liegt $h$ einerseits im Ideal $(g_1, …, g_a)$.
|
|||
|
Auf der anderen Seite wissen nach Definition von ``Divisionsrest'', dass der
|
|||
|
Leitterm $\ini h$ kein Vielfaches eines der $\ini g_•$ ist. Es gilt also
|
|||
|
\[
|
|||
|
(\ini g_1, …, \ini g_a) ⊊ (\ini g_1, …, \ini g_a, \ini h).
|
|||
|
\]
|
|||
|
Es folgt also, dass sich das Ideal $(g \:: g ∈ G)$ beim Durchlauf von
|
|||
|
Zeile~\ref{lin:buchberger-12} nicht ändert, während das Ideal
|
|||
|
$(\ini g \:: g ∈ G)$ bei jedem Durchlauf der Zeile echt größer wird. Wegen
|
|||
|
der Noether-Eigenschaft von $k[x_1, …, x_n]$ kann Letzteres aber nur endlich
|
|||
|
oft passieren.
|
|||
|
\end{proof}
|
|||
|
|
|||
|
\begin{proof}[Korrektheit des Buchberger-Algorithmus]
|
|||
|
Der Algorithmus terminiert, wenn in Zeile~\ref{lin:buchberger-12} die Menge
|
|||
|
$S$ gleich leer ist. Das bedeutet aber, dass jedes der $S_{ij}$ einen
|
|||
|
Divisionsrest hat, der gleich 0 ist. Nach dem Buchberger-Kriterium ist dies
|
|||
|
gleichbedeutend damit, dass $G$ eine Gröbner-Basis ist.
|
|||
|
\end{proof}
|
|||
|
|
|||
|
\begin{bemerkung}
|
|||
|
Der Buchberger-Algorithmus kann als weitreichende Verallgemeinerung des
|
|||
|
Gauß-Algorithmus verstanden werden. Er ist heute der Kern von fast allen
|
|||
|
Algorithmen der Computeralgebra und spielt auch in wirtschaftlichen
|
|||
|
bedeutenden Anwendungen wie etwa der Logikverifikation eine wichtige Rolle.
|
|||
|
|
|||
|
Trotz der großen praktischen Bedeutung ist die Komplexität des
|
|||
|
Buchberger-Algorithmus kaum verstanden. So sieht man in der Praxis sehr
|
|||
|
schnell, dass sowohl die Anordnung der $f_•$ als auch die Wahl der
|
|||
|
Monomordnung einen riesigen Einfluss auf die Laufzeit hat. Es scheint, dass
|
|||
|
die graduiert-rückwärtslexikografische Ordnung häufig recht gut abschneidet.
|
|||
|
Es gibt aber kaum quantitative Ergebnisse in dieser Richtung. Es gibt meines
|
|||
|
Wissens kein Verfahren, mit dem man vorab entscheiden könnte, welche Anordnung
|
|||
|
und welche Monomordnung für ein gegebenes Problem gut ist.
|
|||
|
\end{bemerkung}
|
|||
|
|
|||
|
|
|||
|
\subsection{Beispiel}
|
|||
|
|
|||
|
Das folgende Beispiel habe ich aus dem
|
|||
|
\href{http://hilbert.math.uni-mannheim.de/~seiler/CA17/CASkript17.pdf}{Skript
|
|||
|
des Mannheimer Kollegen Seiler} gestohlen. Ich hoffe, Kollege Seiler hat sich
|
|||
|
nicht verrechnet und ich habe richtig abgeschrieben. Wir starten mit dem Körper
|
|||
|
$ℚ$, dem Polynomring $ℚ[x,y]$ und verwenden die graduiert-lexikografische
|
|||
|
Monomordnung. Es sei
|
|||
|
\[
|
|||
|
f_1 = x³ - 2·xy \quad\text{und}\quad f_2 = x²y - 2·y² + x.
|
|||
|
\]
|
|||
|
Wir wollen eine Gröbner-Basis des Ideals $(f_1, f_2)$ bestimmen und wenden zu
|
|||
|
diesem Zweck den Buchberger-Algorithmus an.
|
|||
|
|
|||
|
\paragraph{Erster Schleifendurchgang:} schreibe
|
|||
|
\[
|
|||
|
G = (\underbrace{x³ - 2·xy}_{= g_1}, \underbrace{x²y - 2·y² + x}_{= g_2})
|
|||
|
\]
|
|||
|
und berechne
|
|||
|
\[
|
|||
|
S_{1,2} = y·g_1 - x·g_2 = -x².
|
|||
|
\]
|
|||
|
Als nächstes berechne ich mithilfe von Algorithmus~\ref{alg:8-4-6} den
|
|||
|
Divisionsrest,
|
|||
|
\[
|
|||
|
S_{1,2} = 0·g_1 + 0·g_2 + (-x²).
|
|||
|
\]
|
|||
|
Also ist $S = \{-x²\}$.
|
|||
|
|
|||
|
|
|||
|
\paragraph{Zweiter Schleifendurchgang:} schreibe
|
|||
|
\[
|
|||
|
G = (\underbrace{x³ - 2·xy}_{= g_1}, \underbrace{x²y - 2·y² + x}_{= g_2}, \underbrace{-x²}_{= g_3})
|
|||
|
\]
|
|||
|
und berechne
|
|||
|
\[
|
|||
|
\begin{matrix}
|
|||
|
S_{1,2} & = & y·g_1 - x·g_2 & = & -x² \\
|
|||
|
S_{1,3} & = & g_1 + x·g_3 & = & -2·xy \\
|
|||
|
S_{2,3} & = & g_2 + y·g_3 & = & -2·y²+x.
|
|||
|
\end{matrix}
|
|||
|
\]
|
|||
|
Als nächstes berechne ich mithilfe von Algorithmus~\ref{alg:8-4-6} die
|
|||
|
Divisionsreste,
|
|||
|
\[
|
|||
|
\begin{matrix}
|
|||
|
S_{1,2} & = & 0·g_1 &+& 0·g_2 &+& 1·g_3 &+& 0 \\
|
|||
|
S_{1,3} & = & 0·g_1 &+& 0·g_2 &+& 0·g_3 &+& (-2·xy) \\
|
|||
|
S_{2,3} & = & 0·g_1 &+& 0·g_2 &+& 0·g_3 &+& (-2·y²+x).
|
|||
|
\end{matrix}
|
|||
|
\]
|
|||
|
Also ist $S = \{-2·xy, -2·y²+x\}$.
|
|||
|
|
|||
|
|
|||
|
\paragraph{Dritter Schleifendurchgang:} schreibe
|
|||
|
\[
|
|||
|
G = (\underbrace{x³ - 2·xy}_{= g_1}, \underbrace{x²y - 2·y² + x}_{= g_2}, \underbrace{-x²}_{= g_3}, \underbrace{-2·xy}_{= g_4}, \underbrace{-2·y²+x}_{= g_5})
|
|||
|
\]
|
|||
|
und berechne
|
|||
|
\[
|
|||
|
\begin{matrix}
|
|||
|
S_{1,2} & = & y·g_1 - x·g_2 & = & -x² \\
|
|||
|
S_{1,3} & = & g_1 + x·g_3 & = & -2·xy \\
|
|||
|
S_{1,4} & = & y·g_1 + \frac{1}{2}x²·g_4 &=& -2·xy²\\
|
|||
|
S_{1,5} & = & y²·g_1 + \frac{1}{2}x³·g_5 &=& -2·xy³ + \frac{1}{2}·x⁴ \\
|
|||
|
S_{2,3} & = & g_2 + y·g_3 & = & -2·y²+x \\
|
|||
|
S_{2,4} & = & g_2 + \frac{1}{2}x·g_4 &=& -2·y²+x\\
|
|||
|
S_{2,5} & = & y·g_2 + \frac{1}{2}x²·g_5 &=& \frac{1}{2}·x³ + x·y -2·y³ \\
|
|||
|
S_{3,4} & = & -y·g_3 - \frac{1}{2}·x·g_4 &=& 0 \\
|
|||
|
S_{3,5} & = & -y²·g_{3}- \frac{1}{2}·x²·g_{5} &=& \frac{1}{2}·x³ \\
|
|||
|
S_{4,5} & = & -\frac{1}{2}·y·g_4 - \frac{1}{2}·x·g_5 &=& \frac{1}{2}·x²
|
|||
|
\end{matrix}
|
|||
|
\]
|
|||
|
Als nächstes berechne ich mithilfe von Algorithmus~\ref{alg:8-4-6} die
|
|||
|
Divisionsreste,\setcounter{MaxMatrixCols}{20}
|
|||
|
\[
|
|||
|
\begin{matrix}
|
|||
|
S_{1,2} & = & 0·g_1 &+& 0·g_2 &+& 1·g_3 &+& 0·g_4 &+& 0·g_5 &+& 0 \\
|
|||
|
S_{1,3} & = & 0·g_1 &+& 0·g_2 &+& 0·g_3 &+& 1·g_4 &+& 0·g_5 &+& 0 \\
|
|||
|
S_{1,4} & = & 0·g_1 &+& 0·g_2 &+& 0·g_3 &+& y·g_4 &+& 0·g_5 &+& 0 \\
|
|||
|
S_{1,5} & = & \frac{1}{2}x·g_1 &+& 1·g_2 &+& 0·g_3 &+& y²·g_4 &+& (-1)·g_5 &+& 0 \\
|
|||
|
S_{2,3} & = & 0·g_1 &+& 0·g_2 &+& 0·g_3 &+& 0·g_4 &+& 1·g_5 &+& 0 \\
|
|||
|
S_{2,4} & = & 0·g_1 &+& 1·g_2 &+& 0·g_3 &+& 0·g_4 &+& 1·g_5 &+& 0 \\
|
|||
|
S_{2,5} & = & \frac{1}{2}·g_1 &+& 0·g_2 &+& 0·g_3 &+& \frac{-1}{2}·g_4 &+& y·g_5 &+& 0 \\
|
|||
|
S_{3,4} & = & 0·g_1 &+& 0·g_2 &+& 0·g_3 &+& 0·g_4 &+& 0·g_5 &+& 0 \\
|
|||
|
S_{3,5} & = & \frac{1}{2}·g_1 &+& 0·g_2 &+& 0·g_3 &+& \frac{-1}{2}·g_4 &+& 0·g_5 &+& 0 \\
|
|||
|
S_{4,5} & = & 0·g_1 &+& 0·g_2 &+& \frac{-1}{2}·g_3 &+& 0·g_4 &+& 0·g_5 &+& 0
|
|||
|
\end{matrix}
|
|||
|
\]
|
|||
|
Voilà! Alle Divisionsreste sind Null, also ist $(g_1, g_2, g_3, g_4, g_5)$ eine
|
|||
|
Gröbnerbasis des Ideals $(f_1, f_2)$.
|
|||
|
\href{https://sage.cplx.vm.uni-freiburg.de/share/d179fd0bf0faf1b0c5e1d4cb0d29774d645b2394/Beispielrechnung\%20Buchberger-Algorithmus.ipynb?viewer=share}{Hier
|
|||
|
habe ich das Ergebnis noch einmal mit dem Computer überprüft}.
|
|||
|
|
|||
|
\begin{bemerkung}
|
|||
|
Das Beispiel zeigt eindrücklich, dass man solche Aufgaben besser dem Computer
|
|||
|
überlässt. Es gibt noch ein weiteres Problem, dass in diesem Beispiel nicht
|
|||
|
offensichtlich wird: der Algorithmus verlangt exaktes Rechnen,
|
|||
|
Näherungslösungen funktionieren nicht! Das wird ein riesiges Problem bei
|
|||
|
Rechnungen über dem Körper $ℚ$, denn beim Addieren von Brüchen werden Nenner
|
|||
|
und Zähler immer größer und komplizierter. Die Zahlen werden in der Praxis
|
|||
|
oft so lang, dass der Hauptspeicher nicht ausreicht --- und zwar unabhängig
|
|||
|
davon, auf welchem Rechner sie arbeiten! Dieses Problem tritt bei Rechnungen
|
|||
|
mit endlichen Körpern wie $𝔽_3$ natürlich nicht auf.
|
|||
|
\end{bemerkung}
|
|||
|
|
|||
|
%%% Local Variables:
|
|||
|
%%% mode: latex
|
|||
|
%%% TeX-master: "21-KA"
|
|||
|
%%% End:
|