Wie macht man 2 aus 1?
Das Paradoxon von Banach-Tarski

Reinhard Winkler,
TU Wien,
Österreichische Akademie der Wissenschaften

20.4.2001

pdf-version dieses Textes

Zusammenfassung:

Das vielleicht verblüffendste Ergebnis der modernen, auf der Mengenlehre basierenden Mathematik ist das Paradoxon von Banach-Tarski. Es erklärt, wie eine Kugel in Teile zerlegt werden kann, welche - anders zusammengesetzt - zwei volle Kugeln ergeben, jede gleich groß wie die ursprüngliche.

Der scheinbare Widerspruch zur Tatsache, dass durch Bewegungen keine Volumina verändert werden können, löst sich auf, wenn man die Konsequenz zieht, dass die Teile in der Zerlegung so kompliziert sind, dass ihnen gar kein Volumen zugeordnet werden kann.

In diesem Artikel wird ein Beweis des Paradoxons von Banach-Tarski gebracht, der sich zwar an Wagon's Monographie [Wa 2] anlehnt, der aber kein mathematisches Wissen voraussetzt, das über den Schulstoff noch vor der Infinitesimalrechnung hinausgeht. Dementsprechend werden fundamentale Eigenschaften abzählbarer und überabzählbarer Mengen, soweit sie für den Beweis notwendig sind, im Text ausführlich besprochen. Die bei der Konstruktion der paradoxen Zerlegung involvierten Drehungen werden ohne Verwendung des Matrizenkalküls behandelt. Lediglich mit linearen Gleichungssystemen wird umgegangen, deren Interpretation als Drehungen explizit erläutert wird. Der Grenzwertbegriff kommt nur implizit über die Zifferndarstellung reeller Zahlen vor.

Anschließend an den Beweis wird noch die Bedeutung des Paradoxons in etwas größerem Kontext diskutiert. Solche Diskussionen über die Bedeutung mathematischer Sätze in ideengeschichtlichem Zusammenhang erscheinen für den Schulunterricht wünschenswert.

Der Artikel soll exemplarisch zeigen, dass es sehr wohl möglich ist, anspruchsvolle Mathematik auf Schulniveau zu betreiben, ohne sich in endlosen Rechnereien zu erschöpfen, und dabei außerdem zu starken Resultaten zu gelangen, ohne unzulässige Verkürzungen in Kauf nehmen zu müssen. Überdies können anhand des Paradoxons von Banach-Tarski grundsätzliche Fragen über das Wesen der Mathematik und anderer Wissenschaften angeschnitten werden.


Inhalt


1 Einführung


1.1 Worum geht es?

Grob gesprochen besagt das Paradoxon von Banach-Tarski (PvBT), dass es möglich ist, eine Kugel in mehrere Teile zu zerlegen und diese so zusammenzusetzen, dass man schlussendlich zwei Kugeln hat, von denen jede jeweils das gleiche Volumen hat wie die ursprüngliche Kugel.

Diese Aussage klingt höchst paradox und scheint auf den ersten Blick dem gesunden Menschenverstand zu widersprechen. Sie scheint nämlich die Verdopplung von Volumina zu ermöglichen. Dieser scheinbare Widerspruch löst sich auf, wenn man die Konsequenz zieht, dass die Kugelteile in der Zerlegung ganz einfach kein wohldefiniertes Volumen besitzen, weil sie so kompliziert sind, dass es zwar kaum vorstellbar aber doch denkbar ist.

Zweifellos ist das Paradoxon von Banach-Tarski eines der spektakulärsten Resultate der reinen Mathematik. So sehr es auch zunächst verblüffen mag - nach etwas eingehenderer Analyse verliert es seine (scheinbare) Absurdität und wird zu einem ganz gewöhnlichen mathematischen Satz, der bewiesen und verstanden werden kann.

Es zieht aber auch bedeutende innermathematische Konsequenzen nach sich und gibt zu interessanten Überlegungen über das Verhältnis von Mathematik und Wirklichkeit Anlass.


1.2 Die didaktischen Ambitionen dieses Artikels

Vorneweg soll betont werden, dass mündlicher Vortrag und schriftliche Fixierung sehr unterschiedliche Mitteilungsformen sind, jede mit Vor- und Nachteilen. Deshalb kann die vorliegende schriftliche Fassung nicht dieselben Mittel einsetzen wie der mündliche Vortrag.

Beiden Darstellungen gemeinsam ist der Versuch, durch sparsamen Einsatz der mathematischen Zeichensprache den mit dieser nicht so vertrauten Schüler, Leser oder Zuhörer nicht abzuschrecken. Anstelle umfangreicher Formelketten wird vor allem in der schriftlichen Fassung oft durch ausführliche verbale Beschreibung ein anschaulicher Zugang zu den wichtigsten Ideen angestrebt. Der mündliche Vortrag kann und soll diesbezüglich einiges mit rhetorischen Mitteln ersetzen. Das Wesen selbst mathematischer Beweise ist primär Überzeugungskraft und nicht Formalisierung. Dennoch wird vor allem in der schriftlichen Fassung der Anspruch auf Vollständigkeit der Beweise erhoben.

Das erste Hauptziel dieses Artikels, nämlich einen kompletten Beweis einer Version des Paradoxons von Banach-Tarski zu präsentieren, scheint angesichts der mathematischen Tiefe dieses Satzes durchaus ehrgeizig. Schließlich handelt es sich bei den Didaktikheften ja nicht primär um ein Forum für Fachartikel aus der mathematischen Forschung. Es soll aber auch in didaktischem Kontext kein Zweifel daran aufkommen, dass Beweise in der Mathematik eine zentrale Rolle spielen. Natürlich wäre es verfehlt, Vollständigkeit immer und überall zu fordern. Was mit angemessenem Aufwand verstehbar ist, soll aber verstehbar gemacht werden. Die Akzeptanz für Mathematik in der Öffentlichkeit kann sicher wesentlich verbessert werden, wenn sich weniger Menschen ausgeschlossen fühlen.

Das Augenmerk wird im Beweis so sehr auf die wesentlichen Ideen gelegt, dass das Resultat selbst für den mathematischen Laien plausibel, für den nur durchschnittlich begabten und ambitionierten Schüler oder Studienanfänger sogar restlos verstehbar wird. Damit soll exemplarisch vorgeführt werden, dass sich manche äußerst attraktive und bedeutende Ergebnisse der Mathematik durchaus dafür eignen, ohne Verkürzung einem deutlich breiteren Publikum zugänglich gemacht zu werden, nicht nur Fachstudenten in fortgeschrittenen Semestern. Insofern versteht sich dieser Artikel in erster Linie als didaktisch.

Hierin unterscheidet er sich nicht nur von den bald 100 Jahre alten Originalarbeiten [H] und [Ba-T], sondern auch von hervorragenden und leichter lesbaren Artikeln jüngeren Datums wie [St] und [Wa 1]. In [Wa 2] liegt sogar eine sehr empfehlenswerte Monographie zum Thema vor. Diese Werke richten sich durchwegs an ein Publikum von, wenn auch nicht spezialisierten, so doch mathematisch überdurchschnittlich ausgebildeten Lesern.

Das zweite Hauptziel des vorliegenden Artikels besteht darin, wenigstens in Ansätzen die Bedeutung des Paradoxons von Banach-Tarski im Gesamtkontext der Mathematik und sogar in darüber hinausgehenden wissenschaftstheoretischen Zusammenhängen zur Sprache zu bringen. Innermathematisch seien die Schlagworte wie Messbarkeit von Mengen und Invarianz von Maßen bezüglich bestimmter Gruppen von Transformationen erwähnt. Außermathematisch geht es z.B. um das Verhältnis zwischen Mathematik und empirischer Wirklichkeit oder um generelle erkenntnistheoretische Fragen. Der Relevanz von mathematischen oder anderen einzelwissenschaftlichen Ergebnissen in größeren Zusammenhängen kann im Unterricht kaum genug Bedeutung beigemessen werden.

Der Artikel richtet sich vor allem an Mathematiklehrer an Höheren Schulen in der Hoffnung, dass das Gebotene reich genug ist, um eine individuelle Auswahl für den Unterricht zu ermöglichen und Anregungen zu bieten. In einer beliebigen Klasse der Oberstufe einer AHS sollten geringfügige Anpassungen der Darstellung an den aktuellen Wissensstand reichen, um den präsentierten Stoff oder Teile davon im Unterricht einzubauen.


1.3 Eine exakte Formulierung des PvBT

Wir werden den vollständigen Beweis für das PvBT in folgender Formulierung führen:

Das Paradoxon von Banach-Tarski: Bezeichne $K$ die volle Einheitskugel im dreidimensionalen Anschauungsraum. (Formal ist das die Menge aller Punkte $x \in {\mathbb{R}}^3$, deren Abstand vom Koordinatenursprung nicht größer als eine Einheit ist.) $K$ besitzt eine paradoxe Zerlegung bezüglich Bewegungen im ${\mathbb{R}}^3$. Das heißt:

Es ist möglich, disjunkte (das heißt paarweise nicht überschneidende) Mengen $A_1,A_2,\ldots,A_m$ und $B_1,B_2,\ldots,B_n$ zu finden, welche zu zwei vollen Kugeln, ebenfalls mit Radius 1, zusammengesetzt werden können. Das soll wiederum bedeuten, dass es sogenannte Bewegungen (das sind Transformationen, welche sich aus Drehungen und Schiebungen zusammensetzen) $g_1,g_2,\ldots,g_{m'}$, $m' \le m$, und $h_1,h_2,\ldots,h_{n'}$, $n' \le n$, gibt mit folgender Eigenschaft: Unterwirft man die Mengen $A_i$ den $g_i$, so erhält man Mengen $g_i(A_i)$, deren Vereinigung die gesamte Kugel $K$ ergibt. Analoges gilt für die $B_j$ und $h_j$, also:

\begin{displaymath}
K = \bigcup_{i=1}^m A_i \cup \bigcup_{j=1}^n B_j =
\bigcup_{i=1}^{m'} g_i(A_i) = \bigcup_{j=1}^{n'} h_j(B_j).
\end{displaymath}


1.4 Mögliche Verschärfungen

Man beachte, dass in der obigen Formulierung des PvBT nicht alle $A_i$ und $B_j$ weiterverwendet werden, falls $n' < n$ oder $m' < m$. Man kann aber zeigen, dass $m=m'=3$ und $n=n'=2$ gewählt, die Zerlegung also mit 5 Teilen bewerkstelligt werden kann. Es gilt sogar die Verschärfung, dass je zwei beschränkte Teilmengen des ${\mathbb{R}}^3$, welche beide irgendeine Kugel mit positivem Radius enthalten, zerlegungsgleich sind. Das soll heißen, dass man die eine Menge geeignet in endlich viele Stücke zerlegen kann die, richtig zusammengesetzt, die andere Menge ergeben.

Der Beweis dieser Aussagen erfordert aber die Entwicklung umfangreicherer Theorien oder technische Feinarbeit, welche den Rahmen dieses Artikels sprengen oder gar vom Kern des PvBT ablenken könnten. Als diesen Kern wollen wir die Tatsache betrachten, dass aus Bestandteilen einer einzigen Kugel durch geeignete Zusammensetzung zwei Kugeln entstehen können.


1.5 Überblick über die folgenden Kapitel

In Kapitel 2 werden einige klassische und als Paradoxien des Unendlichen bekannte Beobachtungen erwähnt, welche beispielsweise schon von Galilei [Ga] und Bolzano [Bo] angestellt wurden. Sie liegen gedanklich exakt auf dem Weg zum PvBT und können im Beweis erfolgreich eingesetzt werden. Außerdem werden fundamentale Eigenschaften abzählbarer und überabzählbarer Mengen wiederholt. Wer mit den grundlegenden Tatsache wie Abzählbarkeit von ${\mathbb{Q}}$ und Überabzählbarkeit von ${\mathbb{R}}$ vertraut ist, wird über die ersten Abschnitte rasch hinweggehen. Dennoch bilden sie insbesondere ab 2.10 eine gezielte Vorbereitung auf das Nachfolgende. Wer mehr wissen möchte, sei auf den ebenfalls in den Didaktikheften erschienenen Artikel [Go] verwiesen, der ganz der Mengenlehre gewidmet ist.

Kapitel 3 präsentiert den vollständigen Beweis des PvBT in der Formulierung von 1.3. Der wesentliche Durchbruch wurde 1914 von Hausdorff erzielt, siehe [H], indem er eine paradoxe Zerlegung der Sphäre (Oberfläche der Kugel), vermindert um eine abzählbare Menge, fand (vgl. 3.1). Der entscheidende Schritt besteht erstens in der zwar unanschaulichen aber trivial nachzuprüfenden Tatsache, dass die von zwei Elementen frei erzeugte Gruppe (3.2) eine paradoxe Zerlegung besitzt (3.3), und zweitens in der Identifikation zweier Drehungen im ${\mathbb{R}}^3$ (3.6), welche eine freie Gruppe erzeugen (3.7). Damit kann die paradoxe Zerlegung der freien Gruppe auf typischen (fixpunktfreien) Orbits (3.4) in kanonischer Weise zu einem Beweis des Hausdorffschen Paradoxons herangezogen werden (3.5). Zum Beweis des vollen PvBT sind dann nur noch vergleichsweise harmlose Schritte nötig. Zunächst wird die abzählbare Ausnahmemenge eliminiert (3.8), dann die erhaltene Zerlegung der Sphäre in offensichtlicher Weise für eine der Vollkugel ohne Mittelpunkt genutzt (3.9), und schließlich wird noch der fehlende Mittelpunkt ergänzt (3.10).

Das abschließende Kapitel 4 präsentiert einige Gedanken, die sich unmittelbar ans PvBT anschließen, sowohl innermathematische als auch außermathematische. Innermathematisch ist die wichtigste Konsequenz des PvBT die Nichtexistenz gewisser Maße (4.1). Somit zeigt sich, dass das PvBT kein Kuriosum darstellt, sondern ein zentrales Resultat der Mathematik. Daran schließen einige Überlegungen an über das Verhältnis von Zählen (4.2) und Messen (4.3) aus mathematischer Sicht und über das Auswahlaxiom (4.4). Dann werden wichtige Unterschiede zwischen Mathematik und Physik anhand des Messens erörtert (4.5) und abschließend nochmals einige didaktische Aspekte besprochen (4.6).


2 Unendliche Mengen


2.1 Die einfachsten Paradoxien des Unendlichen

Schon früh machten Philosophen und Mathematiker bei der Analyse des Unendlichen die Beobachtung bemerkenswerter Phänomene, welche in endlichen Bereichen nicht auftreten können, vgl. [Ga] und [Bo].

Obwohl die Menge ${\mathbb{N}}^+ = \{1,2,\ldots\}$ eine echte Teilmenge der Menge ${\mathbb{N}}= \{0,1,2,3,\ldots\}$ ist, liegt es nahe, beide als gleich groß anzusehen (in Zeichen $\vert{\mathbb{N}}\vert = \vert{\mathbb{N}}^+\vert$). Schließlich lassen sich beide Mengen in gleicher Weise als unendliche Folgen niederschreiben, gehen also durch die bloße Umbenennung $n \mapsto n+1$ der Elemente auseinander hervor. Im Unendlichen muss der Teil also nicht unbedingt kleiner sein als das Ganze.

Wir geben uns damit nicht zufrieden, sondern treiben die Paradoxie um einen Schritt weiter. So bilden die geraden Zahlen einerseits eine echte Teilmenge $G = \{0,2,4,6,\ldots\}$ der natürlichen Zahlen ${\mathbb{N}}= \{0,1,2,3,4,\ldots\}$. $G = {\mathbb{N}}\setminus U$, $U = \{1,3,5,7,\ldots\}$, entsteht aus ${\mathbb{N}}$ durch Weglassen unendliche vieler Elemente, nämlich sämtlicher ungerader Zahlen $n \in U$. Andererseits füllen die Elemente von $G$ wie die von $U$ in genau derselben Weise wie die natürlichen Zahlen eine unendliche Liste, sind also nicht wirklich weniger.

Wir können die Situation bereits im Sinn des Titels lesen: Aus 1 wird 2 gemacht; nämlich aus einer unendlichen Menge zwei, die gleich groß sind wie die ursprüngliche, formal

\begin{displaymath}
\vert G\vert = \vert U\vert = \vert{\mathbb{N}}\vert = \vert G \cup U\vert = \vert G\vert + \vert U\vert.
\end{displaymath}

In 4.2 werden wir aber darauf zurückkommen, dass diese Situation nicht fälschlich als Identifikation der Zahlen 1 und 2 interpretiert werden darf.


2.2 Abzählbare und überabzählbare Mengen

In moderner Sprechweise nennt man eine unendliche Menge $X$ abzählbar, wenn sich ihre Elemente mit den natürlichen Zahlen durchnummerieren lassen, wenn man also

\begin{displaymath}
X = \{x_0,x_1,x_2,\ldots\}
\end{displaymath}

schreiben kann. Jede abzählbare Menge ist in dem Sinn gleich groß wie ${\mathbb{N}}$ (Schreibweise: $\vert X\vert = \vert{\mathbb{N}}\vert$), dass man die Elemente der beiden Mengen einander in umkehrbar eindeutiger zuordnen kann: $x_n \mapsto n$. (Hier setzen wir voraus, dass kein Element $x_n$ mehrmals mit verschiedenen Indizes $n$ aufgelistet ist.) Ist eine unendliche Menge nicht abzählbar, so heißt sie überabzählbar.

Die Menge ${\mathbb{N}}$ der natürlichen Zahlen ist also abzählbar ($x_n = n$), ebenso wie die Menge $G$ der geraden ($x_n = 2n$), $U$ der ungeraden Zahlen ($x_n = 2n+1$), $Q$ der Quadratzahlen ($x_n = n^2$) oder ${\mathbb{P}}= \{2,3,5,7,11,\ldots\}$ der Primzahlen.

Jede unendliche Menge $X$ enthält eine abzählbare Teilmenge. (Der simple Beweis macht bereits vom sogenannten Auswahlaxiom, vgl. Abschnitt 4.4, Gebrauch: Man wähle zuerst $x_0 \in X$, dann $x_1 \in X$ verschieden von $x_0$ usw., induktiv also $x_{n+1}$ verschieden von $x_0,x_1,\ldots,x_n$.) Gewissermaßen sind die abzählbaren Mengen also die kleinsten unendlichen Mengen. Es gibt aber auch abzählbare Mengen, die auf den ersten Blick größer als ${\mathbb{N}}$ erscheinen.


2.3 Abzählbarkeit von ${\mathbb{Z}}$

Relativ leicht sieht man, dass die Menge ${\mathbb{Z}}= \{\ldots,-3,-2,-1,0,1,2,3,\ldots\}$ aller ganzen Zahlen abzählbar ist. Man kann in der Aufzählung nämlich immer abwechslend positive und negative Zahlen verwenden: ${\mathbb{Z}}= \{0,1,-1,2,-2,3,-3,4,-4,\ldots\}$, also $x_{2n} = n$ für $n \ge 0$ und $x_{2n-1}=-n$ für $n \ge 1$. Grob gesprochen (d.h. 0 vernachlässigend) hat man damit zwei Kopien der natürlichen Zahlen (nämlich ${\mathbb{N}}$ und $-{\mathbb{N}}$) in einer Kopie untergebracht. Die Analogie zur Zerlegung aus 2.1 von ${\mathbb{N}}$ in gerade und ungerade Zahlen liegt auf der Hand.


2.4 Abzählbare Vereinigungen und kartesische Produkte

Nun stellen wir uns den Ehrgeiz, nicht nur zwei Kopien, sondern sogar (abzählbar) unendlich viele zu einer zu komprimieren. Dazu betrachte man zum Beispiel die Menge ${\mathbb{Z}}^2$ aller ganzzahligen Gitterpunkte in der Ebene, also aller Punkte $(k_1,k_2)$ mit $k_1,k_2 \in {\mathbb{Z}}$. Für jedes festgehaltene $k_1$ erhält man über $k_2 \mapsto (k_1,k_2)$ eine Kopie ${\mathbb{Z}}_{k_1} = \{(k_1,k_2):  k_2 \in {\mathbb{Z}}\}$ der ganzen Zahlen. Offensichtlich ist es möglich, alle diese Gitterpunkte in einer Folge $x_0,x_1,x_2,\ldots$ anzuordnen, indem man mit dem Punkt $x_0 = (0,0)$ beginnt, dann (in irgendeiner Reihenfolge) alle (insgesamt acht) Punkte nimmt, wo die betragsmäßig größte Koordinate $1$ oder $-1$ ist, also die Punkte $(0,\pm 1), (\pm1,0), (\pm 1,\pm 1)$, dann die (insgesamt 16) Punkte mit betragsmäßig größter Komponente $\pm 2$ etc. Damit ist sogar allgemein bewiesen, dass die Vereinigung (hier ${\mathbb{Z}}^2$) von abzählbar vielen abzählbaren Teilmengen (hier die ${\mathbb{Z}}_{k_1}$, $k_1 \in {\mathbb{Z}}$) wieder abzählbar ist. (Ganz versteckt und verkleidet fließt in der Aussage für Vereinigungen wieder das Auswahlaxiom ein. Wer erkennt es?) Anders formuliert: Das kartesische Produkt

\begin{displaymath}
X_1 \times X_2 = \{(x_1,x_2): x_i \in X_i\}
\end{displaymath}

von zwei abzählbaren Mengen ist wieder abzählbar. Da sich das Argument iterieren lässt, gilt das gleiche für das kartesische Produkt $X_1 \times \ldots \times X_n$ von $n=2,3,\ldots$, also beliebig endlich vielen abzählbaren Mengen $X_i$.


2.5 Abzählbarkeit von ${\mathbb{Q}}$

Eine interessante Folgerung ist die folgende: In der soeben konstruierten Folge von Punkten in der Ebene interpretieren wir $(0,0)$ als 0, $(k_1,k_2)$ mit $k_2 \neq 0$ als rationale Zahl (Bruch) $\frac{k_1}{k_2}$, lassen davon aber nur jene stehen, welche eine Zahl darstellt, die in der Folge nicht schon vorher aufgetreten ist. In der verbleibenden Folge kommt also jede rationale Zahl genau einmal vor. Somit erweist sich auch die Menge ${\mathbb{Q}}$ der rationalen Zahlen als abzählbar, obwohl sie unter anderer Betrachtungsweise scheinbar viel mehr Elemente anthält als ${\mathbb{N}}$ oder auch ${\mathbb{Z}}$: Auf der Zahlengerade liegen zwischen je zwei aufeinanderfolgenden ganzen Zahlen unendlich viele rationale.


2.6 Abzählbarkeit der Menge endlicher Folgen bzw. Wörter

Eine andere Variation ist die folgende: Gegeben ein Alphabet $A$ aus endlich oder sogar abzählbar unendlich vielen Buchstaben $a_1,a_2,\ldots$. Wir fragen uns, wieviele Wörter (das heißt endliche Folgen) wir aus diesen Buchstaben bilden können. (Wir wollen auch das leere Wort $\varepsilon $ der Länge 0 zulassen.) Nach Voraussetzung ist die Menge $W_1 = A$ aller Wörter der Länge 1 (die also aus einem Buchstaben bestehen) endlich bzw. abzählbar. Die Wörter der Länge 2 entsprechen in offensichtlicher Weise den Elementen des kartesischen Produktes $A^2 = A \times A$, bilden nach 2.4 also ebenso eine abzählbare Menge $W_2$, wie allgemein die Menge $W_n$ aller Wörter der Länge $n$ abzählbar ist. Damit ist aber wieder nach 2.4 auch die Menge $W = W(A)$ sämtlicher endlichen Wörter als Vereinigung der abzählbar vielen höchstens abzählbaren Mengen $W_0, W_1, W_2, \ldots$ abzählbar. (Für unendliche Wörter/Folgen siehe 2.8.)

Wir fassen bisher besproche abzählbare Mengen bzw. Variationen davon zusammen:

\begin{displaymath}
\begin{array}{lll}
{\mathbb{N}}& = & \{0,1,2,3,4,\ldots\} \\...
...,10,11,000,001,010,011,
100,101,110,111, \ldots\}.
\end{array}\end{displaymath}


2.7 Potenzmengen sind groß

Es scheint also nicht leicht, Mengen zu konstruieren, die nicht abzählbar sind. Die Klasse der abzählbaren Mengen ist nach unseren bisherigen Überlegungen nämlich sehr stabil gegenüber diversen scheinbar vergrößernden Operationen wie der Bildung von abzählbaren Vereinigungen und endlichen kartesischen Produkten.

Es war Cantors bahnbrechende Leistung zu erkennen, dass es aber sehr wohl überabzählbare Mengen gibt. (Es ist keine Übertreibung zu behaupten, dass die von Cantor begründete Mengentheorie ihre Existenz genau dieser Tatsache verdankt.) Und zwar bemerkte er, dass die Bildung der sogenannten Potenzmenge ${\cal P}(X)$, das heißt der Menge aller Teilmengen von $X$, stets zu einer größeren Menge führt. Gäbe es nämlich eine Zuordnung $x \mapsto f(x)$ zwischen $X$ und ${\cal P}(X)$, in welcher als $f(x)$ alle Teilmengen von $X$ auftreten, so könnte man die Menge $T$ aller $x \in X$ mit $x \notin f(x)$ betrachten. Ist $T = f(x_0)$ (so ein $x_0 \in X$ gäbe es nach Voraussetzung), so wäre $x_0 \in T$ genau dann, wenn $x_0 \notin T$. Das ist absurd, also kann es die gesuchte Zuordnung nicht geben. Genau in diesem Sinne muss die Potenzmenge ${\cal P}(X)$ also mehr Elemente besitzen als die ursprüngliche Menge $X$. Insbesondere ist die Potenzmenge einer unendlichen Menge niemals abzählbar, sondern größer, also überabzählbar.


2.8 Überabzählbarkeit des Kontinuums

Wir wollen diesen Sachverhalt noch im Fall $X = {\mathbb{N}}$ genauer unter die Lupe nehmen. ${\cal P}({\mathbb{N}})$ ist nach 2.7 überabzählbar. Jeder Teilmenge $T$ von ${\mathbb{N}}$ ist in natürlicher Weise eine Folge $a_0,a_1,\ldots$ zugeordnet, indem man $a_n =1$ für $n \in T$ und $a_n = 0$ für $n \notin T$ setzt. Fassen wir solche 0-1-Folgen wiederum auf als Binärdarstellungen von reellen Zahlen

\begin{displaymath}
x = \sum_{n=0}^{\infty} \frac{a_n}{2^{n+1}},
\end{displaymath}

so erhalten wir eine (fast umkehrbar eindeutige) Zuordnung zwischen Teilmengen von ${\mathbb{N}}$ und solchen Zahlen $x$. Die $x$ liegen alle im Einheitsintervall $[0,1]$ aller reellen Zahlen zwischen 0 und 1. Umgekehrt besitzt jedes solche $x$ eine Binärdarstellung, die nur dann nicht eindeutig ist, wenn ab einem gewissen Glied nur die Ziffer 0 oder nur die Ziffer 1 auftritt. Diese beiden Fälle lassen sich ineinander überführen. (So wie sich dekadisch $0.100000\ldots = 0.099999\ldots$ schreiben lässt.) Diese abbrechenden unendlichen Binärdarstellungen entsprechen nämlich genau den Zahlen

\begin{displaymath}
0.w011111\ldots = \sum_{i=0}^{n-1} \frac{a_i}{2^{i+1}} +
\...
...-1} \frac{a_i}{2^{i+1}} + \frac 1{2^{n+1}} =
0.w100000\ldots,
\end{displaymath}

wobei $w = a_0a_1 \ldots a_{n-1}$, $a_i \in \{0,1\}$, irgendeine Vorperiode bezeichnet. Dabei durchläuft $w \in W(A)$ genau sämtliche endlichen Wörter, welche nach 2.6 nur abzählbar viele sind. Die übrigen Binärdarstellungen, die nämlich nicht schließlich nur mehr aus Nullen oder nur mehr aus Einsen bestehen, müssen daher überabzählbar viele sein. (Denn abzählbar plus abzählbar ergäbe ja nur abzählbar.) Da diese die eindeutigen Binärdarstellungen von reellen Zahlen zwischen 0 und 1 sind, ist also auch das Intervall $[0,1]$ überabzählbar. Durch die bijektive Zuordnung $x \in [0,1] \mapsto a+(b-a)x \in [a,b]$ überträgt sich diese Eigenschaft auf beliebige nichtausgeartete Intervalle $[a,b]$.

Man nennt die (gemeinsame) Kardinalität = Mächtigkeit = Größe $\vert{\cal P}({\mathbb{N}})\vert = \vert[0,1]\vert = \vert[a,b]\vert$ dieser Mengen übrigens auch die Kardinalität des Kontinuums. Es sei auf einige kurze Bemerkungen zur Kontinuumshypothese am Ende von 4.4 verwiesen.

Wir halten fest: Das Einheitsintervall (und damit jedes Intervall reeller Zahlen) ist überabzählbar. Desgleichen jede Menge, in die ein Intervall eingebettet werden kann, also etwa jede eindimensionale Kurve (zum Beispiel die Kreislinie $S^1$) und erst recht $S^2$ (die zweidimensionale Oberfläche einer Kugel) oder gar $K$ (die dreidimensionale Vollkugel). Diese Mengen sind also alle sehr groß im Vergleich zu abzählbaren Mengen.


2.9 Große Kardinalitäten als Gegenstand der Mengenlehre

Aus 2.7 folgt, dass von $\vert{\mathbb{N}}\vert$ ausgehend durch iterierte Potenzmengenbildung immer größere Unendlichkeiten konstruiert werden können. Die verschiedenen Unendlichkeiten steigen also selbst unendlich an. Die Beschäftigung damit ist der Kern der Mengenlehre. Die für uns wichtigen Mengen ${\mathbb{R}}$, ${\mathbb{R}}^n$, $S^1$, $S^2$ erweisen sich aber alle als genau von der Mächtigkeit des Kontinuums. Dass sie mindestens so groß sind, haben wir uns bereits überlegt; dass sie nicht größer sind, brauchen wir nicht. (Wir überlassen den Nachweis dem interessierten Leser als sehr instruktive Übung. Bei dieser Gelegenheit wollen wir auch auf den Satz von Schröder-Bernstein aufmerksam machen: Ist $A$ zu einer Teilmenge von $B$ gleich mächtig und $B$ zu einer Teilmenge von $A$, dann sind $A$ und $B$ gleich mächtig. Formal: Aus $\vert A\vert \le \vert B\vert$ und $\vert B\vert \le \vert A\vert$ folgt $\vert A\vert=\vert B\vert$.)

Nach diesem Exkurs in die Grundbegriffe unendlicher Mengen wollen wir bisher präsentierte Ideen noch in einigen konkreten Zusammenhängen wiederholen beziehungsweise modifizieren. Das wird sich für den Beweis des PvBT noch als nützlich erweisen.


2.10 Hilberts Hotel

Hilbert veranschaulichte einige der behandelten Phänomene mit einem Bild, welches als Hilberts Hotel bekannt ist. Man stelle sich dazu ein Hotel mit abzählbar unendlich vielen Zimmern vor, welche alle besetzt sind. Kommt nun ein weiterer Reisender an, der Unterkunft sucht, so kann ihm leicht geholfen werden. Sind die Zimmer mit $Z_0,Z_1,Z_2,\ldots$ durchnummeriert, so muss lediglich jeder Gast in das Zimmer mit der nächst höheren Nummer wechseln. Damit wird das Zimmer $Z_0$ frei, und unser Neuankömmling kann einziehen. Offenbar entspricht das genau der Beziehung $\vert{\mathbb{N}}\vert = \vert{\mathbb{N}}^+\vert$ aus 2.1. (Es mag die Vorstellungskraft von Leser und Schüler anregen, auch andere behandelte Paradoxien des Unendlichen in den Kontext von Hilberts Hotel zu übertragen.)


2.11 Hilberts Hotel auf dem Kreis aufgewickelt

Weil es auch für unsere späteren Zwecke nützlich ist, wollen wir uns nun die Zimmer von Hilberts Hotel durch Punkte auf einer Kreislinie $S^1$ dargestellt denken. Und zwar beginnen wir mit irgendeinem Punkt $Z_0$. Von diesem tragen wir einen Winkel $\alpha$, $0 < \alpha < 2\pi$, (etwa im Uhrzeigersinn) auf und markieren dort $Z_1$. Wir setzen in dieser Weise fort, markieren also $Z_n$ beim Winkel $n\alpha$. Irgendwann werden wir erstmals eine ganze Drehung $2 \pi = 360^{\circ}$ überschreiten. Wenn $\alpha$ nicht gerade von der Gestalt $\frac {2\pi}n$ ist, werden wir aber nicht genau auf $Z_0$ treffen. Ist $\frac{\alpha}{2\pi} = \frac mn \in {\mathbb{Q}}$ (gekürzte Darstellung) wird uns das immerhin noch nach $m$ vollen Umläufen passieren. Ist $\frac{\alpha}{2\pi}$ jedoch irrational (nicht als Bruch ganzer Zahlen darstellbar), so werden wir nie einen Punkt mehrmals markieren. Dies soll in weiterer Folge vorausgesetzt werden.

Wir haben also die Menge der Zimmer $Z_n$ als Teilmenge von $S^1$ dargestellt, man sagt auch in die Kreislinie $S^1$ eingebettet. Dem großen Umzug von Zimmer $Z_n$ nach Zimmer $Z_{n+1}$ entspricht jetzt einfach eine Drehung $h$ um den Winkel $\alpha$. Der Punkt $Z_0$ wird dadurch frei.

Bezeichne $D$ die Menge der $Z_n$, $n \in {\mathbb{N}}$, und $A = S^1 \setminus D$ den Rest der Kreislinie. Dann gilt offenbar die Darstellung $X = A \cup D$, gleichzeitig aber auch $X \setminus \{Z_0\} = A \cup h(D)$ mit jeweils disjunkten Teilmengen. Durch Anwendung der Drehung $h$ auf die Menge $D$ ist also ein Punkt abhandengekommen, bzw., wenn man die Konstruktion umkehrt, dazugekommen. Das ist das erste Beispiel einer paradoxen Zerlegung, in welcher geometrische Objekte (Kreislinie) und größenerhaltende Bewegungen (Drehungen) vorkommen, die dennoch Punkte gewissermaßen herbei- oder wegzaubern.


2.12 Absorption abzählbarer Teilmengen des Kreises

Keine großen Schwierigkeiten macht die Übertragung auf den Fall, dass man statt mit einem Punkt $Z_0$ mit einer beliebigen abzählbaren Teilmenge $D$ der Kreislinie beginnt. Wir wollen eine Drehung $h$ um einen geeigneten Winkel $\alpha$ finden derart, dass iterierte Anwendung von $h$ zu Mengen $D, h(D), h^2(D), \ldots$ führt, die wieder paarweise disjunkt sind. Das funktioniert im Wesentlichen deshalb, weil uns viel mehr $\alpha \in S^1$ zur Auswahl stehen als Punkte $d \in D$, die Schwierigkeiten machen könnten.

Etwas genauer ausgeführt lautet das Argument wie folgt: Besteht $D$ aus den Punkten $d_0,d_1,d_2,\ldots$, so gibt es zu jedem Paar $(k,l)$ von Indizes und jeder Potenz $n$ nur endlich viele Werte für $\alpha$ (nämlich $\alpha = d_k-d_l + \frac in$ mit $i=0,1,\ldots,n-1$) derart, dass $h^n(d_l) = d_k$. Zu jedem Tripel $(k,l,n) \in {\mathbb{N}}^3$ gibt es also nur eine endliche Menge $E(k,l,n)$ verbotener Werte für $\alpha$. Wir wissen bereits, dass ${\mathbb{N}}^3$ abzählbar ist. Daher ist die gesamte Ausnahmemenge $E$ als Vereinigung der abzählbar vielen endlichen Mengen $E(k,l,n)$ abzählbar. Es muss daher überabzählbar viele $\alpha \in S^1 \setminus E$ geben, von denen wir jedes wählen können. Sei also so ein $\alpha$ festgehalten und bezeichne $h$ die Drehung um den Winkel $\alpha$, $B$ die Vereinigung aller $h^n(D)$, $n \in {\mathbb{N}}$, und $A = S^1 \setminus B$ den Rest. Dann haben wir die Darstellungen $S^1 = A \cup B$ und $S^1 \setminus D = A \cup h(B)$, wieder jeweils mit paarweise disjunkten Mengen. Auch jede abzählbar unendliche Teilmenge $D$ der Kreislinie kann also her- bzw. weggedreht werden.


2.13 Das Gleiche nochmals mit der Sphäre

Ganz Ähnliches funktioniert, wenn wir statt der eindimensionalen Kreislinie $S^1$ die zweidimensionale Sphäre $S^2$ betrachten. Sei eine beliebige höchstens abzählbare Menge $D \subset S^2$ von Punkten auf der Sphäre gegeben. Fassen wir gegenüberliegende (antipodische) Punkte auf $S^2$ zu Paaren zusammen, so erhalten wir überabzählbar viele Punktepaare (andernfalls wäre nach früheren Ergebnissen $S^2$ abzählbar, was nach 2.8 falsch ist). Demnach gibt es Punktepaare, in denen kein Partner in $D$ liegt. Durch ein solches Punktepaar legen wir eine Rotationsachse $a$. Nach derselben Überlegung wie in 2.12 kann man einen Winkel finden, sodass für die Rotation $h$ um diesen Winkel mit Achse $a$ alle Mengen $D, h(D), h^2(D), \ldots$ paarweise disjunkt sind. Wie für $S^1$ induziert das auch Zerlegungen $S^2 = A \cup B$ und $S^2 \setminus D = A \cup h(B)$.


2.14 Das Konzept der Zerlegungsäquivalenz

In solchen Situationen wie den in den drei letzten Abschnitten behandelten sprechen wir von zerlegungsgleichen Mengen und schreiben $S^1 \sim S^1 \setminus D$ bzw. $S^2 \sim S^2 \setminus D$.

Vermutlich wird der Leser das Paradoxe an den bisher behandelten Beispielen bei weitem nicht so beeindruckend finden wie im PvBT. Das liegt wohl daran, dass die Menge $D$, die her- oder weggezaubert werden kann, sehr klein (abzählbar) ist im Vergleich zu den überabzählbaren Mengen $S^1$ und $S^2$. Tatsächlich lässt sich in maßtheoretischer Hinsicht damit auch nichts Außergewöhnliches gewinnen. Die Menge $D$ hat einfach das Maß 0.

Dennoch werden wir die gewonnen Einsichten noch erfolgreich einsetzen können. Als wesentlichen Schritt in Richtung PvBT werden wir nämlich das Hausdorffsche Paradoxon beweisen, welches eine paradoxe Zerlegung von $S^2 \setminus D$ liefert, wobei $D$ abzählbar ist. Die Zerlegungsäquivalenz zu $S^2$ wird dann zu einer paradoxen Zerlegung von ganz $S^2$ führen.


3 Der Beweis des Paradoxons von Banach-Tarski


3.1 Hausdorffs wichtiger Beitrag

Wie bereits angekündigt, werden wir zunächst eine paradoxe Zerlegung von $S^2 \setminus D$ konstruieren, wobei $D$ eine geeignete abzählbare Menge ist. Genauer: Wir werden $S^2 \setminus D$ in paarweise disjunkte Mengen $A_1,A_2,B_1,B_2,B_3$ zerlegen und zu diesen zwei Drehungen $\sigma$ und $\tau$ finden derart, dass

\begin{displaymath}
\begin{array}{lll}
S^2 \setminus D &=& A_1 \cup A_2 \cup B_1...
... A_1 \cup \sigma(A_2) = \\
&=& B_1 \cup \tau(B_2)
\end{array}\end{displaymath}

gilt.

Als $\sigma$ werden wir eine Drehung um einen geeigneten Winkel $\alpha$ mit der $z$-Achse als Rotationsachse wählen. Ist $x$ ein beliebiger Punkt auf der Sphäre, wobei wir nur die beiden Fixpunkte, nämlich Nord- und Südpol ausschließen, so zeigen die Überlegungen aus 2.11, dass die Punkte $x, \sigma(x), \sigma^2(x), \ldots$ (der sogenannte $\sigma$-Orbit von $x$) alle verschieden sind. Entsprechendes gilt, wenn wir z.B. statt der $z$-Achse die $x$-Achse als Rotationsachse wählen und die beiden Punkte verbieten, in welchen sie $S^2$ schneidet. Wir kommen darauf später zurück.

Es soll darauf hingewiesen werden, dass der maßtheoretische Kern des PvBT (für die zweidimensionale Kugeloberfläche statt für die dreidimensionale Vollkugel) bereits mit dem Abschluss des Beweises des Hausdorffschen Paradoxons in 3.7 bewältigt sein wird. Gibt man nämlich der überabzählbaren Menge $S^2$ das Maß 1, so wird man der abzählbaren Teilmenge $D$ sinnvollerweise nur das Maß 0 zuordnen können. Denn jedes endliche Vielfache einer abzählbaren Menge ist wieder abzählbar. Endliche Vielfache von $D$ können also niemals ganz $S^2$ ausmachen. Wäre das Maß von $D$ positiv, so wäre demnach jenes von $S^2$ größer als jedes endliche Vielfache dieser Zahl, somit unendlich.

Was in der paradoxen Zerlegung auf ganz $S^2$ noch fehlt, ist für den Maßtheoretiker also vernachlässigbar. Insofern scheint es berechtigt, den Beweis des Hausdorffschen Paradoxons als den Kern im Beweis des PvBT zu betrachten.


3.2 Die von zwei Elementen frei erzeugte Gruppe

Wir fragen uns, was wir erhalten, wenn wir zunächst nicht näher bestimmte Drehungen $\sigma$ und $\tau$ in beliebiger Reihenfolge und in positiver und negativer Richtung auf $x$ anwenden. Als sogenannte Orbitpunkte erhalten wir also beispielsweise $\sigma \tau(x)$, $\tau \sigma(x)$, $\sigma^{-1} \tau^2(x)$ etc. Man beachte, dass es keinen Grund gibt anzunehmen, dass manche dieser Punkte übereinstimmen. Insbesondere gilt allgemein kein Kommutativgesetz.

Wollen wir die Situation formal fassen, bietet es sich an, die Sprechweise aus 2.6 zu wählen. Wir haben also (endliche) Wörter $w$ mit Buchstaben oder Symbolen $\rho \in A = \{\sigma, \sigma^{-1}, \tau, \tau^{-1}\}$ zu bilden. Wir dürfen außerdem verlangen, dass $w$ reduziert ist, das heißt, dass die beiden Symbole $\sigma$ und $\sigma^{-1}$ nicht unmittelbar hintereinander stehen, da man sie ja sonst wegkürzen könnte. Die Menge all dieser Wörter trägt eine Gruppenstruktur: Als Produkt zweier Wörter $w_1$ und $w_2$ haben wir einfach das Kompositum $w_1w_2$ zu nehmen. Stoßen an der Schnittstelle zwei Symbole $\rho$ und $\rho^{-1}$ zusammen, dann können wir durch Wegkürzen erzwingen, dass auch das Produkt ein reduziertes Wort ist.

Beispiel: Für $w_1 = \sigma^2\tau^{-1} = \sigma\sigma\tau^{-1}$ und $w_2 = \tau \sigma^{-1} \tau \sigma \tau$ kürzen sich in $w_1w_2$ die letzten beiden Glieder von $w_1$ gegen die ersten beiden von $w_2$ weg, und wir erhalten

\begin{displaymath}
w_1w_2 = (\sigma \sigma \tau^{-1})(\tau \sigma^{-1} \tau \si...
...tau \sigma^{-1}) \tau \sigma \tau) =
\sigma \tau \sigma \tau.
\end{displaymath}

Zum Nachweis der Gruppeneigenschaften ist nur zu bemerken, dass man in der beschriebenen Weise wirklich wieder reduzierte Worte erhält, dass offenbar das Assoziativgesetz $(w_1w_2)w_3=w_1(w_2w_3)$ gilt, dass das leere Wort $w = \varepsilon $ die Rolle des neutralen Elements spielt und dass jedes Wort $w = \rho_1\rho_2\ldots\rho_n$ ein Inverses, nämlich $w^{-1} = \rho_n^{-1}\ldots\rho_2^{-1}\rho_1^{-1}$ besitzt. (Hier ist natürlich $(\rho^{-1})^{-1} = \rho$ für $\rho = \sigma, \tau$ zu vereinbaren.)

Die Menge $F$ aller reduzierten Wörter mit der beschriebenen Gruppenstruktur heißt auch die von den Symbolen $\sigma$ und $\tau$ frei erzeugte Gruppe. Wenn wir kurz von der freien Gruppe sprechen, werden wir immer diese Gruppe meinen.

Wegen $F \subset W = W(A)$, $A = \{\sigma, \sigma^{-1}, \tau, \tau^{-1}\}$, ist $F$ nach 2.6 abzählbar. Von dieser Tatsache werden wir wiederholt Gebrauch machen.

Eine kurze und etwas ungenaue Bemerkung zum Wort frei: Wir können hier nicht auf die sehr interessanten und allgemeinen Eigenschaften freier Gruppen (oder noch allgemeiner: freier Objekte) eingehen. In unserem Kontext genügt es, wenn man sich vorstellt, dass die freie Gruppe frei ist von (einschränkenden) Gesetzen, die nicht allein aus den Gruppenaxiomen folgen. So folgt beispielsweise das Kommutativgesetz nicht allgemein und gilt tatsächlich nicht in $F$.


3.3 Hausdorffs entscheidende Beobachtung: Eine paradoxe Zerlegung der freien Gruppe

Eine wichtige Vorstellung, die der Mathematiker mit dem Begriff der Gruppe verbindet, besteht darin, dass jedes Gruppenelement $g \in G$ als Transformation $\pi_g: G \to G$, $\pi_g: x \mapsto gx$, der Gruppe auf sich selbst interpretiert werden kann. (Dieses Faktum ist auch als Darstellungssatz von Cayley bekannt, wobei es vor allem um die Relation $\pi_{g_1g_2} = \pi_{g_1}\pi_{g_2}$ geht.) Diese Transformationen sind stets umkehrbar eindeutig, bewahren also gewissermaßen alle Informationen. Bei kommutativen Gruppen wie ${\mathbb{Z}}$ oder ${\mathbb{R}}$ sind die $\pi_g$ Translationen (Verschiebungen) um die additive Konstante $g$. Das entspricht der in diesem Fall unverfänglichen Intuition, dass die durch Gruppenelemente induzierten Transformationen die Größe von Mengen nicht verändern.

Der erste entscheidende Schritt für den Beweis des RvBT ist die einfache Beobachtung, dass im Fall der freien Gruppe etwas passiert, was dieser Intuition widerspricht. Es liegt nämlich nahe, die Wörter in $F$ einzuteilen nach Anfangssymbol. Bezeichne also $F_{\rho}$ die Menge jener $w \in F$, welche mit dem Symbol $\rho \in \{\sigma, \sigma^{-1}, \tau, \tau^{-1}$ beginnen, so liegt die Partition

\begin{displaymath}
F = F_{\sigma} \cup F_{\sigma^{-1}} \cup F_{\tau} \cup F_{\tau^{-1}}
\cup \{\varepsilon \}
\end{displaymath}

auf der Hand. Vernachlässigen wir die Einermenge $\{\varepsilon \}$, so stellt jedes $F_{\rho}$ gewissermaßen ein Viertel von $F$ dar. Multiplizieren wir aber Elemente $w = \sigma^{-1}w'$ aus $F_{\sigma^{-1}}$ von links mit $\sigma$, so kürzt sich das erste Symbol weg, und es bleibt $w'$ übrig. Die einzige Einschränkung für $w'$ ergibt sich aus der Reduziertheit von $w$. Das bedeutet, dass $w'$ nicht mit $\sigma$ beginnen kann. Da alles andere möglich ist, kann $w'$ ein beliebiges Element in $F \setminus F_{\sigma}$ sein. In obiger Schreibweise notiert bedeutet das

\begin{displaymath}
\pi_{\sigma}(F_{\sigma^{-1}}) = \sigma F_{\sigma^{-1}} =
F...
...F_{\tau^{-1}} \cup \{\varepsilon \} =
F \setminus F_{\sigma}.
\end{displaymath}

Aus dem Viertel $F_{\sigma^{-1}}$ wurde durch Anwendung der Transformation $\pi_{\sigma}$ also ein Dreiviertel von $F$. Da sich das gleiche Spiel mit $\tau$ statt $\sigma$ treiben lässt, kann man ebenso das Viertel $F_{\tau^{-1}}$ zum Dreiviertel $\tau(F_{\tau^{-1}}) = F \setminus F_{\tau}$ aufblasen. In Mengengleichungen haben wir also, wenn wir $A_1 = F_{\sigma}$, $A_2 = F_{\sigma^{-1}}$, $B_1 = F_{\tau}$, $B_2 = F_{\tau^{-1}}$ und $B_3 = \{\varepsilon \}$ setzen und für $\pi_{\rho}$ kurz $\rho$ schreiben, die an 3.1 erinnernde paradoxe Zerlegung

\begin{displaymath}
\begin{array}{lll}
F &=& A_1 \cup A_2 \cup B_1 \cup B_2 \cup...
...A_1 \cup \sigma(A_2) = \\
&=& B_1 \cup \tau(B_2).
\end{array}\end{displaymath}

Wir werden diese Zerlegung von Mengen formaler Zeichenketten verwenden, um auch zu geometrisch paradox anmutenden Zerlegungen wie im PvBT zu gelangen.


3.4 Typische Orbits unter der freien Gruppe

In der Definition der freien Gruppe mit den Erzeugenden $\sigma$ und $\tau$ wurde überhaupt nicht von einer Interpretation dieser beiden Elemente als Rotationen oder auch nur als Abbildungen Gebrauch gemacht. Die freie Gruppe ist in diesem Sinne ein rein formales, nur Symbole und deren Manipulation voraussetzendes Objekt.

Die für uns entscheidende Frage ist, ob sich die Orbits $O_F(x) = \{w(x): w \in F\}$ eines Punktes $x \in S^2$ unter $F$ so verhalten können wie die freie Gruppe $F$ selbst. Dabei fassen wir die Worte $w$ jetzt als Rotationen im ${\mathbb{R}}^3$ auf, welche sich aus den erzeugenden Rotationen $\sigma$ und $\tau$ und deren Inversen zusammensetzen. Wunschgemäßes Verhalten tritt offenbar genau dann auf, wenn $w_1(x)=w_2(x)$ nur bei Übereinstimmung der reduzierten Wörter $w_1=w_2$ als solcher vorliegt. Da die Gleichung $w_1=w_2$ mit $w_1w_2^{-1} = \varepsilon $ äquivalent ist, kann man die Bedingung auch so ausdrücken: $w(x)=x$ nur für $w = \varepsilon $. Wir sagen in diesem Fall, dass $x$ kein Fixpunkt von $F$ ist und wollen den Orbit $O_F(x)$ fixpunktfrei oder typisch nennen.

Für einen typischen Orbit $O_F(x)$ können wir die paradoxe Zerlegung von $F$ aus 3.3 offenbar unmittelbar übertragen zur entsprechenden paradoxen Zerlegung

\begin{displaymath}
\begin{array}{lll}
O_F(x) & = & A_1(x) \cup A_2(x) \cup B_1(...
...sigma(A_2(x)) = \\
& = & B_1(x) \cup \tau(B_2(x))
\end{array}\end{displaymath}

von $O_F(x)$.


3.5 Das Zusammensetzen der typischen Orbits

Die paradoxe Zerlegung eines typischen Orbits lässt sich in (fast) trivialer Weise auf die Vereinigung $X$ aller typischen Orbits übertragen.

Zunächst ist klar, dass $O_1 = O_F(x_1)$ und $O_2 = O_F(x_2)$ entweder disjunkt oder identisch sind. (Sei $y = w_1(x_1) = w_2(x_2) \in O_1 \cap O_2$, dann folgt aus $z = w(x_1) \in O_1$ auch $z = ww_1^{-1}w_2(x_2) \in O_2$, also $O_1 \subseteq O_2$. Analog gilt $O_2 \subseteq O_1$, also $O_1 = O_2$.) $S^2$ ist also die disjunkte Zerlegung sämtlicher Orbits. Aus jedem typischen Orbit $O$ sei nun ein $x_O \in O$ ausgewählt. Als $A_1$ wählen wir die Vereinigung aller $A_1(x_O)$, wobei $O$ sämtliche typischen Orbits durchläuft. In völlig analoger Weise definiert man $A_2$, $B_1$, $B_2$ und $B_3$ und erhält eine paradoxe Zerlegung der Vereinigung $X$ aller typischen Orbits.

(Dass es zu jeder disjunkten Menge nichtleerer Mengen so eine Auswahlfunktion $O \mapsto x_O$ gibt, ist genau die Aussage des sogenannten Auswahlaxioms aus der Mengenlehre. Manche Mathematiker legen Wert darauf, penibel anzugeben, wenn sie dieses Axiom verwendet haben. Einzelne Vereinsamte lehnen seine Verwendung sogar generell ab. Doch mehr davon in 4.4.)

Wir sind mit dem Beweis des Hausdorffschen Paradoxons fertig, wenn wir zeigen können, dass die Restmenge bei geeigneter Wahl von $D = S^2 \setminus X$ abzählbar ist. Hierzu eine geometrische Überlegung.

Jedes $w \in F$ repräsentiert eine Bewegungung, welche als Komposition von $\sigma$ und $\tau$ und ihren Inversen zustandekommt. Angenommen, es handelt sich dabei nicht um die identische Abbildung $\mbox{Id}$, welche alle Punkte fest lässt. Sei dennoch $x = w(x)$ ein Fixpunkt von $w$. (Die aus der Linearen Algebra bekannte Tatsache, dass jedes derartige $w$ in ${\mathbb{R}}^3$ wirklich zwei Fixpunkte hat, benötigen wir hier nicht einmal.) Dann handelt es sich bei $w$ offenbar um eine Drehung um eine Rotationsachse, die durch $x$ und den gegenüberliegenden (antipodischen) Punkt $-x$ geht. Alle übrigen Punkte werden durch $w$ bewegt und bleiben nicht fix. Jedes $w \neq \mbox{Id}$ hat also nur zwei Fixpunkte.

Angenommen, nur das leere Wort $\varepsilon $ stellt die identische Abbildung dar, so liefern die abzählbar vielen $w \in F \setminus \{\varepsilon \}$ also nur abzählbar viele Fixpunkte $x$. Jedes solche $x$ hat einen höchstens abzählbaren Orbit $O_F(x)$, somit machen die nicht typischen Orbits nur eine abzählbare Ausnahmemenge $D$ aus, und der Beweis ist fertig.

Offen bleibt also lediglich die Frage, ob $\sigma$ und $\tau$ geeignet gewählt werden können derart, dass tatsächlich nur das leere Wort die identische Abbildung darstellt. Es erscheint sehr plausibel, dass dies möglich ist. Schließlich müssen nur die abzählbar vielen Bedingungen $w \neq \varepsilon $, $w \in F \setminus \{\varepsilon \}$, erfüllt werden, während für die Rotationswinkel und die Winkel der beiden Rotationsachsen zueinander überabzählbar viele Werte zur Verfügung stehen. Wie die nachfolgenden Argumente zeigen, führt uns diese Plausibilitätsüberlegung nicht in die Irre.


3.6 Die Abbildungsgleichungen geeigneter Rotationen

Wir wollen uns aber mit dem Plausibilitätsargument aus 3.5 nicht zufriedengeben. Glücklicherweise lassen sich sehr einfach zwei konkrete Wahlen von $\sigma$ und $\tau$ angeben, die freie Erzeugende einer freien Untergruppe der vollen Drehgruppe sind. Und zwar kann man zwei Rotationen mit orthogonalen Achsen und dem Rotationswinkel $\alpha = \arccos \frac 13$ wählen.

Sei $\sigma: (x,y,z) \mapsto (x',y',z')$ durch folgende Gleichungen definiert.

\begin{displaymath}
\begin{array}{llrrr}
x' & = & \frac 13 x & - \frac{2 \sqrt 2...
...ac{2 \sqrt 2}3x & + \frac 13 y & \\
z' & = & & & z
\end{array}\end{displaymath}

Die Abbildung $\sigma$ verändert nichts an der $z$-Koordinate, während umgekehrt $x'$ und $y'$ nur von $x$ und $y$, nicht aber von $z$ abhängen. Die Transformation $\sigma$ wird deshalb hinreichend verstanden, wenn klar ist, was sie für $z=0$, also innerhalb der $x$-$y$-Ebene bewirkt. Innerhalb dieser wird der Punkt $e_1 = (1,0)$ auf den Punkt $e'_1 = (\frac 13, \frac{2 \sqrt 2}2)$ abgebildet. Da $e'_1$ nach dem pythagoräischen Lehrsatz ebenso wie $e_1$ auf dem Einheitskreis liegt, entspricht das zunächst für diesen Punkt tatsächlich einer Drehung mit Drehzentrum im Ursprung. Der Drehwinkel $\alpha$ ist durch die Gleichungen $\cos \alpha = \frac13$, $\sin \alpha = \frac{2 \sqrt 2}3$ bestimmt, also $\alpha = \arccos \frac 13$. Die analoge Überlegung für $e_2=(0,1)$ und $e'_2 = (-\frac{2\sqrt 2}3,\frac 13)$ bestätigt das auch für den anderen Basispunkt. $\sigma$ bewahrt als lineare Abbildung Linearkombinationen; jeder beliebige Punkt der Grundebenebene $z=0$ ist Linearkombination der beiden Basisvektoren $e_1$ und $e_2$. Deshalb dreht $\sigma$ jeden Punkt dieser Ebene um den Ursprung $(0,0,0)$ und jede dazu parallele Ebene $z = c$, $c \in {\mathbb{R}}$, um den Punkt $(0,0,c)$, jeweils um denselben Winkel $\alpha$. Also stellen obige Abbildungsgleichungen für $\sigma$ die Drehung um den Winkel $\alpha = \arccos \frac 13$ mit der $z$-Achse als Rotationsachse dar. (Diese vielleicht etwas umständlich anmutende geometrische Überlegung wurde so dargestellt, um eine Möglichkeit zur Vermeidung des in der Schule nicht zum Standardrepertoir gehörenden Matrizenkalküls zu skizzieren.)

Ganz analog überlegt man sich, dass die Drehung $\tau: (x,y,z) \mapsto (x',y',z')$ um die $x$-Achse um denselben Winkel $\alpha = \arccos \frac 13$ durch die Gleichungen

\begin{displaymath}
\begin{array}{llrrr}
x' & = & x & & \\
y' & = & & \frac 13 ...
...3z \\
z' & = & & \frac{2 \sqrt 2}3y & + \frac 13 z
\end{array}\end{displaymath}

beschrieben wird.

Außerdem sei darauf hingewiesen, dass bei der Umkehrung der Rotationsrichtung, d.h. bei Ersetzung von $\sigma$ und $\tau$ durch $\sigma^{-1}$ bzw. $\tau^{-1}$ in den Abbildungsgleichungen nur die Vorzeichen der Ausdrücke vom Betrag $\frac{2 \sqrt 2}3$ geändert werden müssen.


3.7 Eine kurze Rechnung

Um zu beweisen, dass die angegebenen Drehungen $\sigma$ und $\tau$ wirklich eine freie Gruppe erzeugen, müssen wir zeigen, dass jedes reduzierte Wort $w \in F \setminus \{\varepsilon \}$ eine Rotation verschieden von der Identität darstellt. Dafür genügt es, einen einzigen Punkt zu finden, der nicht auf sich abgebildet wird. Hört $w$ mit einer positiven oder negativen Potenz von $\sigma$ auf, so erweist sich der Punkt $(1,0,0)$ als geeignet; im anderen Fall, dass nämlich $w$ mit einer positiven oder negativen Potenz von $\tau$ aufhört, muss dann aus Symmetriegründen der Punkt $(0,0,1)$ die entsprechende Eigenschaft haben. Wir dürfen uns für den Beweis daher auf den ersten Fall beschränken.

Durch vollständige Induktion nach der Länge $k$ von $w$ überzeugt man sich davon, dass $w(1,0,0) = (a,b \sqrt 2,c)/ 3^k$ gilt mit ganzen Zahlen $a,b,c$. Für $k=1$ ist das unmittelbar durch Einsetzen in die Abbildungsgleichungen aus 3.6 ersichtlich. Für $k>1$ hat man die vier möglichen Fälle für das erste Symbol $\rho$ in $w = \rho w'$ zu unterscheiden. Mit $w'(1,0,0) = (a',b' \sqrt 2, c')/ 3^{k-1}$ (Induktionsannahme) erhält man durch Einsetzen in die Abbildungsgleichung von $\rho$ im Fall $\rho = \sigma^{\pm 1}$ die Rekursion $a = a' \mp 4b'$, $b = b' \pm 2a'$, $c = 3c'$; im Fall $\rho = \tau^{\pm 1}$ entsprechend $a = 3a'$, $b = b' \mp 2c'$, $c = c' \pm 4b'$. Das zeigt die Ganzzahligkeit von $a,b,c$.

Offen ist nur noch $w(1,0,0) = (a,b \sqrt 2 ,c)/3^k \neq (1,0,0)$. Dazu genügt der Nachweis, dass $b$ nicht durch 3 teilbar ist. Besteht $w$ nur aus einem Symbol, welches dann in unserem Fall $\sigma^{\pm 1}$ sein muss, so ist $b=1$ tatsächlich nicht durch 3 teilbar. Ist das Wort $w$ länger, so sind für die ersten zwei Symbole $\rho_1, \rho_2$ in $w = \rho_1 \rho_2 v$ vier Möglichkeiten zu unterscheiden, nämlich $\rho_1 \rho_2 = \sigma^{\pm 1} \tau^{\pm 1}$, $\tau^{\pm 1} \sigma^{\pm 1}$, $\sigma^{\pm 2}$ oder $\tau^{\pm 2}$. Im ersten Fall erhält man aus der Rekursion ein durch 3 teilbares $c'$, also kann mit $b'$ auch $b = b' \mp 2c'$ nicht durch 3 teilbar sein. Ähnlich verhält sich der zweite Fall mit $b = b' \pm 2a'$ und durch 3 teilbarem $a'$. In den verbleibenden beiden Fällen muss man in der Rekursion einen Schritt weiter zurückgreifen und $v(1,0,0) = (a'',b'' \sqrt 2,c'')$ heranziehen. In beiden Fällen erhält man (hier für den dritten Fall durchgeführt) mit Hilfe der Rekursion

\begin{displaymath}
b = b' \pm 2a' = b' \pm 2(a'' \mp 4b'') = b' + b'' \pm 2a'' - 9b''
= 2b' - 9b''.
\end{displaymath}

Die Eigenschaft, nicht durch 3 teilbar zu sein, vererbt sich also von $b'$ auf $b$.

Damit ist der Beweis des Hausdorffschen Paradoxons, wie es in 3.1 formuliert wurde, erbracht.


3.8 Eine paradoxe Zerlegung der Sphäre

Der Schritt zu einer paradoxen Zerlegung der gesamten Kugeloberfläche liegt auf der Hand. Wir wissen nämlich einerseits aus den letzten Abschnitten, dass es eine abzählbare Teilmenge $D \subset S^2$ gibt, so dass $S^2 \setminus D$ eine paradoxe Zerlegung besitzt. Andererseits wissen wir aus 2.13 und 2.14, dass $S^2 \sim S^2 \setminus D$ zerlegungsäquivalent sind. Wir müssen uns also nur überlegen, dass sich die Existenz paradoxer Zerlegungen auf zerlegungsäquivalente Objekte überträgt. Dies zeigt die folgende Überlegung, in der wir bewusst auf formalere Notationen verzichten.

Seien also $X \sim Y$ zerlegungsäquivalent. Der Zerlegungsäquivalenz entsprechen Zerlegungen von $X$ und $Y$ in gleich viele Teile $X_i$ bzw. $Y_i$, von denen entsprechende durch Bewegungen $g_i$ (in unserem Fall durch Drehungen) ineinander übergeführt werden können. Gleichzeitig besitze $X$ eine paradoxe Zerlegung in Mengen $A_j$ und $B_k$, wo die Bewegungen $\sigma_j$ und $\tau_k$ auftreten. Will man eine paradoxe Zerlegung von $Y$ konstruieren, baut man seine Bruchstücke $Y_i$ zunächst mit den $g_i^{-1}$ zu $X$ um. Aus $X$ erzeugt man mit den $\sigma_j$ und $\tau_k$ zwei Kopien von sich selbst. Diese kann mit den $g_i$ jeweils wieder zu Kopien von $Y$ zurückbauen. Da in allen drei Schritten Zerlegungen nur in endlich viele Teile vorkommen, genügt also eine Zerlegung von $Y$ ebenfalls in endlich viele Teile, um das skizzierte Programm mit entsprechenden Bewegungen durchzuführen.


3.9 Eine paradoxe Zerlegung von $K' = K \setminus \{0\}$

Die im letzten Abschnitt gefundene paradoxe Zerlegung von $S^2$ überträgt sich in offensichtlicher Weise auf $K' = K \setminus \{0\}$, ($0=(0,0,0)$), die Vollkugel ohne Mittelpunkt, indem man an jedem Punkt $x \in S^2$ auf der Kugeloberfläche die Verbindungslinie zum Mittelpunkt der Kugel anheftet. Die beteiligten Rotationen können direkt übernommen werden.

Etwas formaler sieht das so aus. Sei

\begin{displaymath}
\begin{array}{lll}
S^2 &=& A_1 \cup A_2 \cup \ldots A_m \cup...
...&=& \tau_1(B_1) \cup \ldots \cup \tau_{n'}(B_{n'}),
\end{array}\end{displaymath}

$m' \le m$ und $n' \le n$, die paradoxe Zerlegung von $S^2$. Für eine beliebige Teilmenge $X \subseteq S^2$ der Sphäre sei $X'$ die Menge aller $x' = \lambda x$, $0 < \lambda \le 1$, $x \in X$, also die Menge aller Verbindungspunkte zwischen dem Mittelpunkt (exklusive) und Punkten aus $X$ (inklusive). Dann ist

\begin{displaymath}
\begin{array}{lll}
K' &=& A'_1 \cup A'_2 \cup \ldots A'_m \c...
...& \tau_1(B'_1) \cup \ldots \cup \tau_{n'}(B'_{n'}),
\end{array}\end{displaymath}

$m' \le m$ und $n' \le n$, die gesuchte paradoxe Zerlegung von $K'$.


3.10 Vollendung des Beweises

Nach denselben Überlegungen wie in 3.8 genügt es auch hier, wenn wir $K \sim K'$ zeigen. Dabei beziehen wir uns wieder auf die Paradoxien des Unendlichen, insbesondere jene aus 2.11. Diese besagt, dass die Kreislinie zerlegungsäquivalent zur Kreislinie mit einem fehlenden Punkt ist. Wir zerlegen daher $K$ in irgendeine Kreislinie, welche durch den Mittelpunkt verläuft, und den Rest. Diesen Rest lassen wir unverändert. Die Kreislinie bleibt zerlegungsäquivalent, wenn wir einen Punkt herausnehmen. Also gilt tasächlich $K \sim K'$, und der Beweis des PvBT ist erbracht. (Man beachte, dass bei der Rotation der verwendeten Kreislinie eine Rotation im Spiel ist, deren Achse nicht durch den Ursprung geht.)


4 Was lernen wir aus dem PvBT?


4.1 Nichtexistenz von Maßen

Die wichtigste Konsequenz des PvBT besteht in der Einsicht, dass nicht allen Teilmengen von ${\mathbb{R}}^3$ sinnvoll ein Volumen zugewiesen werden kann. Dabei verstehen wir unter sinnvoll, dass wenigstens die Eigenschaften Positivität ($\mu(A) \ge 0$, $\mu(\emptyset)=0$), Additivität ( $\mu(A \cup B) = \mu(A)+\mu(B)$ sofern $A \cap B = \emptyset$), Bewegungsinvarianz ( $\mu(\sigma(A)) = \mu(A)$ für Bewegungen $\sigma$ und Normierung ($\mu(W)=1$, $W=$ Einheitswürfel) erfüllt sein sollen, so ist das PvBT der schlagende Beweis dafür, dass unseren Wünschen Grenzen gesetzt sind.

Wir gehen von einer beliebigen Kugel $K$ mit positivem und endlichem Radius aus. Ist $\mu$ ein normiertes Maß, so hat $\mu(K)$ einen positiven und endlichen Wert. Wir betrachten eine paradoxe Zerlegung

\begin{displaymath}
\begin{array}{lll}
K &=& A_1 \cup A_2 \cup \ldots A_m \cup B...
...&=& \tau_1(B_1) \cup \ldots \cup \tau_{n'}(B_{n'}),
\end{array}\end{displaymath}

wie sie laut PvBT existiert. Wir nehmen an, den involvierten Mengen seien in bewegungsinvarianter Weise Volumina $a_i=\mu(A_i)=\mu(\sigma_i(A_i))$ und $b_j = \mu(B_j) = \mu(\tau_j(B_j))$ zugeordnet. Sei $a = \sum_{i=1}^{m'}a_i$ und $b = \sum_{j=1}^{n'} b_j$, dann führt die Additivität von $\mu$ einerseits zu $\mu(K) = a = b$, andererseits wegen $a_i,b_j \ge 0$ zu

\begin{displaymath}
\mu(K) = \sum_{i = 1}^m a_i + \sum_{j=1}^n b_j \ge a+b = 2\mu(K).
\end{displaymath}

Damit kann $\mu(K)$ nur die Werte $0$ oder $\infty$ annehmen, was aber zur Normierungsbedingung im Widerspruch steht. Damit erweisen sich die Volumszahlen für die $A_i$ und $B_j$ als widersprüchlich. Es kann also kein additives und bewegungsinvariantes Maß im ${\mathbb{R}}^3$ geben, welches für alle Teilmengen definiert ist.

Man beachte, dass diese Konsequenz des PvBT insofern stärker ist als das Vitalische Argument (vgl. [V]) für die Existenz nicht Lebesgue-messbarer Mengen in ${\mathbb{R}}$, als das PvBT nicht nur $\sigma$-additive (d.h. abzählbar additive), sondern auch endliche additive Maße ausschließt.

(Das Argument von Vitali lässt sich transparenter für die Kreislinie $S^1$ statt für das Einheitsintervall $[0,1) \subseteq {\mathbb{R}}$ formulieren und lautet folgendermaßen: Auf $S^1$ betrachte man die abzählbare Gruppe $G$ der Drehungen um rationale Bruchteile $\alpha$ der vollen Rotation um $2\pi$. Bezüglich $G$ zerfällt $S^1$ in Orbits $O$. Aus jedem Orbit wählt man einen Punkt $x_O \in O$ aus. Sei $A = A_0$ die Auswahlmenge aller $x_O$ und $A_{\alpha}$, $\frac{\alpha}{2\pi} \in {\mathbb{Q}}$, das Bild von $A$ unter der Drehung um $\alpha$. Dann bilden diese $A_{\alpha}$ eine abzählbare Partition von $S^1$ in bewegungsgleiche Kopien von $A$. Wäre $\mu$ ein abzählbar additives und drehinvariantes Maß auf $S^1$, so sind zwei Fälle zu unterscheiden. $\mu(A) > 0$ impliziert $\mu(S^1) = \infty$, $\mu(A)=0$ impliziert $\mu(S^1)=0$. $\mu$ kann also in keinem Fall zu $\mu(S^1)=1$ normiert werden.)

Notwendig für das stärkere PvBT war, dass im ${\mathbb{R}}^3$ auch nicht kommutierende Bewegungen auftreten, was bei den Translationen in ${\mathbb{R}}$ oder Drehungen von $S^1$ nicht der Fall ist.

Tatsächlich zeigt eine allgemeinere Theorie paradoxer Zerlegungen, dass die wichtige Rolle, welche in unserem Beweis die (hochgradig nichtkommutative) von zwei Elementen frei erzeugte Gruppe spielt, nicht zufällig ist, sondern im Wesen (gewisser) paradoxer Zerlegungen liegt.

Hier sei noch der fundamentale Satz von Tarski (vgl. [T]) erwähnt, welcher besagt, dass immer, wenn paradoxe Zerlegungen nicht existieren, nichttriviale endlich additive Maße konstruiert werden können. Der Beweis dafür würde den hier gegebenen Rahmen allerdings sprengen.


4.2 Bis $2 \neq 1$ zählen und darüber hinaus

Mancher Leser mag versucht sein, das PvBT zur Formel $1=2$ zu komprimieren. Das ist aber nicht zulässig. Die präzise Formulierung des PvBT (wie etwa in 1.3) ist nämlich eine recht komplizierte Aussage, in der Begriffe wie Punkte, Bewegungen, Drehungen, Teilmengen etc. vorkommen. Es wurde aber nirgends die Gleichheit $1 \neq 2$ behauptet. Was hätte ein Beweis der Implikation $\mbox{PvBT} \Longrightarrow 1=2$ für Konsequenzen?

Glücklicherweise ist die Mengenlehre so konstruiert, dass mit ihren Mitteln der Satz $1 \neq 2$ leicht bewiesen werden kann (vgl. auch nächster Abschnitt). Weniger leicht, aber dennoch schlüssig war der (stark mengentheoretisch geprägte) Beweis des PvBT. Wäre auch die Implikation $\mbox{PvBT} \Longrightarrow 1=2$ beweisbar, so hätten wir neben $1 \neq 2$ auch den Satz $1=2$, was einen Widerspruch bedeutete. Nach dem logischen Prinzip ex falso quodlibet folgt aus einem Widerspruch aber Beliebiges. Also wäre jede auch noch so absurde Aussage, welche sich überhaupt nur sinnvoll mit den vogegebenen sprachlichen Mitteln (z.B. denen der Mengenlehre) formulieren lässt, beweisbar. Damit wäre aber das übliche mathematische System in seiner anerkannten Form unbrauchbar.

Da wir das System nicht grundlegend umstellen wollen, hoffen wir nicht, dass $\mbox{PvBT} \Longrightarrow 1=2$ bewiesen werden kann. Eine Konsequenz des Unvollständigkeitssatzes von Gödel besteht darin, dass es mit den Mitteln einer widerspruchsfreien mathematischen Theorie nicht möglich ist, ihre eigene Widerspruchsfreiheit zu beweisen. In diesem Sinne müssen wir uns also mit der Hoffnung begnügen, dass wir nicht zu Widersprüchen gelangen. Gewissheit gibt es nicht, es sei denn wir lassen wesentlich stärkere Mittel zu. Diese bestünden aber in mathematischen Annahmen, die nicht mehr Rechtfertigung besitzen als die schlichte Zuversicht, dass die üblichen Voraussetzungen (die mengentheoretischen Axiome, siehe auch 4.4) widerspruchsfrei sind.

In den obigen Erörterungen ist die Frage nach einem mengentheoretischen Beweis für $1 \neq 2$ aufgetaucht. Um einen solchen zu führen, müssen die Objekte 1 und 2 definiert sein. In der mengentheoretisch fundierten Mathematik hat es sich als naheliegend und praktisch erwiesen, die natürlichen Zahlen so zu definieren, dass jedes $n$ gleich der Menge seiner Vorgänger ist. (Vor allem in Hinblick auf unendliche Ordinal- und Kardinalzahlen erweist sich dieser Zugang zusammen mit dem zum Auswahlaxiom äquivalenten Wohlordnungssatz als sehr mächtig.) Damit ergibt sich $0 = \emptyset$ als leere Menge, $1 = \{0\} = \{\emptyset\}$ und $2 = \{0,1\} = \{\emptyset, \{ \emptyset \} \}$. Wäre $1=2$, so müssten die entsprechenden Mengen genau dieselben Elemente besitzen. Insbesondere müsste das Element $1 = \{0\} \in 2$ auch in 1 selbst enthalten sein. 1 enthält nur das Element $0 = \emptyset$, also folgt $\emptyset = 0 = 1 = \{ 0 \}$, d.h. $0 \in \emptyset$. Die leere Menge $\emptyset$ enthält definitionsgemäß aber keine Elemente, Widerspruch.

Vermutlich wird dieser Beweis als nicht sehr befriedigend empfunden, weil alles von einer willkürlichen Definition der natürlichen Zahlen abhängt. Tatsächlich gibt es hieraus einen Ausweg, wenn man darauf verzichtet, die natürlichen Zahlen als fest definierte Objekte aufzufassen:

Wir versuchen nicht, die Zahlen $0, 1, 2, \ldots$ selbst zu definieren, sondern lediglich festzulegen, was es bedeutet, wenn wir sagen: Es gibt genau $n=0,1,2,\ldots$ Objekte mit der Eigenschaft $\phi$. (Wir schreiben $\phi(x)$, falls $x$ die Eigenschaft $\phi$ besitzt.) Für $n=0$ genügt es zu sagen, es gibt keine solchen Objekte. Für $n=1$: Es gibt ein $x$ mit $\phi(x)$, und für alle $y$ mit $\phi(y)$ folgt $x=y$. Für $n=2$: Es gibt Elemente $x \neq y$ mit $\phi(x)$ und $\phi(y)$, und für jedes $z$ mit $\phi(z)$ folgt $z=x$ oder $z=y$. (Es ist klar wie dies auf höhere Werte von $n$ übertragen werden kann.) Das Wesentliche bei diesen Formulierungen ist, dass nur rein logische Sprachelemente wie Negation, Folgerung, die logischen Quantoren für alle und es gibt etc. vorgekommen sind sowie die Identität $=$. Damit ist alles zurückgeführt auf die fundamentale Frage, ob zwei Objekte identisch sind oder nicht.

Man beachte, dass mit dieser Methode für jede einzelne natürliche Zahl $n$ auf rein logischem Wege definiert werden kann, wann die Anzahl gewisser Objekte $n$ ist. Nicht jedoch kann damit $n$, geschweige denn so etwas wie die Menge aller natürlichen Zahlen (aktual unendlich) als eigenständiges Objekt definiert werden.


4.3 Der schwierige Begriff des Maßes

Wie geht der Mathematiker an die Aufgabe des Messens heran? Der Erfolg seiner Disziplin hängt nicht nur von der strengen Schlüssigkeit seiner Beweise ab, sondern, damit diese überhaupt erst einen Sinn haben, von der klaren Definition seiner Objekte. Will er das Volumen (Maß) eines gegebenen geometrischen Körpers bestimmen, so muss er zunächst einmal definieren, was er unter geometrischem Körper und Volumen überhaupt versteht. Dabei hat die Definition anders als in der Physik zu erfolgen (vgl. 4.5).

Die mathematisch erfolgreichste Antwort auf die Frage, was ein Maß sei, gibt die Mengenlehre. Eines ihrer wesentlichen Merkmale ist, dass all ihre Objekte als Mengen gedeutet werden. Tatsächlich haben wir ja auch die Kugel $K$, um deren Zerlegung es im PvBT gegangen ist, als Menge von Punkten im Raum aufgefasst. (Wie diese Punkte und ihre Koordinaten selbst wiederum als Mengen gedeutet werden können, spielt in unserem Kontext keine bedeutende Rolle, wir gehen daher nicht näher darauf ein. Immerhin haben wir in 4.2 kurz angedeutet, wie man natürliche Zahlen als Mengen interpretieren kann.)

Das Volumsmaß ist also mathematisch gesehen eine Abbildung $\mu$, welche gewissen Teilmengen $M \subseteq {\mathbb{R}}^3$ des Raumes (insbesondere Würfeln, Kugeln etc.) eine reelle Maßzahl $\mu(M)$ (oder auch $\infty$) zuordnet. Messen im mathematischen Sinn hat daher zumindest zwei Aspekte:

  1. Definition der Abbildung
  2. Berechnung der Werte der Abbildung für spezielle Körper (Mengen)

Für den Ingenieur ist der zweite Punkt der spannendere, für den Mathematiker eher der erste; auch wenn er die wichtige Aufgabe hat, Berechnungsmethoden für den Ingenieur zu entwickeln.

Da sich der Artikel [We] in diesem Band viel ausführlicher mit Inhalt und Maß auseinandersetzt, begnügen wir uns hier mit kurzen Andeutungen. Bei der Definition der Werte $\mu(M)$ beginnt man zunächst zum Beispiel mit der Forderung $\mu(W)=1$ für den Einheitswürfel $W$. Dieser Wert muss definiert werden, er kann nicht aus physikalischen Sachverhalten abgeleitet werden.

Wie auch schon in Abschnitt 4.1 erwähnt, wünscht man sich von $\mu$ außerdem gewisse Eigenschaften wie Positivität $\mu \ge 0$, $\mu(\emptyset)=0$ und Additivität, d.h. $\mu(A \cup B) = \mu(A)+\mu(B)$ für $A \cap B = \emptyset$. Entscheidend sind im ${\mathbb{R}}^3$ (wie in allen euklidischen Räumen oder allgemeiner in Gruppen) auch Invarianzen der Form $\mu(\sigma(M))=\mu(M)$ für Translationen oder beliebige Bewegungen $\sigma$. Im Beweis des PvBT haben solche Abbildungen $\sigma$ tatsächlich eine wesentliche Rolle gespielt.

Aus den drei Bedingungen Additivität, Bewegungsinvarianz und Normierung folgt vielerlei. So ergibt sich, dass der Einheitswürfel $W$ in acht Teilwürfel $W_i$ mit halber Seitenlänge zerfällt, deren Maß wegen der Translationsinvarianz von $\mu$ untereinander gleich und deren Summe wegen der Additivität gerade $\mu(W)=1$ sein muss, also $\mu(W_i) = \frac 18$. Ähnlich ergibt sich eindeutig das Volumen noch kleinerer Würfel. Diese wiederum können verwendet werden, um Kugeln und viele andere Körper $K$ mit beliebig kleinem Fehler von innen zu füllen oder von außen zu umschreiben. Das Volumen $\mu(K)$ des Körpers muss wegen Additivität und Positivität von $\mu$ zwischen diesen beiden Approximationen liegen; also etwa $\mu(K_0) \le \mu(K) \le \mu(K_1)$, wenn $K_0$ die innere und $K_1$ die äußere Approximation von $K$ bezeichnet. Zeigt man, dass $\mu(K_0)$ und $\mu(K_1)$ beliebig nahe beisammen liegen können, bleib für $\mu(K)$ nur ein einziger möglicher Wert dazwischen. Im Falle einer Kugel $K$ mit Radius $r$ kann man dann die bekannte Formel $\mu(K) = \frac 43 r^3 \pi$ beweisen. (Das ist aber gar nicht so trivial!)

Aus unseren Überlegungen folgt, dass, sofern es überhaupt eine sinnvolle Möglichkeit gibt, Kugeln etc. ein Volumen zuzuweisen, dieses aufgrund unserer Forderungen an $\mu$ eindeutig bestimmt ist. Wir müssen hier auf den zwar nicht schwierigen, aber doch einigermaßen langwierigen Beweis verzichten, dass diese Zuweisung auch wirklich möglich ist. Das heißt, dass die Forderungen, die wir an $\mu$ gestellt haben, nicht zu Widersprüchen führen.

Man sieht leicht, dass sich mit den skizzierten Methoden nicht für alle Teilmengen $M$ von ${\mathbb{R}}^3$ der Wert $\mu(M)$ eindeutig ergibt. Das klassische Beispiel hierzu ist die Menge der Punkte im Einheitswürfel $W$ mit rationalen Koordinaten. Einerseits hat kein noch so kleiner Würfel mit positivem Volumen darin Platz. Also liefert die innere Approximation den Wert 0. Umgekehrt muss jede endliche Überdeckung von $M$ mit Würfeln bereits ganz $W$ überdecken, als äußere Approximation also mindestens $\mu(W)=1$ liefern. Damit bleibt zwischen 0 und 1 eine Lücke der Unbestimmtheit übrig. Diese kann bei diesem $M$ überbrückt werden, wenn man die Additivität von $\mu$ zur $\sigma$-Additivität verschärft. Man argumentiert: $W$ enthält nur abzählbar viele Punkte, jeder davon hat Maß 0, ihre abzählbare Summe soll sich daher auch nur zu 0 aufaddieren. Man erhält also $\mu(M)=0$. Dieser Zugang reflektiert die Vorstellung, dass abzählbare Mengen im Vergleich zu überabzählbaren verschwindend klein sind. Der Nachweis für die Existenz eines solchen $\sigma$-additiven Maßes zeigt natürlich mehr als jener für die endliche Additivität, ist aber auch dementsprechend schwieriger. Aus 4.1 wissen wir dass bezüglich eines $\sigma$-additiven Maßes nicht nur in ${\mathbb{R}}^3$, sondern schon in ${\mathbb{R}}$ nichtmessbare Mengen existieren. Deshalb sind die grundsätzlichen Schwierigkeiten durch Ausweitung auf $\sigma$-Additivität nur verschoben, nicht aber aufgehoben.

Als Konsequenz unserer Überlegungen erkennen wir, dass Zählen und Messen begrifflich sehr unterschiedliche Operationen sind. Bestenfalls kann das Zählen als sehr einfacher Spezialfall des Messens interpretiert werden, wo als Maßzahlen nur die natürlichen auftreten und als invariante Transformationen beliebige bijektive (umkehrbar eindeutige) Abbildungen zugelassen sind. Wir fassen einige Unterschiede zusammen:


4.4 Das Auswahlaxiom

Es ist unvermeidlich, noch ein paar Bemerkungen über das Auswahlaxiom (Axiom of Choice, AC) zu verlieren und über seine Rolle im Beweis des PvBT und in verwandten Resultaten der Maßtheorie. Tatsächlich kann man zeigen, dass ein Beweis des PvBT ohne Auswahlaxiom grundsätzlich unmöglich ist. Lässt man eine Verletzung des Auswahlaxioms zu, so kann man nämlich, wie Solovay in [So] gezeigt hat, widerspruchsfrei annehmen, dass alle Teilmengen reeller Zahlen messbar sind. Allerdings liegt das daran, dass man ohne Auswahlaxiom die nicht messbaren Mengen nicht finden kann und nur deshalb auf keinen Widerspruch stößt.

Es wird oft nicht darauf hingewiesen, dass man statt des Auswahlaxioms mit gleichem Recht auch andere Axiome der Mengenlehre für das PvBT verantwortlich machen könnte. Ohne Potenzmengenaxiom beispielsweise könnte man keine überabzählbaren Mengen konstruieren (vgl. 2.7), also weder ${\mathbb{R}}$ noch die Kugel. Ohne Unendlichkeitsaxiom bliebe man sogar schon im Endlichen stecken. Damit hätte man überhaupt sämtliche Paradoxien des Unendlichen verbannt. Und auch das Vereinigungsmengenaxiom wird zur Konstruktion wenigstens scheinbar großer Mengen herangezogen. Trotzdem hat gerade das Auswahlaxiom vor allem zu Beginn des 20. Jahrhunderts so viele Diskussionen entfacht:

AC: Ist $X$ eine Menge von nichtleeren und paarweise disjunkten Mengen $X_i$, so gibt es eine sogenannte Auswahlmenge $A$, welche aus jedem $X_i$ genau ein Element (einen Repräsentanten) enthält.

Wie kann eine so plausible Annahme auch heute noch manche Gemüter erhitzen? Das erscheint sehr plausibel, dennoch haben die Diskussionen darüber Tradition. Im Zusammenhang mit dem PvBT, in dessen Beweis wir AC ja verwendet haben (nämlich in 3.5), könnte man zunächst einwenden, dass die Aussage des PvBT zu paradox ist. Das hieße aber, den Standpunkt (= Gesichtskreis vom Radius 0) einnehmen, dass nicht sein könne, was nicht sein darf. Wir hoffen, dass der Leser den Beweis - auch wenn er ihn vielleicht nicht in allen Details überprüft hat - als überzeugend nachvollziehen konnte. Eine eingehendere Analyse ist also gefragt.

Ein etwas subtilerer Einwand, der das Wesen des Auswahlaxioms und auch des PvBT besser trifft, besteht in der Kritik, dass die Auswahlmenge $A$ lediglich als existent gefordert wird, dass aber keine nähere Beschreibung mitgeliefert wird. Andere Axiome der Mengenlehre, die zum Beispiel die Existenz von Vereinigungs- oder Potenzmengen sichern, scheinen diesen Mangel nicht zu haben.

Hier wird aber die Auffassung vertreten, dass diese Unterschiede nur gradueller Art sind. Mathematische Objekte (und vermutlich alle Objekte unseres Denkens) sind stets mit dem erkenntnistheoretischen Mangel behaftet, dass wir von ihnen nur gewisse Eigenschaften kennen und nicht alle, geschweige denn das von Kant als unerkennbar diagnostizierte Ding an sich. So wissen wir von der Auswahlmenge $A$ im Wesentlichen nur das, was uns das Auswahlaxiom liefert. Genauso wissen wir durch Knochenfunde von Urmenschen auch nicht, in welcher Sprache sie sich unterhalten haben. Dennoch zweifeln wir nicht an ihrer prähistorischen Existenz.

In mancherlei Hinsicht kann man die Rolle des Auswahlaxioms in der Mathematik auch mit der des Teleskops in der Astronomie vergleichen: Man kann wesentlich mehr damit sehen, auch wenn die betrachteten Objekte dadurch im wörtlichen Sinn um nichts greifbarer werden.

Außerdem muss betont werden, dass sich die Mathematik im Unterschied zur Paläoontologie oder auch zur Astronomie grundsätzlich nur mit ideellen Objekten beschäftigt, von denen nur gewisse Eigenschaften relevant sind. Beispiel: Beim Begriff der Zahl 2 kommt es darauf an, dass sie z.B. der Summe $1+1$ entspricht; wir kümmern uns aber nicht um ihre Farbe, Laune, etc.

Angemessen gegenüber Auswahl- wie auch anderen Axiomen der Mengenlehre oder Mathematik generell mag es daher sein, wenn man sie als explizit formulierte Denkfreiheiten ansieht, nicht jedoch als gratis Erkenntnisquelle für die empirische Wirklichkeit. Der Gegenstand der Mathematik geht nämlich über die Erfahrungswelt und sogar über den Bereich des Vorstellbaren hinaus und erschließt sich die schillernde Welt des Denkmöglichen. (In [M] ist der Mann mit dem Möglichkeits- statt Wirklichkeitssinn nicht zufällig Mathematiker!) Wer mathematische Axiome aus metaphysischen oder ideologischen Gründen ablehnt, spricht also Denkverbote aus. Wer hingegen untersucht, welche Ergebnisse auch ohne Verwendung gewisser Prämissen und Axiome erzielbar sind und welche nicht, betreibt seriöse Mathematik, möglicherweise auf allerhöchstem Niveau.

Das dies keine leeren Worte sind, lässt sich sogar durch mathematische Ergebnisse belegen: Gödel zeigte, dass das Auswahlaxiom zu keinen Widersprüchen führt (also denkbar ist), sofern nur die übrigen und weit weniger diskutierten Axiome der gängigen Mengenlehre widerspruchsfrei sind. Aber auch die Verletzung des Auswahlaxioms ist widerspruchsfrei denkbar, wie später Cohen gezeigt hat. Damit liegt eines der prominentesten Beispiele eines sogenannten Unabhängigkeitsresultats vor.

Vollkommen analog dazu (auch was die Rollen von Gödel und Cohen betrifft) ist die Situation hinsichtlich der sogenannten Kontinuumshypothese. Hilbert hob sie im Jahre 1900 sogar als das erste und fundamentalste der berühmten 23 Probleme hervor, deren Beantwortung er als zentrale Aufgabe für das damals bevorstehende 20. Jahrhundert betrachtete. Die offene Frage lautet: Gibt es überabzählbare Mengen, die echt kleiner als das Kontinuum sind? Auch diese Frage erwies sich als mit den gängigen Axiomen der Mengenlehre nicht entscheidbar.


4.5 Mathematisches versus physikalisches Messen

Im Zusammenhang mit dem PvBT scheint es nicht unwesentlich, den Unterschied zwischen mathematischen und physikalischen Volumsbegriffen herauszuarbeiten. Dem mathematischen Zugang war Abschnitt 4.3 gewidmet. Doch was versteht der Physiker unter dem Volumen z.B. einer Kugel? Der Leser möge innehalten und selbst nach einer Antwort suchen!

Eine physikalische Möglichkeit der Volumsmessung ist die folgende: Man taucht den Körper in einen quaderförmigen Behälter mit Wasser, dessen Grundfläche ein Quadrat mit Seitenlänge 1 ist, und misst den Anstieg des Wasserspiegels. Die Maßzahl dieses Anstiegs in Längeneinheiten stimmt dann mit der Maßzahl des Volumens des Körpers in Volumseinheiten überein.

Dieses Verfahren führt die Messung eines Volumens auf die einfachere Messung einer Länge zurück. Es setzt allerdings voraus, dass das Wasser auf diese Art nicht komprimiert wird, d.h. sein Volumen beibehält. Aber damit ist ja auch bereits ein Volumsbegriff vorausgesetzt! Die Katze beißt sich also in den Schwanz. Aus der Sicht des Physikers ist das aber nicht so tragisch. Entscheidend ist für ihn, dass die Wiederholung des beschriebenen Messvorgangs immer wieder zum selben Ergebnis führt. Damit ist ein praktikabler Kontext hergestellt, in dem von einer physikalischen Größe Volumen gesprochen werden kann. Dass das Experiment tatsächlich immer dasselbe Ergebnis liefert, ist eine empirische (aus der Erfahrung stammende) Tatsache, die durch widersprechende Erfahrungen prinzipiell auch widerlegt werden könnte. Das entspricht exakt der Popperschen Forderung nach Falsifizierbarkeit von Aussagen empirischer Wissenschaften. Mathematische Aussagen sind aber von anderem Charakter. Sie beschreiben das auf empirische Art nicht bestimmbare Wesen von Begriffen, die vor allem in logischem Kontext ihren Sinn entfalten.

Doch ist noch ein Wort zur physikalischen Längenmessung angebracht, auf welche wir oben die Volumsmessung zurückgeführt haben. Was tun wir denn, wenn wir eine Länge mit einem Maßstab messen? Wir bewegen zuerst den Maßstab zum zu vermessenden Gegenstand und führen dann einen Vergleich durch. Es wird also auch hier eine (empirisch gerechtfertigte) Invarianz von Längenmaßen unter Bewegungen vorausgesetzt. Man mache sich den Unterschied zu den begrifflich bestimmten Invarianzen eines mathematischen Längenbegriffs klar!

Dass diese Überlegungen keine müßigen Haarspaltereien sind, zeigt sich in spektakulärer Weise in der empirisch mittlerweile in höchstem Maße gesicherten Einsteinschen Relativitätstheorie. Sie impliziert nämlich, dass genau die unterstellten Invarianzen von Länge (und Zeit) verlorengehen, wenn sehr große Geschwindigkeiten oder sehr starke Gravitationsfelder wirksam werden. Dennoch steht das nicht im Widerspruch zur Mathematik. Man muss nur eine kompliziertere Raumstruktur als Modell verwenden. Bezeichnend ist, dass die wesentlichen Ideen dazu auf den Mathematiker Riemann zurückgehen, der ungefähr ein halbes Jahrhundert vor Einstein wirkte und (wie dieser übrigens auch) seine Ideen seiner Phantasie und keinen empirischen Messdaten verdankte.

Die großen Unterschiede zwischen mathematischem (vgl. 4.3) und physikalischem Messen lassen es nicht mehr verwunderlich erscheinen, dass die Mathematik Denkbarkeiten eröffnet, die physikalisch nicht realisierbar sind. Kritiker der Mathematik und insbesondere der mengentheoretischen Grundlegung mögen einwenden, dass sie unbrauchbare Modelle für die Welt liefere. Wir hingegen sehen einen Erkenntnisfortschritt darin, dass durch Ausweitung des Bereichs des Denkbaren (vgl. auch 4.4) jener des Machbaren nicht nur von innen, sondern auch von außen besser eingegrenzt und damit besser verstanden werden kann.


4.6 Didaktische Konsequenzen

Im Hinblick auf den Unterricht in Schulen soll die vorliegende Aufbereitung des PvBT belegen, dass die gleichzeitige Umsetzung folgender Ziele möglich ist:

  1. Präsentation eines attraktiven Resultats: Etwas Spektakuläreres als das PvBT gibt es in der Wissenschaft kaum.
  2. Vollständiger Beweis: Die mathematischen Voraussetzungen für den präsentierten Beweis sollten schon zwei Jahre vor der Matura vorhanden sein.
  3. Interessante inner- und außermathematische Querverbindungen: Problematik des Maß- und Inhaltsbegriffs, Beziehungen zwischen Mathematik und Physik, prinzipielle Erkenntnisgrenzen etc.
  4. Auffächerung in viele Hilfsresultate, die auch für sich interessant sind: Abzählbare und überabzählbare Mengen, Darstellung von Drehungen durch Abbildungsgleichungen, Gruppen allgemein und speziell die freie Gruppe etc.
Bei der didaktischen Aufbereitung anspruchsvoller mathematischer Inhalte erscheinen für das Erreichen obiger Ziele folgende Mittel als hilfreich:
  1. Entformalisierung, Ideen statt Kalküle: Die mathematische Zeichensprache hat ihre großen Meriten für den Fachmann und ist aus einer fruchtbaren mathematischen Forschung nicht wegzudenken. Will man bedeutende mathematische Ideen hinter der Formelsprache verständlich machen, wird dem in der Formelsprache weniger Geübten das Verständnis wesentlich leichter fallen, wenn die Sprachschwierigkeiten möglichst reduziert werden. Außerdem stehen auch für den mathematischen Forscher in der Regel die Ideen im Mittelpunkt und nicht die formalen Kalküle. Insbesondere bei geometrischen Überlegungen wie dem PvBT leistet die natürliche Sprache oft bessere Dienste als die formalisierte. Auch Abbildungen, auf welche in diesem Text aus technischen Gründen leider verzichtet werden musste, spielen eine wichtige Rolle. Generell sind solche mathematischen Inhalte besser vermittelbar, die auch ohne großen formalen Aufwand verständlich gemacht werden können. Leider hat diese Tatsache im Schulunterricht nicht immer angemessene Berücksichtigung gefunden. (Warum?)
  2. Zerlegung in kleine Einheiten: Die allermeisten Schüler (und nicht nur diese) werden durch allzu lange Schlussketten überfordert. Deshalb scheint es ratsam, einzelnen Beweisschritten den Charakter einer attraktiven und einprägsamen Idee abzugewinnen und ihrer Behandlung mehr Raum einzuräumen. Im Text wurde das dadurch hervorgehoben, dass die beweistechnischen Kapitel 2 und 3 in relativ ausführliche Abschnitte gegliedert wurden, die jeweils einem einzigen Hauptgedanken gewidmet sind.
  3. Der Weg ist das Ziel: Im Beweis des PvBT spielten abzählbare und überabzählbare unendliche Mengen eine entscheidende Rolle. Was spricht dagegen, diesen zentralen Aspekten der Mengenlehre einige Zeit zu widmen? Nicht viel! Ähnliches gilt für die analytische Beschreibung der Drehungen in 3.6 und 3.7. Es wäre für den Unterricht doch bereichernd, die Behandlung linearer Gleichungssysteme durch die geometrische Interpretation als Abbildungen zu ergänzen. Auch die freie Gruppe lässt sich in anderem Kontext (z.B. Wortproblem, automatisches Beweisen, Gödelscher Satz) sinnvoll als per se interessantes Objekt behandeln.
  4. Zentrale Beweisidee: Hat man einen wichtigen Satzes als vordringliches Ziel vor Augen, so erweist sich statt einer strikt linearen Abarbeitung des Beweises didaktisch ein anderer Weg als zielführender, nämlich die Identifikation und Hervorhebung einer oder weniger entscheidenden Beweisideen als Ausgangspunkt. Im Falle des PvBT bieten sich die paradoxe Zerlegung der freien Gruppe (3.3) und die Aussicht auf Realisierung mittels Drehungen an. Von hier ausgehend lassen sich alle anderen Beweiselemente als sehr natürliche Schritte leicht motivieren.
  5. Mut zur Subjektivität: Dieser Artikel will nicht jeden Methamatiklehrer dazu überreden, das PvBT im Unterricht zu behandeln. Übergeordnet ist das Anliegen, anhand eines Beispiels, welches dem Autor sehr geeignet erscheint, zur Umsetzung ehrgeiziger Ziele im Mathematikunterricht zu ermutigen. Die Schüler werden von einem schwierigen Resultat, das mit Begeisterung behandelt wird, mehr verstehen, als von einer flachen Trivialität, die nur aus Pflichtgefühl und mit dementsprechender Langeweile vorgetragen wird.

Um von diesen allgemeinen Gedanken über den Mathematikunterricht nochmals zum PvBT zurückzukehren, wollen wir mit der Empfehlung schließen, die paradoxe Zerlegung einer Kugel aus Holz, Stein, Metall oder anderen Materialien nicht im Werkunterricht zu versuchen.

Literatur

Ba-T
S. Banach und A. Tarski. Sur la decomposition des ensembles de points en parties respectivement congruent. Fund. Math. 6 (1924), 244-277.

Bo
B. Bolzano. Paradoxien des Unendlichen. 1851, Reclam, Leipzig.

Ga
Galileo. Dialogues Concerning Two New Sciences. 1914, Macmillan, New York. Übersetzung des Originaltextes von 1638.

Go
M. Goldstern. Mengenlehre: Hierarchie des Unendlichen. Didaktikhefte, Österr. Math. Gesellschaft, Schriftenreihe zur Didaktik der Mathematik der Höheren Schulen, Heft 32, 59-72.

H
F. Hausdorff. Bemerkungen über den Inhalt von Punktmengen. Math. Ann. 75 (1914), 428-433.

M
R. Musil. Der Mann ohne Eigenschaften. Rowohlt.

So
R. M. Solovay. A model of set theory in which every set of reals is Lebesgue measurable. Ann. Math. 92 (1970), 1-56.

St
K. Stromberg. The Banach-Tarski Paradox. Amer. Math. Monthly 86 (1979), Nr.3, 151-161.

T
A. Tarski. Algebraische Fassung des Maßproblems. Fund. Math. 31 (1938), 47-66.

V
G. Vitali. Sul problema della mesura dei gruppi di punti in una retta. 1905, Bologna.

Wa 1
S. Wagon. Circle-squaring in the twentieth century. Math. Intelligencer 3 (1980/81), Nr.4, 176-181.

Wa 2
S. Wagon. The Banach-Tarski Paradox. Cambridge University Press 1985.

We
W. Wertz. Inhalt und Maß. Didaktikhefte, Österr. Math. Gesellschaft, Schriftenreihe zur Didaktik der Mathematik der Höheren Schulen, Heft 33.

Über dieses Dokument ...

Erstellt durch "LaTeX2html" am 10.Mai 2001

Zurück zu Reinhard Winklers Homepage