Next: Was ist die Bellsche Up: Herr Einstein, Herr Podolski Previous: Was ist die Bohm-Theorie?


Was ist das Kochen-Specker-Theorem?

Das Kochen-Specker-Theorem ist der jüngste in einer Reihe von Versuchen, die Unmöglichkeit bestimmter Klassen von ,,hidden variable``-Theorien theoretisch zu beweisen. Das Kochen-Specker-Theorem wurde in [KS67] (nachgedruckt in [Hoo75]) veröffentlicht; die Darstellung hier richtet sich im wesentlichen nach [Red87] und dem exzellenten Übersichtsartikel [Mer93].

Angenommen, eine Teilchenquelle emittiere Atome im Triplettzustand, also mit der Spinquantenzahl S=1. Weiterhin angenommen, in einiger Entfernung von der Quelle befinde sich eine Apparatur, die das Quadrat des Spins in jeder beliebigen Richtung messen kann (die Apparatur sei um alle Raumachsen drehbar, und zwar schnell genug, daß noch während der Flugzeit des Atoms das interne Koordinatensystem der Apparatur gegenüber dem Laborsystem verändert werden kann). Im internen Koordinatensystem der Meßapparatur sind dann die Operatoren für den Spin (in Einheiten von $\hbar$) gegeben durch die drei Paulimatrizen für S=1 [PMH84]:

\begin{displaymath}
S_x=\frac{1}{\sqrt{2}}
\left(\begin{array}{rrr}0&1&0\\ 1&0...
...ft(\begin{array}{rrr}1&0&0\\ 0&0&0\\ 0&0&-1\end{array}\right)
\end{displaymath}

Es ist sofort ersichtlich, daß die drei Operatoren nicht kommutieren, entsprechend haben sie zwar dieselben Eigenwerte, aber unterschiedliche Eigenvektoren:

\begin{eqnarray*}
\mathrm{Eig}(S_x)&=&
\left(
\begin{array}{r\vert rrr}
-1 &...
...\rule[-4pt]{0pt}{16pt}}1 & 1 & 0 & 0\\
\end{array} \right) \\
\end{eqnarray*}


Ihre Quadrate hingegen:

\begin{displaymath}
S_x^2=\frac{1}{2}
\left(\begin{array}{rrr}1&0&1\\ 0&2&0\\ ...
...eft(\begin{array}{rrr}1&0&0\\ 0&0&0\\ 0&0&1\end{array}\right)
\end{displaymath}

kommutieren, da sie einen gemeinsamen Satz von Eigenvektoren (zu unterschiedlichen Eigenwerten) haben:

\begin{eqnarray*}
\mathrm{Eig}(S_x^2)&=&
\left(
\begin{array}{r\vert rrr}
1 ...
... \mbox{\rule[-4pt]{0pt}{16pt}}0 & 0&1&0
\end{array} \right) \\
\end{eqnarray*}


Damit sind, wenn alle drei Quadrate gemessen werden, genau drei Meßergebnisse möglich: (Sx2,Sy2,Sz2) = (1,0,1), (0,1,1), oder (1,1,0). Das bedeutet: bei jeder beliebigen Ausrichtung der Meßapparatur ergeben die drei Messungen der Quadrate der Spinoperatoren genau einmal 0 und zweimal 1. In welcher der drei Richtungen die 0 gemessen wird, ist jedoch quantenmechanisch nicht festgelegt.

Eine hidden variable-Theorie, die sagt, daß die Meßergebnisse für das Atom bereits nach Verlassen der Quelle determiniert (aber noch unbekannt) sind, muß nun einen Algorithmus bereitstellen, mit dem bereits kurz nach Emission des Atoms unter Einbeziehung der versteckten Variablen das spätere Meßergebnis im Detail vorhergesagt werden kann. Da zu diesem Zeitpunkt aber die Ausrichtung der Meßapparatur noch nicht fixiert ist, muß sie das für jede mögliche Aurichtung können. Und da die Operatoren kommutieren, muß die Voraussage für das Ergebnis etwa der Sz2-Messung unabhängig von einer Rotation um die z-Achse sein, also unabhängig davon, welche beiden anderen Vektoren nun konkret x und y sind. (Wenn die Operatoren kommutieren, ist die Reihenfolge, in welcher die Messungen durchgeführt werden, irrelevant. Insbesondere kann Sz2 als erstes gemessen werden. Wäre nun Sz2 abhängig von der Wahl der beiden anderen Vektoren, so wäre mit anderen Worten der Wert von Sz2 abhängig von einer zukünftigen Messung von Sx2, Sy2 resp. Sx'2, Sy'2. Das zu leisten kann von keinem vernünftigen Realitätskriterium erwartet werden). Die hidden variable-Theorie muß also bereits jetzt jeder möglichen Ausrichtung und damit jedem möglichen Satz von orthogonalen Vektoren (x,y,z) die Werte 1 (zweimal) und 0 (einmal) zuordnen können, und zwar so, daß diese Zuordnung für einen der Vektoren unabhängig von der konkreten Wahl der anderen beiden Vektoren ist.

Das ist äquivalent zu dem Problem, die Oberfläche einer Kugel mit dem Radius 1 einzufärben, so daß:

(1)
Jeder Punkt auf der Kugeloberfläche entweder rot (0) oder blau (1) ist.
(2)
Jeder Satz von drei Punkten, für die die Vektoren vom Kugelmittelpunkt zum jeweiligen Vektor zueinander paarweise orthogonal sind, genau einen roten und zwei blaue Punkte enthält.
Ein wenig anders ausgedrückt: Gesucht ist eine Abbildung, die jedem dreidimensionalen Vektor der Länge 1 eine Farbe (rot oder blau) zuweist, so daß jeder Vektor, der zu einem roten Vektor orthogonal ist, blau sein muß, und jeder Vektor der zu zwei zueinenader orthogonalen blauen Vektoren orthogonal ist, rot sein muß (die Farbgebung ist natürlich völlig willkürlich). Das Kochen-Specker-Theorem besagt nun, daß eine solche Färbung/Abbildung unmöglich ist. Um das Theorem zu beweisen, beweist man zuerst einen Hilfssatz (ein Lemma), der sagt, daß unter den beiden obigen Regeln zwei Punkte, die einander näher sind (zwei Einheitsvektoren, für die der Winkel zwischen ihnen kleiner ist) als ungefähr $19.5^{\circ}$, dieselbe Farbe haben müssen.

Abbildung 2: Wahl der Winkel $\theta _{14}$ und $\theta _{12}$. O ist die Mitte der Einheitskugel.
\includegraphics[width=0.5\textwidth]{ksvectors.eps}

Seien 1 und 2 Punkte auf der Einheitskugel (mit Mittelpunkt O), die einen spitzen Winkel $\theta_{12}\leq19.5^{\circ}$ bilden (Abbildung 2). Der Hilfssatz sagt:
,,Die Punkte 1 und 2 müssen dieselbe Farbe haben.``
Der Beweis ist indirekt: Es werde (ohne Beschränkung der Allgemeinheit) angenommen, daß 1 rot und 2 blau sei. Im folgenden wird gezeigt, daß daraus und aus obigen Bedingungen (1) und (2) ein Widerspruch folgt. Zunächst wird (per Konstruktion) gezeigt, daß ein Diagramm wie in Abbildung 3, für das folgende Regeln gelten sollen:
(1)
Jeder Punkt (1-10) repräsentiert einen Einheitsvektor resp. einen Punkt auf der Einheitskugel.
(2)
Zwei Punkte, die durch eine Linie verbunden sind, respräsentieren zueinander orthogonale Vektoren.

Abbildung 3: Kochen-Specker-Diagramm.
\includegraphics[width=0.7\textwidth]{ks.eps}

konstruierbar ist. Für dieses Diagramm gilt:
(1)
$\overrightarrow{O3}$ ist orthogonal zu $\overrightarrow{O1}$ und $\overrightarrow{O2}$. $\overrightarrow{O4}$ ist orthogonal zu $\overrightarrow{O3}$. Also muß $\overrightarrow{O4}$ in der Ebene $\overrightarrow{O1}-\overrightarrow{O2}$ liegen. Gleichzeitig ist $\overrightarrow{O4}$ orthogonal zu $\overrightarrow{O2}$. Natürlich $\overrightarrow{O1}$ so gewählt werden, daß der Winkel $\theta _{14}$ ein spitzer Winkel ist (Abbildung 2).
(2)
Sei nun $\mathbf{i}=\overrightarrow{O5}$, $\mathbf{k}=\overrightarrow{O6}$ und j ein Einheitsvektor orthogonal zu beiden, so daß i, j, k ein Orthonormalsystem bilden.
(3)
Dann kann $\overrightarrow{O7}$, welches ja orthogonal zu i ist, als Linearkombination von j und k geschrieben werden:

\begin{displaymath}
\overrightarrow{O7} = \frac{\mathbf{j}+x\mathbf{k}}{\sqrt{1+x^2}}
\end{displaymath}

und ganz analog:

\begin{displaymath}
\overrightarrow{O8} = \frac{\mathbf{i}+y\mathbf{j}}{\sqrt{1+y^2}}
\end{displaymath}

mit $x,y\in \mathbf{R}$
(4)
Dann folgt daraus sofort:

\begin{eqnarray*}
\overrightarrow{O9} &=& \frac{x\mathbf{j}-\mathbf{k}}{\sqrt{1...
...rrightarrow{O10}&=& \frac{y\mathbf{j}-\mathbf{k}}{\sqrt{1+x^2}}
\end{eqnarray*}


wie durch Einsetzen leicht zu zeigen ist.
(5)
$\overrightarrow{O1}$ ist orthogonal zu $\overrightarrow{O7}$ und $\overrightarrow{O8}$. Das bedeutet:

\begin{displaymath}
\overrightarrow{O1} = \frac{
xy\mathbf{i}-x\mathbf{j}+\mathbf{k}}{
\sqrt{1+x^2+x^2y^2}}
\end{displaymath}

und analog

\begin{displaymath}
\overrightarrow{O4} = \frac{
\mathbf{i}+y\mathbf{j}+xy\mathbf{k}}{
\sqrt{1+y^2+x^2y^2}}
\end{displaymath}

(5)
Und das wiederum heißt unmittelbar:

\begin{displaymath}
\sin\theta_{12}
=\cos\theta_{14}
=\overrightarrow{O1}\cdo...
...ghtarrow{O4}
=\frac{xy}{\sqrt{(1+x^2+x^2y^2)(1+y^2+x^2y^2)}}
\end{displaymath}

Ein wenig Algebra später sieht man: $\max\sin\theta_{12}=\frac{1}{3}$ für $x=y=\pm1$. Das heißt: Für zwei beliebige Punkte 1 und 2 lassen sich, wenn der Winkel zwischen ihnen $\theta_{12}\leq\arcsin\frac{1}{3}\approx19.5^{\circ}$ ist, immer acht weitere Punkte finden, so daß ein Diagramm wie in Abbildung 3 konstruierbar ist.

Sei nun 1 rot, dann müssen 3, 7 und 8 blau sein. Wenn nun 2 auch blau wäre, müßte 4 rot sein. 9 und 10 wären dann beide blau. Wenn aber 7 und 9 blau sind, so muß 5 rot sein. Wenn 8 und 10 blau sind, muß 6 rot sein. 5 und 6 sind aber orthogonal zueinander und können nicht beide rot sein. Widerspruch.

Damit ist der Hilfssatz bewiesen: Wenn der Winkel zwischen 1 und 2 kleiner ist als $\arcsin\frac{1}{3}$, können die beiden Punkte nicht verschieden gefärbt sein.

Der Beweis des Kochen-Specker-Theorems benutzt nun diesen Hilfssatz, indem folgende 15 Vektoren betrachtet werden (siehe Abbildung 4): sei p0 der Nordpol der Einheitskugel, und seien p1 bis p4 Punkte auf dem Nullmeridian, die jeweils $18^{\circ}$ auseinanderliegen (also auf 72, 54, 36 und 18 Grad nördlicher Breite). Seien q0 bis q4 Punkte auf dem Äquator bei 0, 18, 36, 54 und 72 Grad östlicher Länge und schließlich r0 bis r4 Punkte auf dem 90. Grad östlicher Länge und 0, 18, 36, 54 und 72 Grad nördlicher Breite.

Abbildung 4: Wahl der 15 Vektoren im Beweis des Kochen-Specker-Theorems.
\includegraphics[width=0.7\textwidth]{cradlevectors.eps}

Dann ist mit dem oben bewiesenen Hilfssatz sofort klar, daß alle 15 Punkte dieselbe Farbe haben müssen. Insbesondere müssen die Punkte p0, q0 und r0, die einen Satz von drei paarweise zueinander orthogonalen Vektoren repräsentieren, alle dieselbe Farbe haben. Nach Voraussetzung muß aber genau einer von drei paarweise zueinander ortohgonalen Vektoren rot sein und die anderen blau. Widerspruch. Damit ist bewiesen: Die Färbung einer Kugeloberfläche nach den beiden oben gesetzten Regeln ist unmöglich.

Abbildung: Unmögliches Kochen-Specker-Diagramm.
\includegraphics[width=0.7\textwidth]{cradle.eps}

Es ist auch möglich, die Verallgemeinerung des Diagramms aus Abbildung 3 zu konstruieren (Abbildung 5).

Das alles heißt:

(1)
In einem dreidimensionalen Raum mit nichtkommutierenden Untermengen jeweils untereinander kommutierender Operatoren (Sx2, Sy2, Sz2 und Sx'2, Sy'2, Sz'2 zum Beispiel) ist es unmöglich, einen Satz versteckter Variablen zu finden, so daß die Ergebnisse beliebiger Messungen durch die versteckten Variablen determiniert sind.
(2)
Da in jedem beliebigen höherdimensionalen Raum (1) für jeden beliebigen dreidimensionalen Unterraum gilt, sind hidden-variable-Theorien nach obigem Muster auch in jedem höherdimensionalen Hilbertraum unmöglich.
Das bedeutet nicht, daß jede hidden-variable-Theorie grundsätzlich unmöglich ist: eine hidden-variable-Theorie könnte zum Beispiel den Zusammenhang zwischen kommutierenden Observablen und Beliebigkeit der Messreihenfolge leugnen, und damit dem Beweis den Boden entziehen. Dieser Ansatz wird etwa in [Mer93] diskutiert und mit einer Reformulierung des Theorems erwidert (vgl. [KP94], aber auch [Mer90]). Eine solche Theorie müßte dann aber eine überzeugende Erklärung finden, warum bisher bei allen Experimenten beobachtet wurde, daß kommutierende Observablen in beliebiger Reihenfolge gemessen werden können.

Eine hidden-variable-Theorie könnte auch explizit nichtlokal sein [Pit89]. So könnte man in obigem Beispiel anführen, daß die Ausrichtung der Detektoren ihrerseits die versteckten Variablen beeinflußt. Dann müßte die hidden-variable-Theorie nicht mehr für beliebige Meßrichtungen, sondern nur für eine bestimmte gelten (was selbstverständlich möglich ist). Die Bohmsche hidden-variable-Theorie beispielsweise ist eine nichtlokale hidden-variable-Theorie: in ihr wird die Funktion $\Psi$ durch das gesamte System und nicht nur durch lokale Gegebenheiten bestimmt. An solchen nichtlokalen Theorien sind jedoch mehrere Dinge problematisch: erstens wurden hidden-variable-Theorien entwickelt, um Nichtlokalitäten zu beseitigen und durch lokale Beschreibungen zu ersetzen, und zweitens ist ein Abgrenzungsproblem diesen Theorien inhärent: In [ADR82] etwa wird die Ausrichtung der Detektoren während der Flugzeit der beobachteten Photonen geändert. Das bedeutet, daß die Information über die Ausrichtung eines der Detektoren das Photon, welches auf den anderen Detektor zufliegt, mit Überlichtgeschwindigkeit erreicht haben müßte, was natürlich nicht geht.

Der einzige Ausweg für eine nichtlokale hidden-variable-Theorie zur Beschreibung des Experiments in [ADR82] bestünde darin, zu erklären, daß die Information über Zeitpunkt der Änderung sowie neuer Ausrichtung der Detektoren schon a priori ,,im System`` enthalten war. Der von [ADR82] zur Veränderung der Detektorrichtung verwendete Modulator hätte dann die versteckten Variablen bereits vor Beginn des Experiments in geeigneter Weise beeinflußt. Es ist natürlich leicht einzusehen, daß diese Erweiterung des Systembegriffs keine Grenzen kennen darf: wenn die Ausrichtung des Detektors etwa vom Fall einer Roulettekugel in Monte Carlo oder von der Beobachtung eines Himmelsphänomens abhängig ist, dann müssen diese ebenfalls Teil der hidden-variable-Theorie sein. Dann aber stellt sich die Frage, was die Theorie dann überhaupt noch beschriebt.

Aus diesen Gründen sind hidden-variable-Theorien in den letzten Jahren etwas aus der Mode gekommen.



Next: Was ist die Bellsche Up: Herr Einstein, Herr Podolski Previous: Was ist die Bohm-Theorie?
FAQ Homepage