Nächste Seite: Pfadintegrale Aufwärts: Galilei-Symmetrie Vorherige Seite: Die Pauli-Gleichung   Inhalt

Der Stern-Gerlach-Versuch

Der Stern-Gerlach-Versuch zur ,,Richtungsquantelung`` wurde 1922, also schon vor der Entwicklung der modernen Quantentheorie ausgeführt6.9. Das Bohr-Sommerfeldsche Atommodell sagte allerdings bereits damals voraus, daß der Drehimpuls quantisiert sein sollte. Außerdem war bekannt, daß ein Atom mit einer Elektronenkonfiguration in einem Zustand zum Bahndrehimpuls $ l \neq 0$ (in moderner Sprache ausgedrückt) ein entsprechendes magnetisches Moment wie durch (6.11.39) aufweisen muß. Der Spin war allerdings noch unbekannt. Gleichwohl sollte ein Atomstrahl mit Atomen mit magnetischem Moment in einem inhomogenen Magnetfeld abgelenkt werden. Während die klassische Physik einfach eine kontinuierliche Aufweitung des Strahls vorhersagte, mußte nach dem Bohrschen Atommodell der Strahl in einem Magnetfeld mit Feldgradient in $ z$-Richtung entsprechend der Quantelung der $ z$-Komponente des Bahndrehimpulses in diskreter Weise abgelenkt werden. Stern und Gerlach gelang der Nachweis dieser Richtungsquantelung eines Atomstrahls von Silberatomen. Sie fanden eine Aufspaltung des Strahls entsprechend zweier Einstellmöglichkeiten der $ z$-Komponente des Drehimpulses, was mit der damaligen Vorhersage des Bohr-Sommerfeld-Modells verträglich war. Die moderne Quantentheorie würde allerdings bei einem Teilchen ohne Spin nur Aufspaltungen in eine ungerade Anzahl von Strahlen vorhersagen, denn der Bahndrehimpuls gehört immer zu Darstellungen der Drehgruppe mit Drehimpulsquantenzahl $ l \in \N_0$, und die $ z$-Komponente des Bahndrehimpulses kann immer nur die $ (2l+1)$ Werte $ m_z=\{0,\pm 1,\ldots,\pm l \}$ annehmen.

Im Lichte der modernen Quantentheorie betrachtet ist allerdings die Aufspaltung in zwei Strahlen für Silberatome leicht erklärbar: Das Silberatom besitzt ein Valenzelektron, das sich im Grundzustand in einem Bahndrehimpulszustand $ l=0$ ($ s$-Orbital) befindet. Die übrigen Elektronen füllen ihre entsprechenden Orbitale vollständig auf, so daß deren Gesamtdrehimpuls 0 ist. Entsprechend ist der Gesamtdrehimpuls des Atoms $ J=1/2$. Es verhält sich also wie ein neutrales Teilchen mit einer großen Masse und einem magnetischen Moment aufgrund des Spins $ 1/2$ dieses Elektrons, solange das Atom nicht auf irgendeine Weise in angeregte Zustände übergeht. Dies ist aber unter den Versuchsbedingungen von Stern und Gerlach nur höchst unwahrscheinlich. Daher können wir bei der Analyse des Experiments das Silberatom einfach als neutrales Teilchen mit einem magnetischen Moment entsprechend dem vom Spin des Valenzelektrons behandeln. Entsprechend der beiden Einstellungsmöglichkeiten für die $ z$-Komponente des Spins ( $ \sigma =\pm 1/2$) spaltet sich also der Strahl in der Tat in zwei Teilstrahlen auf, von denen einer aus Teilchen mit $ \sigma=1/2$ und einer aus solchen mit $ \sigma =-1/2$ besteht.

Schon diese qualitative Beschreibung zeigt, warum der Stern-Gerlach-Versuch auch heute noch als Musterbeispiel für den quantenmechanischen Meßprozeß dient: Er zeigt alle Charakteristika einer quantenmechanischen Messung, und wir wollen daher dieses Experiment aus quantentheoretischer Sicht genauer betrachten.

Image Stern-Gerlach_Experiment_de
Schematischer Aufbau des Stern-Gerlach-Versuchs (Quelle des Bildes: Wikipedia).
Der Versuchsaufbau ist schematisch in Abb. 6.1 dargestellt. In einem Ofen wird Silber geschmolzen, und durch eine Öffnung tritt ein Atomstrahl aus und wird durch Blenden auf eine bestimmte Richtung fokussiert. Dies können wir im Sinne der Quantentheorie als Präparation der Silberatome auffassen. Wir haben es allerdings mit einem gemischten Zustand von Teilchen zu tun, die einen Impuls besitzen, der entsprechend einer thermischen Verteilung um den Mittelwert $ \erw{\vec{p}}=\vec{e}_x p_0$ verteilt ist. Die Atome durchlaufen nun ein inhomogenes zeitlich konstantes Magnetfeld, welches wir in der Nähe des Strahls durch die Entwicklung bis zur ersten Ordnung in den Raumkoordinaten approximieren können:

$\displaystyle \vec{B}=(B_0 + \beta z) \vec{e}_z - \beta y \vec{e}_y.$ (6.12.1)

Dieses Feld erfüllt offenbar die Maxwell-Gleichungen

$\displaystyle \vec{\nabla} \cdot \vec{B}=0, \quad \vec{\nabla} \times \vec{B}=0$ (6.12.2)

für ein statischen Magnetfeld in einem quellenfreien Raumbereich. Der Hamiltonoperator (6.11.25) vereinfacht sich im gegebenen Falle wegen $ q=0$ zu6.10

$\displaystyle \op{H}=\frac{\vec{\op{p}}^2}{2M} + \mu_B g_s \vec{\op{S}} \cdot \vec{B}.$ (6.12.3)

Setzen wir (6.12.1) ein, erhalten wir ein vom Spin abhängiges Potential, dessen klassisches Analogon einer konstanten Kraft entspricht. Um die Analyse weiter zu vereinfachen, nehmen wir an, daß $ \vert B_0\vert \gg \beta \vert\erw{y}\vert$ ist, wobei wir annehmen, der Strahl sei hinreichend in $ xy$-Richtung um $ x=0$, $ y=0$ fokussiert. Dann können wir zunächst den einfacheren Hamiltonoperator

$\displaystyle \op{H}'=\frac{\op{\vec{p}}^2}{2M} + \mu_B g_s (B_0+\beta \op{z}) \op{S}_z$ (6.12.4)

verwenden. Betrachten wir Teilchen in einem $ \op{S}_z$-Eigenzustand, haben wir es also mit der Bewegung in einem konstanten Kraftfeld zu tun, und die Atome werden für $ \sigma=1/2$ nach unten, für $ \sigma =-1/2$ nach oben abgelenkt. Ein Atomstrahl, dessen Zustand durch eine beliebige Superposition aus solchen Eigenzuständen beschrieben wird, spaltet sich also entsprechend in zwei Teilstrahlen auf.

Falls die Strahlen in der $ yz$-Ebene hinreichend fokussiert bleiben, bilden sich zwei wohlseparierte Teilstrahlen, die in der hier betrachteten Näherung aus reinen $ \op{S}_z$-Eigenzuständen bestehen, d.h. in diesen Teilstrahlen haben wir es mit Teilchen zu tun, die eine wohldefinierte $ z$-Komponente des Spins besitzen. Vorher war diese Spinkomponente unbestimmt. Durch das inhomogene Magnetfeld können wir nun einen der Teilstrahlen ausfiltern und so Teilchen mit determinierter Spinkomponente präparieren. Der Zustand des Gesamtensembles wird aber immer noch durch eine Superposition bzw. durch einen Statistischen Operator beschrieben. Allerdings sind nach Durchlaufen des Magnetfeldes Ort und Spin-$ z$-Komponente verschränkt, d.h. eine hinreichend genaue Ortsmessung liefert zugleich auch einen wohlbestimmten Spinzustand. Man kann also durch Nachweis eines Silberatoms am Schirm mit einer nahezu $ 100\%$-Wahrscheinlichkeit sagen, welchen Wert $ \sigma =\pm 1/2$ die Spin-$ z$-Komponente dieses Silberatoms besitzt. Voraussetzung dafür ist allerdings, daß der Ort der Teilchen zumindest in $ z$-Richtung so scharf bestimmt ist, daß die beiden Teilstrahlen als wohlsepariert angesehen werden können. In diesem Zusammenhang nennt man die Ortskomponente $ z$ auch eine Zeigervariable, denn sie wird bei dem betrachteten Versuchsaufbau zur Messung der eigentlich interessierenden Observable, nämlich der Spin-$ z$-Komponente, im Sinne des Zeigers eines Meßgerätes verwendet.

Wir betrachten nun diese Vorgänge quantitativ. Zunächst beschreiben wir den Anfangszustand des Atomstrahls vereinfacht durch einen beliebigen Spinzustand und bzgl. des Ortes als Gaußsches Wellenpaket, das um $ \vec{x}=0$ gepeakt ist und einen entsprechend der Unschärferelation bestimmten Impuls mit $ \erw{\vec{p}} = p_0 \vec{e}_x$ besitzt:

$\displaystyle \psi_{\sigma}(t=0,\vec{x})=\frac{c_{\sigma}}{(2 \pi \Delta^2)^{3/...
...ta^2} + \ii p_0 x \right ), \quad \vert c_{1/2}\vert^2+\vert c_{-1/2}\vert^2=1.$ (6.12.5)

Diese Wellenfunktion ist normiert (Übung!):

$\displaystyle \int_{\R^3} \dd^3 \vec{x} \; \vert\psi(t=0,\vec{x})\vert^2=1.$ (6.12.6)

Die zeitliche Entwicklung dieser Wellenfunktion ist durch den Hamiltonoperator (6.12.3) bestimmt.

Wir betrachten hier aber nur den einfacheren Hamiltonoperator (6.12.4) und berechnen den Propagator. Dazu verwenden wir die Methode, die wir in Abschnitt 2.11 verwendet haben, um den Propagator für das freie Teilchen zu berechnen.

Wir berechnen also die Zeitentwicklung im Heisenberg-Bild, d.h. der Zustandsvektor $ \ket{\psi}$ ist zeitlich konstant, und die Zeitabhängigkeit der hier relevanten Observablenoperatoren wird durch die Heisenbergschen Bewegungsgleichungen

$\displaystyle \frac{\dd \vec{\op{x}}}{\dd t}$ $\displaystyle =\frac{1}{\ii} \comm{\vec{\op{x}}}{\op{H}'} = \frac{\vec{\op{p}}}{M},$ (6.12.7)
$\displaystyle \frac{\dd \vec{\op{p}}}{\dd t}$ $\displaystyle =\frac{1}{\ii} \comm{\vec{\op{p}}}{\op{H}'}=-\vec{e}_z M a \op{S}_z,$ (6.12.8)
$\displaystyle \frac{\dd \op{S}_z}{\dd t}$ $\displaystyle = \frac{1}{\ii} \comm{\op{S}_z}{\op{H}'}=0$ (6.12.9)

beschrieben. Dabei haben wir zur Abkürzung die Beschleunigung $ a=\mu_B
g_s \beta/M$ eingeführt. Die Gleichungen (6.12.7)-(6.12.9) sind unter Berücksichtigung der Anfangsbedingungen

$\displaystyle \vec{\op{x}}(0)=\pvec{\op{x}}, \quad \vec{\op{p}}(0)=\pvec{\op{p}}, \quad \op{S}_z(0)=\op{S}_z'$ (6.12.10)

zu lösen. Die Integration ist in diesem Falle sehr einfach und ergibt (Übung!)

\begin{displaymath}\begin{split}\vec{\op{x}} &=-\frac{a}{2} t^2 \op{S}_z' \vec{e...
...'\vec{e}_z + \pvec{\op{p}},\\ \op{S}_z &=\op{S}_z'. \end{split}\end{displaymath} (6.12.11)

Wie wir in (2.11.17) gesehen haben, ist das konjugiert Komplexe des Propagators durch

$\displaystyle U_{\sigma \sigma'}^{*}(t,\vec{x};t_0=0,\pvec{x}) = \braket{t=0,\p...
...sigma} = \matrixe{t=0,\pvec{x},\sigma'}{\exp(\ii t \op{H})}{t=0,\vec{x},\sigma}$ (6.12.12)

gegeben. Diese Gleichung folgt unmittelbar aus der Bewegungsgleichung für die Eigenvektoren nicht explizit zeitabhängiger Observablen im Heisenbergbild

$\displaystyle \ket{t,\vec{x},\sigma}=\exp(\ii t \op{H}) \ket{t=0,\vec{x},\sigma}.$ (6.12.13)

Es handelt sich also um die Komponenten der simultanen $ \vec{x}$-$ S_z$-Eigenvektoren bzgl. der $ \pvec{x}$-$ S_z'$-Eigenbasis. Wir können diese Größe unter Verwendung von (6.12.11) bestimmen, indem wir zunächst die simultanen Eigenwertgleichungen in dieser Basis schreiben:

\begin{displaymath}\begin{split}\hat{\vec{x}} U_{\sigma \sigma'}^{*} &= \left (-...
...^{*} \stackrel{!}{=} \sigma U_{\sigma \sigma'}^{*}. \end{split}\end{displaymath} (6.12.14)

Die letzte Gleichung besagt, daß $ U_{\sigma \sigma'} \propto
\delta_{\sigma \sigma'}$ ist. In der hier betrachteten Näherung bleibt also ein Spin-$ z$-Eigenzustand stets in diesem Eigenzustand, maW. es erfolgt während der Bewegung durch das Magnetfeld kein ,,Spin-Flip``. Wie wir unten noch sehen werden, ist dies allerdings die wesentliche Folge der hier betrachteten Näherung. Die Lösung von (6.12.14) ist ebenfalls einfach durch direkte Integration zu gewinnen (Übung!):

$\displaystyle U_{\sigma \sigma'}(t,\vec{x},\pvec{x}) = N(t) \exp \left \{\frac{...
...{x}-\vec{x})^2 - a t^2 \sigma (z'+z) \right] \right \} \delta_{\sigma \sigma'}.$ (6.12.15)

Dabei haben wir die Integrationskonstanten so angepaßt, daß unter der Voraussetzung, daß wir $ N(t)$ so wählen können, daß

$\displaystyle N(t)=N^*(-t)$ (6.12.16)

ist,

$\displaystyle U_{\sigma' \sigma}^*(-t,\pvec{x},\vec{x}) = U_{\sigma \sigma'}(t,\vec{x},\pvec{x})$ (6.12.17)

gilt6.11. Um $ N(t)$ zu bestimmen, verwenden wir die Tatsache, daß $ U_{\sigma \sigma'}(t,\vec{x},\pvec{x})$ die zeitabhängige Schrödingergleichung erfüllt. Dies führt auf eine lineare Differentialgleichung erster Ordnung für $ N(t)$, die die Lösung (Übung!)

$\displaystyle N(t)=\left (\frac{m}{2 \pi \ii t} \right )^{3/2} \exp \left (-\ii \frac{M a^2 \sigma^2 t^3}{24} \right)$ (6.12.18)

besitzt. Dabei haben wir die zunächst unbestimmte Normierungskonstante bereits so gewählt, daß auch die Anfangsbedingung

$\displaystyle U_{\sigma,\sigma'}(t=0,\vec{x},\pvec{x})=\delta^{(3)}(\vec{x}-\pvec{x})$ (6.12.19)

erfüllt ist.

Die Wellenfunktion mit dem Gaußschen Wellenpaket (6.12.5) als Anfangsbedingung lautet also

\begin{displaymath}\begin{split}\psi_{\sigma}(t,\vec{x}) & = \int_{\R^3} \dd^3 \...
...ght \} \\ & \qquad \times \exp[\ii \Phi(t,\vec{x})] \end{split}\end{displaymath} (6.12.20)

mit der Phase

\begin{displaymath}\begin{split}\Phi(t,\vec{x})=\frac{1}{24 M (4 \Delta^4 m^2 + ...
...- 12 M^2 a \sigma t^2 + 16 M^2 \vec{x}^2) \Bigg \}. \end{split}\end{displaymath} (6.12.21)

\includegraphics[width=0.6\linewidth]{sg-result-simple}
Wahrscheinlichkeitsverteilung für die $ z$-Position eines Teilchens nach Durchlaufen eines inhomogenen Magnetfeldes bei $ x=L$. Anfangs lag eine bei $ \vec{x}=0$ gepeakte Gaußverteilung vor, wobei die Teilchen mit gleicher Wahrscheinlichkeit eine Spinkomponente $ \sigma =+1/2$ oder $ \sigma =-1/2$ besitzen.
Um diese Wellenfunktion zu interpretieren, bilden wir ihr Betragsquadrat:

\begin{displaymath}\begin{split}\vert\psi_{\sigma}(t,\vec{x})\vert^2= &\left (\s...
...\frac{a \sigma}{2} t^2 \right)^2 \right ] \Bigg \}. \end{split}\end{displaymath} (6.12.22)

Die Ortswahrscheinlichkeitsverteilung für ein Teilchen mit anfangs scharf bestimmter Spin-$ z$-Komponente $ \sigma$ ist also zur Zeit $ t$ in der Tat eine Gaußverteilung, mit Ortserwartungswerten entsprechend der Bewegung des entsprechenden klassischen Teilchens. Dies liegt daran, daß die Kraft hier konstant ist und folglich die Ortserwartungswerte aufgrund des Ehrenfestschen Theorems die klassischen Bewegungsgleichungen erfüllen. Dies ersieht man auch durch direkte Mittelwertbildung aus (6.12.11). Die Unschärfe jeder der Ortskomponenten ist

$\displaystyle \Delta x(t)=\Delta y(t) = \Delta z(t)=\frac{\sqrt{4 \Delta^4 M^2 + t^2}}{2 M \Delta}.$ (6.12.23)

Stellen wir nun einen Schirm bei $ x=L$ auf, erreicht das Maximum des Wellenpakets diesen Schirm bei $ t=t_L=2ML/p_0$, und wir erhalten eine gute Separation der beiden Peaks in $ z$-Richtung, wenn die entsprechende Unschärfe klein gegen $ 2 z(t_L)=a \sigma t_L^2$ ist.

Gemessen werden (unter der Annahme einer idealen Photoplatte, die jedes Teilchen, das auf sie trifft, auch wirklich registriert) alle Teilchen, die im Laufe der Zeit $ t \in (-\infty,\infty)$ bei $ x=L$ ankommen. Die entsprechende Verteilung erhalten wir offenbar, indem wir die Stromkomponente

$\displaystyle j_x(t,x=L,y,z) = \frac{1}{2M \ii} \sum_{\sigma} [\psi_* \partial_x \psi - (\partial_x \psi^*) \psi ]$ (6.12.24)

über $ t \in \R$ integrieren. In Abb. 6.2 haben wir diese Stromkomponente für die Situation, daß anfangs gleich viele Teilchen mit Spin-$ z$-Komponenten $ \sigma =\pm 1/2$ vorhanden waren (d.h. $ c_{+1/2}=c_{-1/2}=1/\sqrt{2}$) numerisch über $ t \in \R$ und $ y
\in \R$ integriert, d.h. wir betrachten die Verteilung in $ z$-Richtung. In der Tat sind aufgrund der Wahl der Anfangsparameter für dieses Beispiel die beiden Peaks entsprechend der Anfangseinstellung des Spins wohlsepariert, und die Teilchen besitzen entsprechend unserer Näherung des Hamiltonoperators (6.12.4) praktisch reine Spin-$ z$-Zustände, wenn wir einen der beiden Teilstrahlen durch eine Blende laufen lassen, und den anderen vollständig absorbieren.

Betrachtet man statt der Näherung (6.12.4) den genaueren Hamiltonoperator (6.12.5), läßt sich das Problem nicht mehr geschlossen lösen. Die Heisenbergschen Bewegungsgleichungen für Orts-, Impuls- und Spinoperatoren lauten dann nämlich

\begin{displaymath}\begin{split}\dot{\vec{\op{p}}} &=\frac{1}{\ii} \comm{\vec{\o...
...S}}} &= \mu_B g_s \vec{\op{B}} \times \vec{\op{S}}. \end{split}\end{displaymath} (6.12.25)

Man kann allerdings mit Hilfe der zeitabhängigen Störungstheorie zeigen, daß für $ B_0 \gg \beta \erw{y}$ die Beimischungen von Teilchen mit entgegengesetzten Spin klein sind, weil die Korrekturglieder mit der großen Larmorfrequenz $ \omega=\mu_B g_s B_0$ oszillieren und sich somit bei der Zeitintegration der entsprechenden Stromkomponente $ j_x$ gegenseitig aufheben. Genauere numerische Untersuchungen zur Berücksichtigung des Spin-Flips beim Stern-Gerlach-Versuch finden sich in [PBCBGC05].




Nächste Seite: Pfadintegrale Aufwärts: Galilei-Symmetrie Vorherige Seite: Die Pauli-Gleichung   Inhalt