2023.06.16 - Klein-Gordon propagator in position space

Feynman propagator를 계산한 김에 그냥 관련 함수를 전부 계산해보기로 했다. 모든 two-point function은 결국 Wightman function이라 불리는 다음 두 함수의 계산으로 수렴한다.

$$ G^+(t,\vec{r}) := \langle 0 | \phi(t,\vec{r}) \phi(0) | 0 \rangle \,,\, G^- (t, \vec{r}) := \langle 0 | \phi(0) \phi(t,\vec{r}) | 0 \rangle $$

여기서 $G$에 달린 윗첨자의 부호는 positive frequency인가 negative frequency인가를 나타낸다. scalar field의 mode expansion에서 annihilation operator에 붙는 mode function이 positive frequency($\sim e^{- i E t}$)라고 불린다는 점에서 더없이 적절한 이름이라 하겠다.

$$ G^\pm = \int \frac{d^3 k}{(2\pi)^3} \frac{e^{\mp i (\omega_{\vec{k}} t - \vec{k} \cdot \vec{r})} }{2 \omega_{\vec{k}}} \,,\, \omega_{\vec{k}} := \sqrt{\vec{k}^2 + m^2} $$

Wightman function은 Klein-Gordon 방정식의 homogeneous solution을 만족한다.

$$ (\partial^\mu \partial_\mu + m^2) G^{\pm} (x) = 0 $$

주의해야 할 점이라면 Wightman function은 $x$가 원점을 지나는 lightcone의 안에 있든 밖에 있든 상관없이 정의된다는 점. 애초에 $x^2 = 0$인 lightcone 바로 위가 아니라면 발산하지 않는다. Feynman propagator는 time ordering operator[각주:1] $T$를 끼워넣은 것이므로 Wightman function으로부터 다음과 같이 구현할 수 있다. 단위허수 $i$가 어딘가에 붙긴 할텐데 중요한건 아니니까 무시하기로 하자.

$$ G_F (x) := \langle 0 | T \phi(x) \phi(0) | 0 \rangle = \Theta (t) G^+ (x) + \Theta(-t) G^{-} (x) $$

여기서 $x = x^\mu = (t, \vec{r})$은 좌표 4-vector인데, 혼동의 여지가 없으므로 그냥 위와 같이 간단하게 적기로 하자. 여기서 $\Theta(t)$는 Heaviside step function을 가리킨다. Feynman propagator가 Klein-Gordon 방정식의 Green's function이 되는 이유는 추가로 붙은 Heaviside function이 Dirac delta를 만들기 때문이다. ODE에서 Green's function을 구할 때 쓰는 테크닉과 원리상으로는 완전히 동등한 접근.

 

계산은 Feynman propagator 계산과 거의 동일하다. 약간의 부호만 신경써주면 될 뿐. 편의상 timelike separation을 먼저 고려하자.

$$ G^{\pm} =  \int \frac{d^3 k}{(2\pi)^3} \frac{e^{\mp i t \sqrt{k^2 + m^2}} e^{\pm i \vec{k} \cdot \vec{x}}}{2 \sqrt{k^2 + m^2}} $$

위 식에서 $k$ 적분을 구면좌표계로 변환한 뒤 $d \cos \theta$적분을 취한다.

$$ G^{\pm} = \frac{1}{2 (2 \pi)^2} \int k^2 dk d \cos \theta \frac{e^{\pm i k r \cos \theta} e^{\mp i t \sqrt{k^2 + m^2}}}{\sqrt{k^2 + m^2}} \\\\ = \frac{\mp i}{8 \pi^2 r} \int_0^\infty k dk \frac{e^{\mp i (t \sqrt{k^2 + m^2} - kr)} - e^{\mp i (t \sqrt{k^2 + m^2} + kr)}}{\sqrt{k^2 + m^2}} $$

$k \to -k$의 대칭을 이용하여 적분구간을 전체 실수로 확장하고 $\frac{1}{2}$를 곱한 뒤 지수를 정리하기 위해 다음 변수들을 도입한다. 이 때 $t>0$이라고 가정한다.

$$ \rho = \sqrt{t^2 - r^2} \,,\, \cosh \alpha = t / \rho \,,\, \sinh \alpha = r / \rho \,,\, k = m \sinh \eta $$

이 경우 적분은 다음과 같이 정리된다.

$$ G^{\pm} = \frac{\mp i m}{16 \pi^2 r} \int_{-\infty}^{\infty} \sinh \eta d \eta \left( e^{\mp i m \rho \cosh (\eta - \alpha)} - e^{\mp i m \rho \cosh (\eta + \alpha)} \right) $$

우선 적분구간을 정리해준다.

$$ G^{\pm} = \frac{\mp i m}{16 \pi^2 r} \int_{-\infty}^{\infty} \left( \sinh (\eta + \alpha) - \sinh (\eta - \alpha) \right) d \eta e^{\mp i m \rho \cosh \eta} $$

다음으로는 삼각함수 항등식을 이용해서 수식을 정리해준다.

$$ G^{\pm} = \frac{\mp i m \sinh \alpha}{8 \pi^2 r} \int_{-\infty}^{\infty} \cosh \eta d \eta e^{\mp i m \rho \cosh \eta} = \frac{\mp i m}{4 \pi^2 \rho} \int_{0}^{\infty} \cosh \eta d \eta e^{\mp i m \rho \cosh \eta} $$

마찬가지로 DLMF의 10.32.9식을 이용하면 정리 완료. 이 때 $z$는 $|\text{ph} (z) | < \pi/2$의 조건을 만족해야 하므로, 엄밀히 말해서는 $\pm i m \rho$를 허수축에서 $0^+$만큼 떨어진 boundary value로서 취급해야 한다.

$$ K_\nu (z) = \int_0^\infty dt \cosh (\nu t) e^{- z \cosh t} $$

위 적분을 대입하면 Feynman propagator와 비슷하게 생긴 Wightman function을 얻는다.

$$ G^{\pm} = \frac{m^2}{4 \pi^2} \frac{K_1 (\pm i m \rho)}{\pm i m \rho} \,,\, \rho^2 = t^2 - \vec{r}^2 > 0 \,,\, t>0 $$

$t<0$의 경우에는 $\cosh \alpha$ 정의의 부호를 뒤집어준다.

$$ \rho = \sqrt{t^2 - r^2} \,,\, \cosh \alpha = -t / \rho \,,\, \sinh \alpha = r / \rho \,,\, k = m \sinh \eta $$

정리되는 식은 $t>0$과 거의 비슷하지만 지수에서 차이가 나게 된다.

$$ G^{\pm} = \frac{\mp i m}{16 \pi^2 r} \int_{-\infty}^{\infty} \sinh \eta d \eta \left( e^{\pm i m \rho \cosh (\eta + \alpha)} - e^{\pm i m \rho \cosh (\eta - \alpha)} \right) $$

전체 부호를 앞으로 빼면 $G^+ \leftrightarrow G^-$의 교환에 대응되니 다음 식으로 정리된다.

$$ G^{\pm} = \frac{m^2}{4 \pi^2} \frac{K_1 (\mp i m \rho)}{\mp i m \rho} \,,\, \rho^2 = t^2 - \vec{r}^2 > 0 \,,\, t<0 $$

함수 자체는 거의 같게 나오지만 세세한 부분에서 차이가 있는 것을 볼 수 있다. 참고로 위 결과는 DLMF의 connection formula 10.27.8을 이용해 Hankel function으로도 적을 수 있다. 구체적으로 필요한 식은 다음.

$$ K_1(iz) = - \frac{\pi}{2} H_1^{(2)} (z) \,,\, K_1(-iz) = - \frac{\pi}{2} H_2^{(1)} (z) \,,\, z>0 $$

이 경우 positive frequency Wightman function은 다음과 같이 정리되며

$$ G^+ = \frac{i m}{8 \pi \rho} \left[ H_1^{(2)} (m \rho) \Theta(t) - H_1^{(1)} (m \rho) \Theta(-t) \right] \,,\, \rho^2 = t^2 - \vec{r}^2 > 0$$

negative frequency Wightman function은 위 함수의 켤레복소수로 주어진다.

$$ G^- = \frac{- i m}{8 \pi \rho} \left[ H_1^{(1)} (m \rho) \Theta(t) - H_1^{(2)} (m \rho) \Theta(-t) \right] \,,\, \rho^2 = t^2 - \vec{r}^2 > 0$$

여기서 $\Theta(x)$는 Heaviside step function. 위 두 형태가 Bogoliubov 양자장론 교재에서 제공하고 있는 형태이다.

 

Spacelike separation의 경우 $|\text{ph} (im\rho) | < \pi/2$의 조건을 생각해서 analytic continuation을 하면 되는데, 결과적으로는 $ \rho' = \sqrt{r^2 - t^2}$로 두고 Bessel function의 argument가 $m \rho'$이 되면 된다. 하지만 이왕 계산을 시작했으니 Feynman propagator 계산처럼 $t=0$인 좌표계를 잡는 대신 제대로 계산해보자. 이번에 택할 변수변환은 다음과 같다.

$$ \rho' = \sqrt{r^2 - t^2} \,,\, \cosh \alpha = r / \rho' \,,\, \sinh \alpha = t / \rho' \,,\, k = m \sinh \eta $$

이번에는 사인함수로 정리된다.

$$ G^{\pm} = \frac{\mp i m}{16 \pi^2 r} \int_{-\infty}^{\infty} \sinh \eta d \eta \left( e^{\pm i m \rho' \sinh (\eta - \alpha)} - e^{\mp i m \rho' \sinh (\eta + \alpha)} \right) $$

적분을 반으로 나눠서 정리해준다. 첫번째 항은 다음과 같이 정리된다.

$$ \int_{-\infty}^{\infty} \sinh \eta d \eta e^{\pm i m \rho' \sinh (\eta - \alpha)} = \int_{-\infty}^{\infty} \sinh (\eta + \alpha) d \eta e^{\pm i m \rho' \sinh \eta} \\ = \int_{-\infty}^{\infty} ( \sinh \eta \cosh \alpha + \cosh \eta \sinh \alpha) d \eta e^{\pm i m \rho' \sinh \eta} $$

두번째 항도 마찬가지로 정리할 수 있다.

$$ \int_{-\infty}^{\infty} \sinh \eta d \eta e^{\mp i m \rho' \sinh (\eta + \alpha)} = \int_{-\infty}^{\infty} ( \sinh \eta \cosh \alpha - \cosh \eta \sinh \alpha) d \eta e^{\mp i m \rho' \sinh \eta} $$

둘을 더하면 다음과 같이 정리된다.

$$ \cosh \alpha \int_{-\infty}^{\infty} \sinh \eta d \eta \left( e^{\pm i m \rho' \sinh \eta} - e^{\mp i m \rho' \sinh \eta} \right) \\\\ + \sinh \alpha \int_{-\infty}^{\infty} \cosh \eta d \eta \left( e^{\pm i m \rho' \sinh \eta} + e^{\mp i m \rho' \sinh \eta} \right) $$

첫번째 항은 DLMF의 10.32.7식을 이용해 정리할 수 있다.

$$ K_\nu (x) = \frac{1}{\sin (\nu \pi / 2)} \int_0^\infty \sin \left( x \sinh t \right) \sinh (\nu t) dt $$

결과는 Feynman propagator에서 보던 것과 비슷한 항.

$$ \int_{-\infty}^{\infty} \sinh \eta d \eta \left( e^{\pm i m \rho' \sinh \eta} - e^{\mp i m \rho' \sinh \eta} \right) = \pm 4 i \int_0^\infty \sinh \eta \sin (m \rho' \sinh \eta) d \eta \\ = \pm 4 i K_1 (m \rho') $$

두번째 항은 발산하는 항을 준다.

$$ \int_{-\infty}^{\infty} \cosh \eta d \eta \left( e^{\pm i m \rho' \sinh \eta} + e^{\mp i m \rho' \sinh \eta} \right) = 4 \int_0^\infty \cosh \eta \cos (m \rho' \sinh \eta) d \eta $$

대응되는 DLMF의 10.32.7식이 발산하기 때문. 식 사용 조건에 $|\mathfrak{R} \nu|<1$이 있었으니 단순 적용하기에 무리가 있기는 했지만.

$$ K_\nu (x) = \frac{1}{\cos (\nu \pi / 2)} \int_0^\infty \cos \left( x \sinh t \right) \cosh (\nu t) dt $$

여튼, 이 적분을 임시로 $f(m \rho')$이라고 부르기로 하자. 적분을 전부 더하면 다음과 같은 식을 얻는다.

$$ G^{\pm} = \frac{m^2}{4 \pi} \frac{K_1 (m \rho')}{m \rho'} \mp \frac{i m t}{ 4 \pi r} \frac{f(m \rho')}{\rho'} $$

발산하는 적분의 앞에 붙는 계수가 Lorentz symmetry를 만족하지 않는 것을 볼 수 있다. 따라서 가장 적절한 해법은 $f(m \rho') = 0$으로 두는 것. 따라서 이 경우 Wightman function은 다음과 같이 정리할 수 있다.

$$ G^{\pm} = \frac{m^2}{4 \pi} \frac{K_1(m s)}{m s} \,,\, s^2 = \vec{r}^2 - t^2 > 0 $$

 

앞서 구한 세 값을 한 식에 정리하고자 한다면 다음과 같이 적을 수 있다.

$$ G^{\pm} = \frac{m^2}{4 \pi^2} \frac{K_1(m \sqrt{s_{\pm}^2})}{m \sqrt{s_{\pm}^2}} \,,\, s_{\pm}^2 = \vec{r}^2 - (t \mp i 0^+)^2 $$

저번에 구한 Feynman propagator는 두 Wightman function을 조합하는 것으로 구할 수 있다.

$$ G_F = \Theta (t) G^+ + \Theta(-t) G^- = \frac{m^2}{4 \pi^2} \frac{K_1(m \sqrt{s_F^2})}{m \sqrt{s_F^2}} \,,\, s_F^2 = \vec{r}^2 - t^2 + i 0^+ $$

단순하게 analytic continuation condition이 맞도록 $s_{\pm}^2$에 붙은 $i0^+$의 위치를 바꿔준 것. 흥미로운 경우는 Pauli-Jordan 함수라고도 불리는 commutator의 기댓값. 이번에도 단위허수 $i$는 무시하기로 한다.

$$ G_{PJ} := \langle 0 | [\phi(x) , \phi(0)] | 0 \rangle = G^+ - G^- = \frac{m^2}{4 \pi^2} \left[\frac{K_1(m \sqrt{s_{+}^2})}{m \sqrt{s_{+}^2}} - \frac{K_1(m \sqrt{s_{-}^2})}{m \sqrt{s_{-}^2}}\right] $$

이 함수는 $s^2 = \vec{r}^2 - t^2 > 0$일때 0이 된다. 이렇게 spacelike separation의 commutator가 사라지는 조건을 microcausality라고 부르기도 한다.

  1. 레퍼런스에 따라서는 chronological ordering이라고 부르기도 한다. [본문으로]

'Physics > Problems' 카테고리의 다른 글

Klein-Gordon propagator in position space  (1) 2023.06.16
Measurements and Projection Operators  (0) 2015.03.04
Independent Susceptibilities  (1) 2014.09.18
압력밥솥 기압재기 및 밥 짓는 온도 재기  (10) 2009.03.30
상대론 문제  (2) 2008.07.14
Posted by 덱스터

Klein-Gordon field의 Feynman propagator를 position space에서 계산해본 적이 없는 것 같아서 뒤늦은 숙제(...) 처리. 일반적인 차원 $D$ 대신 그냥 4차원에서만 계산하기로 했다.[각주:1] 다음의 Fourier transform을 구하는 문제.

$$ \int \frac{d^4 k}{(2\pi)^4} \frac{-i}{-k^2 + m^2 - i \epsilon} e^{- i k \cdot x} = \int \frac{d^4 k}{(2\pi)^4} \frac{i e^{- i k_0 t} e^{- \vec{k} \cdot \vec{x}} }{k_0^2 - ( \vec{k}^2 + m^2 - i \epsilon)} $$

우선 $dk^0$ 적분을 처리한다. $t$의 부호에 의존하는 residue integral로 정리할 수 있는데 결과적으로는 $t$의 절댓값에만 의존하는 결과를 얻는다.

$$ \int \frac{d^3 k}{(2\pi)^3} \frac{e^{- i |t| \sqrt{k^2 + m^2}} e^{i \vec{k} \cdot \vec{x}}}{2 \sqrt{k^2 + m^2}} $$

앞으로는 $\tau = |t|$로 적기로 하자. 다음은 구면좌표계로 변환한 뒤 $d \cos \theta$적분을 취하면 된다.

$$ \frac{1}{2 (2 \pi)^2} \int k^2 dk d \cos \theta \frac{e^{i k r \cos \theta} e^{- i \tau \sqrt{k^2 + m^2}}}{\sqrt{k^2 + m^2}} \\\\ = \frac{-i}{8 \pi^2 r} \int_0^\infty k dk \frac{e^{- i (\tau \sqrt{k^2 + m^2} - kr)} - e^{- i (\tau \sqrt{k^2 + m^2} + kr)}}{\sqrt{k^2 + m^2}} $$

$k \to -k$의 대칭을 이용하여 적분구간을 전체 실수로 확장하고 $\frac{1}{2}$를 곱한 뒤 지수를 정리하기 위해 다음 변수들을 도입한다. 우선은 timelike separation을 고려하기로 한다.

$$ \rho = \sqrt{\tau^2 - r^2} \,,\, \cosh \alpha = \tau / \rho \,,\, \sinh \alpha = r / \rho \,,\, k = m \sinh \eta $$

이 경우 적분은 다음과 같이 정리된다.

$$ \frac{-i m}{16 \pi^2 r} \int_{-\infty}^{\infty} \sinh \eta d \eta \left( e^{- i m \rho \cosh (\eta - \alpha)} - e^{- i m \rho \cosh (\eta + \alpha)} \right) $$

우선 적분구간을 정리해준다.

$$ \frac{-i m}{16 \pi^2 r} \int_{-\infty}^{\infty} \left( \sinh (\eta + \alpha) - \sinh (\eta - \alpha) \right) d \eta e^{- i m \rho \cosh \eta} $$

다음으로는 삼각함수 항등식을 이용해서 수식을 정리해준다.

$$ \frac{-i m \sinh \alpha}{8 \pi^2 r} \int_{-\infty}^{\infty} \cosh \eta d \eta e^{- i m \rho \cosh \eta} = \frac{-i m}{4 \pi^2 \rho} \int_{0}^{\infty} \cosh \eta d \eta e^{- i m \rho \cosh \eta} $$

이제 DLMF의 10.32.9식을 이용하면 정리 완료. 이 때 $z$는 $|\text{ph} (z) | < \pi/2$의 조건을 만족해야 한다.

$$ K_\nu (z) = \int_0^\infty dt \cosh (\nu t) e^{- z \cosh t} $$

위 적분을 대입하면 Feynman propagator의 position space representation을 얻는다.

$$ \frac{-i}{-k^2 + m^2 - i \epsilon} \leftrightarrow \frac{m^2}{4 \pi^2} \frac{K_1 (i m \rho)}{i m \rho} \,,\, \rho^2 = t^2 - \vec{r}^2 > 0 $$

Spacelike separation의 경우 $ \rho' = \sqrt{r^2 - t^2}$로 두고 $\rho \to - i \rho'$로 continuation을 하면 된다. Analytic continuation에서 어떤 부호를 택할지 결정하는 문제는 $|\text{ph} (im\rho) | < \pi/2$의 조건으로부터 결정할 수도 있지만 $\tau=0$으로 두고 적분을 다음과 같이 정리하는 것으로도 결정할 수 있다.

$$ \frac{-i}{8 \pi^2 r} \int_0^\infty k dk \frac{e^{i kr} - e^{- i kr}}{\sqrt{k^2 + m^2}} = \frac{1}{4 \pi^2 r} \int_0^\infty k dk \frac{\sin (kr)}{\sqrt{k^2 + m^2}} $$

동일하게 변수변환 $k = m \sinh \eta$를 도입하면 적분이 다음과 같이 정리된다.

$$ \frac{m}{4 \pi^2 r} \int_0^\infty \sin \left( m r \sinh \eta \right) \sinh \eta d\eta $$

이번에는 DLMF의 10.32.7식을 이용한다.

$$ K_\nu (x) = \frac{1}{\sin (\nu \pi / 2)} \int_0^\infty \sin \left( x \sinh t \right) \sinh (\nu t) dt $$

정리하면 얻는 식은 다음과 같으므로 $\rho \to - i \rho'$의 부호 선택이 정답임을 알 수 있다.

$$ \frac{m^2}{4 \pi^2} \frac{K_1 (mr)}{mr} $$

결과적으로 branch cut이 자동으로 결정되는 식을 적고 싶다면 다음과 같이 적으면 되겠다.

$$ \frac{-i}{-k^2 + m^2 - i 0^+} \leftrightarrow \frac{m^2}{4 \pi^2} \frac{K_1 (i m \rho)}{i m \rho} \,,\, \rho^2 = t^2 - \vec{r}^2 - i 0^+ $$

  1. 별 이유는 없고 angular integral 처리가 귀찮아서 그렇다. 좋은 교재들의 전범(...)을 따라 일반적인 차원 $D$에서의 position space propagator는 독자들을 위한 연습문제로 남겨두기로 하자. [본문으로]

'Physics > Problems' 카테고리의 다른 글

Wightman functions for a scalar field  (1) 2023.06.20
Measurements and Projection Operators  (0) 2015.03.04
Independent Susceptibilities  (1) 2014.09.18
압력밥솥 기압재기 및 밥 짓는 온도 재기  (10) 2009.03.30
상대론 문제  (2) 2008.07.14
Posted by 덱스터

This series is divergent; therefore, we may be able to do something with it. -- Oliver Heaviside

 

$\frac{1}{r}$꼴을 갖는 Coulomb potential은 IR 발산이 있는 것으로 유명하다. 좀 더 구체적으로 말하자면, 학부 역학 수준에서 계산할 수 있는 궤도방정식을 풀어 얻는 Rutherford scattering의 미분단면적(differential cross-section)을 계산할 경우 다음과 같은 $\sin^{-4} (\theta/2)$의 꼴을 갖는다는 것이 알려져 있다.

$$ \frac{d\sigma}{d\Omega} \propto \frac{1}{\sin^4 (\theta/2)} $$

이 식을 적분하여 얻는 총산란단면적(total cross-section)은 발산한다.

$$ \sigma_{\text{tot}} = \int \frac{d \sigma}{d \Omega} d \Omega \propto \int \frac{d(\cos \theta)}{\sin^4 (\theta/2)} \to \infty$$

양자역학에서 Coulomb potential이 주어졌을 때의 산란문제를 풀 때도 이 성질과 관련된 현상이 나타난다. Griffiths 양자역학에서는 Coulomb potential을 Yukawa potential의 질량이 없는 극한으로 생각하기 때문에 등장하지 않지만 Landau 3권이나 교수님 세대의 메인 레퍼런스(...)란 느낌이 있는 Shiff책을 뒤적이다 보면 asymptotic region에서 파동함수가 평면파인 $e^{ikz}$로 수렴하는 것이 아니라 로그가 붙은 추가적인 위상항(phase factor)이 등장하는 것을 볼 수 있다.

$$ \psi \sim e^{ikz + (i/k) \log [k(r-z)]} $$

교재에서는 이런 Coulomb potential의 IR 발산에 대해 'Coulomb potential이 장거리 상호작용(long-range interaction)이기 때문에 발생한다'는 설명을 써놓지만, 구체적으로 무한원점에서 0으로 수렴하는 다른 potential들과 어떻게 다른지에 대해 설명하는 경우는 드물다[각주:1]. 왜 이런 현상이 일어나는지 고전역학적으로 이해하는 것이 이 포스트의 목표.

 

---

 

Coulomb potential이 주어졌을 때 그 potential을 따라 움직이는 시험 입자(test particle)의 궤도방정식을 푸는 문제는 몇 안 되는 정확하게 풀 수 있는 고전역학 문제이다. 심지어 궤도방정식 위키백과 페이지가 있을 정도. 시간에 대한 거리의 미분방정식을 각도에 대한 거리의 미분방정식으로 바꾼 뒤 $u = 1/r$이란 변수변환으로 조화진동자 방정식으로 바꾸는 과정이나 이렇게 얻은 궤도방정식으로부터 충돌 파라메터(impact parameter)에 대한 산란각(scattering angle)의 방정식을 얻는 과정은 많은 교재에서 충분히 다루고 있으니 여기서는 생략하기로 하자[각주:2].

 

여기서는 eikonal 근사의 변종으로 Coulomb potential에서의 산란을 풀어보자. Eikonal은 기하광학에서 빛의 경로를 계산하기 위해 쓰는데, WKB 근사라고 생각해도 좋다. 여담으로 eikonal은 해밀턴이 기하광학을 풀기 위한 수학적 기법을 다듬으면서 같은 기법이 고전역학에도 적용될 수 있음을 알아차리면서 현재의 해밀턴역학과 심플렉틱기하를 만들어내는 계기가 되었고, 슈뢰딩거의 파동방정식은 기하광학의 eikonal 방정식에서 영감을 얻었다고 한다.

 

고전역학이든 양자역학이든 산란 문제에서 eikonal 근사란 '직선 근사'라고 생각하면 된다[각주:3]. 구체적으로 이야기한다면, 입자의 경로를 1) 아무런 산란이 없는 직선 경로에 2) 산란을 일으키는 포텐셜의 효과를 집어넣어 얼마나 직선 경로에서 벗어나는지 섭동계산으로 구하는 방법이 되겠다.

 

이제 Coulomb potential에서의 고전적인 산란 문제에 eikonal 근사를 적용해보자. Landau 1권에서는 뉴턴역학을 기반으로 eikonal 근사를 사용하지만 여기서는 해밀턴역학을 기반으로 eikonal 근사를 써보기로 한다[각주:4]. 먼저 해밀토니안을 다음과 같이 적는다.

$$ H = \frac{p^2}{2} - \frac{k}{r} $$

해밀턴 운동방정식은 금방 적을 수 있다.

$$ \dot{\vec{r}} = \{ H , \vec{r} \} = \vec{p} \,,\, \dot{\vec{p}} = \{ H , \vec{p} \} = - \frac{k \vec{r}}{r^3} $$

이 역학계의 산란문제를 eikonal 근사로 푸는 것은 다음과 같은 ansatz를 이용해 섭동전개 파라메터 $k$에 대해 푸는 것으로 생각할 수 있다.

$$ \vec{p} = \vec{p}_0 + k \vec{p}_1 (t) + k^2 \vec{p}_2 (t) + \cdots \,,\, \vec{r} = \left( \vec{b} + \vec{p}_0 t \right) + k \vec{r}_1 (t) + k^2 \vec{r}_2 (t) + \cdots $$

여기서 $\vec{p}_0$는 asymptotic region에서의 운동량이고, $\vec{b}$는 충돌 파라메터의 역할을 한다. 이렇게 해석하려면 $\vec{b} \cdot \vec{p}_0 = 0$이란 조건을 추가로 얹어주는 것이 좋다. 섭동이 없는 원래 경로에서 시간 $t$의 원점을 재정의하는 것으로 이 조건을 맞출 수도 있고.

 

이제 위의 방정식을 풀어보자. 방정식을 풀려면 경계조건을 줘야 하는데, 가장 먼저 생각할 수 있는 경계조건은 다음 경계조건이다.

$$\vec{r}_{i>0} (-\infty) = \vec{p}_{i>0} (-\infty) = 0$$

언듯 보기에는 문제가 없는 경계조건으로 보인다. $t = -\infty$는 산란이 일어나기 한참 전의 과거이므로 섭동이 없는 원래 경로와 일치해야 한다는 직관과도 맞고. 하지만 이 경계조건은 절대로 맞춰줄 수 없다. Coulomb potential의 꼬리가 너무 길기 때문. 우선 이 문제를 무시하고 그냥 방정식을 풀어보자.

 

$\vec{p}_1$에 대한 운동방정식은 다음과 같이 주어진다.

$$ k \dot{\vec{p}}_1 (t) = - \frac{k (\vec{b} + \vec{p}_0 t)}{(b^2 + p_0^2 t^2)^{3/2}} $$

이 식에 처음 얹은 경계조건을 넣고 풀면 다음과 같은 답을 얻는다.

$$ \vec{p}_1 (t) = - \int_{-\infty}^t \frac{\vec{b} + \vec{p}_0 \tau}{(b^2 + p_0^2 \tau^2)^{3/2}} d\tau = -\frac{1}{ab^2} \left[ \left( 1 + \frac{at}{\sqrt{1 + a^2 t^2}} \right) \hat{b} - \frac{\hat{a}}{\sqrt{1 + a^2 t^2}} \right] $$

쌍곡함수로 변수변환을 하면 적분을 쉽게 할 수 있다. 문제를 풀 때 새로 정의한 변수들은 다음과 같다.

$$ \hat{b} := \frac{\vec{b}}{b} \,,\, \vec{a} := \frac{\vec{p}_0}{b} \,,\, \hat{a} := \frac{\vec{a}}{a} = \frac{\vec{p}_0}{p_0} $$

$k^1$ 차수에서 운동량 변화는 단순히 $\vec{p}_1 (+\infty)$를 읽어내면 된다.

$$\Delta \vec{p}_1 := \vec{p}_1 (+\infty) = - \frac{2 \hat{b}}{ab^2} = - \frac{2 \vec{b}}{p_0 b^2}$$

마찬가지로 $k^2$ 차수에서 운동량 변화는 $\vec{p}_2 (+\infty)$를 읽어내면 되는데, $\vec{p}_2$는 $\vec{r}_1$에 대한 해가 있어야 풀 수 있다[각주:5].

$$k^2 \dot{\vec{p}}_2 = - k^2 \left[ \frac{\vec{r}_1}{r_0^3} - \frac{3 \vec{r}_0 (\vec{r}_0 \cdot \vec{r}_1)}{r_0^5} \right]$$

따라서 $\vec{r}_1(t)$를 풀어야 한다. 우선 식을 적어보자.

$$\vec{r}_1 (t) = \int_{-\infty}^{t} \vec{p}_1 (\tau) d\tau = - \frac{1}{ab^2} \int_{-\infty}^{t} \left[ \left( 1 + \frac{a\tau}{\sqrt{1 + a^2 \tau^2}} \right) \hat{b} - \frac{\hat{a}}{\sqrt{1 + a^2 \tau^2}} \right] d\tau$$

눈치가 빠른 분들은 알아차리셨겠지만, 이 정적분은 잘 정의되질 않는다. 두번째 항이 $\sim \tau^{-1}$의 꼴을 하고 있기 때문에 무한대에서 로그 발산이 있기 때문이다. 첫번째 항은 정적분으로 처리하고 두번째 항은 정적분을 포기하고 부정적분으로 처리할 경우 다음 식을 얻는다.

$$\vec{r}_1 (t) = - \frac{ e^{\sinh^{-1} (at)}}{a^2 b^2} \hat{b} + \left. \frac{\sinh^{-1}(at)}{a^2 b^2} \hat{a} \right|_{-\infty}^{t}$$

$x \in \mathbb{R}$일 때 $\sinh^{-1} x = \log (x + \sqrt{1+x^2})$이므로, 두번째 항의 발산은 예상대로 로그 발산임을 확인할 수 있다. 이 로그 발산은 다음과 같이 이해할 수 있다. Coulomb potential에서의 에너지 보존을 생각하면 무한대에서의 입자의 속력을 $v$라고 할 때 asymptotic region에서의 입자의 속력 $v$는 다음과 같다.

$$ \frac{v^2}{2} = \frac{v_0^2}{2} + \frac{k}{r} \Rightarrow v \sim v_0 + \frac{c}{r}$$

따라서 아무런 힘을 못 느끼고 $v_0$의 속력으로 이동하는 섭동이 없는 경로와 Coulomb potential의 영향을 받아 섭동이 있는 경로 사이의 변위(displacement)를 계산하면 다음과 같아진다.

$$ \Delta r \sim \int (v - v_0) dt \sim \int \frac{c}{r} dt \sim \int \frac{1}{dr/dt} \frac{c}{r} dr \sim \frac{c}{v_0} \log r $$

$r^{-1}$보다 빠르게 떨어지는 다른 potential의 경우 입자가 멀어져 가면서 potential로부터 받는 영향이 충분히 빠르게 줄어들어 섭동이 없는 경로와 potential의 영향을 받은 경로 사이의 변위가 일정하게 유지된다. 하지만 Coulomb potential의 경우 potential의 영향이 0으로 줄어드는 속도가 느려 아무리 멀어지더라도 변위의 차이가 계속 누적되는 것이다. 발산하는 총산란단면적이나 양자역학 산란 문제를 풀 때 평면파에 로그만큼의 위상항이 추가로 붙는 현상은 이 흔적이라고 이해할 수 있다.

 

---

 

여튼, $k^2$ 차수의 운동량 변화를 계산하는 문제로 돌아오자. 발산이 있으면 잡으면 되는 법이다.

 

가장 단순한 해법은 $t = - \infty$를 기준점으로 잡지 않고 $t = 0$를 기준점으로 잡는 것이다. 실제로 worldline quantum field theory(WQFT)를 도입해서 post-Minkowskian 계산을 하는 팀에서 이런 접근을 취하고 있는데, 이 접근법은 일관성이 있다는 장점이 있지만 asymptotic variable을 새로 계산해야 하는 번거로움이 있다.

 

다른 해법은 로그 발산을 미리 섭동계산의 경계조건에 반영하는 것이다. 구체적으로는 다음과 같이 로그 발산을 $\vec{r}_1^{(0)}$로 뽑아내고 $\vec{r}_1^{(1)}$에 대한 방정식을 푸는 것.

$$ \vec{r}_1 (t) = \vec{r}_1^{(0)} (t) + \vec{r}_1^{(1)} (t) \,,\, \vec{r}_1^{(0)} (t) = \frac{\sinh^{-1} (at)}{a^2 b^2} \hat{a} $$

로그 발산을 갖는 경계조건을 $\vec{r}_1^{(0)}$로 뽑아내었기 때문에 남는 경계조건은 $\vec{r}_1^{(1)} (-\infty) = 0$이 되며, $\vec{r}_1 (t)$는 다음과 같이 풀린다.

$$ \vec{r}_1 (t) = \vec{r}_1^{(0)} (t) + \vec{r}_1^{(1)} (t) = - \frac{ at + \sqrt{1 + a^2 t^2}}{a^2 b^2} \hat{b} + \frac{\log \left( at + \sqrt{1 + a^2 t^2} \right)}{a^2 b^2} \hat{a} $$

위 해를 $\vec{p}_2$에 대한 운동방정식에 집어넣으면 $k^2$ 차수의 운동량 변화를 구할 수 있다. 적분구간이 $(-\infty, +\infty)$로 대칭적이라는 것을 이용하면 식을 좀 다 단순화할 수 있다.

$$ \Delta \vec{p}_2 = \int_{-\infty}^{+\infty} \left[ \frac{1}{a^2 b^5 (1 + a^2 \tau^2)} - 3 \frac{\sqrt{1 + a^2 \tau^2} - a\tau \log (a\tau + \sqrt{1 + a^2\tau^2})}{a^2 b^5 (1 + a^2 \tau^2)^{5/2}} \right] \hat{b} d\tau \\ - \int_{-\infty}^{+\infty} \left[ \frac{3a^2\tau^2}{a^2 b^5 (1 + a^2 \tau^2)^{5/2}} \right] \hat{a} d\tau $$

얼핏 봐서는 적분이 꽤 복잡하게 보이는데, 의외로 적분하고 나면 값 자체는 단순하다.

$$ \Delta \vec{p}_2 = - \frac{2 \vec{a}}{a^4 b^5} = - \frac{2 \vec{p}_0}{p_0^4 b^2}$$

$k$를 전부 살린 산란 후 운동량은 다음과 같은데

$$\vec{p} (+ \infty) = \left( 1 - \frac{2 k^2}{p_0^4 b^2} \right) \vec{p}_0 - \frac{2k}{p_0 b^2} \vec{b} + \mathcal{O}(k^3)$$

제곱해보면 $k^2$ 차수에서 에너지 보존이 성립한다는 것도 확인할 수 있다.

$$ \left| {\vec{p} (+ \infty)} \right|^2 = p_0^2 + \mathcal{O}(k^3) $$

  1. Landau 3권에는 있다 (566쪽 주석). 이 포스트와는 다른 설명을 보고 싶다면 란다우를 보세요. [본문으로]
  2. 진짜로 상관없는 여담이지만, 고등학생을 대상으로 한 물리 경시대회가 있던 시절 궤도방정식을 푸는 문제가 나온 적이 있다. 문제에 전혀 손도 못 댄 것이 분해서 그날 돌아오자마자 Marion의 해당 파트를 잡고 수식 유도과정을 전부 외워버렸는데, 다음 해 경시대회에는 궤도방정식과 관련된 문제가 전혀 등장하지 않았다. [본문으로]
  3. 다만 Weinberg의 양자역학 교재에서는 WKB근사로 취급하고 있어서 약간 다르다. Landau 3권의 quasi-classical 근사로 말하고 있다고 봐도 좋을 듯. [본문으로]
  4. 따로 작성하던 노트가 해밀턴역학 기반이라 뉴턴역학으로 옮겨적기 귀찮아서(...) 그렇다. 뉴턴역학에 적용하는 것은 연습 문제로 남긴다. [본문으로]
  5. 고전역학 교재에서 eikonal 근사로 산란문제를 푸는 것을 배웠고 Coulomb potential에 적용하는 연습문제도 풀어봤는데 IR 발산을 본 기억이 없다면 1차 근사까지만 배웠기 때문일 가능성이 높다. [본문으로]
Posted by 덱스터

제목은 아는 사람들은 다 아는(?) 책인 PCT, Spin and Statistics, and All That을 참고했다. 물론 나는 읽다 만(...) 책이지만. 이 포스트의 출발점은 다음 트윗 타래. 한번 정도는 정리해두는 것이 좋겠다는 생각이 들었다.

'세상에서 가장 아름다운 공식'이란 별명이 있는 오일러 공식의 장점(?)은, 네이피어수 (혹은 자연상수) $e$ 위에 올라가는 수학적 물체(mathematical object의 번역으로 이게 맞는지 모르겠다) $a$가 무엇이든 $a^2 = -1$이란 조건을 만족하기만 하면 된다는 것이다.

\[ a^2 = -1 \Rightarrow e^{a \theta} = \cos(\theta) + a \sin(\theta)\]

여기서 $a$는 일반적인 숫자(복소수체에서는 확실히 성립하는데 일반적인 체에서도 되는지는 모르겠다)나 행렬(사원수quaternion는 $2 \times 2$ 행렬과 대응관계를 맺기 때문에 사원수에서도 위의 식이 적용된다), 혹은 클리포드 대수Clifford algebra의 원소(기하대수geometric algebra 계산에서 이 성질을 이용한다) 등 무엇이든 될 수 있다. 그냥 1이 잘 정의되어 있고 제곱해서 -1이 되는 물체가 있다고 하면 언제든 쓸 수 있다는 의미. 다른 특기할 점은 위 공식이 다루기 까다로운 경우가 많은 삼각함수trigonometric function를 지수함수exponential function로 바꾸는 역할을 한다는 것이다. 따라서 주기성을 갖는 물리량이 있는 물리계에서는 위 공식을 반대로 적용해 삼각함수로 써지는 물리량을 지수함수의 '실수부'로 놓는 작업을 자주 한다.

\[ \cos(\theta) = \text{Re}[e^{i \theta}] \]

여기까지는 학부 2학년 수준에서 얼마든지 다루는 내용.

 

전기공학에서는 교류회로를 다룰 때 단위허수 $j$를 $j^2 = -1$으로 도입해 전류와 같은 물리량을 다음과 같이 쓰곤 한다.

\[ I(t) = \text{Re}[I_0 e^{j (\omega t + \delta)}] \]

일반적으로 쓰는 단위허수 $i$가 있는데 왜 하필 $j$일까? 트윗 타래에서 언급했듯 $j = -i$라고 여기는 경우가 있기 때문이다. $(-1)^2 = +1$이므로, 애초부터 단위허수에는 부호를 선택하는 자유도가 남아있었던 셈. $j=-i$라고 여기는 이유는 푸리에 전개가 다음과 같은 꼴을 취하기 때문이다.

\[ F(t) = \sum_{\omega} \tilde{F} (\omega) e^{-i \omega t} \]

처음 식과 비교해보면 지수함수에 올라간 항은 $-i \omega t$로, $j \omega t$와 부호 차이를 갖고있다. $j = -i$란 인식은 이 차이에서 비롯된 것. 그렇다면 왜 푸리에 전개는 위와 같은 꼴을 택하는 것일까? 예컨대 다음과 같은 표현도 수학의 관점에서 볼 때 푸리에 전개로서는 딱히 결격사유가 없다.

\[ F(t) = \sum_{\omega} \tilde{F} (\omega) e^{+i \omega t} \]

문제는 인과율causality로부터 얻는 주파수 공간frequency space의 함수 $\tilde{F}(\omega)$가 갖길 원하는 해석적 성질analytic property에 있다. 일반적으로 푸리에 전개를 통해 해석하는 (실)함수 $F(t)$는 입력에 따라 어떤 출력을 예상할 수 있는지를 나타내는 반응함수response function이고, 인과율과 계의 시간불변성time invariance을 가정할 경우 시간차 $t$가 양수일 경우에만 0이 아닌 값을 갖는다.

\[ t<0 \Rightarrow F(t) = 0 \]

그리고 이렇게 '한쪽 방향으로만 값을 갖는 함수'는 라플라스 변환Laplace transform을 쓸 수 있다. 이 방향은 나중에 브롬위치 적분Bromwich integral을 이야기할 기회가 생기거든 돌아오기로 하자. 여튼, 주파수 공간의 함수 $\tilde{F}(\omega)$는 다음과 같이 주어진다.

\[ F(t) = \sum_{\omega} \tilde{F}(\omega) e^{\mp i \omega t} \Rightarrow \tilde{F}(\omega) = \int F(t) e^{\pm i \omega t} dt \]

일반적으로 $\tilde{F} (\omega)$는 실수값만 갖지는 않고, 실수부와 허수부를 모두 갖는다. 따라서 다음과 같은 질문을 해볼 수 있다; 어차피 복소수 값을 갖는 복소함수라면, $\tilde{F} (\omega)$를 복소해석학complex analysis을 통해 다뤄 볼 수는 없을까? 안타깝게도 $\tilde{F}$는 전체 $\omega$ 복소평면에서 해석적인 성질을 가질 수는 없다. 단순하게 복소수 $\omega = \omega_1 + i \omega_2$를 실수부와 허수부로 나누어서 분석해보자.

\[ \tilde{F}(\omega_1 + i\omega_2) = \int F(t) e^{\mp \omega_2 t \pm i \omega_1 t} dt \]

위 표현은 $\mp \omega_2 < 0$일때 $F(t)$가 어지간히 이상한 함수가 아닌 이상 수렴한다. 반대로, $\mp \omega_2 >0$일때 많은 경우 발산해버리고 말 것이다. 따라서, 다음과 같은 결론을 내릴 수 있다.

  • \[ \tilde{F}(\omega) = \int F(t) e^{+ i \omega t} dt \]로 정의할 경우, $F(t)$가 인과율을 따른다는 성질은 $\tilde{F}$는 위쪽 반평면upper half plane에서 해석적인 성질을 갖는다는 성질로 이어진다.
  • \[ \tilde{F}(\omega) = \int F(t) e^{- i \omega t} dt \]로 정의할 경우, $F(t)$가 인과율을 따른다는 성질은 $\tilde{F}$는 아래쪽 반평면lower half plane에서 해석적인 성질을 갖는다는 성질로 이어진다.

일반적으로 $\tilde{F}(\omega)$는 위쪽 반평면에서 해석적인 성질을 갖는 것이 바람직하다고 여겨지기 때문에 푸리에 변환의 부호가 $F(t) = \sum_{\omega} \tilde{F} e^{-i\omega t}$로 결정되는 것이다. 힐베르트 변환Hilbert transform을 이용해 반응함수의 실수부와 허수부를 관계짓는 Kramer-Kronig 관계식 또한 이 부호의 선택에 의존한다. 'Kramer-Kronig 관계식을 증명하기 위해 그리는 적분 컨투어contour를 왜 위쪽 반평면에서 닫아야만 하는가?'란 질문에 대해 답을 주기 때문. 이유는 적분에 들어가는 integrand가 위쪽 반평면에서 완전히 해석적인 성질을 가지므로, 위쪽 반평면으로 컨투어를 닫아야 0이 되기 때문이다. 아래쪽 반평면에서는 무슨 일이 일어날지 모른다는 것은 또 다른 이야기.

\[ \tilde{F}(\omega) = \int F(t) e^{+ i \omega t} dt \,,\, \text{Im} [\omega_0] \le 0 \Rightarrow \frac{\tilde{F} (\omega)}{\omega - \omega_0} \, \text{analytic on upper half plane} \]

이렇게 사소해 보이는 부호 하나에도 그 부호를 선택해야만 하는 이유가 있기 마련이다.

Posted by 덱스터

대학원 고전역학에서 다룰만한 내용으로 교수님과 이야기하다가 Dirac bracket 이야기가 나와서 간단(?)하게 트위터에서 주절거렸던 내용을 정리. 해당 타래는 이것.



모든 미분방정식은 충분한 숫자의 변수를 도입하는 것으로 1계미분방정식으로 만들 수 있다. 예컨대 $y''+y=0$이란 미분방정식이 있다면 $x=y'$이란 독립변수 $x$를 도입하여 $x'+y=0$으로 만들 수 있다. 해밀턴역학도 어떤 의미에서는 그런 접근의 연장선상에 놓여있다. 르장드르 변환과도 엮여있기 때문에 좀 복잡한 방식으로 이 과정을 이용하기는 하지만.


트윗 타래에서 설명했듯, 해밀턴역학에서 해밀토니안 함수는 위상공간 위에서의 흐름(flow)을 만들어내는 물체로 생각할 수 있다. 해밀토니안 함수와 그에 대응되는 흐름 혹은 벡터장을 연결해주는 역할을 하는 것이 포아송 괄호(Poisson bracket)이다. 연결 방법은 $H \to \{H,\bullet \}$. 물론 위상공간 위에서의 흐름을 만들어내는 해밀토니안이 실제 계의 동역학과 관계가 있어야 할 이유는 없다. 보다 추상적인 임의의 함수도 포아송 괄호를 통해 위상공간 위에서 흐름을 만들어낼 수 있으며, 일반적으로는 계의 보존량 $Q$를 이용해 이런 흐름을 만들어낼 때 $Q$를 대칭 생성자(symmetry generator)라고 부른다. 이쪽은 운동량 사상(moment map)과 연결되는 방향이지만 이 글의 주제에서는 벗어나니 다음 기회에[각주:1].


임의의 함수는 포아송 괄호를 통해 위상공간 위에서의 벡터장과 대응될 수 있다.


위의 관점은 계의 모든 변수가 독립변수인 경우에는 문제 없이 적용이 가능하지만 계의 모든 변수가 독립변수가 아닌 경우, 즉 제약조건(constraint)이 존재하는 계의 경우에는 위의 관점을 적용하는데 무리가 있다. 이 경우 좌표를 새로 잘 정의해서 새 좌표에서는 모든 변수가 독립변수가 되도록 하는 것으로 위의 관점을 살려내는 방법이 있다. 물론 새 좌표를 찾는다는 것은 원칙상 가능하다는 뜻이고, 이 좌표를 찾는 일이 항상 쉬우리란 보장은 없다. 다른 방법은 디락의 디락 괄호(Dirac bracket)를 도입하는 것.


잠시 원래 이야기에서 벗어나 역사적인 맥락을 살펴보면, 디락이 디락 괄호의 도입을 생각하게 된 이유는 양자전기역학이었다고 한다. 디락은 포아송 괄호를 교환자(commutator)로 교체하는 것으로 고전계를 양자화할 수 있다는 것을 발견했는데, 같은 방법을 전자기학에 적용하려니 뭔가 잘 안 맞는다는 것을 알게 된 것이다. 디락은 가우스 법칙에 의해 전자기장이 가질 수 있는 값에 제약이 생기는 것이 원인이라는 것을 알게 되었고, 제약조건이 있는 계의 포아송 괄호에 해당하는 물체를 어떻게 찾아낼 것인가를 고민한 결과 디락 괄호를 찾아내게 된다.


다시 원래 이야기로 돌아와서, 제약조건이 있다는 뜻은 전체 위상공간 중 그 부분집합에 해당하는 $f_i(\vec{p},\vec{q})=0$을 만족하는 $(\vec{p},\vec{q})$만 실제 계의 상태를 나타낸다는 관점으로도 이해할 수 있다. 일반적으로 해밀토니안에 의해 만들어지는 흐름은 이 제약조건을 만족하는 위상공간 속 부분다양체(submanifold) 위에서 출발하더라도 그 밖을 벗어나게 되리라고 예상할 수 있다.


해밀토니안에 의해 만들어지는 흐름(연두)은 제약조건을 만족하는 부분다양체(연파랑) 위에서 출발하더라도 그 부분다양체 위에서 움직이는 방향(녹색)과 그 부분다양체에서 벗어나는 방향(적색)을 모두 포함한다.


이제 문제는 포아송 괄호를 통해 얻은 해밀토니안 함수에 대응되는 흐름에서 제약조건을 만족하지 못하게 하는 방향의 흐름을 제거하는 것이다. 위의 그림에서 적색 화살표에 해당하는 성분을 제거하는 것이 목표인 셈. 이 목표는 제약조건을 만족하는 경우 0이란 값을 갖는 제약조건에 해당하는 함수 $f_i$들을 적당히 더하는 것으로 이루어진다. $f_i$에 의해 만들어지는 흐름 $\{f_i,\bullet\}$은 일반적으로 0이 아니기 때문. 수식으로 나타내면 다음과 같다.

\[ H \to \{ H, \bullet \}_{\text{Dirac}} = \{ H + c_i f_i , \bullet \} \]


이제 문제는 1. 충분한 숫자의 $f_i$를 찾아서 어떤 방향으로 벗어나더라도 벗어나는 방향을 제거할 수 있을 것 2. 계수들 $c_i$를 결정할 것 두가지로 나뉘게 된다. 첫번째 문제에 대한 답은 제약조건을 primary/secondary constraint와 1st class/2nd class constraint로 분류하는 과정과 관련이 있는데[각주:2] 여기서는 일단 충분한 숫자의 $f_i$들을 구했다고 가정하기로 하자.


디락 괄호는 포아송 괄호에 보정을 가해서 제약조건을 만족시키도록 한 것으로 볼 수 있다.


계수들 $c_i$는 어떤 해밀토니안 함수를 통해 생성된 흐름이더라도 제약조건 $f_i$의 값을 0으로 유지시켜야 한다는 것으로부터 구할 수 있다. 따라서 다음 방정식의 해를 구해야 한다는 뜻이다.

\[ \forall i \,, \{ H, f_i \}_{\text{Dirac}} = 0 \]


이 문제는 다음 가설풀이(ansatz)를 적용해서 풀 수 있다. 이런 가설풀이를 도입하는 이유는 포아송 괄호의 성질들 중 필요한 성질들을 보존하기 위함인데, 그 이야기까지 하기에는 글이 너무 길어지므로 대충 넘어가기로 하자.

\[ c_i(H) = - \{ H, f_j \}M^{ji} \]


위의 가설풀이를 적용하면 이제 풀어야 할 방정식은 아래와 같이 바뀐다.

\[ \{ H, f_i \}_{\text{Dirac}} = \{ H, f_i \} - \{ H, f_k \} M^{kj} \{ f_j, f_i \} = 0\]


고맙게도 위 방정식은 단순한 역행렬 계산으로 풀 수 있다.

\[ M^{ij} \text{ is the solution to } M^{ij} \{ f_j, f_k \} = \delta^i_k \]


이 정도가 디락 괄호의 핵심적인 아이디어에 속한다.

  1. 오스카 와일드의 표현을 따르자면 '다음 기회가 있다면'.(...) [본문으로]
  2. 나도 잘 구분 못한다. 어차피 아이디어를 이해할 때 명칭은 아주 중요한 것은 아니니 대충 넘어가자. [본문으로]
Posted by 덱스터

입자물리에서 표준모형(standard model)이란 현재 우리가 알고 있는 모형 중 가장 자연을 잘 기술하는 모형을 의미합니다. 물리학에 관심이 있으시다면 들어보셨을 네 개의 힘과 쿼크, 중성미자 등등이 이 표준모형을 구성하고 있죠. 그리고 대부분의 (입자)물리학자들의 꿈은 표준모형을 넘어서는 것입니다. 그래야 교과서에도 기록되고 운이 좋으면 노벨상도 받는 영광을 누릴 수 있을 테니까요. 그렇다면 현재 알려진 가장 정확한 자연에 대한 기술이 실패하고 있는 지점은 어디일까요?


표준모형이 자연을 기술하는데 실패하고 있는 지점은 의외로 많으며, 그 중 하나는 뮤온의 이상자기모멘트(anomalous magnetic moment)입니다. 뮤온은 경입자(lepton)의 하나로, 전자의 무거운 형제라고 생각하시면 얼추 맞습니다. 현재(2018년 12월) 위키백과의 해당 페이지에서 인용하고 있는 측정된 뮤온의 이상자기모멘트는 다음과 같습니다.

\[a_\mu = 0.001~165~920~9(6)\]


반면에 표준모형이 예측하는 뮤온의 이상자기모멘트는 다음과 같죠.

\[a_\mu^{SM} = 0.001~165~918~04(51)\]


두 값은 약 3.5 표준편차만큼의 차이를 보입니다. 3.5 표준편차는 두 값이 실제로 같았을 경우 1/1000보다도 작은 확률로 이런 차이를 보여야 한다는 의미로, 실험이 어딘가 잘못되었거나 우리가 가진 이론이 어딘가 잘못되었을 가능성이 높다는 정황증거가 되지요. 현재 페르미랩(Fermilab)에서는 이 차이가 실존하는지 검증하기 위한 정밀측정 실험이 진행되고 있습니다.




이상자기모멘트가 흥미로운 관측량이라는 것은 알겠는데, 그래서 이상자기모멘트란 무엇일까요? 이상자기모멘트를 이해하기 위해서는 각운동량과 자기모멘트에 대한 이해가 선행되어야 하므로, 우선은 이 둘에 대한 이야기를 해보도록 하죠.


물리학은 정량적인 측정량을 정성적인 측정량보다 우선시하는 학문입니다. 그러므로 다루고자 하는 대상의 특성을 숫자로 만드는 것이 중요하죠. 예컨대 운동량(momentum)이란 물체가 얼마나 격하게 일정한 방향으로 움직이고 있는지 그 양을 계량화한 것을 의미합니다. 같은 물체라도 더 빠르게 움직이고 있다면 더 많은 운동을 하고 있다고 할 수 있으니 더 큰 운동량을 가질 것이고, 같은 속도로 움직이고 있는 두 물체라도 더 무거운 물체가 더 많은 운동을 하고 있다고 할 수 있으니 더 큰 운동량을 갖는 식이죠. 물론 물체는 일정한 방향으로 움직이지만은 않습니다. 팽이와 같이 한 자리에서 뱅그르르 도는 운동을 하는 경우도 있지요. 이런 회전운동을 계량하기 위해 만들어진 물리량이 각운동량(angular momentum)입니다.


각운동량은 자신이 잡은 기준점에 대해 상대적으로 움직이기 때문에 갖는 오비탈 각운동량(orbital angular momentum)과 그 물체가 스스로 회전하기 때문에 갖는 스핀(spin)이란 두 값으로 분류할 수 있습니다. 흥미롭게도 우리가 아무런 내부구조도 없는 순수한 점으로 취급하는 전자와 같은 기본입자들조차 스핀을 가지며, 기본입자들이 어떤 스핀을 가지는가는 우리가 보고 있는 우주의 형성에 큰 영향을 미치고 있습니다. 물론 아무것도 없는 점이 회전하고 있다고 생각할 수는 없으므로 '전자가 회전하고 있다'는 설명을 너무 곧이곧대로 받아들여서는 안되고, '어떤 이유인지는 모르겠으나 전자는 고유한 각운동량을 갖는다'고 이해하시는 것이 좋겠습니다. 이제 이 모든 이야기의 출발점이 되었던 이상자기모멘트로 돌아오면, 이상자기모멘트는 입자가 갖는 스핀으로부터 예상되는 자기모멘트가 그 측정값으로부터 얼마나 벗어나는지를 나타내는 값입니다. 이제 자기모멘트에 대해 이야기할 시간이 되었군요.


자석 중에는 전기의 힘으로 자력을 발휘하는 전자석이란 물건이 있습니다. 전자석은 전하를 가진 물체가 움직여서 전류를 만들면 그 전류에 의해 자기장이 발생하는 원리를 이용한 자석입니다. 물론 대부분의 전자석처럼 전하가 크게 도는 운동을 해야만 자석이 만들어지는 것은 아닙니다. 전하가 제자리에서 뱅글뱅글 도는 것으로도 자석이 만들어질 수 있지요. 이렇게 회전하는 대전된[각주:1] 물체가 자신의 회전운동으로 만들어내는 작은 자석을 계량화한 값이 자기모멘트입니다. 그리고 자기모멘트는 회전운동으로부터 만들어졌으므로, 어떤 물체의 자기모멘트는 그 물체의 스핀과 비례할 것이라고 예상할 수 있습니다. 이 예상을 반영하여 한 물체의 자기모멘트를 그 물체의 스핀으로 나눈 것을 자기회전비율(gyromagnetic ratio)이라고 부르며, 랑데 g 인자(Landé g-factor)는 자기회전비율을 기본입자를 기술하기에 유용한 단위로 측정한 값을 의미합니다. 물론 이 이야기에는 기본입자인 전자나 뮤온도 포함되며, 앞서 잠깐 이야기했듯이 뮤온 자기회전비율의 이론으로 계산한 값과 실험으로 측정한 값 사이의 불일치는 현대물리가 마주하고 있는 가장 큰 문제 중 하나이기도 합니다.




그렇다면 가장 '자연스러운' 자기회전비율은 얼마일까요? 여기에 답하기 위해서는 기본입자들의 스핀에 대해서 좀 더 이해해야 할 필요가 있습니다.


앞서 우리는 기본입자들 또한 스핀을 가질 수 있다는 사실을 배웠습니다. 그렇다면 기본입자들은 아무런 스핀이나 가질 수 있는 것일까요? 물론 여기에 대한 대답은 '아니오'입니다. 현재 알려진 기본입자들은 스핀이 1(글루온/광자/W,Z 보손)이거나 1/2(쿼크/전자/중성미자 등), 혹은 최근 발견되어 누구나 이름은 들어본 적이 있는 힉스 입자처럼 0입니다. 일반적으로 양자역학에 따르면 스핀은 정수(0,1,2 등)거나 반정수(1/2,3/2,5/2 등)를 가져야만 하죠. 여기에서 스핀을 단순한 숫자로 적기는 했지만, 각운동량은 단순한 숫자가 아니라 어떤 단위로 계량되는 값이기에 실제 스핀은 $\hbar$로 쓰는 디락 상수를 단위로 잰 값이라고 생각하셔야 합니다.


흥미로운 점은 기본입자들이 전자기적으로 상호작용한다는 것을 반영하는 최소한의 조건(이를 minimal coupling이라 부릅니다)을 요구할 경우 스핀 1/2 입자를 기술하는 방정식인 디락방정식으로부터 g 인자의 값이 2여야 한다는 결론을 얻게 된다는 것입니다. 앞서 이야기했던 이상자기모멘트란 실제 g 인자의 값이 2에서 얼마나 벗어나는지를 잰 것으로, g 인자의 값은는 양자역학적인 효과에 의해 예측된 값인 2로부터 벗어나게 됩니다. 이상자기모멘트가 적어도 소수점 셋째 자리에서 시작한다는 것은 그만큼 양자역학적인 효과를 무시해도 좋으며, 많은 경우 g 인자의 값을 2로 취급해도 문제가 없다는 것을 의미하죠. 그렇다면 다른 입자의 경우에는 어떨까요?


Belinfante는 디락방정식의 선례를 따라 minimal coupling을 요구할 경우 스핀이 s인 기본입자는 g 인자의 값으로 1/s를 갖는다는 가설을 내놓은 적이 있습니다. s에 1/2를 대입할 경우 우리가 잘 아는 전자나 뮤온의 g=2라는 결론을 얻게 되죠. 그렇다면 다른 스핀을 갖는 기본입자의 경우는 어떨까요? 현재 표준모형에 남아있는 전하를 가지면서 스핀이 1/2이 아닌 입자로는 W 보손이 있으며, W 보손의 g 인자는 2.11[각주:2]정도인 것으로 알려져 있습니다. 그리고 W 보손의 스핀은 1이죠. 따라서 자연스러운 자기회전비율은 g=1/s란 Belinfante의 가설은 벌써부터 반례와 마주하게 되죠. 그래서, 가장 자연스러운 값은 무엇일까요?


W 보손의 g 인자 값이 2에 가깝다는 실험결과에 대해서 들으신 다음이라면 '가장 자연스러운 g 인자의 값은 2가 아닐까?'란 의심을 해볼 수 있겠지요. 흥미롭게도 이 단순무식한 답이 실제 답일 가능성이 높습니다. Holstein은 다음과 같은 정황근거를 제시합니다.[각주:3]


1) 고에너지 콤프턴 산란(Compton scattering)이 좋은 성질을 갖기 위해서 필요한 값이다.

2) GDH 합 규칙(sum rule)이 자연스럽게 측정하는 값이다.

3) 중력자 산란과 광자 산란 사이의 KLT 관계를 자연스럽게 반영하기 위해 필요한 값이다.

4) 열린 끈이론(open string theory)으로부터 예측되는 값이다.

5) 일반상대론에서 전기장의 영향 아래 움직이는 입자의 스핀을 기술하는 BMT 방정식이 가장 간단해지는 값이다.

6) 전하가 있는 회전하는 블랙홀(Kerr-Newman)을 점입자로 취급하는 극한에서 얻는 값이다.


위 목록의 흥미로운 점이라면 중력이 등장한다는 것입니다. 1번과 2번을 제외하면 모두 중력과 접점을 갖고 있습니다; 중력자 산란이나 일반상대론, 블랙홀은 당연히 중력과 떼려 해도 뗄 수 없는 관계이며, 끈이론의 경우에는 닫힌 끈(closed string)을 자연스럽게 고려하면서 닫힌 끈의 한 상태인 중력자를 이야기할 수 밖에 없게 되지요. 표준모형에서는 일반적으로 중력을 다른 힘들과 같은 위치에 두고 다루지는 않기 때문에 은근슬쩍 나타난 중력은 예상 밖의 등장이라고 할 수 있겠습니다. 하지만 예상 밖의 등장이라고 해서 그것이 우연이라고 단정할 수는 없는 법이죠.




이 포스트의 제목인 중력과 자기회전비율의 관계를 이야기하려면 이 관계가 가장 명확하게 드러나는 새로운 기술법으로부터 출발하는 편이 좋겠습니다. 주인공은 스피너-헬리시티 변수(spinor-helicity variable)입니다.


스피너-헬리시티 변수는 우리가 사는 세계인 3+1차원의 세계에서 회전을 기술하는 군인 $SO(1,3)$군이 행렬식이 1인 $2 \times 2$ 복소행렬들의 집합인 $SL(2,\mathbb{C})$군으로 확장될 수 있다는 사실에서 출발합니다. 표준적인 양자역학을 따른다면 우리가 다루는 모든 상태(state)는 이 $SL(2,\mathbb{C})$군의 표현(representation) 중 하나로 수렴해야 하죠. 스피너-헬리시티 변수는 단순히 모든 상태를 $SL(2,\mathbb{C})$군의 가장 기본적인 표현(fundamental representation)과 그 켤레복소수(complex conjugate)에 해당하는 표현만을 이용해 기술하는 것을 의미합니다. 이 모든 전문적인 내용을 이해하지 못하셨다면 단순히 '최대한 군더더기를 없애고 입자들의 상태를 표현하는 방법'이라고 생각하셔도 좋습니다.


최근까지만 해도 스피너-헬리시티 변수는 질량이 없는 입자에 대해서만 그 기술법이 알려져 있었습니다. 이 변수가 질량이 있는 입자에 대해서도 쓸 수 있도록 확장된 것은 채 2년이 지나지 않았죠. 이 변수를 쓰게 되면 여태 이야기한 g 인자와 중력과의 관계를 더욱 쉽게 이해할 수 있게 됩니다. 이제부터 우리가 주로 다룰 문제는 다음 파인만 도표(Feynman diagram)으로 나타낼 수 있으며, 질량이 있는 입자(검은 선)가 질량이 없는 입자(연파랑 물결선)를 방출하는 과정에 대한 산란진폭(amplitude)입니다. 산란진폭이란 산란실험의 중요한 물리량인 산란단면적을 계산하기 위해 필요한 물리량으로, 자세한 설명을 다루기에는 이 글이 너무 길어지므로 다른 글에서 설명하도록[각주:4] 하겠습니다. 또한 산란진폭 업계의 표준을 따라 모든 운동량은 들어오는(incoming) 방향으로 취급하도록 하겠습니다.

입자 셋을 다루는 파인만 도표


자세한 설명은 논문으로 넘기기로 하고 결과만 적어보면, 위와 같은 일반적인 입자 셋의 산란진폭은 다음과 같은 꼴로 적을 수 있습니다. 여기서 질량이 있는 입자는 질량 m에 스핀 s인 입자라고 가정하였으며[각주:5], 질량이 없는 입자의 헬리시티는[각주:6] h로 가정하였습니다.

\[ M_3^{h} = (mx)^h \left[ g_0 \frac{\langle {\bf 21} \rangle^{2s}}{m^{2s-1}} + g_1 x^{1} \frac{\langle {\bf 21} \rangle^{2s-1} \langle {\bf 2} 3 \rangle \langle 3 {\bf 1} \rangle}{m^{2s}} + \cdots + g_{2s} x^{2s} \frac{\langle {\bf 2} 3 \rangle^{2s} \langle 3 {\bf 1} \rangle^{2s}}{m^{4s-1}} \right] \]


이 산란진폭을 보면 총 2s개의 파라메터 $g_i$가 등장하며, 모두 각자의 해석이 존재합니다. 예컨대 질량이 없는 입자의 헬리시티를 h=1로 둘 경우 이 산란진폭은 입자가 전자기적으로 어떻게 반응하는지를 나타내며[각주:7], 첫번째 파라메터인 $g_0$는 입자의 전하량을 결정합니다. 흥미로운 점은 두번째 파라메터인 $g_1$인데, 이 경우 $g_1$은 g 인자를 결정하는 역할을 하며, $g_1$이 0이여야만 g 인자의 값이 2가 됩니다. 어떤 의미에서는 $g_0$만 남기고 나머지 파라메터를 전부 0으로 결정한 $M_3 = x \langle {\bf 21} \rangle^{2s}$이 가장 단순하고 자연스럽다고 할 수 있으니[각주:8] 이런 관점에서도 g=2가 가장 자연스러운 자기회전비율이라고 주장할 수 있겠지요.


위의 산란진폭에서 질량이 없는 입자의 헬리시티를 h=2로 둘 경우 이 산란진폭은 입자가 중력과 어떻게 상호작용하는지를 나타내게 됩니다[각주:9]. 흥미롭게도 중력이 입자의 질량과 상호작용하는 방식이 정해져 있을 뿐만 아니라 스핀과도 상호작용하는 방식이 정해져 있다는 성질에 의해 $g_1$이 0 이외의 값을 가지는 것은 금지되어 있습니다. g 인자가 자연스러운 값 2를 갖기 위해서는 $g_1$이 0이어야 한다는 사실을 의식할 수 밖에 없는 결과이지요. 그리고 실제로도 둘은 관련이 있습니다.




1986년 Kawai-Lewellen-Tye 세 사람은 (끈이론의 맥락 안에서) 중력자를 포함한 산란진폭을 글루온만 있는 산란진폭의 (적절한 처리를 거친) 제곱으로 쓸 수 있다는 사실을 발견합니다. 이를 KLT 관계라고 부르며, 이 관계를 양자효과를 고려한 경우까지 확장한 것을 BCJ(Bern-Carrasco-Johannsson) 관계라고 부릅니다. 이런 관련성은 색-운동학 이중성(colour-kinematics duality), 중력은 양밀 제곱 (GR=YM^2), 혹은 더블 카피 (double copy) 관계라는 이름을 쓰기도 합니다. 위에서 Holstein이 언급한 g=2에 대한 여섯가지 정황증거 중 세번째 정황증거가 이 관계를 이용하죠.


글루온은 양밀이론(Yang-Mills theory)의 스핀 1인 질량이 없는 입자를 지칭하는 말로, 우리가 아는 전자기력의 광자와 닮은 사촌이라고 생각하셔도 좋습니다. 따라서 KLT 관계는 광자를 포함한 산란진폭을 적절한 처리를 거쳐 제곱하면 중력자를 포함한 산란진폭으로 바꿀 수 있다는 것을 의미한다고 볼 수 있지요. 어째서 KLT 세 사람이 이런 관련성을 알아내게 되었는지 이해하기 위해서는 끈이론에서 중력과 양밀이론이 어떻게 구현되는지 알아야 합니다.


끈이론에서 입자는 끈의 각기 다른 진동 모드로 구현됩니다. 진동 모드란 끈이 얼마나 격하게 진동하는가를 나타내는 것으로, 대체로 진동이 격해질수록 그 진동 모드에 해당하는 입자의 질량과 스핀이 증가하게 됩니다. 둘은 진동이 격해짐에 따라 서로 비례해서 증가하는 모습을 보이는데, 이를 레제 궤적(Regge trajectory)이라고 부릅니다. 레제 궤적은 핵물리 발전 초창기에 강한 핵력을 통해 상호작용하는 입자들의 스핀과 질량 사이에 선형(linear)[각주:10] 관계가 존재한다는 관찰을 바탕으로 세워진 가설인데, 끈이론의 태동기에는 끈이론이 레제 궤적을 만들어낸다는 사실 때문에 많은 사람들이 끈이론을 가망있는 핵물리 모형으로 여기고 뛰어들게 되었죠.


각기 다른 진동 모드. N이 클 수록 격렬하게 진동하고 스핀과 질량이 증가한다.



끈이론에서 다루는 끈의 종류는 크게 두가지로 나눌 수 있습니다; 열린 끈(open string)과 닫힌 끈(closed string)이죠. 열린 끈은 신발끈처럼 양 끝이 이어져 고리를 이루지 않는 끈을 지칭하며, 닫힌 끈은 고무줄처럼 양 끝이 이어져 고리를 이루는 끈을 말합니다. 열린 끈의 경우 질량이 없는 입자에 해당하는 진동 모드 중에는 스핀이 1인 진동 모드가 포함되며, 닫힌 끈의 경우 질량이 없는 입자에 해당하는 진동 모드 중에는 스핀이 2인 진동 모드가 포함됩니다. 따라서 열린 끈의 경우에는 질량이 없고 스핀이 1인 입자가 등장하고 닫힌 끈의 경우에는 질량이 없고 스핀이 2인 입자가 등장합니다. 질량이 없고 스핀이 1인 입자로는 글루온과 광자가 있고, 질량이 없고 스핀이 2인 입자는 중력자로 유일하다는 것이 알려져 있습니다. 따라서 열린 끈을 다루게 되면 질량 없는 스핀 1 입자가 필요한 양밀이론을 포함하게 되며, 닫힌 끈을 다루게 되면 질량 없는 스핀 2 입자가 필요한 중력을 포함하게 되지요.


흥미로운 점은 열린 끈 두 개를 가져다가 양 끝을 이으면 닫힌 끈을 만들 수 있다는 것입니다. 그리고 이런 관계에서 양밀이론의 산란진폭을 제곱하면 중력이론의 산란진폭을 얻을 수 있다는 KLT 관계가 유도됩니다. 닫힌 끈의 산란진폭은 열린 끈의 산란진폭 한 쌍을 가져다가 곱한 것으로 이해할 수 있으므로, 중력이론의 산란진폭은 양밀이론의 산란진폭 한 쌍을 가져다가 곱한 것으로 이해할 수 있다는 것이지요.


열린 끈 둘의 끝을 잇는 것으로 닫힌 끈을 만들 수 있으며, 이 성질은 KLT 관계의 근간이 됩니다.


이 모든 이야기가 앞서 도입한 스피너-헬리시티 변수와 무슨 관계가 있을까요? 우리는 입자 셋의 산란진폭에는 총 2s개의 파라메터 $g_i$가 등장할 수 있으며, 그 중 $g_1$은 광자/글루온과의 상호작용의 경우 g 인자와 밀접한 관계를 맺고 중력자와의 상호작용의 경우 항상 사라져야 한다는 것을 배웠습니다. 만약 이 입자가 광자/글루온과의 산란진폭을 제곱하는 것으로 중력자와의 산란진폭을 얻을 수 있는 KLT 관계를 만족하게 된다면 광자/글루온 산란진폭의 $g_1$은 중력자 산란진폭의 $g_1$으로 변하게 됩니다. 그런데 중력자 산란진폭의 $g_1$은 항상 0이어야 한다는 것이 알려져 있으므로 이 입자의 광자/글루온 산란진폭의 $g_1$ 또한 0이어야 한다는 결론을 내릴 수 있으며, 이로부터 이 입자의 g 인자는 항상 2란 값을 만족해야 한다는 사실을 알 수 있습니다. 어떤 의미에서는 중력이 g 인자의 값이 2가 되도록 강제한다고 할 수 있는 것이죠.




우리는 자기회전비율이라는 입자의 전자기장과 상호작용하는 방식을 나타내는 한 파라메터가 전자기력과는 전혀 상관없어 보이는 중력과의 상호작용과 어떻게 연결될 수 있는지 알아보았습니다. 그리고 그 관계를 가장 명확하게 드러내는 방법은 최근에 개발된 표기법인 스피너-헬리시티 변수라는 것도 알게 되었죠. 이 새로운 도구는 우리에게 어떤 도움을 줄 수 있을까요?


미래를 예단하는 것은 멍청한 헛소리를 하는 가장 빠른 지름길이므로 여기서는 무엇을 할 수 있을지 조심스러운 전망을 내놓기보다는 이미 알려진 흥미로운 결과를 이야기해보려고 합니다. 중력과의 가장 '단순한' 상호작용이지요.


스피너-헬리시티 변수로 쓸 수 있는 가장 단순한 중력자와의 상호작용은 다음과 같습니다.

\[ M_3 = x^2 \langle {\bf 21} \rangle^{2s} \]


그리고 중력이 있는 계에서 가장 단순한 물체는 아무런 특징이 없는 (no hair) 블랙홀이라는 사실이 알려져 있죠. 따라서 이 산란진폭이 블랙홀과 중력자의 상호작용을 나타내는 것은 아닐까 가설을 세워 볼 수 있겠죠. Arkani-Hamed는 그 가설이 실제로 밝혀진다면 흥미로울 것이라고 이야기한 적이 있습니다. 블랙홀이 '기본입자'처럼 반응한다는 것을 의미한다면서요. 그리고 실제로도 이 산란진폭이 (고전적인 크기의 스핀을 갖는) 블랙홀의 산란진폭과 일치한다는 것을 보일 수 있습니다. 위에서 Holstein이 언급한 '블랙홀의 g 인자는 2다'란 명제를 생각해본다면, 어쩌면 이 사실은 그리 놀라운 일이 아닐지도 모릅니다. 하지만 스피너-헬리시티 변수라는 새로운 도구가 없었더라면 우리는 이 그렇게까지는 놀랍지 않은 일을 알 길이 없었겠지요. 이 새로운 도구가 어떤 길로 우리를 안내하게 될 지 기대하게 되는 이유이기도 합니다.

  1. 대전된 물체는 전체적으로 전하를 가진 물체를 말합니다. [본문으로]
  2. loop effect라 불리는 양자효과를 고려한 값으로, 양자효과를 제하면 남는 값은 정확히 2입니다. https://arxiv.org/pdf/hep-ex/0209015.pdf [본문으로]
  3. 이 목록에는 등장하지 않지만, 대부분의 초대칭이론의 경우에도 g 인자의 값이 2로 고정된다는 사실이 알려져 있습니다. 또 다른 강력한 정황증거인 셈이죠. [본문으로]
  4. 끈이론 개론 시리즈의 2편이 산란진폭을 다룰 예정입니다. [본문으로]
  5. 때때로 중요하지 않다고 생각되면 수식에서 질량을 나타내는 m을 생략하겠습니다. [본문으로]
  6. 헬리시티는 질량이 없는 입자의 스핀을 말합니다. 질량이 없는 입자의 경우 스핀의 방향을 뒤집을 수 없기 때문에 특별히 헬리시티란 이름을 붙입니다. [본문으로]
  7. 광자의 스핀이 1이기 때문에 일어나는 현상입니다. [본문으로]
  8. 이렇게 $g_0$만 남기고 다른 파라메터를 전부 0으로 날려버리는 선택은 질량이 없는 극한으로 아무런 문제 없이 보낼 수 있는 유일한 선택지이기도 합니다. [본문으로]
  9. 중력자의 스핀이 2이기 때문에 일어나는 현상입니다. [본문으로]
  10. 비례관계를 보다 전문적으로 일컫는 말이라고 생각하시면 됩니다. [본문으로]
Posted by 덱스터

얼마 전에 했던 삽질 관련 내용 정리.



이 잘 알려진(하지만 나는 몰랐던) 상식을 증명하는 방법은 Schwarz-Christoffel transform을 이용하는 것. 이 변환은 복소평면의 윗 반평면(upper half plane)을 다각형의 내부로 보내는 등각변환이다. 완전한 등각변환이라고 하기에는 꼭지점에서의 등각성이 깨지긴 하지만 그 정도는 무시하기로 하고(...). 2차원 이상유체 문제나 도파관 문제를 풀 때 이 변환을 이용하는 경우가 있는데, 요즘 물리과에서는 보통 풀 일이 없는 문제들이라 생소한 사람들도 많을듯. 구체적인 설명은 위키백과의 해당 항목으로 넘기기로 하자.


Schwarz-Christoffel map이 하는 일. 변수 z에서의 upper half plane을 등각성을 유지한 상태로 변수 w에서의 다각형 내부로 보낸다.


이 변환을 통해 증명하고 싶은 것은 'open string disk amplitude에서 vertex operator를 집어넣는 점들 중 일부가 한 점으로 수렴하고 이 점들을 a1, a2, ...으로 쓰기로 하자. 한 점으로 수렴하는 극한의 산란진폭은 a1, a2, ...에 해당하는 입자들이 산란하는 산란진폭과 나머지 입자들이 산란하는 산란진폭에 해당한다'는 주장인데, 다르게 이야기하면 'a1, a2, ... , c가 산란하는 진폭과 c, b1, b2, ...(b1, b2, ...는 vertex operator들 중 a1, a2, ...에 해당하지 않는 나머지)가 산란하는 진폭으로 나누어지며 그 사이를 c에 해당하는 상태가 진행하는 극한에 해당한다'가 된다. 단순히 말하면 c에 해당하는 internal propagator가 on-shell에 가까워져서 먼 거리를 이동한다는 이야기.


편의상 4ptc scattering을 생각하기로 하고 t-channel이 on-shell로 가는 극한을 생각하자. 이때 $SL(2,R)$를 이용해 vertex operator를 집어넣는 점 셋을 고정할 수 있다. 정석적인 선택은 $(0,\sigma,1,\infty)$. 따라서 다음 그림과 같은 형태의 Schwarz-Christoffel map을 찾는 것이 목표가 된다.


t-channel에서 intermediate state가 on-shell에 가까워지면 먼 거리를 이동하는 극한과 동등하다는 것을 보이기 위해 필요한 Schwarz-Christoffel map


여기서 $\bar{\sigma_1}$은 왼쪽의 꺾이는 점(혹은 1번과 4번 string이 intermediate state에 해당하는 string으로 합쳐지는 점)에 해당하고 $\bar{\sigma_2}$는 오른쪽의 꺾이는 점(혹은 intermediate state에 해당하는 string이 2번과 3번 string으로 갈라지는 점)에 해당한다. 이제 위 그림에서 $\sigma \to 1$의 극한이 $f(\bar{\sigma_2}) \to +\infty$로 가는 극한, 즉 $\bar{\sigma_1}$에 해당하는 점에서 $\bar{\sigma_2}$에 해당하는 점까지 이동하는 거리가 무한히 늘어나는 극한과 일치한다는 것을 보이면 된다. 이 변환은 다음 미분방정식의 해로서 주어진다.

\[ f'(z) = A (z-x)^{1}(z-0)^{-1}(z-\sigma)^{-1}(z-[\sigma + a(1-\sigma)])^{1} (z-1)^{-1} \]


이 식은 다음과 같이 분수들의 합으로 정리할 수 있다.

\[ f'(z) = A\left\{ \frac{\alpha}{z-0} + \frac{\beta}{z-\sigma} + \frac{\gamma}{z-1} \right\} \]


약간의 Mathematica 계산을 통해[각주:1] $\alpha = \frac{-x(a\sigma - a - \sigma)}{\sigma}$, $\beta=\frac{a(\sigma - x)}{\sigma}$, $\gamma = (1-a)(1-x)$가 된다는 것은 금방 확인할 수 있다. 영 못 믿겠으면 손으로 계산하는 것도 방법. 여기서 $a$와 $x$가 고정되어 있다면 $\alpha$, $\beta$, $\gamma$ 모두 유한한 값으로 고정된다는 것을 알 수 있다. 적분은 단순한 $1/z$의 적분이므로 바로 계산이 가능하다. 단, 복소변수이기 때문에 약간의 주의가 필요. Argument를 결정하는 branch cut은 편의상 -Im(z)축 방향으로 뻗도록 하는 것이 좋다.

\[ f(z) = A\left\{ {\alpha}\text{Log}z + {\beta}\text{Log}(z-\sigma) + {\gamma}\text{Log}(z-1) \right\} + B \]


state 1은 $-A\alpha$방향, state 2는 $-A \beta$방향, state 3는 $-A \gamma$방향, state 4는 $A(\alpha+\beta+\gamma) = A$방향에 위치한다는 것을 알 수 있다. 그러므로 위의 그림에 맞게 $A$의 값을 정하면 $A<0$이 된다. 이제 string worldsheet이 갈라지는 점들($f(\bar{\sigma_1})$과 $f(\bar{\sigma_2})$)의 위치를 살펴보자. 여기서 중요한 것은 Im(w)축상의 위치가 아니라 Re(w)축 방향의 거리이므로 Log의 argument에 해당하는 항은 잠시 무시해도 좋다. 우선 왼쪽의 합쳐지는 점의 위치를 구하면 다음과 같다.

\[ f(\bar{\sigma_1}) = A \left\{ \alpha \log |x| + \beta \log |x-\sigma| + \gamma \log |x-1| \right\} + i \cdots + B \]


오른쪽의 합쳐지는 점의 위치는 다음과 같이 주어진다.(수식이 약간 깨지는데 중요한 부분은 다음 문단에 있으므로 굳이 편집하지는 않겠다)

\[ f(\bar{\sigma_2}) = A \left\{ \alpha \log |\sigma + a(1-\sigma)| + \beta \log |a(1-\sigma)| + \gamma \log |(a-1)(1-\sigma)| \right\} + i \cdots + B \]


$\sigma \to 1$의 극한에서 발산하는 항만 모아보면 다음과 같다.

\[ f(\bar{\sigma_2}) = A \left\{ \beta \log |(1-\sigma)| + \gamma \log |(1-\sigma)| \right\} + \cdots \]


참고로 이 극한에서는 $\beta + \gamma \to 1 - x$이기 때문에, 오른쪽의 갈라지는 점은 $+\infty$의 방향으로 밀려나는 것이 맞다(부호를 $x<0$와 $A<0$로 결정했기 때문). 여기서 발산하는 항들은 전부 로그에 들어가는 값이 0으로 수렴하는 극한 때문에 등장했으므로, 이런 현상은 4ptc scattering에만 국한된 것이 아니라 일반적인 산란 상황에서도 관찰할 수 있을 것으로 기대할 수 있다. vertex insertion point가 모이게 되면 amplitude factorisation이 되는 극한, 혹은 intermediate state가 long distance propagation을 하는 IR divergence가 있는 극한으로 생각할 수 있다는 의미.


$\sigma \to 1$ 극한은 두 갈라지는 점 사이의 거리가 무한이 멀어지는 극한으로 생각할 수 있다


다만 이 논증은 worldsheet에서의 이야기이고, 실제 target space로 바로 연결되지는 않는다. 하지만 induced metric을 생각해보면 worldsheet상에서의 거리가 무한히 멀어지는 것과 target space상에서의 거리가 무한히 멀어지는 것은 비슷하다고 봐도 무방해 보인다.

  1. Apart 함수를 쓰면 된다. [본문으로]
Posted by 덱스터

지도교수님과 회식을 하던 도중 이런 이야기가 나왔습니다.

최근 들어 논문 원고만 쓰고 블로그는 방치해뒀다는 약간의 자책감과 글을 쓰지 않는 버릇을 들이다가는 생각하는 법도 잊어버린다는 약간의 위기감과 연구에 진척이 나질 않는데 잠시 숨을 돌려볼까 하는 약간의 일탈감에 힘입어 오랜만에 글을 써 볼까 키보드를 잡았습니다. 주제는, 교수님의 이야기에서 아이디어를 얻어, 제 전공이 있는지조차 모르는 사람들을 위한 안내서가 좋겠다 싶었죠. 제가 제 전공에 대해 글을 쓸 정도로 제 전공을 잘 아느냐고 물으신다면 양심의 가책은 느끼겠지만, 그런 것에 전혀 구애받지 않고 배짱으로 들이대는 것이 젊음의 특권 아니겠습니까(?)


이제부터는 나이를 묻거든 얼굴에 철판을 깔고 살기로 했습니다


과거 인기를 끌었던 사극 중 <태양인 이제마>가 있습니다. 사상의학의 개척자 이제마의 일대기를 다룬 드라마였는데, 드라마 중간에는 양의학을 접한 이제마가 다음의 말을 하는 장면이 있습니다.

"양의학은 부분을 깊게 살펴 빠르게 효과를 보지만 전체를 고려하지 않아 근본적인 대책이 되지는 못한다"(기억에 의존한 대사라 정확하지 않을 수 있습니다)

인터넷의 영원한(?) 떡밥 중 하나인 '한의학과 양의학 중 어느 쪽을 믿을 것인가'란 질문은 잠시 제쳐두고, '부분을 깊게 살핀다'는 말에 초점을 맞춰보겠습니다.


'부분을 자세히 파고들어 전체를 이해해보겠다'는 접근방식을 환원주의(reductionism)라 부릅니다. 예컨대 시계가 어떻게 작동하는지 알고 싶다면 시계를 구성하는 톱니바퀴들 사이의 관계를 이해하면 된다는 것이지요. 환원주의는 근대과학의 주된 구심점으로 작동했습니다. 현실 세계는 복잡하지만 현실 세계에서 '중요하지 않은 부분'을 쳐내고 나면 보다 단순한 현상으로 환원되고, 환원된 단순한 현상은 우리가 충분히 이해할 수 있으며, 단순화된 현실을 다루는 것으로 얻은 지식을 현실 세계로 다시 외삽하면 현실 세계를 이해할 수 있다는 것이 과학의 근간이었으니까요. 20세기부터 이어진 근대과학의 눈부신 성장을 보면 이런 접근법이 매우 성공적이었다고 평할 수 있겠죠.


입자물리, 혹은 고에너지물리는 이런 환원주의의 끝에 놓인 학문 중 하나입니다. 예로부터 사람들은 자신을 둘러싼 세계를 이해하고자 노력했습니다. 각종 신화 및 설화를 살펴보면 '왜 번개가 치는가?' 혹은 '왜 무지개가 생기는가?'와 같은 질문에 대한 답을 어렵지 않게 찾을 수 있다는 것이 그 방증이지요. 그리고 (어떤 의미에서는 지나치게) 성공적이었던 환원주의를 이 런 문제들에 적용해보는 사람들이 나타나는 것은 필연이라 할 수 있겠지요. 환원주의에 따르면 우리는 우리를 둘러싼 세계를 보다 작은 부분으로 나누어 그 작은 부분을 이해하는 것으로 원래 이해하고자 했던 세계를 이해할 수 있습니다. 이렇게 계속 세계를 작은 부분으로 나누어 나가다 보면 물질의 구성 요소라 여겨지는 소립자들을 이해하는 문제와 마주하게 됩니다. 소립자물리, 혹은 입자물리를 환원주의의 끝에 놓인 학문이라 부르는 것은 이러한 맥락에서입니다. 입자물리학의 성배를 최종이론(final theory), 혹은 모든 것의 이론(TOE; Theory Of Everything)이라 부르는 것 또한 이 연장선상에 있습니다.




입자물리는 고에너지물리라고도 부릅니다. 물리학자들이 작은 물체들의 행동을 가장 정확하게 묘사한다고 믿는 양자역학에 따르면 보다 작은 것을 보기 위해서는 보다 높은 에너지를 필요로 하므로, 가장 작은 것을 보고자 한다면 가장 높은 에너지를 이용해야만 하기 때문입니다. 그리고 실제로는 입자가 아닌 것들 또한 다룬다는 점에서 고에너지물리라는 명칭이 보다 정확하다고도 할 수 있지만, 용어의 혼동을 방지하고자 이 글에서는 입자물리라는 이름을 계속 사용하도록 하겠습니다.


입자물리는 그 이름이 시사하듯이 입자들의 행동을 다룹니다. 그렇다면 먼저 입자가 무엇인지 정의하는 것이 필요하겠지요. 양자역학이 등장하기 이전까지 물리학자들이 세계를 바라보는 관점에 커다란 영향을 미쳤던 뉴턴의 입장을 따른다면 입자는 하나의 점이고, 따라서 점입자(point particle)이란 용어를 쓰기도 합니다. 기하학에서 다루곤 하는 '크기와 부피를 갖지 않는 추상적인 점'이 바로 입자라는 것이지요. 물론 이 정의는 '얼마나 공간을 차지하는가'의 관점에서 주어지는 것으로, 점입자는 다른 물리적인 성질 즉 질량이나 전하와 같은 성질은 얼마든지 가질 수 있습니다. 또한 우리가 책을 한 권, 두 권 세는 것처럼 입자도 한 개, 두 개 셀 수 있지요. 이런 입자의 정의는 직관적으로는 잘 와닿기는 하지만 실제 연구를 하는 사람들에게 있어서는 충분히 세밀하지 못하다는 단점이 있습니다.


보다 현대적인 입자의 정의는 헝가리 출신 미국 물리학자 유진 위그너(Eugene Wigner)에 의해 정립되었습니다. 위그너 분류법(Wigner classification)은 다음과 같은 아이디어를 따릅니다.


1. 이론상 어떤 물체의 에너지와 운동량은 정확하게 측정할 수 있다. 그러므로 물체의 에너지와 운동량을 기본적인 변수로 잡자.

1'. (특수)상대론에 따라 에너지와 운동량을 조합하여 질량을 정의한다.

2. 어떤 물체든 그 물체를 회전시키면 그 회전에 반응한다[각주:1]. 물체의 운동량을 변화시키지 않고 물체를 회전시켰을 때 물체가 반응하는 방식을 따라 같은 운동량을 갖는 물체를 분류하자.

2'. 회전에 반응하는 방식을 스핀으로 정의한다.


운동량이라는 개념이 생소할 분들을 위해 운동량을 약간 설명해보자면, 운동량이란 말 그대로 '물체가 얼마나 많은 양의 운동을 갖고 있는가?'를 계량화한 것입니다. 같은 속도로 달리는 소형차와 거대한 트럭을 비교하면 거대한 트럭 쪽(무거운, 혹은 질량이 큰 쪽)이 보다 많은 운동을 갖고 있다고 할 수 있습니다. 또한 같은 소형차라고 해도 보다 빠르게 달리는 소형차가 보다 많은 운동을 갖고 있다고 할 수 있지요. 뉴턴의 입장에서는 이 두 관찰 결과를 반영하여 운동량을 질량과 속도의 곱으로 정의합니다. 운동량의 현대적인 정의는 이와는 조금 차이가 있지만 필요 이상으로 길어지게 되므로 이 정도에서 설명을 마치겠습니다.


정리하자면 현대적인 입자의 정의에서는 입자를 다음과 같은 것들에 의해 무엇인지 식별할 수 있는 대상으로 봅니다; 운동량 및 에너지가 몇인가(질량이 몇인가), 그리고 스핀은 몇인가. 이 과정을 통해 분류한 입자 한 개 한 개를 모아 입자 여러개를 묘사하는 것 또한 가능하다고 여깁니다. 물론 이 관점에서는 뉴턴의 입장에서와 마찬가지로 '전하가 몇인가'란 질문을 통해 서로 다른 입자를 식별할 수 있는 여지는 남아 있습니다. 하지만 이 정의에 '입자의 크기는 얼마이고 위치는 어디인가?'란 질문이 비집고 들어올 틈은 보이지 않죠. 그렇다고 입자의 크기나 위치를 묻는 질문이 의미가 없다고는 할 수 없습니다. 분명히 모든 존재하는 것은 어딘가 공간을 조금이라도 차지하고 있으니까요.




'입자의 크기가 무엇인가?'란 질문에 답하려면 '입자의 크기는 어떻게 측정하는가?'를 묻는 것이 더 나을 수도 있습니다. 이렇게 어떤 개념을 그 개념을 얻어내는 과정을 이용하여 정의하는 것을 조작적 정의(operational definition)라 부릅니다[각주:2]. 입자의 크기는 어떻게 측정할 수 있을까요?


우리는 손에 닿지 않는 물건의 크기를 가늠하는데 눈을 사용하곤 합니다. 눈이 하는 역할은 그 물건의 표면에서 반사된 빛을 잡아채는 것이지요. 그리고 이 과정을 다르게 표현하면 빛과 물건이 충돌을 일으킨 뒤 튕겨져 나온 빛을 관찰하는 것이라고 할 수 있습니다. 비슷한 방법을 입자의 크기를 측정하는 데 써볼 수 있습니다. 각기 다른 입자끼리 충돌시켜 보는 것이죠. 이처럼 입자와 입자를 충돌시키는 실험을 산란실험이라고 부릅니다. 가장 기본적이고 가장 투박하면서도 그에 걸맞지 않을만큼 강력한 실험이지요. 최근 힉스 입자의 발견으로 (약간의 희망을 담아 멋대로 수식어를 붙여본다면) 대중에게 널리 알려진 LHC에서 하는 실험도 이런 종류의 실험입니다. 그 이름(Large Hadron Collider; 큰 강입자 충돌기)이 암시하듯 LHC에서는 물리학자들이 강입자라고 분류하는 입자들을 매우 빠르게 가속시켜 서로 충돌시키는 실험을 하고 있습니다. 강입자는 나중에 이야기의 주연으로 등장하게 되지만 강입자에 대해서는 그 때 설명하기로 하죠.


산란실험은 반복수행을 염두에 두고 설계된 실험입니다. 작고도 작아 정확한 제어가 힘든 소립자들을 이용해야 하는 실험이라는 점이 반영된 셈이죠. 이렇게 반복수행을 염두에 두고 설계된 실험에서는 총 반복한 실험 횟수에 대하여 어떤 결과가 몇 번 얻어졌는지 그 비율을 관측하는 것이 실험의 목적이 됩니다. 그리고 이 비율은 입자의 '크기'를[각주:3] 정의하는 기준이 됩니다. '큰 물체일수록 더 많은 빛을 반사한다'란 일상생활에서의 관찰 결과를 소립자의 세계까지 확장한 것이지요. 재미있게도 산란실험은 '입자가 어디에 위치하고 있는가'에 대한 부분적인 답 또한 줍니다. 한 입자가 다른 입자와 충돌을 일으켰다면, 두 입자는 서로 같은 위치를 지나친 것이니까요. 어떻게 보면 당연해 보이는 '같은 위치를 지나쳐야만 충돌을 일으킨다'는 성질은 사실 상당히 강력한 제약이 됩니다. 이에 대해서는 다음 글에서 이야기하도록 하겠습니다.


물리학자들은 산란실험으로 결정되는 '크기'를 산란단면적(scattering cross-section)이라 부릅니다. 현대 입자물리학 역사의 큰 줄기는 산란실험으로 얻은 산란단면적의 정보로부터 이 산란단면적과 일치하는 예측치를 주는 이론을 역추적하는 일과 주어진 이론으로부터 원하는 산란과정에 해당하는 산란단면적을 계산해내는 일로 요약할 수 있을 정도로 산란단면적은 입자물리학에서 거대한 주축을 담당하고 있습니다. 끈이론은 이 거대한 주축으로부터 탄생했습니다.


연관글:


비전공자를 위한 끈이론 개론(2) - 산란행렬의 계산 (작성중)

비전공자를 위한 끈이론 개론(3) - TBA (작성 예정?)


  1. 여기서 반응이라는 것은 '책상 위의 책을 뒤집으면 더 이상 앞면이 보이지 않고 보이지 않던 뒷면이 보이는 것'처럼 그 물체를 기술하는 방법이 바뀐다는 것을 의미합니다. [본문으로]
  2. 보다 물리학, 특히 고전역학에 익숙한 독자들을 위해 약간의 설명을 덧붙이자면, '힘을 받지 않는 물체가 등속운동하는 기준계'가 관성기준계에 대한 일반적인 정의라면 '힘을 받지 않는 물체들을 각기 다른 방향으로 던져 그 물체들이 등속운동을 하는 것으로 보이도록 잡은 좌표계'가 관성기준계의 조작적 정의에 해당합니다. [본문으로]
  3. '크기'에 따옴표를 친 이유는 크기를 (조작적으로) 정의하는 다양한 방법이 있을 수 있기 때문입니다. 대부분의 경우 크기에 대한 각기 다른 정의는 물체의 크기에 대해 다른 답을 줍니다. 다양한 크기의 정의법을 보고 싶으신 분은 이 글을 참고하시면 좋겠습니다(링크된 글에서 전자의 크기를 정의하기 위해 사용하는 조작적 정의들은 이 글에서 사용한 정의와는 차이가 있습니다). [본문으로]
Posted by 덱스터

2016년 노벨 물리학상은 위상론적인 물질과 관련된 연구를 한 사울레스, 홀데인, 그리고 코스털리츠에게 돌아갔지요. 제 전공과는 조금 거리가 있는 주제인지라 그냥 넘어가려고 했었는데, 트위터에서 어쩌다가 개인 DM으로 해설을 부탁받아버려서 제가 아는 범위 내에서만 썰을 풀어봅니다. 그 말인즉, 노벨상 수상자들이 무엇을 했는지 설명하기보다는 노벨상 수상자들이 무엇을 했는지 알기 위해 필요한 사전지식들에 대해 설명해보겠다는 소리죠.


다음 주제를 주로 다룰 생각입니다.

1) 새로 발견된 상전이는 이전의 알려졌던 상전이와 어떻게 다른가

2) 실제로 이용하는 위상수학은 무엇에 대한 위상수학인가

3) 왜 위상론적 물질에서 경계면이 중요해지는가


그러면 시작해보죠.




위상수학에 대해 가장 널리 알려진 예시라고 한다면 도넛과 머그잔이겠지요. 거기에 질세라 노벨위원회에서 올해 수상자를 발표할 때 위상수학을 설명하면서 베이글과 프레츨을 예시로 들었습니다. 이 물체들이 어떻게 위상수학적으로 같고 다른지는 찰흙을 가지고 장난을 치다가 부모님께 혼나본 경험이 있으시다면 이해할 수 있으시겠지요. 아쉽게도 위상론적 물질에서 필요한 위상수학적인 양은 천 숫자(Chern number)라는 값으로, 앞선 예시들과는 달리 쉽게 머리 속으로 그릴 수 있는 것들은 아닙니다.


위상수학에서는 우리가 머리 속으로 그릴 수 있는 평범한 도형들을 다양체(manifold)라는 개념을 이용해 정의합니다. 구체적인 정의는 논의를 괜히 쓸데없이 복잡하게 만들테니 필요없겠지요. 천 숫자는 접속(connection)이란 특별한 종류의 수학적인 물체를 다양체 위에 올려놓았을 때 그 접속에 대한 위상론적인 정보를 담고 있는 값입니다. 그러면 우선 접속이 무엇인지에 대해 알아야 위상수학이 어떤 역할을 하는지 알 수 있겠지요.


그다지 좋은 예는 아니지만[각주:1] 접속을 이해하는데 쓸 수 있는 장난감으로 굴렁쇠가 있습니다. 비록 저 자신은 굴렁쇠를 실제로 굴려본 적이 없고 교과서 사진으로나 봤을 뿐이지만 동전은 자주 굴려봤으니 자신감을 가져도 좋겠지요. 다시 굴렁쇠로 돌아와서, 어떤 위치에서 굴리기 시작한 굴렁쇠를 적당한 경로를 따라 원래 위치로 돌아오는 것을 생각해 봅시다. 만약 굴렁쇠의 각 점에 눈금이 매겨져 있었다면 굴리기 전의 굴렁쇠와 바닥이 맞닿은 점을 가리키는 눈금과 굴리고 같은 위치로 돌아왔을 때 굴렁쇠와 바닥이 맞닿은 점을 가리키는 눈금은 다르겠지요. 홀로노미(holonomy)나 모노드로미(monodromy)는 이 눈금이 얼마나 달라지는가를 잡아내기 위해 정의된 수학적인 물체입니다. 하지만 오늘 논의에서는 다루려던 내용이 아니므로 두 용어에 대해서는 이 정도에서 설명을 마치도록 하지요.


접속이란 개념을 이해하기 위해서는 굴렁쇠를 굴린 경로 위의 각 점에 굴러가고 있는 굴렁쇠를 관찰하는 관찰자를 올려놓는 것이 좋습니다. 각 점에 앉아있는 관찰자는 굴렁쇠의 눈금 중 어떤 눈금이 바닥과 닿아있는지를 기록할 수 있겠지요. 그리고 한 점에 앉아있는 관찰자가 관찰한 눈금은 바로 옆에 앉은 관찰자가 관찰한 눈금과 일정한 관계를 맺고 있습니다. 굴렁쇠는 미끄러지지 않고 굴렀을테니, 두 관찰자 사이의 거리만큼 굴렁쇠와 바닥이 닿은 눈금이 변했을테니까요. 이처럼 한 점에서 관찰한 무언가의 값을 바로 옆의 점으로 끌고가면 일반적으로는 그 값이 변합니다. 수학에서는 이런 정보를 담은 것을 접속이라고 부릅니다. 한 점에서의 정보를 바로 옆의 점으로 연결시켜 준다는 점에서 더없이 적절한 용어(접속은 영어로 connection이라 부릅니다)라고 할 수 있겠지요. 한 점에서 바로 옆의 다른 점으로 움직이는 방법은 움직일 수 있는 방향만큼이나 다양하기 때문에 접속은 '어떤 방향으로 움직이는가'에 대한 정보도 함께 담고 있어야 합니다. 방향에 대한 정보를 가지고 있다는 점에서 접속은 벡터장과 매우 비슷합니다.


약간은 의외의 사실일 수 있겠지만, 어떤 다양체에는 벡터장을 임의로 올려놓지 못한다는 것이 알려져 있습니다. 가장 간단하고 머리 속으로 그려볼 수 있는 예시로는 털난 공 정리(hairy ball theorem)이 있습니다. '털난 공을 빗을 수 없다'란 표현으로 유명한 이 정리는 공의 표면(2차원 곡면이므로 $S^2$라 부릅니다) 위에 올려놓은 벡터장은 항상 0이 되는 지점이 있어야 한다고 주장합니다. 크기가 0이 아닌 벡터장을 공에 납작하게 붙은 털에 빗댄 것이지요. 실제로 그런지 의심이 드는 분이라면 바람이 부는 지구 표면을 생각해 보시면 좋습니다. 과연 지구 표면의 모든 점에서 동시에 바람이 불 수 있을까요? 털난 공 정리에 따르면 지구의 적어도 한 점에서는 바람이 불고 있지 않아야 합니다.


위의 정리는 위상수학적인 결과입니다. 털난 공이라고는 했지만 그것이 꼭 공일 필요는 없는 것이지요. 공이 조금 찌그러져 있다거나 허리같은 길쭉한 부분이 있다거나 해서 벡터장이 0인 지점이 하나는 있어야 한다는 사실이 변하지는 않는다는 말입니다. 천 숫자는 털난 공 정리와 비슷하게 다양체 위에 올려놓은 접속이 임의로 주어질 수는 없다는 것을 말해줍니다. 천 숫자를 계산하면 정수를 얻지만 이 정수가 정확히 무엇을 세는가에 대해서는 저도 좋은 설명이 없다는 점이 아쉽군요. 다만 한 가지 확실하게 말할 수 있는 것은 두 접속에 대해 계산한 천 숫자가 서로 차이가 난다면 하나의 접속에 작은 변화를 누적시켜서 다른 접속으로 바꾸는 것이 불가능하다는 것이고, 이런 의미에서 천 숫자가 위상론적인 불변량이라는 것입니다.




천 숫자에 대해 이해하려면 우선 접속에 대해 더 자세히 알아야 합니다. 그러므로 접속에 대해 좀 더 이야기해보도록 하죠.


잘 만들어진 굴렁쇠라면 모든 점이 서로 엇비슷하게 생겼을 겁니다. 굴렁쇠에 눈금을 새겼더라도 어떤 눈금을 1로 두고 그 눈금부터 번호를 매길 것인가에 대한 자유가 남아있는 것이지요. 때문에 각 점에 앉아있는 관찰자가 각자 굴렁쇠를 하나씩 들고 '나는 이 눈금을 1로 세겠다'고 주장하는 것을 생각해 볼 수 있습니다. 이 눈금을 1로 세는 점을 기준점이라고 부르도록 하죠. 각 점에 앉아있는 관찰자가 임의로 기준점을 재조정하더라도 실제로 굴렁쇠가 굴러가는 것에는 영향을 미치지 않아야 합니다. 이렇게 기준점을 재조정하는 것을 게이지 변환(gauge transform)이라 부르고, 기준점 재조정에 영향을 받지 않는 것을 게이지 대칭(gauge symmetry)이라 부릅니다. 입자물리에 관심이 있으신 분들이라면 게이지 보존(gauge boson)이란 단어를 들어보셨을텐데, 그 단어에서 말하는 게이지와 지금 여기에서 말하는 게이지는 같은 수학적인 물체입니다. 단지 그 수학적인 물체를 무엇을 나타내기 위해 쓰고 있느냐의 차이 정도만 있을 뿐이지요.


접속은 언제까지나 '한 점에서 읽어낸 값을 바로 옆의 점으로 옮기는 방법'을 결정해주기 때문에 값을 읽어낸 점에서 관찰자가 선택한 기준점과 값이 옮겨질 점에서 관찰자가 선택한 기준점에 영향을 받습니다. 그래서인지 기준점을 재조정하는 과정인 게이지 변환을 할 경우 각 점이 얼마나 다르게 기준점을 재조정했는지의 정보까지 들어가야 해서 보다 복잡하게 변화하지요. 다르게 말하자면 '각 점에서의 기준점 선택'에 영향을 받는다는 의미에서 진짜 물리적인 의미를 갖는 대상이라고 보기는 힘들다고 할 수 있습니다. 게이지 변환에 영향을 받지 않는 것들, 즉 게이지 불변(gauge invariant)인 것만이 실제 물리적인 의미를 갖는 대상이라고 생각해야 한다는 것이지요. 그렇다면 접속으로부터 충분히 물리적인 의미를 갖는 대상을 얻어낼 수 있는지가 문제가 됩니다.


한가지 방법은 아주 작은 폐곡선을 생각하고 그 폐곡선을 따라 굴렁쇠를 원래 위치로 굴린 것과 굴리기 전의 굴렁쇠의 차이를 확인하는 것입니다. 같은 점에서 굴렁쇠를 비교하는 것이기 때문에 기준점을 옮긴다고 해도 눈금의 차이는 변하지 않지요. 마치 12와 16의 차이가 112와 116의 차이와 같은 것처럼 말입니다. 이를 곡률(curvature)이라고 부릅니다.[각주:2] 곡률은 작은 폐곡선의 경우 그 폐곡선을 경계면으로 갖는 곡면의 넓이에 비례해서 눈금의 차이가 커진다는 관찰에 기반을 두고 있습니다. 작은 곡면은 평행사변형으로 근사할 수 있고 평행사변형은 두 방향(마주한 변은 같은 방향이므로 두 방향만 갖습니다)을 갖기 때문에 곡률은 방향에 대한 정보를 둘 가지고 있어야 합니다. 또한 이 두 방향이 겹치게 되면 넓이를 갖는 평행사변형이 만들어지지 않기 때문에 주어진 두 방향에 대해 반대칭적(antisymmetric)이어야 하죠.


곡률은 물리적인 정보를 담습니다. 게이지 이론으로 이해할 수 있는 전자기학을 예로 들자면, 전자기장에 해당하는 접속의 곡률은 우리가 실제로 측정할 수 있는 전기장과 자기장으로 인식됩니다. 또한 실제 천 숫자를 계산할 때는 접속을 이용하는 것이 아니라 접속의 곡률을 이용합니다. 이것을 이용해 여러가지 위상론적인 물체들을 만들 수 있습니다. 예를 들어 3차원 공간의 한 점을 감싸는 구의 표면 위에서 전자기장의 천 숫자를 계산하면 그 표면을 통과하는 총 자기장의 양을 얻는데, 천 숫자는 정수로 주어지므로 그 구 안에 들어있는 자기장의 원천 즉 자하의 총량은 정수로 주어진다는 것을 알 수 있습니다. 전하와 마찬가지로 자하 또한 양자화되어야 한다는 것을 의미하는 것이지요. 약간 원래 논의에서 벗어나기는 했지만, 고에너지 물리학에서는 이런 방식으로 위상수학을 이용해 위상론적인 물체들을 다루곤 합니다. 위상론적인 원인이 있고 입자의 성질을 갖기 때문에 이런 물체들을 위상론적 솔리톤(topological soliton)이라고 부르지요. 다른 위상론적인 물체로는 인스탄톤(instanton)들이 있는데 시간을 허수로 만드는 다소 설명하기 껄끄러운 일들을 해야 하므로 넘어가도록 하겠습니다.


천 숫자가 위상론적인 물질에서 물리적인 의미를 갖는 사례 중 하나는 정수 양자 홀 효과(integer quantum Hall effect)입니다. 금속에 아주 강한 자기장을 수직축으로 걸었을 때 전기장을 수평축으로 걸면 자기장과 전기장에 수직한 방향으로 전류가 흐르는데, 정수 양자 홀 효과는 이때 흐르는 전류와 전기장의 비를 측정한 것(홀 전도도라고 부릅니다)이 폰 클리칭 상수(von Klitzing constant)의 정수배로 나타나는 현상을 말합니다. 정수 양자 홀 효과에서는 이 홀 전도도가 천 숫자로부터 계산할 수 있다는 것이 알려져 있습니다.


정수 양자 홀 효과에서 계산하는 천 숫자는 조금 독특한 공간에서 계산합니다. 2차원 공간을 돌아다니는 전자들을 운동량으로 분류했을 때, 이 운동량이 만드는 공간에서의 적분이죠. 이 공간 위에서도 접속을 정의할 수 있습니다. 특정 운동량을 갖는 전자의 위상을 측정할 때 기준으로 삼는 위상을 운동량마다 다르게 설정해 줄 수 있기 때문이죠. 이를 베리 접속(Berry connection)이라고 부르고, 베리 접속으로부터 얻는 곡률을 베리 곡률(Berry curvature)라고 부릅니다. 양자 홀 효과와 관련된 천 숫자는 베리 곡률로부터 얻어지며, 이를 TKNN 불변량이라고 부릅니다.


정리해보자면, 실제로 위상론적 물질에서 쓰이는 위상수학은 접속과 관계된 천 숫자라는 불변량들이고 천 숫자가 실제로 힘을 발휘하는 경우의 예로 정수 양자 홀 효과를 들 수 있었습니다. 논의를 벗어나기는 했지만 고에너지 물리학에서는 위상수학을 어떻게 이용하는지를 다루면서 솔리톤에 대한 이야기도 꺼냈지요. 위상수학에 대한 이야기만 잔뜩 하고 정작 물리 이야기는 거의 하지 않았다는 점이 조금 마음에 걸리지만, 일단은 여기까지가 현재 할 수 있는 범위 내에서는 최선인 것 같네요.




천 숫자를 중심으로 살펴보긴 했지만 실제로는 더 많은 위상수학이 쓰입니다. 예를 들어 애니온(anyon)의 경우에는 매듭 군(braid group)과 관련이 있지만 잘 알지 못하는 관계로 넘어갔습니다. 글에서 언급된 자기단극자의 경우 한 차원 낮추게 되면 소용돌이(vortex)의 양자화를 얻는데, 이건 천 숫자로 표현하기에는 껄끄러운 점이 있어서 넘어갔죠.


마지막 글은 솔직히 쓰기는 할지 모르겠습니다. 요즘 일이 많아서... ㅠㅠ

  1. 수학적으로 정합적(consistent)인 묘사가 불가능하다는 점에서 좋은 예는 아닙니다. [본문으로]
  2. 참고로 일반상대론에서 말하는 '휜 공간'의 곡률과 이 곡률은 같습니다. 단지 곡률을 정의하기 위해 사용하는 접속이 다를 뿐이죠. [본문으로]
Posted by 덱스터

지구가 둥글다는 것을 알았던 옛 사람들은 태양이 지구를 도는 것에서 낮과 밤이 생기는 이유를 찾았습니다. 이를 천동설이라고 합니다. 갈릴레오 갈릴레이가 "그래도 지구는 돈다"라고 말했을 때는 '지구의 태양에 대한 회전'과 '태양의 지구에 대한 회전'이 서로 충돌하던 시절이었죠. '회전과 우주의 구조'라고 말했으니 이 대립을 생각하시는 분들도 많을 것입니다. 하지만 이 글에서는 조금 다른 이야기를 해 보려고 합니다.




회전을 정의하기


우선은 다루기 쉽게 회전을 수학적으로 정의해 보도록 하겠습니다. 중학생 수준을 넘는 수식은 쓰지 않을 예정이니 수학이라는 단어에 겁을 먹지 않으셔도 됩니다. 다만 얼마 전까지만 해도 고등학교 정규교육과정에 포함되어 있던 행렬 이야기는 할 예정이니 '행렬이 무엇인가' 정도는 알고 계셔야겠군요.


가장 먼저 필요한 것은 '공간을 수학으로[각주:1] 나타낼 방법'입니다. 이걸 '좌표'라고 부르죠. 어떤 물건의 위치를 문자(여기서는 숫자와 문자를 구분하지 않겠습니다)로 나타내는 규칙입니다. 토런트같은 P2P에서 파일의 위치를 나타내는 주소나 인터넷 페이지의 DNS 주소를 구할 때 "좌표 찍어줘"라고 말하는 것을 생각하시면 되겠습니다.


우리가 사는 공간에서는 세 숫자면 공간상의 모든 점을 표현할 수 있습니다. 예컨데 '내가 앉은 위치에서 동쪽으로 세 칸, 북쪽으로 두 칸, 위로 네 칸'으로 한 위치를 특정지을 수 있지요. 이를 두고 '우리는 3차원 공간에 산다'라고 말합니다. 한 물건의 크기를 적을 때 높이x너비x깊이 이 세 숫자로 크기를 적을 수 있는 것은 같은 이유에서입니다. (변위)벡터는 이 세 쌍의 숫자를 말합니다. 많은 경우 벡터를 시각화하기 좋도록 원점(내가 앉은 위치)에서 목표점(특정지을 위치)까지 이은 화살표로 생각하는데, 벡터의 크기는 이 화살표의 길이가 되지요.


이제 수학적으로 회전을 정의할 수 있겠네요. 회전이란 3차원 공간상의 벡터들을 1. 벡터의 크기를 보존하고 2. 벡터간 각도를 보존하는 3. 선형변환 입니다.[각주:2] 선형은 다른 의미가 아니고 $a$를 $f(a)$로 보내는 변환 $f$에 $a+b$를 집어넣으면 $f(a+b)=f(a)+f(b)$를 만족한다는 뜻입니다. 직선의 방정식처럼 결과가 단순하게 더해진다는 뜻이지요.


'선형'이라는 말이 나오는 순간부터(무한차원이 아닌 한) 우리는 행렬을 생각해야 합니다. 모든 선형변환은 행렬로 나타낼 수 있기 때문입니다. 여기서는 세 숫자를 세 숫자로 보내는 행렬이 되어야 하므로 우리가 생각해야 할 행렬은 3x3 행렬이며, 위에서 말한 세 조건들을 만족하는 회전을 나타내는 행렬들의 집합에는 O(3)라는 이름이 붙어 있습니다. 이 집합에는 거울상 변환에 해당하는 행렬도 들어있는데, 거울상 변환이란 거울에 비추었을 때 상이 뒤집어지는 것처럼 왼손을 오른손으로 보내는 변환들을 말합니다. 일반적으로는 이를 제거한 행렬들의 집합인 SO(3)를 주로 고려합니다. 어떻게 회전하든 오른손이 왼손과 포개어지지는 않으니까요.


SO(3) 집합이라는 표현할 대상을 찾았으면 표현할 방법을 구상해야겠지요. 이 집합의 한 원소(회전을 나타내는 어떤 행렬이 되겠죠)를 나타내는 한 가지 방법은 위도와 경도를 이용해 지구 위 위치를 나타내듯 두 각도를 이용해 회전의 중심으로 잡을 축을 찾고 그 축에 대한 회전각도를 적어주는 것입니다. 여기에는 숫자 셋이 필요하죠(위도, 경도, 회전각). 중요한 것은 숫자 셋이면 충분하다는 것입니다.


더 보기 쉽게 SO(3) 집합의 한 원소를 나타내는 방법은 오일러 각입니다. 오일러 각은 축 세 개를 지정하면 각 축에 대한 회전만으로 모든 회전을 구현할 수 있다는 것에서 출발합니다. 마찬가지로 숫자 셋(회전각 세 개)으로 모든 회전을 나타낼 수 있지요. 흔히 보는 자이로스코프에 회전축이 단 세 개만 존재하는 것과도 관련이 있습니다.


http://en.wikipedia.org/wiki/File:Gimbal_3_axes_rotation.gif


학부 2학년 역학 시간이나 동역학 시간에는 보통 zxz 오일러 각을 배웁니다. z축을 중심으로 전체를 한번 돌린 뒤 x축을 중심으로 한번 더 돌리고 다시 z축에 대해서 돌리는 것이죠. 보통은 팽이의 움직임이나 인공위성의 자세를 묘사하기 위해서 사용합니다. 반면 항공동역학 시간에는 xyz 오일러 각을 배웁니다. z축을 중심으로 돌린 뒤 y축으로 돌리고 다시 x축으로 돌리는 방법이죠. 다른 각을 쓰는 이유는 이 조합이 항공기의 세 횡운동(yaw, pitch, roll)을 나타내는데 더 편해서입니다.


오일러 각의 문제점은 특이점이 존재한다는 것입니다. 회전 전체의 집합 SO(3)에 대해서 우리는 '비슷한 회전'이란 것을 생각해 볼 수 있겠죠. 대부분의 회전에 대해서는 비슷한 회전으로 바뀔 때 오일러 각이 연속적으로 변합니다. 하지만 특정 회전에 대해서는 오일러 각이 불연속적으로 변합니다. 이를 두고 Gimbal lock이라 부릅니다. 이 문제가 생기면 제어 프로그램이 맛이 가기 때문에 이 문제를 피하는 것이 중요합니다.


문제가 있으면 해결하는 방법도 있어야겠죠. 이 문제를 해결하는 한 방법은 위에서 처음 제시한 (위도, 경도, 회전각) 조합을 이용하는 것입니다. 이 방법을 택할 경우 3x3 행렬들의 곱셈, 즉 아홉 숫자의 곱을 계산해야 합니다.


다른 방법은 사원수(quaternion)를 이용하는 것입니다. 이 방법은 단 네 숫자의 곱셈만을 이용합니다.




회전을 나타내는 다른 방법: 사원수


사원수는 간단하게 말하자면 복소수의 확장입니다.[각주:3] 복소수에 단위허수 두개를 더해서 숫자'처럼' 만든 물건이죠. 숫자'처럼'이라고 하는 이유는 행렬처럼 교환법칙( $ab=ba$)이 성립하지 않기 때문입니다.(다만 실수에 대해서는 교환법칙이 성립) 해밀턴 경이 아일랜드 왕립학회에 가다 떠올렸는데 마땅한 적을 곳이 없어서 지나가던 다리 위에다 사원수의 기본 아이디어를 새겼다는 일화가 전해지죠.


다리 위에 새긴 공식은 $i^2 = j^2 = k^2 = ijk = −1$ 으로, 단위허수 $i,j,k$ 간의 관계식입니다. 이 관계식으로부터 단위허수 사이의 관계식을 얻을 수 있는데, 가령 $ijk=-1$의 양 변 좌측에 $-i$를 곱하면

\[jk=(-ii)jk=(-i)(ijk)=(-1)(-i)=i\]


를 얻습니다.비슷한 과정을 반복하면 $ij=-ji=k, ki=-ik=j, jk=-kj=i$라는 관계식을 얻습니다.[각주:4]



회전은 크기가 1인 사원수(단위 사원수라 부릅니다)를 이용해 나타낼 수 있습니다.[각주:5] 벡터 $(e,f,g)$를 사원수 $v=ei+fj+gk$로 나타내면 단위 사원수 $q$를 이용해 회전된 벡터 $(e',f',g')$를 $e'i+f'j+g'k=qvq^{-1}$로 나타낼 수 있습니다.[각주:6] 구체적인 방법은 http://en.wikipedia.org/wiki/Quaternions_and_spatial_rotation를 참조하시는 편이 낫겠네요.


여기에 재미있는 점이 하나 있는데, 크기가 1인 사원수의 집합은 4차원 공간에서 원점으로부터 거리가 1인 구면, 그러니까 3차원 구면이 됩니다( $a^2+b^2+c^2+d^2=1$. 3차원 구면은 $S^3$란 기호를 써서 나타냅니다.) 따라서 우리는 회전의 집합 SO(3)가 3차원 구면 $S^3$의 구조를 가지리라고 예상할 수 있습니다. 정말로 그럴까요?


애석하지만 조금 다른 구조를 갖습니다. 왜냐하면 $q$를 이용한 회전과 $-q$를 이용한 회전이 같거든요. '3차원 구면의 대척점 쌍'에 대해 하나의 회전이 정의된 것이죠. 이는 다음 식으로부터 알 수 있습니다.

\[(-q)v(-q)^{-1}=(-1)qv(-1)q^{-1}=(-1)^2 qvq^{-1}=qvq^{-1}\]


SO(3)란 집합은 '3차원 구면의 대척점 쌍'을 원소로 갖는 것이죠. 이런 공간을 사영공간(projective space) $RP^3$로 부릅니다. $RP^3$는 '4차원 공간의 원점에서 직선을 쏘는 방법'들의 공간이기도 합니다.


회전을 나타내는 사원소들의 집합과(3차원 구면 $S^3$의 구조) 실제 회전을 나타내는 행렬의 집합 SO(3)는(사영공간 $RP^3$의 구조) 구조상 미묘한 차이를 보이는 것이지요. 놀랍게도 이 차이는 우리가 보는 세상이 우리가 보는대로 구성되는 것과도 관련이 있습니다.




회전의 미묘한 차이와 우주의 구조


지금까지 회전을 나타내는 두 가지 방법(오일러 각/사원수)이 있으며, 이 중 사원수를 이용한 방법은 오일러 각을 이용한 방법보다 실제로는 더 많은 경우의 수를 가지고 있다는 것을 보여드렸습니다. 재미있게도 이 차이는 물리학에서 입자를 구분하는 방식, 그리고 우주의 모습이 지금 이 모습인 것과 관련이 있습니다.


우선은 회전의 집합을 제대로 규정해야겠지요. 먼저 말씀드렸다시피 3차원 공간에서 회전의 집합은 SO(3)가 됩니다. 하지만 실제 회전에 대응되는 사원수가 나타내는 집합은 SU(2)라고 부릅니다. SU(2)는 3차원 구면 $S^3$의 구조를 가지며, '일반적인 회전 집합' SO(3)에 대해 SU(2)의 두 원소가 SO(3)의 한 원소에 대응되겠죠(사원수 $q$와 $-q$가 같은 회전이므로). 어떤 면에서는 SU(2)라는 집합이 SO(3)라는 집합을 '두 번 덮는다'고 표현할 수 있습니다. 이런 경우를 두고 'SU(2)가 SO(3)의 덮개공간(covering space)이다'라 합니다.



이런 수학적인 장난(?)을 하는 이유는 보통은 느끼기 힘들지만 회전은 분명 흔적을 남기기 때문입니다. 이 흔적은 다음과 같은 실험으로 확인할 수 있습니다. (머플러나 리본처럼) 면을 가진 끈을 준비해 책에 한 끝을 붙이고 다른 끝을 공중 어딘가에 고정합니다. 책을 바닥에 평평하게 두고 한 바퀴 돌리게 되면 끈은 꼬이겠지요. 하지만 '같은' 방향으로 한번 더 돌리면 끈이 풀립니다. 이를 Balinese plate trick이라고 부릅니다. 다음 동영상에서 컵이 계속 위쪽으로 향하도록 한 뒤 회전시킬 때 한 번 회전하면 팔이 꼬이지만 두 번 회전하면 팔이 다시 풀리는 것으로 확인할 수 있죠.



SU(2)와 SO(3)의 2대 1 대응은 '이 차이를 보는가/보지 못하는가'를 나타낸다고 생각하시면 됩니다. 홀수 번 회전과 짝수 번 회전을 구분할 수 있으면 SU(2), 구분하지 못하면 SO(3)가 되는 것이지요.


전자나 양성자와 같은 페르미 입자(fermion)는 홀수 번 회전과 짝수 번 회전을 구분하는 입자들입니다. 이 입자들은 한 바퀴 회전할 때 마다 -1이란 부호를 획득합니다. 광자나 중력자(아직 관찰되지 않았습니다)와 같은 보즈 입자(boson)는 둘을 구분하지 못합니다. 이 차이는 상당히 중요한 결과를 가져옵니다. 두 입자의 자리바꿈과 두 입자의 회전이 동등하기 때문에 페르미 입자의 '회전을 구분하는 특징'은 파울리 배타원리로 나타나게 됩니다. 파울리 배타원리는 '구분할 수 없는 페르미 입자가 같은 상태에 존재하는 것'을 금지합니다. 구분할 수 없는 페르미 입자 두 개가 자리를 바꾸면서 얻는 -1이란 부호가 파동함수의 상쇄간섭을 일으키기 때문입니다.[각주:7] 반면 보즈 입자에 대해서는 파울리 배타원리가 적용되지 않기 때문에 '구분할 수 없는 보즈 입자가 같은 상태에 존재하는 것'이 얼마든지 가능합니다. 극단적인 경우에는 모든 구분이 불가능한 보즈 입자들이 한 상태에 밀집하며, 이를 보즈-아인슈타인 응축이라 부릅니다.


파울리 배타원리의 가장 중요한 결과는 주기율표입니다. 다른 종류의 원자가 서로 다른 화학적 성질을 갖는 이유는 전자가 페르미 입자라서 같은 상태에 두 입자가 존재할 수 없기 때문에 서로 다른 궤도를 갖고 원자핵을 돌기(물론 엄밀하게 말할 때 '도는 것'은 아닙니다만 다른 궤도를 갖고 있다는 것이 중요합니다) 때문입니다. 만약 전자가 보즈 입자였다면 전자는 모두 가장 낮은 에너지를 갖는 궤도에 안착할 것이고(파울리 배타원리가 이런 '붕괴'를 막습니다) 모두 같은 궤도에 있기 때문에 화학 반응이 일어나지 않겠지요.


또 다른 중요한 결과는 항성 핵과 중성자별의 존재입니다. 연소가 끝난 항성 핵은 가장 안정적인 철 원자로 구성되어 있고 철 원자의 전자들은 페르미 입자이기 때문에 '열운동에 의한 압력' 및 '파울리 배타원리의 효과'를 받아 중력으로 붕괴하지 않습니다. 중성자별은 연소가 끝난 별들의 원자핵이 페르미 입자인 중성자로 변해 마찬가지의 원리로 붕괴하지 않지요. 만약 파울리 배타원리의 효과를 받지 않는다면 이 천체들은 연속적으로 붕괴하여 블랙홀이 됩니다.


우리 모두는 별의 잔해에서 태어났습니다. 우리 몸을 구성하는 탄소나 산소와 같은 원소들은 별들의 핵에서 생성되었으니까요. 파울리 배타원리의 효과로 천체들이 불연속적으로 붕괴하는 것이 중요한 이유는 별들이 불연속적으로 붕괴하면서 핵에서 만들어진 원소들을 우주 공간으로 날려보내고, 이로부터 생명이 시작되기 때문입니다. 철 원자로 이루어진 항성의 핵을 지탱해주는 파울리 배타원리의 효과가 중력을 이겨내지 못하는 순간 항성의 핵의 철 원자 핵은 전자를 흡수하며 중성자가 되고, 이 과정에서 부피가 줄어들기 때문에 항성 핵은 붕괴하기 시작합니다. 하지만 중성자도 부피를 갖기 때문에 무한히 붕괴하지는 않지요. 원자 핵 밖에서 항성의 중심으로 낙하하던 물질들은 새롭게 만들어진 중성자 핵이라는 벽에 부딪치고 별 밖으로 튕겨나가게 됩니다. 이 과정을 초신성이라 부릅니다. 항성이 연속적으로 붕괴했다면 일어나지 않았을 일들이지요.


우리가 보는 세상이 우리가 보는 모습대로 있는 이유는, 그리고 우리가 존재할 수 있는 이유는 얼핏 보면 드러나지 않는 회전의 미묘한 차이를 구분할 수 있는 소립자들의 존재 때문인 셈입니다.





트위터에 날린 융단폭격을 조금 정리해봤습니다. 융단폭격의 우두머리(?)는 다음 세 트윗:


https://twitter.com/AstralDexter/status/568795182709125120

https://twitter.com/AstralDexter/status/568802072251887616

https://twitter.com/AstralDexter/status/568809524733222912


자이로스코프 이야기를 하려다 하려던 자이로스코프 이야기는 안 하고 샛길로 새어버렸네요 -_-;; 해당 내용을 추가하기는 늦은 듯 해서 다음에 기회가 생기면 이야기하기로 했습니다.

  1. 정확히는 숫자입니다. 앞으로 각주를 달 내용은 글의 내용과 관련만 있고 흐름과는 상관없는 내용들만 쓸 예정이므로 읽지 않으셔도 좋습니다. 어느 정도 배경지식이 있는 사람들을 위한 이야기라서요. 접어둔 내용은 글을 이해하시는 데 필요할 수 있는 정보들입니다. [본문으로]
  2. 3은 사실 연속성(비슷한 벡터는 비슷한 벡터로)과 같이 생각해야 하는 조건입니다. 연속성이란 조건을 날려버리면 '구 하나를 쪼개고 잘 합쳐 둘로 만드는' 것도 가능합니다. Banach-Tarski 역설을 참조: http://en.wikipedia.org/wiki/Banach-Tarski_paradox [본문으로]
  3. 복소수에서 사원수로 확장하는 과정을 이용해서 수 체계를 계속 확장하는 것이 가능합니다. http://en.wikipedia.org/wiki/Cayley-Dickson_construction [본문으로]
  4. 사원수의 경우 Gibbs가 벡터 연산을 개발하기 전까지 물리학의 기본 언어로 쓰일 정도로 물리에 영향을 많이 미쳤습니다. 이후 사원수와 같은 방향으로 나아간 것에는 geometric algebra란게 있는 모양입니다만 공부해보진 않았네요. 참고로 xyz 단위벡터를 쓸 때 ijk를 쓰는 것은 사원수의 흔적입니다. [본문으로]
  5. 바로 다음 파트에서 다룰 예정이지만, 단위 사원수의 집합은 SU(2)와 동일합니다. [본문으로]
  6. 앞선 각주를 읽으셨고 게이지 장론을 공부하셨다면 회전을 나타내는 방법 중 SO(3)는 fundamental representation에, SU(2)는 adjoint representation에 해당한다는 것을 확인할 수 있습니다. [본문으로]
  7. 공간이 2차원이 되면 한 바퀴 회전할 때 얻는 부호가 1 또는 -1로 제한될 필요가 없습니다. Anyon이 이런 경우를 다룹니다. [본문으로]
Posted by 덱스터

일반물리학2 기말고사에서 양자역학과 (특수)상대론을 다루는 것을 보고 멘붕했는데(전 왜 배운 기억이 없을까요 =_=;;)[각주:1] 채점을 맡은 문제에서 틀린 사람이 너무 많아서 해설지를 써보았습니다. 스캔 상태가 엉망인 것과 악필인 것은 감안하시고...



sol.pdf





4.(a) 폭이 $L$인 1차원 무한 포텐셜 우물의 내부( $0<x<L$)에서 자유로이 움직일 수 있는 양자입자가 있다. 양자입자의 바닥상태 에너지가 0이 될 수 없음을 불확정성 원리를 이용해서 간단히 설명하라.


이 문제는 하이젠베르크의 불확정성 원리에 대한 이해를 물어보는 문제였습니다. 표준적인 방법은 위치-운동량 불확정성 원리를 이용하는 것인데, 사람에 따라서는 시간-에너지 불확정성을 이용하더군요. 문제는 시간-에너지 불확정성은 위치-운동량 불확정성과는 전혀 다르게 해설한다는 것이지만요(그래서 전부 오답처리).




8. (a) 철수가 광속에 가까운 속력 $v$로 일정하게 달리는 우주선을 타고 먼 별을 향해 여행을 떠난다. 지상에 남아 있는 영희는 철수에게 일정한 간격 $T$로 빛신호를 보내 안부를 전한다. 우주선에 타고 있는 철수는 빛 신호를 얼마의 간격으로 받고 있을까?


평범한 상대성이론 문제입니다. 상대론 문제를 풀 때 가장 중요한 건 "내가 누구 관점에서 문제를 풀고 있더라?"를 끝까지 기억하는거죠. 이게 엉켜버리면 난리가 나고요. 여러가지 방법으로 답을 구하는 방법을 적어보았습니다.


사실 마지막 '기하학적 풀이'에는 4-벡터를 이용한 해도 적어볼까 했지만 처음부터 설명하는건 무리라고 판단해서 생략. 사실 4-벡터를 내적해서 값을 구하는 짓을 하게 되면 불변량들을 가지고 숫자놀음을 하게 되기 때문에 식이 절대로 엉키지 않습니다. Landau 2권에서 retarded potential을 구할 때 이 방법을 쓰는 것으로 기억하고 있는데, 가장 논리를 따라가기 힘들었던 파트중 하나였죠.

  1. 물론 제가 들은건 1학년 상대로 4-벡터를 가르치던 고급물리였습니다만(다같이 멘붕) 양자는 한 기억이 없어요... [본문으로]

'Physics' 카테고리의 다른 글

간단한 어록 정리  (0) 2015.12.20
네 귀중한 교훈들 - 스티븐 와인버그  (8) 2014.02.23
GRE Physics 문제  (0) 2013.09.29
양자장론 참고자료  (0) 2013.01.05
전자기학 교재(?)  (0) 2010.01.28
Posted by 덱스터

다음 연작 트윗에 대한 보충설명.

 

 

일단 susceptibility라는 뭉뚱그려진 표현(?)은 '하나의 제한조건(에너지가 일정할 것 등)이 걸려있을 때 두 상태함수의 변화비'로부터 유도되는 값들을 말한다. 정압비열은 '압력이 일정할 때 온도의 변화에 대한 엔트로피의 변화비'에 온도를 곱한 값이 되고, 쓰로틀링(throttling)에 등장하는 줄-톰슨 계수(Joule-Thomson coefficient)는 '엔탈피가 일정할 때 압력의 변화에 대한 온도의 변화비'가 된다.

 

\[C_p\equiv T\left.\frac{\partial S}{\partial T}\right|_p=\left.\frac{\delta Q}{\delta T}\right|_{\delta p=0} \\\\C_{JT}\equiv\left.\frac{\partial T}{\partial p}\right|_H\]

 

열역학에서 다루는 기체(물론 액체나 고체, 플라즈마에도 적용되지만 고체를 다룰 경우에는 자화를 다루며 자기장까지 끌려나오는 경우가 있어서 좀 애매하다. 보통 '무언가를 태우는' 열역학에서 써먹을법한 상태를 가정한다)는 '단 두개의 변수로 상태를 완전히 정의할 수 있다'는 가정이 붙는다. 이건 canonical ensemble의 partition function을 구할 때 온도 T와 부피 V만 주어지면 된다는 사실로부터도 알 수 있고, 더 쉽게는 제1법칙에서 에너지가 단 두개의 열역학적 변수로 적분이 가능하다는 사실로부터 알 수도 있다. 이렇게 '상태를 정해주기 위해 선택한 두 열역학적 값'을 열역학적 변수로 부르기로 하자.

 

열역학에서는 굉장히 다양한 함수를 다룬다. 에너지에 엔트로피와 온도의 곱을 뺀 헬름홀츠 에너지라던가, 에너지에 부피와 압력의 곱을 더한 엔탈피라던가. 이렇게 하나의 상태가 주어졌을 때 그 상태가 갖는 여러 물리적 성질들을 열역학적 (상태)함수라고 부르자. 우리가 열역학에서 관심갖는 대부분의 함수들은 다섯가지 변수(에너지 E, 온도 T, 엔트로피 S, 압력 p, 부피 V)로부터 정의된다. 따라서 임의의 열역학적 함수 f에 대해 이 함수의 변화량은 다음과 같이 전개할 수 있다. f의 정의로부터 미분이 가능하기 때문이다.

 

\[f=f(E,T,S,p,V) \\\delta f=\frac{\partial f}{\partial E}\delta E+\frac{\partial f}{\partial T}\delta T+\frac{\partial f}{\partial S}\delta S+\frac{\partial f}{\partial p}\delta p+\frac{\partial f}{\partial V}\delta V \]

 

여기에 어떤 장난을 치느냐? 열역학 1법칙을 이용해 변화량을 열역학적 변수 두개로 줄여버린다.

 

\[ \delta E=T\delta S-p\delta V \\\delta T=\left.\frac{\partial T}{\partial S}\right|_V\delta S+\left. \frac{\partial T}{\partial V}\right|_S\delta V \\\delta p=\left.\frac{\partial p}{\partial S}\right|_V\delta S+\left. \frac{\partial p}{\partial V}\right|_S\delta V \\\therefore\delta f=\frac{\partial f}{\partial E}\delta E+\frac{\partial f}{\partial T}\delta T+\frac{\partial f}{\partial S}\delta S+\frac{\partial f}{\partial p}\delta p+\frac{\partial f}{\partial V}\delta V \\\text{ }=\left.(T\frac{\partial f}{\partial E}+\frac{\partial f}{\partial T}\left.\frac{\partial T}{\partial S}\right|_V+\frac{\partial f}{\partial S}+\frac{\partial f}{\partial p}\left.\frac{\partial p}{\partial S}\right|_V\right)\delta S \\\text{ }\text{ }+\left.(-p\frac{\partial f}{\partial E}+\frac{\partial f}{\partial T}\left. \frac{\partial T}{\partial V}\right|_S+\frac{\partial f}{\partial V}+\frac{\partial f}{\partial p}\left. \frac{\partial p}{\partial V}\right|_S\right)\delta V\]

 

참고로 Maxwell relation에 의해 맨 마지막 줄에 등장하는 편미분 넷 중 둘이 같다. 여기서 '세 susceptibility(소괄호로 강조되어 있다)로 임의의 열역학적 상태함수에 대한 편미분을 구할 수 있다'는 중간정리를 얻는다.

 

\[\left. \frac{\partial p}{\partial S}\right|_V=-\left. \frac{\partial T}{\partial V}\right|_S \\\therefore\left. \frac{\partial f}{\partial S}\right|_V=\left[T\frac{\partial f}{\partial E}+\frac{\partial f}{\partial T}\left(\left. \frac{\partial T}{\partial S}\right|_V\right)+\frac{\partial f}{\partial S}-\frac{\partial f}{\partial p}\left(\left. \frac{\partial T}{\partial V}\right|_S\right)\right] \\\left. \frac{\partial f}{\partial V}\right|_S=\left[-p\frac{\partial f}{\partial E}+\frac{\partial f}{\partial T}\left(\left. \frac{\partial T}{\partial V}\right|_S\right)+\frac{\partial f}{\partial V}+\frac{\partial f}{\partial p}\left(\left. \frac{\partial p}{\partial V}\right|_S\right)\right]\delta V\]

 

이제는 편미분을 임의의 함수에 대해서 쓸 차례이다. 원 증명에서는 알파베타감마를 썼는데 귀찮은 관계로 A, B, C라고 하자. 이 값들의 변화는 다음과 같이 쓸 수 있다.

 

\[\\\delta A=\left. \frac{\partial A}{\partial S}\right|_V\delta S+\left. \frac{\partial A}{\partial V}\right|_S\delta V \\\delta B=\left. \frac{\partial B}{\partial S}\right|_V\delta S+\left. \frac{\partial B}{\partial V}\right|_S\delta V \\\delta C=\left. \frac{\partial C}{\partial S}\right|_V\delta S+\left. \frac{\partial C}{\partial V}\right|_S\delta V \]

 

이것을 이용해 편미분을 계산할 수 있다. 자세한 계산과정은 간단한 산수니 생략하겠다.

 

\[\left. \frac{\partial A}{\partial B}\right|_C=\left. \frac{\delta A}{\delta B}\right|_{\delta C=0} \\\\\\=\frac{\left. \frac{\partial A}{\partial S}\right|_V\left. \frac{\partial C}{\partial V}\right|_S-\left. \frac{\partial A}{\partial V}\right|_S\left. \frac{\partial C}{\partial S}\right|_V}{\left. \frac{\partial B}{\partial S}\right|_V\left. \frac{\partial C}{\partial V}\right|_S-\left. \frac{\partial B}{\partial V}\right|_S\left. \frac{\partial C}{\partial S}\right|_V}\]

 

자, 저 계산식 안에 있는 모든 항목들은 단 세 susceptibility로 모두 계산할 수 있다. 따라서, 세 susceptibility의 값만 있으면 모든 susceptibility를 알 수 있다는 말이 된다. 증명 완료.

 

 


 

 

트위터에서도 말했다시피 이건 통계역학 문제보다는 열역학 문제에 가깝다. 편미분을 얼마나 자유롭게 사용할 수 있는지를 살펴보겠다는 문제.

Posted by 덱스터


오늘도 하라는 공부는 안 하고 트위터에서 놀다가 함수해석학과 양자역학 이야기가 나와서 위 글을 다시 검토하던 중, '유한 차원에서라면-선형대수학의 영역이라면- 교환자(commutator)가 identity의 상수배가 나오지 않는다는 것을 증명할 수 있지 않을까?'란 생각이 들었다. 결론: 매우 쉽게 보일 수 있다.


아이디어는 매우 쉽다. 2×2 행렬은 Pauli matrice에 identity를 더해 기저로 잡은 복소수체 벡터공간의 원소로 생각할 수 있다. 3×3 행렬은 Gell-mann matrice에 identity를 더하면 된다. 일반적으로 n×n 행렬은 SU(n) 군의 생성자(generator)에 identity를 더해 기저로 잡은 복소수체 벡터공간의 원소로 생각할 수 있다.


\text{In general, a }n\times n\text{ matrix can be thought as} \\\text{an element of a vector space spanned by the set} \\\\\{I,g_1,g_2,\dots,g_{n^2-1} \} \\\\\text{where }I\text{ is the identity matrix and }g_i\text{'s are the} \\\text{generators of SU(}n\text{) group. Note that all bases} \\\text{except for }I\text{ are traceless.}


이제 n×n 행렬 두개를 가져다 교환자를 구성한 뒤 trace를 구하면 0이 됨을 쉽게 알 수 있다. 그런데 identity는 trace가 n이므로, identity의 상수배는 trace가 0일 수 없다. 따라서 유한차원에서 작용하는 연산자(operator)들의 교환자는 identity의 상수배가 될 수 없다.


\text{Let }A\text{ and }B\text{ be arbitrary }n\times n\text{ matrices and let} \\\\A=\alpha_0I+\alpha_ig_i, B=\beta_0I+\beta_ig_i \\\\\text{where summation over }i\text{ is implied. Then the trace} \\\text{of the commutator }[A,B]=AB-BA\text{ vanishes.} \\\\Tr([A,B])=Tr(\gamma_ig_i)=0 \\\gamma_i=\sum_{j,k}C_{ijk}\alpha_j\beta_k \\\\\text{The }C_{ijk}\text{'s are the structure constants. Since identity} \\\text{and its scalar multiple cannot be traceless, commutators} \\\text{in finite dimensional linear algebra cannot be a multiple} \\\text{of identity.}


이제 함수해석학을 배워야 하는 이유가 하나 더 추가되었다(...)




수정: 잠결에 생각해보니 너무 어렵게 풀었네요. 결론은 똑같지만 trace가 0이어야 한다는 것은 다음 trace의 기본 성질로부터 훨씬 쉽게 보일 수 있습니다.


\text{Trace has the following properties} \\\\Tr(cA+dB)=cTr(A)+dTr(B) \\Tr(AB)=Tr(BA) \\\\\text{where lowercase letters are scalars. Therefore} \\\\Tr([A,B])=Tr(AB)-Tr(BA)=0


그러면 위에서 일반적인 연산자를 identity와 SU(n) 군의 생성자를 이용한 기저로 나타내는 것이 무슨 의미를 갖는지 생각해볼 수 있겠죠. 알려진 것과 같이 양자역학에서는 모든 측정가능량이 연산자로 주어집니다. 그리고 임의의 측정량이 있을 때, 여기에 identity의 상수배를 더하는 것은 측정량의 기준점을 이동한다는 의미가 됩니다. 단순히 모든 고유값(eigenvalue)들을 일정한 값만큼 이동하는 것과 동일하니까요. 따라서 identity는 실제 물리적인 의미를 갖는 부분이 아니라고 생각할 수 있습니다. 결국 n개의 독립적인 상태를 가질 수 있는 계가 있다면 이 계에서 얻을 수 있는 모든 측정량들은 SU(n) 리 대수(Lie algebra)의 원소로 생각할 수 있다는 뜻이 되겠죠. 이젠 군론을 배웁시다 야호!


Posted by 덱스터

P. A. M. 디락의 생일 기념으로 The Second Creation(Robert P. Crease, Charles C. Mann, Rutgers University Press, New Jersey, 1996)의 5장 The Man Who Listened의 발췌번역입니다. 디락의 일화를 소개하는데 무게를 두었습니다.


[..]


젊은 과학자들이 첫 논문으로 과학계를 흥분시키고 모든 박사논문이 새로운 분야를 열어젖히던 때, 가장 많은 영향을 미친 것은 디락이었습니다. 양자이론에 대한 반감을 가졌던 아인슈타인이 마지막 고전물리학자라면, P. A. M. 디락(그는 항상 이렇게 서명했지요)은 첫 완전한 현대물리학자였습니다. 1984년 디락의 죽음 직전에 물리학자 실판 슈베버(Silvan Schweber)는 이렇게 평가했습니다. "디락은 양자역학의 주요 저자 중 하나일 뿐 아니라 양자전기역학의 개척자이며 양자장론의 주된 설계가이기도 합니다. 삼사십년대의 양자장론의 중요한 발전은 모두 디락의 작업에서 출발하고 있습니다"


환경은 그가 지독히 내성적이고 과묵하게 자라나도록 짜인 것처럼 보입니다. 디락은 1902년 8월 2일 영국 브리스톨(Bristol)에서 스위스 출신의 아버지 밑에 태어났습니다. 그의 아버지는 반사회적이라고 할 수 있을 정도로 활동이 없었습니다; 디락의 가족은 손님이 없었고, 놀러 나가지도 않았습니다. 자리가 부족했기 때문에 다른 가족들은 부엌에서 식사할 동안 디락은 아버지와 함께 식사했습니다. 아버지는 그가 불어를 배우기 좋을 것이라 생각해 자신과 불어로만 대화하도록 규칙을 만들었는데, 불어로는 자신을 표현할 방법을 못 찾아 조용했다고 디락은 회상했습니다. 대부분의 시간을 야외에서 홀로 산책하며 보냈던 디락은 질서와 대칭을 좋아했습니다. "내 대부분의 작업은 그냥 공식을 가지고 논 뒤 어떤 결과가 나오는지 본 것입니다. 다른 물리학자들도 같다고 생각하지는 않습니다; 물리적으로 전혀 의미가 없을지도 모르는 공식을 가지고 놀며 어떤 아름다운 수학적 관계가 있는지를 살피는 것은 제 특성인듯 합니다. 가끔은 물리적 의미가 있기도 합니다"


디락의 아버지는 사회성의 중요성을 무시했지만 좋은 교육의 필요성은 인식했고, 디락의 수학적 재능을 장려했습니다. 역사의 우연으로 이 재능은 더욱 클 수 있었습니다: 나이에 비해 이르게 전쟁으로 징집되어 텅 빈 고등반에 진학했거든요.[각주:1] 디락은 브리스톨 공과대학과 일부를 공유했던 머천트 벤처러 학교(Merchant Venturer's School)을 좋아했습니다. 부분적으로는 그가 거의 평생 이해할 수 없었던 철학과 미학을 중요히 여기지 않았기 때문이지요. 디락은 대학에 진학하면서 수학으로는 직업을 가질 수 없으리라 생각해 공학을 전공하기로 했습니다. 그는 좋은 학생이었으나 분야의 이론적인 부분에만 관심을 가졌습니다. 실무 훈련은 최악이었죠.


1921년 가을 공학 학위를 끝낸 디락은 직업을 구할 수 없었습니다. 재능있는 수학자가 공학과정을 밟는다는 것에 낙담했던 브리스톨 대학의 수학과 교수들은 수업료를 면제해주겠다고 제안했습니다. 달리 할 일이 없었던 디락은 그러기로 했지요. 명예 수학과정을 밟던 다른 유일한 학생은 물리에 사용될 수 있는 응용수학을 공부하기로 단단히 결심한 여학생이었습니다. 딱히 확신이 없었던 디락은 그녀의 목표를 따라갔고, 세기의 대 물리학자중 하나는 이렇게 활동을 시작했습니다.[각주:2]


디락은 물리를 무계획적으로 시작했던 때부터 말년까지 수학이 물리 발전의 열쇠라고 보았습니다. 그의 마지막 연설들 중 하나에서 그 신조가 드러납니다. "사람은 수학이 이끄는 방향을 따라야 합니다. [...] 사람은 그 끝에서 시작한 것과 전혀 다른 곳에 도착하더라도 수학적인 착상을 좇아야 합니다. [...] 수학은 물리적인 생각만 따라갔을 때 택하지 않았을 길도 갈 수 있게 해 줍니다"


디락은 브리스톨에서 상대론을 배웠고 매료되었습니다. 이학사를 취득한 후 1925년 케임브리지의 성 요한 대학(Saint John's College)에 진학하였고, 1927년 25세가 되었을 때의 양자역학에 대한 기여로 그가 세계에서 가장 중요한 물리학자중 하나라는 것이 확실해졌습니다.[각주:3]


명성은 그를 크게 변화시키진 못했습니다; 계속 과묵했던 디락을 만난 사람들은 자주 무례하다고 생각했습니다. 디락은 케임브리지 물리학 그룹의 명예회원이었으나 적은 학생을 키웠고, 학풍을 세우지도 않았으며, 실험가들과 드물게 대화했습니다. 1930년대 말을 실험실에서 보낸 새뮤엘 데본스(Samuel Devons)는 우리에게 말했습니다. "캐번디시 물리학회 모임이란 준격식적인 모임이 격주로 있었어요. 한 강연자가 들어오면 디락은 첫 줄에 앉아 듣곤 했죠. 그는 매우 드물게 입을 열었어요. 가끔 러더포드가 '그래서 이론하는 사람들은 어떻게 생각하나?'라고 찔러보곤 했죠. 러더포드는 이론이 일종의 사색에 불과하고 진짜는 실험에 있다고 믿었죠.[각주:4] 그리고 디락은 앉아 아무 말도 안 했습니다."


디락은 매우 정확하고 조심스럽게 말했기 때문에 매우 난해했습니다.[각주:5] 양자역학을 강의할 때 그는 강연대 뒤에 서서 그가 쓴 책을 읽어주었는데, 책에 더 이상 명료할 수 없게 적었다고 믿었기 때문입니다.1928년 라이덴(Leiden)에서 몇 개의 강연을 했을 때 폴 에렌페스트는 디락의 태도에 질려버렸습니다. 그 자리에는 H. B. G. 캐시미어도 있었는데, 회상하길 "(각 강연은) 완벽했습니다. 디락은 버릇대로 누군가 이해하지 못한다면 별 다른 설명을 하는 대신 매우 침착하게 정확히 동일한 내용을 반복했습니다. 보통은 충분했지만, 에렌페스트가 선호하는 방법은 아니었죠." 에렌페스트는 항상 사람이 어떻게 작업하는지를 보고 싶어했습니다. 캐시미어는 이어서 말했습니다. "한번은 에렌페스트가 디락에게 질문했고, 디락은 곧바로 답이 떠오르지 않았습니다. 그래서 디락은 칠판에 풀어보기 시작했죠. 그는 온 칠판을 자그마한 글씨로 채웠고, 에렌페스트는 그의 바로 뒤에 서서 무엇을 하고 있는지 보며 외쳤습니다. '애들아, 애들아-이걸 봐라! 이제 그가 뭘 하는지 알겠네!'[각주:6]"


[...]




이 이후는 디락의 작업에 대한 이야기입니다. 하이젠베르크가 발견한 불확정성 원리를 고전역학의 푸아송 괄호와 연결지어 해석하는 것과(더 보편적인 결과입니다) 양자전기역학의 발견, 디락방정식의 발견을 다루고 있고 디락방정식의 중요한 예측인 반전자의 존재에 대해 다루고 있습니다. 디락은 처음엔 디락방정식의 음에너지 해를 보고 양성자(당시만 해도 양전하를 가진 입자는 양성자 뿐이었습니다. 심지어 중성자도 발견되지 않았을 시기죠.)라고 생각했다고 하죠. 그리고 당시만 해도 미국은 예일대의 조시아 깁스[각주:7]를 제외하면 유럽에 비해 급이 떨어졌다고 하네요.

  1. 역주) 시기상으로는 일차대전인데, 이 당시만 해도 전쟁에 참여하는 것에 대한 낭만(?)같은 것이 있던 시절이라 학생들이 적었을 수도 있겠다는 생각이 드네요. [본문으로]
  2. 역주) 하고 싶은걸 하는게 아니라 할 수 있는걸 하는게 중요하다는 교수님의 일갈이 생각나는군요. 하... [본문으로]
  3. 역주) 디락은 1926년 봄 박사학위를 취득했습니다. 1년만에 박사라니... [본문으로]
  4. 역주) 책의 다른 부분을 보면 러더포드는 '간단하면서 본질적인 속성을 드러내는 실험'을 중요시했다고 나옵니다. 러더포드 산란 실험은 대표적인 '간단하고 본질적인 속성을 드러내는 실험'이죠. [본문으로]
  5. Dirac spoke so precisely and carefully that he approached the Delphic; (번역이 힘드네요) [본문으로]
  6. Kinder, Kinder! Schaut jetzt zu! Jetzt kann man sehen, wie er es macht! [본문으로]
  7. 사원수 대신 벡터미적분학을 도입했고 통계역학을 완성했다고 보시면 됩니다. [본문으로]
Posted by 덱스터

양자역학에서 가장 유명한 commutator를 뽑으라면 누구나 하이젠베르크의 불확정성 원리를 꼽을 것이다. 아무래도 제일 먼저 발견된 교환이 불가능한 물리량이니까.


[x,p]=xp-px=i\hbar


그런데 왜 i가 붙을까? 고민해본 사람? 문제는 의외로 쉽게 풀린다. 두 측정가능한 물리량 A와 B를 가정하자. 따라서 A와 B는 에르미트(Hermitian) 연산자이다. 적당한 양자책을 잘 공부했다면 이를 설명할 필요는 없을 터(간단하게 말하자면 고유값(eigenvalue)이 실수가 나와야 해서). 한번 유도해보자.


\text{For observables }A,B\\A^\dagger=A, B^\dagger=B \\\\\therefore [A,B]^\dagger=(AB-BA)^\dagger\\=B^\dagger A^\dagger-A^\dagger B^\dagger=BA-AB \\\\\therefore [A,B]^\dagger=-[A,B] \\\\\text{or, equivalently;} \\\exists C(C^\dagger=C),\,\,[A,B]=iC


측정 가능한 물리량의 commutator는 항상 반에르미트(anti-Hermitian) 연산자여야 한다는 결론을 얻는다. 반에르미트 연산자는 단위허수 i를 곱하거나 나눠서 에르미트 연산자로 만들어줄 수 있으니 이제 그 미스테리한 i가 어디에서 튀어나왔는지 알 수 있다.


이제 조금 더 재미있는 명제를 도출해보자.


\text{Assume observables }A,B\text{ and an eigenstate of }A\\\\A\left|a \right \rangle=a\left|a \right \rangle \\\\\text{Then, we get the expectation value of the commutator}\\\\ \left\langle a|[A,B]|a \right\rangle=\left\langle a|AB-BA|a \right\rangle = (a^\ast - a)\left\langle a|B|a \right\rangle=0 \\\\\text{or, equivalently;} \\\\ C \equiv \frac1i [A,B],\;A\left|a \right \rangle=a\left|a \right\rangle \Rightarrow\left\langle a|C|a \right\rangle=0 \\\\\text{for any observables }A, B


아직 이상한 점을 눈치 못챘는가? A에 x를, B에 p를 넣어보자.


[x,p]=i\hbar\\\\\therefore \left\langle x\middle|\frac1i[x,p]\middle|x \right\rangle=\hbar\left\langle x|x \right\rangle=0\\\left\langle p\middle|\frac1i[x,p]\middle|p \right\rangle=\hbar\left\langle p|p \right\rangle=0


?!?!


이 비정합성은 commutator가 identity의 배수이기 때문에 나타난다. 다르게 말한다면, 어떤 한 측정량이 다른 측정량과 만드는 commutator가 identity의 배수로 나온다면 그 측정량의 고유상태(eigenstate)는 그다지 예쁜 성질을 갖지 않으며(예컨데 위치 x의 고유상태나 운동량 p의 고유상태는 L2(Square-integrable)공간에 속하지 않는다), 따라서 주의를 기울여 다루어야 한다고 결론지을 수 있다.


참고로 가장 간단(?)한 양자화 방법은 고전역학에서의 Poisson bracket을 양자역학의 commutator로 해석하는 것이기 때문에(Dirac quantisation 혹은 canonical quantisation) 양자역학의 미래가 골치아프다는 것은 확실해졌다. 양자장론이 괜히 머리 뽀개지는게 아니라니까...

Posted by 덱스터

방학이 끝나감에 따라 멘탈이 허약해지고 있어서 멘탈 강화를 위해 소소하지만 결과가 있는 일을 해보았습니다. 멘탈이 가루가 되어갈 때에는 이렇게 작은 일을 해 보면서 물을 뿌려 단단히 다지는 것도 필요한 일이라서요.


가끔 교수님들이 링크로 걸어놓곤 하시는 스티븐 와인버그의 글을 옮겨보았습니다. '과학자로서 첫 발을 내딛는 학생들을 위한 조언'이라는 말이 붙어있는데, 이건 번역을 안 했네요.


번역에 대한 신조(?)는 '최대한 자연스럽게'라서 의역을 기본으로 채택했습니다. 가령 첫 문단의 중간 쯤 나오는 '익사하거나 이겨내거나'는 'sink or swim'의 번역인데, 도저히 가라앉음과 수영으로는 두음 운율을 맞출 수가 없어서 '이겨내다'란 의역을 사용했습니다.


글로벌 스탠다드(?)에 맞추어 pdf로도 만들어 올립니다.


네 귀중한 교훈들.pdf





수정 - 27 Feb 2014


아래 댓글에서 어떤 분이 지적해주셨다시피, "역사가 당신의 연구에 도움이 될 수도 있기는 하지만 전혀 중요하지 않은 이유입니다"는 "The least important reason for this is that the history may actually be of some use to you in your own scientific work"의 번역문입니다. 직역하면 "역사가 당신의 연구에 도움이 될 수도 있는 것은 가장 덜 중요한 이유입니다"이고 의미상으로는 "역사가 당신의 연구에 도움이 될 수도 있겠지만, 중요한 이유들 중 가장 중요도가 낮은 이유입니다"가 됩니다. 그런데 한국어에서는 이런 표현을 쓰지 않죠(...) 그래서 어떻게든 자연스럽게 만드려다 보니 문장이 꼬여버렸네요. 해당 문장은 보다 자연스럽고 의미가 통하는 문장으로 수정하였습니다.




네 귀중한 교훈들(Four golden lessons)

스티븐 와인버그(Steven Weinberg)


제가 학부 졸업장을 받았을 때 - 백 년은 전이었던 것 같은데 - 물리학은 구석구석까지 살펴본 뒤에야 나만의 연구를 시작할 수 있는 드넓은 미지의 대양같았습니다. 어떻게 남들이 했던 일을 모르고서 무언가를 할 수 있을까? 운 좋게도 대학원 첫 해에 만난 선배 물리학자들께서는 일단 연구를 시작하고 그 과정에서 내가 알아야 할 것들을 익히라고 조언해 주셨습니다. 익사하거나 이겨내거나였지요. 그리고 놀랍게도 이 방법이 먹힌다는 것을 알게 되었습니다. 저는 빠른 박사학위를 받을 수 있었습니다 - 제가 물리에 대해 아는 것이 거의 없었는데도 말이지요. 하지만 저는 한 가지 중요한 것을 알게 되었습니다: 아무도 모든 것을 알지는 못하고, 그럴 필요도 없다는 것을요.


다른 교훈을 바다에 빗대어 말해보자면, 익사하지 않고 파도를 이겨내고 있는 한 더욱 거친 파도를 향해 나아가야 한다는 것입니다. 제가 1960년대 후반에 매사추세츠 공과대학(Massachusetts Institute of Technology; MIT)에서 교직을 맡고 있을 때 한 학생이 제 전공인 기본입자(elementary particle physics)보다는 일반상대론(general relativity)을 공부하고 싶다고 말했습니다. 일반상대론이 매우 잘 정립된 학문인 반면에 다른 하나는 엉망진창으로 보인다는 이유에서였지요. 제게는 반대로 행동해야 할 아주 좋은 이유였습니다. 입자물리는 아직 창조적인 작업을 할 수 있는 분야였습니다. 1960년대에는 정말 엉망진창이었지만 그 후 많은 이론물리학자와 실험물리학자들은 입자들을 분류하고 모든 것을 (뭐, 거의 모든 것을) 표준모형이라는 아름다운 이론으로 정리하는데 성공하였습니다. 제 조언은 난장판인 곳으로 가라는 것입니다 - 할 것이 있는 곳이니까요.


제 세번째 조언은 아마 가장 받아들이기 힘들 것입니다. 자신이 시간을 낭비하는 것을 용서하십시오. 교수들은 학생들에게 풀 수 있다고 아는 문제들(매우 심술궂은 경우가 아니라면)만 줍니다. 또한, 그 문제들이 과학적으로 중요한가는 상관없습니다 - 수업을 통과하기 위해서 푸는 것이니까요. 하지만 실세계에서 어떤 문제가 중요한지 알기는 매우 어렵고, 지금 이 순간 그 문제를 풀 수 있는지는 절대 알 수 없습니다. 20세기 초 로렌츠(Lorentz)와 아브라함(Abraham)을 포함한 많은 유명한 물리학자들은 전자에 대한 이론을 세우려 하였습니다. 왜 사람들이 지구가 에테르(Ether)를 통과하면서 일어나는 효과를 감지하는데 실패했는지 이해하기 위한 시도이기도 했죠. 모두 알듯이, 사람들은 잘못된 문제에 매달리고 있었습니다. 양자역학이 발견되지 않았던 시절이었기에 아무도 전자에 대한 성공적인 이론을 세울 수 없었지요. 1905년, 알베르트 아인슈타인(Albert Einstein)은 탁월하게도 운동이 시간과 공간의 측정에 주는 영향이 풀어야 할 올바른 문제임을 알아차렸고, 이 발견은 특수상대성이론으로 이어집니다. 무엇이 노력해야 할 올바른 문제인지 확신할 수 있는 사람은 아무도 없기 때문에 실험실이나 책상 위에서 보내는 대부분의 시간은 낭비됩니다. 창의적이고 싶다면, 대부분의 시간을 창의적이지 않은 채 보내는 데, 혹은 지식의 대양에서 정체하는 데 익숙해져야만 합니다.


마지막으로, 조금이라도 과학사에 대해, 최소한 몸담고 있는 과학 분과의 역사에 대해 배우십시오. 역사가 당신의 연구에 도움이 될 수도 있기는 하지만 전혀 중요하지 않은 이유입니다 사실 중요한 이유는 다른 곳에 있습니다.[각주:1] 예컨대, 프랜시스 베이컨(Francis Bacon)에서 시작해 토마스 쿤(Thomas Kuhn)과 칼 포퍼(Karl Popper)와 같은 철학자들이 제시한 과학에 대한 과하게 단순화된 모형들은 이따금 그 모형을 믿는 과학자들을 방해하곤 합니다. 과학철학에 대한 가장 좋은 해독제는 과학사에 대한 지식입니다.


더 중요한 이유는 과학사를 익혀 자신이 하는 일을 더 가치있게 느낄 수 있기 때문입니다. 과학자가 되어 부자가 되기는 어렵습니다. 친구들과 친척들은 보통 하고 있는 일을 이해하지 못할테고요. 더군다나 기본입자물리학과 같은 분야에서 일하게 된다면 당장 유용한 일을 한다는 보람조차 없습니다. 하지만 하고 있는 일이 역사의 일부가 된다는 사실을 아는 것으로 충분히 만족할 수 있습니다.


100년 전인 1903년을 되돌아봅시다. 1903년 대영제국의 국무총리가 누구였는지, 혹은 미합중국의 대통령이 누구였는지가 지금 얼마나 중요합니까? 정말 중요한 일은 맥길 대학교(McGill University)에서 에른스트 러더포드(Ernest Rutherford)와 프레더릭 소디(Frederick Soddy)가 방사능을 연구하고 있었다는 것입니다. 이 연구는 (당연하게도!) 실용적으로 응용할 수 있었지만 더욱 중요했던 것은 이 연구가 가진 문화적인 함의였습니다. 방사능에 대해 이해하게 되면서 물리학자들은 어떻게 태양과 지구의 핵이 수백만 년이 지난 후에도 뜨겁게 유지되는지 설명할 수 있게 되었습니다. 이렇게 많은 지질학자와 고생물학자들이 지구와 태양의 긴 나이에 대한 과학적인 반론이라고 여겼던 주장이 사라졌지요. 이후 기독교인과 유대인들은 성경을 문자 그대로의 진실로 믿는 것을 포기하거나 지적 무책임함으로 물러나야만 했습니다. 그리고 이 작업은 갈릴레오(Galileo)와 뉴턴(Newton), 다윈(Darwin)이 내딛고 지금까지 이어지는 종교 독단주의(religious dogmatism)의 약화라는 여정의 한 발걸음이 되었지요. 아무 신문이나 하나 집어서 읽어보면 이 작업은 아직 끝나지 않았음을 알 수 있습니다. 하지만 과학자들이 자부심을 느낄 만한 세련된(civilizing) 작업입니다.

  1. 오역이라는 의견이 있어 수정하였습니다 [본문으로]

'Physics' 카테고리의 다른 글

간단한 어록 정리  (0) 2015.12.20
불확정성 원리와 상대성이론  (2) 2014.12.22
GRE Physics 문제  (0) 2013.09.29
양자장론 참고자료  (0) 2013.01.05
전자기학 교재(?)  (0) 2010.01.28
Posted by 덱스터

고등과학원 겨울학교에 다녀왔습니다. 일주일의 3일은 마이티/포커/블랙잭/고스톱/섯다를 치느라(...) 밤을 새고 나머지 3일밤은 논문 읽느라 밤을 샜더니 아직도 피로가 덜 풀려서 고생중입니다.


그룹연구주제로는 Monopoles in real and momentum spaces of condensed matter systems를 했습니다. 같은 조원분이 버스를 태워주셔서 유일하게 교수님들께 안 까인 발표(...)가 되었습니다. 프레젠테이션에 맥락과 일관성이 존재한다고 앞으로 이런 식으로 발표해야 한다는 과찬(..)을 받았습니다. 결국 상금 획득. 받은 문화상품권으로 겨울왕국 OST를 사야겠군요.


인상깊었던 부분들을 간략하게 정리해서 옮겨봅니다.




이준규 교수님: "물리에는 사기가 적절하게 들어가야 생명이 있는 거예요" "와인버그 그 사람 책은 생명이 없어. 사람이 너무 박식해서 그래"[각주:1]

(기억나는대로 적어봤습니다)




이필진 교수님이 간략하게 homotopy 이론에 대해 설명해주셨는데, 작년 1학기에 이거 혼자 공부한다고 삽질했던게 원래는 이렇게 쉬운거였나 하는 자괴감이 들더군요. 물론 다시 책을 집었을 때 이해하는가 하는 것은 다른 문제.


사실 (대수적)위상수학보다는 미분기하학 공부가 더 절실하다는 생각이 들어서 공부는 나중에 하기로 했습니다. 재미있어 보이긴 한데...


3차원 구인 S^3가 Hopf Fibration으로 2차원 구 S^2와 1차원 구S^1으로 나누어질 수 있다는데, 알고보니 globally하게는 안 되고 local하게만 된다고 합니다. S^3를 실수공간 R^3에서 무한원점을 하나의 점(대척점이 됩니다)으로 만들어 이미지화하는 버릇이 있는데 '이게 어떻게 되는거냐' 생각으로 하루종일 고민했더랬죠. 대척점과 원점이 같다니?!?! local한 경우에는 당연히 되는거지만요.


(S^3 공간에서는 한 방향으로 계속 나아가다 보면 원점으로 돌아옵니다. S^2에서 방향을 정해주고 S^1으로 쭉쭉쭉쭉 나아가는 것을 이미지화하면 국소적으로는 이게 가능하다는 것을 알 수 있습니다. 그리고 이것이 trivial하지 않은 fibre bundle의 한 예라고 하더군요.)


c.f. 이필진 교수님이 강의록을 개인 홈페이지에 올려 놓으셨더군요. Physics 탭을 누르면 열립니다.




주제가 geometric phase였던지라 이걸 이해해보려고 여러 삽질을 했는데(결국 발표 슬라이드에는 하나도 안 넣었지만요) 그 중 하나가 고전역학적으로 이해해보려는 시도였습니다. 여기에 대해서는 이미 책이 있던데(Geometric Phases in Classical and Quantum Mechanics) 하필이면 djvu를 못 읽는 iPad만 가져왔던지라 맨땅에 헤딩...


일단은 재미있는(?) 결과물이라는 생각이 들어 그 삽질을 공유해보려고 합니다.


geometric phase의 가장 간단한 예는 전하가 자기장이 있는 공간에서 폐곡선을 그리는 운동을 해 원점으로 돌아왔을 때 위상이 변화하는 것입니다. Berry's Phase라고도 하지요. 이때 얻는 위상의 변화는 그 폐곡선이 잡아둔 자기장의 세기, 혹은 그 폐곡선이 만드는 곡면에 대한 자기선속(magnetic flux)에 비례합니다. 고전적으로는 무슨 의미가 있는 양인가, 가 질문.


결론부터 말하자면 한 폐곡선에 대해 운동량을 선적분한 값입니다. 유체역학의 circulation이라는 값과도 연관이 있고, 사실 가장 쉽게 이해하는 방법은 슈뢰딩거와 하이젠베르크 이전의 구양자이론에서 본-조머펠트 양자화조건에 해당하는 양이라는 것이죠. 여기에서 B는 자기장입니다.


\oint_C \bold{p}\cdot d\bold{l}


유도하려면 다음의 조건을 이용합니니다.


\text{The Lorentz force equation can be written as} \\\frac{d\bold{p}}{dt}=e(\bold{E}+\frac{d\bold{x}}{dt}\times\bold{B}) \\\therefore d\bold{p}=e(\bold{E}dt+d\bold{x}\times\bold{B}) \\\\\text{By suppressing changes in time, one gets} \\d\bold{p}=ed\bold{x}\times\bold{B}


벌써부터 쓰기 귀찮아지는데(...) 작은 사각형 루프 ABCDA를 잡아서 값을 더해주면 다음 식을 얻습니다.


\text{Let a closed square loop }ABCDA\text{be specified} \\\text{by infinitesimal lateral displacement }d\bold{x}\text{ and} \\\text{infinitesimal vertical displacement }d\bold{y}\text{. Then} \\\oint_{ABCDA} \bold{p}\cdot d\bold{l} \\\approx \bold{p}(A)\cdot d\bold{x}+\bold{p}(B)\cdot d\bold{y}-\bold{p}(C)\cdot d\bold{x}-\bold{p}(D)\cdot d\bold{y} \\\text{Where} \\\bold{p}(B) \approx \bold{p}(A) + ed\bold{x}\times\bold{B} \\\bold{p}(C) \approx \bold{p}(B) + ed\bold{y}\times\bold{B} \\\approx \bold{p}(A)+ e(d\bold{x}\times\bold{B} + d\bold{y}\times\bold{B}) \\\text{etc. Rearranging terms, one gets} \\\oint_{ABCDA} \bold{p}\cdot d\bold{l} \\\approx e(d\bold{x}\times\bold{B}\cdot d\bold{y}-d\bold{y}\times\bold{B}\cdot d\bold{x}) \\= 2ed\bold{x}\times d\bold{y}\cdot\bold{B} \\=2e\bold{B}\cdot d\bold{a} \\\text{which is the infinitesimal magnetic flux enclosed} \\\text{by the loop.}


계수에 2가 붙는 것이 신경쓰이기는 하는데 그것보다 이걸 momentum space에서 바꾸어서 해석할 방법을 찾지 못해 포기.




또 다른 접근법은 게이지 장론의 minimal coupling을 반대로 이용하는 방법. 보통 minimal coupling은 시공간상의 모든 점에서 운동량에 correction term인 게이지 장을 시공간상의 좌표에 대한 함수로 걸어주는 것으로 생각할 수 있는데 이걸 반대로 momentum space에서 시공간 좌표에 대해 momentum에 대한 함수로 correction term을 걸어주는 방식으로 이해할 때, 이 녀석이 어떤 역할을 하느냐는 것이었습니다. 수식으로 쓰자면


\text{The solutions }\Psi\text{ to the Hamiltonian }\hat{H}(\hat{\bold{p}}+q\bold{A}(\hat{\bold{x}}),\hat{\bold{x}}) \\\text{can be expressed by the solutions }\phi\text{ to the} \\\text{Hamiltonian }\hat{H}(\hat{\bold{p}},\hat{\bold{x}})\text{ by the relation} \\\Psi=e^{-iqf(\bold{x})}\phi \\f= \int_\bold{x_0}^\bold{x} \bold{A}\cdot d\bold{l}


이므로(디락상수는 1로 둡시다), 이 반대 버젼인


\text{The solutions }\Psi\text{ to the Hamiltonian }\hat{H}(\hat{\bold{p}},\hat{\bold{x}}+g\bold{B}(\hat{\bold{p}})) \\\text{can be expressed by the solutions }\phi\text{ to the} \\\text{Hamiltonian }\hat{H}(\hat{\bold{p}},\hat{\bold{x}})\text{ by the relation} \\\Psi=e^{igh(\bold{p})}\phi \\h= \int_\bold{p_0}^\bold{p} \bold{B}\cdot d\bold{p}


를 생각해보자는 것. 재미있는 점은 위에서 언급한 B는 Bloch function에 대해 해석할 경우 unit cell의 원점을 잡는 자유도로 작용하게 됩니다. 또한 momentum space에서 그린 폐곡선에 대해 B를 선적분한 값은 원점의 net displacement가 되지요. 문제는 위의 h라는 함수가 global하게 정의되지 않는다는 것.


나중에 해보고 싶은 시도 중 하나는 위의 방식처럼 momentum space를 기준으로 잡았을 때 momentum space에서 periodic potential을 잡을 경우 x의 spectrum이 discrete해지는데, 어쩌면 이걸 spin wave를 나타내는데 써먹을 수 있는 방법이 없을까, 하는 질문.




아, 그리고 발표 도중에 증명에 사기를 친 것이 있는데(T^2공간에 대한 적분인데 S^2라고 사기를 쳤습니다.) 교수님들이 그냥 넘어갔다는 훈훈한 일화. 사실 ppt 다 만들고 발표 당일 아침에 발견한 문제인데다가 수정하기 귀찮아서 그대로 놔둔 것이었는데, 결국 안 걸렸네요. 물론 증명이 이상하다고 지적하셨면 "역시 교수님들 상대로 사기치기는 쉽지 않네요"라는 드립을 치면서 옆의 칠판을 끌어다가 제대로 된 증명을 쓰려고 했었지만 그냥 넘어갔습니다.

  1. 사기가 너무 없이 타이트한 논리전개를 가지고 있다는 맥락이었습니다. 와인버그 양자장론 교재. [본문으로]

'Daily lives' 카테고리의 다른 글

절대마왕을 향한 투쟁 - Hero Detected  (0) 2014.05.23
무제  (0) 2014.04.20
공부합시다...  (3) 2013.12.14
Words from Feynman  (0) 2013.10.25
당신의 드립을 보여주세요.  (2) 2013.10.20
Posted by 덱스터

2013. 12. 14. 02:47 Daily lives

공부합시다...

1.

가지고 있는 양자역학 책이 무언가 아쉽다고 생각이 들어서 이런저런 책을 찾아보고 있다. 일단 눈에 들어오는건 란다우 이론물리학 시리즈 3권과 Schiff책. 둘 다 archive.org에서 구한 상태. (사실 란다우 양자역학은 구글링으로 3판을 찾았지만) 란다우 양자역학은 교보문고에서 슬쩍 봤는데 핵물리도 들어있어서 상당히 땡기는 상태. QCD전의 파이 중간자를 이용한 이론체계로 보인다.


인상깊었던 것은 왜 충돌이 공명(Breit-Wigner formula)으로 설명되는가에 대한 논증. 두 핵이 합쳐지면서 핵의 구성입자들 사이에 운동에너지가 고르게 분포되어 어느 한 구성입자도 서로의 인력을 벗어나기 충분한 에너지를 갖지 못하기 때문에 공명으로 취급할 수 있다는 내용. 제대로 공부해 봐야겠지만 공명식 자체는 허접해 보였던(...) partial wave를 이용해서 얻어내는 것으로 보인다. Sakurai책을 펴보니 딱 그 전까지만 다시 봤던 흔적이 남아있다(...)



2.

란다우를 검색하다가 란다우의 최소요구치라는 시험문제를 발견. 아무리 몇 달은 준비하고 시험치는 거라고 하지만(더군다나 수십년간 단 43명만 통과했다고) 일단 난 한참 멀었다는게 느껴진다. 깝치지 말고(...) 기본기부터 다시 쌓아야겠다.


관련해서 재미있게 읽었던 글: http://arxiv.org/abs/hep-ph/0204295


실험논문은 읽고 저자의 입장에서(!) 논문을 방어하게 시켰다고 한다. '저자에 따르면'이란 표현을 쓰는게 금지되었다고. 엄청나게 하드코어한데, 이 지옥(?)을 살아남으면 어디에 가서도 살아남을 거란 생각이 든다. 그리고 인터넷에서 발굴한(?) 몇몇 문제:


1> The electron enters a straight pipe of circular cross section (radius r). The tube is bent at a radius R≫r by the angle α and then is aligned back again. Find the probability that the electron will jump out.


2> A hemisphere lies on an infinite two-dimensional plane. The electron falls on the hemisphere, determine the scattering cross section in the Born approximation.


3> The electron "sits" in the ground state in the cone-shaped "bag" under the influence of gravity. The lower end of the plastic bag is cut with scissors. Find the time for the electron to fall out (in the semi-classical approximation).


1번은 감도 안 잡히고(파동광학을 본 적이 없는게 문제다) 2번은 image charge를 써서 V를 구한 다음 푸는 것 같긴 한데 막상 born series에서 cross-section을 구하는 과정이 기억이 안 난다. 작년 겨울에 Sakurai책 산란 파트를 끝까지 안 봤더니... 마지막 껀 긴가민가(...) Airy함수 꼴로 나오는 해를 이어붙이는 문제인것 같긴 하다.


전자기학 공부가 가장 시급하다.



3.

생각난김에 archive.org에서 Herman Weyl의 『군이론과 양자역학』을 구해서 서론을 읽고 있는데(책장의 벽돌이 될 가능성이 높은 책이라도 서론까지는 읽으려고 노력한다) 참고하라고 찝어주는 책들에서 독일어 제목이 엄청 많이 튀어나온다. 한 80%는 읽히는데 독어를 취미로 시작한 것이 이런 곳에서 도움이 될 줄이야. 제목을 읽을 줄 안다고 내용을 아는 것은 아니긴 하지만 어떤 내용을 찾으면 되는지는 알 수 있는거니까.


언급된 독일어 책의 제목들에 분광선(Spektrallinien)이란 단어가 쏟아지는 걸로 봐서는 양자역학이 화학에 빚진게 많아 보인다. 하긴 (말도 안 되는) 보어 원자모형이 받아들여진 가장 큰 이유가 발머선을 기가 막히게 잘 설명해서였다고 하니.

'Daily lives' 카테고리의 다른 글

무제  (0) 2014.04.20
2014 KIAS-SNU Physics Winter Camp  (0) 2014.02.17
Words from Feynman  (0) 2013.10.25
당신의 드립을 보여주세요.  (2) 2013.10.20
블로그를 너무 방치해뒀나...  (0) 2013.02.22
Posted by 덱스터

통계역학 시험결과가 나왔는데 광자의 화학포텐셜(chemical potential)이 0이라고 가정했다고 점수가 까인 것 때문에 까칠모드로 전환해 써 보는 글. 완벽히 고전적으로 할 경우 어디까지 갈 수 있나 해 봅시다.




1. 먼저 진공이 차 있는 실린더를 가정합니다. 실린더 안은 전자기파로만 채워지고 양자역학적으로 말하면 photon gas에 해당하는 radiation continuum으로 채워진다고 가정하겠습니다. '광자'라는 개념 자체가 없으므로 광자의 수 dN은 등장하지 않습니다.


2. 실린더 안의 radiation continuum을 설명할 때 쓸 변수를 T와 V로 고정하고 이것으로 충분하다고 가정합니다.


3. 여기까지의 가정에서 다음 두 정리를 얻습니다.


3.1. 에너지 U는 extensive variable입니다. 따라서 같은 extensive variable인 V에 대해 선형적으로만 영향을 받을 수 있습니다. 그러므로 U/V=u(T)라는 결론을 얻습니다. 엔트로피 S 또한 extensive variable이기 때문에 부피에 선형적으로 비례하고 S/V=s(T)라는 결론을 얻습니다.


3.2. 압력(있다고 가정할 경우) p는 intensive variable입니다. 따라서 V와는 무관한 변수여야 하며, p=p(T)를 얻습니다.


4. 상태방정식 u=3p를 얻어야 하는데, 이 부분이 제일 까다로와 보이네요. 일단


4.1. 상대론적인 물질은 E/P=c라는 방정식을 만족합니다. 여기서 P는 운동량입니다.


4.2. 임의의 방향으로 분포된 P로부터 압력을 구하면 p = Pc/3V를 얻습니다.


dP_\text{avr}=\frac{(dA \times cdt\cos\theta)\times(P/V\times\cos\theta)\times(\sin\theta d\phi d\theta)}{2\pi} \\\\\text{average momentum passing through an area element}\\=\frac{(\text{swept volume})\times(\text{momentum component per volume})\times(\text{solid angle})}{\text{solid angle of half-sphere}}


통과한 평균 운동량 = (면적 * 통과한 수직길이 = 통과한 부피) * [(단위부피당 존재하는 운동량의 크기) * 면에 수직한 성분을 위한 코사인] * (고체각 성분) / (반구-한쪽 방향만 생각하므로-의 고체각)


넘어가면서 phi에 대한 부분은 적분으로 날려버립니다.


dp=\frac{dP_\text{avr}}{dA\times dt}=\frac{Pc}{V}\cos^2\theta\,d(\cos\theta) \\\\\text{contribution to pressure}\\=\frac{\text{momentum flux contribution}}{\text{area element}\times\text{time elapsed}}\\\\0\leq\theta\leq\pi/2


압력을 구하기 위해 적분하면 p = Pc/3V를 얻네요.


4.3. 에너지를 집어넣습니다. P=E/c=U/c에서 p=U/3V=u/3을 얻습니다.


5. 위의 과정을 통해 U/V=u(T)와 p=u(T)/3을 얻습니다. 독립적인 변수는 T와 V 뿐입니다. 따라서 열역학 제 1법칙을 다음과 같이 정리합니다.


dU=TdS-pdV=T\left[ {\left. \frac{\partial S}{\partial T}\right|}_V dT +{\left. \frac{\partial S}{\partial V}\right|}_T dV \right]-pdV \\\therefore dU=T{\left.\frac{\partial S}{\partial T}\right|}_VdT+\left[T{\left. \frac{\partial S}{\partial V}\right|}_T-p \right]dV


5.1. dT=0으로 두면 s = 4u/3T을 얻습니다.


{\left. \frac{\partial U}{\partial V}\right|}_T=u(T)=T{\left. \frac{\partial S}{\partial V}\right|}_T-p=Ts(T)-p(T) \\\therefore u+p=\frac43u=Ts \\\therefore s=\frac{4u}{3T}=\frac{4p}{T}


6. 비열을 구해 봅시다. 정적비열은 다음과 같이 구합니다.


c_V=\frac1V {\left. \frac{\partial U}{\partial T}\right|}_V=\frac TV{\left. \frac{\partial S}{\partial T}\right|}_V=\frac{4T}{3V}{\left. \frac{\partial (U/T)}{\partial T}\right|}_V=\frac{4T}{3V}\left[{\left. \frac1T\frac{\partial U}{\partial T}\right|}_V-\frac{U}{T^2}\right] \\\therefore c_V=\frac43 c_V - \frac{4U}{3VT} \\\\c_V=\frac{4u}{T}=3s=\frac{du}{dT}


6.1. 정압비열은 구할 수 없습니다. 압력이 온도에 대한 함수로 나오기 때문에 압력을 고정한 채로 온도를 변화시킬 수 없기 때문이죠.


7. 마지막 결과를 조금 꼬아 봅시다. 그러면 고전적으로 스테판-볼츠만 법칙(Stefan-Boltzmann law)을 얻을 수 있습니다.


c_V=\frac{du}{dT}=3s=\frac{4u}{T} \\\\\therefore \frac{du}{u}=\frac{4dT}{T} \\\\\ln u=4\ln T +C \Leftrightarrow u=AT^4




스테판-볼츠만 상수는 구할 수 없는데, 그 이유는 스테판-볼츠만 상수에는 플랑크 상수가 들어가기 때문이며 플랑크 상수는 양자역학을 도입해야만 등장할 수 있기 때문입니다. 4번까지가 문제가 되고 5번부터는 위키백과에도 나오는 별로 특별할 것은 없는 문제.(신나게 유도해놓고 혹시 있나 해서 찾아봤더니 있었죠...=_=;;)


상대론적인 에너지와 운동량 관계식을 제외하고는 전부 고전열역학적 취급입니다. 양자 가설은 코빼기도 안 비치고, 굳이 태클을 건다면 4.2에서 kinetic theory가 필요하다고 볼 수 있겠네요.

Posted by 덱스터

페이스북의 타임라인에 계신 많은 물리 전공자 분들께 질문을 날려보았습니다. 답변을 기다리는 중...


===========================================


음... 제가 뭔가 놓친 것 같은데 제 타임라인의 물리에 목숨 건 여러분들의 도움을 요청합니다....


주제는 '특정 파장의 레이저로 물질의 온도를 몇 도 까지 올릴 수 있는가'. 구글 스칼라로 "laser heating limit"을 검색해봤는데 관련있어 보이는 검색결과는 안 잡히네요(문헌조사가 두뇌 가동 알고리즘에 누락되어 있다는 뼈아픈 지적을 계속 받고 있어서 트레이닝중...).


왜 이런 문제를 생각하게 되었는가는 생략하고(전혀..까지는 아니지만 다른 문제에서 파생된(?) 문제라서요) 단순하게 '레이저의 세기가 물질의 복사에너지와 일치하는 시점에서 온도의 상승이 멈춘다'고 할 경우 다음과 같은 사고실험을 해 볼 수 있지 않느냐는 거죠.


===========================================


아이디어는 다음과 같습니다. 아무리 낮은 온도의 복사체라도 얼마든지 높은 에너지의 광자를 방출할 수 있습니다. 그러면 온도 T를 가진 한 복사체를 포물면거울의 초점에 두고, 반사되어 평면파로 바뀐 복사광을 회절 격자에 쬐어 스펙트럼으로 나눕니다. 그 중 특정 파장에 해당되는 빛만 취하고 나머지는 거울을 이용해 되돌려보냅니다. 유사 레이저를 만드는 거죠. 좀 더 그럴듯하게 하고 싶으면 편광판을 이용하는 방법도 있고요. 어쨌든 이것을 '온도 T의 유사 레이저 발진기'라고 부릅시다.


'온도 T의 유사 레이저 발진기'를 병렬로 연결합니다. 그러면 나오는 유사 레이저의 세기를 얼마든지 올릴 수 있겠죠(쓰다 보니 자신없어진 부분). 그러면 '온도 T의 유사 레이저 발진기'를 수십만개 연결해서 물체A를 가열하기 시작합니다. 물체A의 에너지는 계속 오르다가 어느 시점에서 평형을 이룰 텐데, 만약 이 평형을 이루는 온도가 레이저의 세기에만 의존한다면 충분히 많은 '온도 T의 유사 레이저 발진기'를 병렬로 연결하는 것으로 물체A의 온도를 T 이상으로 끌어올릴 수 있다는 말이 됩니다. 수많은 '온도 T의 유사 레이저 발진기'로 물체A를 T1(T1>T)으로 가열하는 거죠.


여기서 잠깐. 열역학 2 법칙에 따르면 더 낮은 온도에서 더 높은 온도로 열을 전달할 수는 없습니다(GRE Physics 9277인가에 나왔던 문제라 기억하고 있습니다. 틀렸거든요(...)).


...어라?


============================================


일단 보이는 '현실적'인 불가능한 부분은 과연 '완벽한 반사체'가 존재하냐는 것인데요, 빛을 반사하는 과정에서 반사체의 온도가 상승할 가능성을 무시할 수 있느냐는 질문이 되겠네요.


두 번째로 이렇게 유사 레이저를 제작한다고 해도 그 유사 레이저를 병렬로 연결하면 과연 위상이 잘 맞아들어가서 유사 레이저의 광도가 증가할 것인가의 문제가 있습니다. 이 경우엔 레이저의 광도에 해당하는 흑체복사온도가 있다는 결론이 나올테니(유사 레이저의 세기는 흑체복사로 방출되는 복사광의 해당 파장에서의 세기 이상은 못 가질테니까요) 레이저의 광도와 온도를 직접적으로 대응시키는 방법이 생기네요. 문제 해결? 그런데 평균이 0인 정규분포를 따르는 변수를 모으면 모을수록 그 합의 분산은 증가하는데 꼭 광도가 어느 정도 이상의 값은 가지지 못할 것이라고 결론내리는 것이 너무 성급한 것은 아닌가 싶기도 합니다.


나머지 하나는 이 이상한(?) 현상을 받아들이고 다른 해석(?)을 하는 것. 물체A의 에너지를 물체A의 온도의 함수로 보고 canonical ensemble처럼 처리해서(온도 T의 reservior와 반응하는 것으로 생각하는 거죠) 평형상태 온도가 확률이 극대화가 된다는 것을 보이는 것인데(density of state를 고려해야 할 테니 잘 하면 한 계의 엔트로피 계산에도 쓸 수 있겠네요.) 신나는 계산이 기다리고 있죠...=_=;; 어떻게 계산하는가와 원하는 결과가 나올 것인가는 일단 옆으로 치워 두고...




Rev. 07Nov13


흑체복사에서 벗어나는 radiation의 분포 때문에 물질 내부의 상태는 equilibrium distribution이 아닙니다. 해당 파장의 radiation의 흡수율이 급격히 떨어지게 된다는 뜻. 이걸 고려해야 하는데, 이게 말이야 쉽지...=_=;;


더 이상 canonical distribution을 갖지 않는 상태에 대한 연구가 될 듯 합니다.

Posted by 덱스터
이전버튼 1 2 이전버튼

블로그 이미지
A theorist takes on the world
덱스터
Yesterday
Today
Total

달력

 « |  » 2024.11
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30

최근에 올라온 글

최근에 달린 댓글

글 보관함