'Physics/Concepts' 카테고리의 글 목록

'Physics/Concepts'에 해당되는 글 35건

2025.03.10 Wilsonian renormalisation과 Wilson-Fisher 고정점 1
2025.01.30 Tadpole, normal ordering, and Wilsonian renormalisation
2022.08.02 볼츠만 엔트로피와 클라우지우스 엔트로피의 등가성 6
2021.10.25 IR divergence of Coulomb potential
2021.04.04 블랙홀은 진짜 시공간에 뚫린 "구멍"일까? 3
2021.01.13 힘과 가상입자의 교환 2
2020.11.16 다이온(dyon) 관련 잡담 약간 1
2020.08.23 Analyticity, causality, Kramers-Kronig relations, and all that 2
2020.07.25 To believe or not to believe, that is the question
2020.02.23 Canonical transformations and equivalence of Hamiltonians
2019.01.29 Elementary introduction to Dirac brackets 2
2016.09.29 Frobenius Theorem in General Relativity
2016.08.08 Particles in Curved Space 1
2014.12.24 Fermi-Walker transport 2
2014.06.23 Computation and Heat 2
2013.12.15 Dirac Equation(1) 4
2013.09.20 볼츠만 분포
2010.11.22 열역학 제 2 법칙과 엔트로피 증가의 법칙 3
2010.08.03 엔트로피 - 고전적인 정의 7
2010.07.14 Hamiltonian formulation(1) 4

2025. 3. 10. 06:30 Physics/Concepts

Wilsonian renormalisation과 Wilson-Fisher 고정점

최근 Fellowship 지원서를 작성하다 보니 서구권에서는 생각했던 것보다 outreach를 중요하게 여긴다는 것을 알게 되었다. 쓸 말이 없나 고민하다 보니 물리학 관련 블로그를 운영중~~(한동안 바빠서 개점휴업하긴 했지만)~~이라는 이야기를 하게 되었고, 최근 들어서는 이것 저것 작성해둔 것이 있긴 한데 아무래도 좀 더 뭔가 추가해 두는 것이 좋을 것 같아서 ~~(먹고 사는게 급하면 이렇게 된다 =_=;;)~~ 얼마 전 Schwinger-Keldysh formalism 관련 연습문제로 해보았던 Wilsonian renormalisation group 계산에서 배운 것들이 좀 있어서 정리해볼 겸 작성하는 포스트.

여튼, 재규격화와 관련해서 최근 깨달은 것이 있어 정리하고 있던 글이 다른 일에 치여 사느라 작성이 계속 늦어지고 있는 바람에^[각주:1] 이 포스트가 먼저 나오게 되었는데, 나중에 나올 재규격화 관련 리뷰(?)의 맛보기라고 생각하면 되겠다.

---

우선 양자장론의 정의를 생각해보자. 양자장론을 정의할 때 직접적으로 정의되는 것과 간접적으로 정의되는 것들이 있는데, 가장 직접적인 것부터 나열해보기로 하자.^[각주:2]

양자장론의 정의(Lagrangian을 이용할 경우)에서 가장 직접적인 것은 operator content와 bare parameter이다. 정확히는 Lagrangian에 무엇을 적을 것인가에 대한 내용
다소 간접적으로 정의되는 것은 cutoff scale $\Lambda$. 보통은 UV cutoff만 정의한다고 생각할 수 있지만 경우에 따라 IR cutoff도 정의한다(우주론이나 QCD를 하는 경우가 이에 대응)고 보는 것이 좋다.
다음으로는 재규격화를 위한 regularisation scheme과 그에 딸려오는 computation scale $\mu$. 여기서 기억해야 할 부분은 $\Lambda$와 $\mu$는 원칙적으로는 독립적인 변수라는 점이다.

가장 표준적인 regularisation scheme인 dimensional regularisation (dimreg)의 경우 UV cutoff와 IR cutoff를 조정하는 변수는 $D = 4 - 2\varepsilon$의 $\varepsilon$이며, computation scale인 $\mu$를 통해 간접적으로 UV/IR cutoff가 결정된다고 봐야 한다. dimreg의 작동방식을 '적분이 발산하는 asymptotic region을 적분 구간에서 도려낸 뒤 해당 구간의 적분을 $\mu^{2\varepsilon}$의 적당한 상수배로 치환한다'로 볼 수 있기 때문.

세번째 포인트인 'cutoff scale인 $\Lambda$와 computation scale인 $\mu$는 서로 독립이다'는 생각보다 깨닫기 쉽지 않은데, 양자장론 수업에서는 서로 다른 재규격화 군 (renormalisation group; RG) 사이에 존재하는 정의의 차이를 뭉개는 경우가 많기 때문이다. 재규격화 군을 단순하게 'computation scale $\mu$를 변화시킬 때 그에 연동되는 parameter를 어떻게 바꿀 것인가?'로만 배우기 때문에 생기는 문제로, '왜 computation scale을 바꾸는가?'란 질문을 비껴가서 생기는 문제이다. Computation scale을 바꾸는 동기에 따라 도입하는 재규격화 군의 정의와 해석이 조금씩 달라진다.

예컨대 Wilson 재규격화 군에서는 UV cutoff $\Lambda_{\text{UV}}$와 computation scale $\mu$가 연동되어 있는데 (사실상 같은 것으로 취급한다), Kadanoff block spin의 아이디어를 따라 'UV 자유도를 뭉개는' 것이 목적이기 때문. Wilson 재규격화 군의 동기는 'IR 물리와 UV 물리 사이에 scale separation이 있다면 UV 물리를 정확히 몰라도 IR 물리에 대해서는 어느 정도 예측을 할 수 있어야 한다'이고, Wilson 재규격화 군은 'UV 자유도를 뭉갤 때, 어떻게 bare parameter를 조정해야 동일한 IR 물리계를 기술할 수 있는가?'에 대한 답을 준다. 흔히 Wilson 재규격화 군의 마지막 단계에 추가하는 momentum rescaling은 등각장론에 대응되는 fixed point를 찾기 위한 도구로 봐야 한다.

재규격화 군의 다른 예시인 Gell-Mann & Low의 재규격화 군은 UV cutoff $\Lambda$와 computation scale $\mu$가 완전히 독립적인 변수이고, 여기서의 목표는 '계산에 필요한 도표의 숫자를 줄이자'로 봐야 한다. 흔히 '큰 로그의 재합(resumming large logarithms)'이라고 부르기도 한다.^[각주:3] ≪괴델, 에셔, 바흐≫Gödel, Escher, Bach에서 언급되는 '입자의 재귀성(self-reference)'을 구현한다는 점에서 위에서 언급한 Kadanoff block spin의 아이디어와 관련이 있기는 하지만 원칙적으로는 다른 아이디어. 좀 더 자세한 내용은 언젠가(...) 쓸 재규격화 군에 대한 포스트에서 다루기로 하자.

---

Wilson-Fisher 고정점을 찾기 위한 시작점은 $\phi^4$ 이론의 Lagrangian을 적는 것이다. 편의상 Euclidean 공간에서 계산하기로 하고, UV cutoff $\Lambda$를 도입한다. 점차 UV cutoff를 바꿀 예정이므로, 아랫첨자를 써서 어떤 UV cutoff에 의존하는 양인지 적어두기로 하자.

$$ - \mathcal{L}_\Lambda [\phi_\Lambda] = - \frac{1}{2} (\partial \phi_\Lambda)^2 - \frac{1}{2} m^2_{\Lambda} \phi_\Lambda^2 - \frac{1}{4!} g_{\Lambda} \phi_\Lambda^4 $$

이 꼴의 Lagrangian은 차원이 있는 bare parameter가 있어서 Wilson-Fisher 고정점을 기술하기에는 좋지 않지만 RG running을 보기에는 이 변수가 더 났다. Wilson-Fisher 고정점은 RG 방정식을 구한 다음 구하기로 하자.

다음은 UV cutoff를 $\Lambda' = \Lambda + d \Lambda$로 내릴 차례 ($d \Lambda < 0$를 택하기로 하자). 뭉갤 UV 자유도는 $\Phi_\Lambda$로 표기하기로 한다. 이렇게 자유도를 분해하면 다음과 같은 식을 적을 수 있다.

$$ \phi_\Lambda = \Phi_\Lambda + \phi_{\Lambda'} $$

이렇게 나눈 자유도를 Lagrangian에 대입하면 다음 결과를 얻는다.

$$ - \mathcal{L}_{\Lambda} [\phi_{\Lambda'},\Phi_{\Lambda}] = - \frac{1}{2} (\partial \phi_{\Lambda'})^2 - \frac{1}{2} m^2_{\Lambda} \phi_{\Lambda'}^2 - \frac{1}{4!} g_{\Lambda} \phi_{\Lambda'}^4 \\ - \frac{1}{4} g_{\Lambda} \phi_{\Lambda'}^2 \Phi_{\Lambda}^2 + [\cdots] - \frac{1}{2} (\partial \Phi_{\Lambda})^2 - \frac{1}{2} m_{\Lambda}^2 \Phi_{\Lambda}^2 $$

첫 줄은 우리가 처음에 시작했던 Lagrangian과 ($\Lambda$를 $\Lambda'$으로 바꾸긴 했지만) 정확히 같은 식이고, 두번째 줄은 우리가 뭉갤 $\Phi_\Lambda$에 의존하는 항들이다. 여기서 $\phi \Phi^3$과 같은 항들은 momentum conservation에 의해 우리가 하는 계산에 영향을 주지 않으므로 $[\cdots]$에 대충 던져넣었다.

다음으로는 Wilsonian effective action을 구할 차례. 새 effective action은 $\Phi_\Lambda$ 자유도를 적분하는 것으로 계산한다. 구체적인 식으로 적으면 다음과 같다.^[각주:4]

$$ e^{- \int \mathcal{L}_{\Lambda'}[\phi_{\Lambda'}]} = \exp \left(- \int \left[ \frac{1}{2} (\partial \phi_{\Lambda'})^2 + \frac{1}{2} m^2_{\Lambda} \phi_{\Lambda'}^2 + \frac{1}{4!} g_{\Lambda} \phi_{\Lambda'}^4 \right] \right) \\ \times \int [\mathcal{D}\Phi_\Lambda] \, \exp \left( - \int \frac{1}{4} g_\Lambda \phi_{\Lambda'}^2 \Phi_{\Lambda}^2 \right) e^{- \int \frac{1}{2} ( \Lambda^2 + m_{\Lambda}^2) \Phi_{\Lambda}^2} $$

두번째 줄을 one-loop order에서 계산하면 다음 식을 얻는다.

$$ \log \left[ \int [\mathcal{D}\Phi_\Lambda] \, \exp \left( - \int \frac{1}{4} g_\Lambda \phi_{\Lambda'}^2 \Phi_{\Lambda}^2 \right) e^{- \int \frac{1}{2} ( \Lambda^2 + m_{\Lambda}^2) \Phi_{\Lambda}^2}\right]
\\ = \int - \frac{1}{4} g_\Lambda \phi_{\Lambda'}^2 \langle \Phi_\Lambda \Phi_\Lambda \rangle V_{D,\Lambda} + \frac{1}{2!} \left( - \frac{g_\Lambda^2}{4} \right)^2 \phi_{\Lambda'}^4 \times (2!) \langle \Phi_\Lambda \Phi_\Lambda \rangle^2 V_{D,\Lambda} $$

여기서 $\langle \Phi_\Lambda \Phi_\Lambda \rangle$은 UV mode의 two-point function이고 $V_{D,\Lambda}$는 $\Phi_\Lambda$ 자유도가 가진 위상공간의 부피(phase space volume)이다. $d\Lambda < 0$을 기억한다면, 둘 모두 다음과 같이 근사할 수 있다.

$$ \langle \Phi_\Lambda \Phi_\Lambda \rangle = \frac{1}{\Lambda^2 + m_\Lambda^2} \,,\quad V_{D,\Lambda} = \frac{1}{(2\pi)^D} \times\frac{2 \pi^{D/2}}{\Gamma(D/2)} \times \Lambda^{D-1} | d\Lambda| = - \frac{2 \Lambda^D d \log \Lambda}{(4 \pi)^{D/2} \Gamma (D/2)} $$

이 계산을 정리하면 effective action을 다음과 같이 적을 수 있다.

$$ - \mathcal{L}_{\Lambda'}[\phi_{\Lambda'}] = - \frac{1}{2} (\partial \phi_{\Lambda'})^2 - \frac{1}{2} \left[ m^2_{\Lambda} - \frac{1}{\Gamma(D/2)} \frac{g_\Lambda}{(4 \pi)^{D/2}} \frac{\Lambda^D}{\Lambda^2 + m_\Lambda^2} d \log \Lambda \right] \phi_{\Lambda'}^2
\\ \phantom{=asdfasdfas} - \frac{1}{4!} \left[ g_{\Lambda} + \frac{3}{\Gamma(D/2)} \frac{g_\Lambda^2}{(4 \pi)^{D/2}} \frac{\Lambda^D}{(\Lambda^2 + m_\Lambda^2)^2} d \log \Lambda \right] \phi_{\Lambda'}^4 $$

이 식에서 큰 괄호가 각각 $m^2_{\Lambda'}$과 $g_{\Lambda'}$에 대응된다. 여기서 $D=4$로 고정하면 다음과 같은 running equation을 얻는다.

$$ \frac{d \log m^2}{d \log \Lambda} = - \frac{g}{(4 \pi)^2} \frac{\Lambda^4}{(\Lambda^2 + m^2) m^2} \,,
\\ \frac{d \log g}{d \log \Lambda} = + \frac{3 g}{(4 \pi)^2} \frac{\Lambda^4}{(\Lambda^2 + m^2)^2} $$

UV cutoff가 $\phi$의 질량보다 매우 클 경우 ($\Lambda \gg m$) running이 일어나지만 반대의 경우 ($\Lambda \ll m$) running이 멈추는 것을 볼 수 있다. Cutoff보다 질량이 작은 자유도만 running에 기여한다는 decoupling theorem의 예시라고 하겠다.^[각주:5]

---

이제 Wilson-Fisher 고정점을 구해보자. 이 경우 변수들을 무차원수로 기술해야 할 필요가 있으므로, 변수들을 다음과 같이 다시 적어준다.

$$ \bar{m}_\Lambda = \frac{m_\Lambda}{\Lambda} \,,\quad \bar{g}_\Lambda = g_\Lambda \Lambda^{D-4} \,,\quad \Lambda'=\Lambda (1 + d\log \Lambda) $$

이 경우 재규격화된 질량 변수와 coupling 변수는 다음 관계식을 따른다.

$$ \bar{m}_{\Lambda'}^2 = \bar{m}_{\Lambda}^2 - \left[ 2 \bar{m}_{\Lambda}^2 + \frac{1}{\Gamma(D/2)} \frac{\bar{g}_\Lambda}{(4 \pi)^{D/2}} \frac{1}{1 + \bar{m}_\Lambda^2} \right] d \log \Lambda \,, \\ \bar{g}_{\Lambda'} = \bar{g}_{\Lambda} + \left[ (D-4) \bar{g}_{\Lambda} + \frac{3}{\Gamma(D/2)} \frac{\bar{g}_\Lambda^2}{(4 \pi)^{D/2}} \frac{1}{(1 + \bar{m}_\Lambda^2)^2} \right] d \log \Lambda $$

$\bar{g}_\Lambda$ 대신 $\bar{\lambda}_{\Lambda} := \frac{\bar{g}_\Lambda}{\Gamma(\frac{D}{2})(4 \pi)^{D/2}}$를 도입하면 다음과 같이 RG 방정식을 적을 수 있다.

$$ \frac{d \bar{m}_\Lambda}{d \log \Lambda} = - 2 \bar{m}_{\Lambda}^2 - \frac{\bar{\lambda}_{\Lambda}}{1 + \bar{m}_\Lambda^2} \,, \\ \frac{d \bar{\lambda_{\Lambda}}}{d \log \Lambda} = (D-4) \bar{\lambda}_\Lambda + \frac{3 \bar{\lambda}^2_\Lambda}{(1 + \bar{m}_\Lambda^2)^2} $$

Dimreg 변수 $\epsilon = 4-D$을 도입할 경우^[각주:6] RG 방정식의 근으로 $\bar{\lambda}_\ast = \frac{\epsilon}{3} + \mathcal{O} (\epsilon^2)$과 $\bar{m}^2_\ast = - \frac{\epsilon}{6} + \mathcal{O} (\epsilon^2)$를 얻는다. 이 근이 바로 Wilson-Fisher 고정점이 된다.

보아하니 1년 넘게 늦어지고 있는 듯 하다. 그런데 작성하다가 중간 즈음 그만둔 포스트가 워낙 많아서... =_=;; [본문으로]
등각장론은 조금 다른 정의를 취할 수 있지만 다음 기회에... [본문으로]
Weinberg QFT 2권이 이 제목을 썼던 것으로 기억하고 있다. [본문으로]
이 계산의 좀 더 다듬어진 버전을 FRG(functional renormalisation group)이라고도 한다. [본문으로]
그리고 한 교수님은 추천서 작성해달라는 요청이 있을 때마다 양자장론의 이해도를 묻는다고 이 질문의 변형(QED의 beta function)을 던저주셨다는 소문을 들은 적이 있다. [본문으로]
$D = 4 - 2 \varepsilon$으로 정의되는 $\varepsilon$과는 다르다! [본문으로]

저작자표시 비영리 변경금지

'Physics > Concepts' 카테고리의 다른 글

Tadpole, normal ordering, and Wilsonian renormalisation (0)	2025.01.30
볼츠만 엔트로피와 클라우지우스 엔트로피의 등가성 (6)	2022.08.02
IR divergence of Coulomb potential (0)	2021.10.25
블랙홀은 진짜 시공간에 뚫린 "구멍"일까? (3)	2021.04.04
힘과 가상입자의 교환 (2)	2021.01.13

Posted by 덱스터

2025. 1. 30. 03:03 Physics/Concepts

Tadpole, normal ordering, and Wilsonian renormalisation

최근 수학자들과 작업할 일이 생기면서 양자장론의 형식적인 부분을 들여다볼 일이 생겼는데, 그러다보니 양자장론 한창 공부할 때 조금 보고는 때려친 axiomatic QFT 관련 지식들이 조금 도움이 되고 있다. Wightman function이라던가 point splitting이라던가 normal ordering이라던가 등등...^[각주:1]

이 와중에 나를 한동안 고민하게 만든 문제가 있었으니 Feynman diagram 계산에서 tadpole diagram들의 존재.^[각주:2] Feynman diagram은 S-matrix의 Dyson series 전개를 도표로서 재해석한 것이고, Dyson series는 interaction Hamiltonian에 대한 무한급수로 주어진다. 여기서 문제가 되는 부분은 우리가 양자장론을 처음 배울 때 일반적으로 interaction Hamiltonian을 양자장의 normal-ordered product로 생각한다는 것과, Feynman diagram을 그릴 때 tadpole이 있는 diagram을 제거하지 않는다는 것이다.

Feynman diagram에서 vertex는 interaction Hamiltonian에 들어있는 항들 중 하나에 대응된다. 따라서, 이미 interaction Hamiltonian이 normal-ordered product로 주어졌다면 같은 vertex에서 시작해서 끝나는 tadpole은 존재해서는 안된다. 해당 tadpole에 대응되는 contribution이 이미 normal ordering에 의해 제거되었기 때문. Tadpole은 그 spacetime point에서 생성된 입자가 다시 그 spacetime point에서 제거되는 과정에 대응되는데, normal-ordered product로 주어진 operator로서는 이런 과정이 있을 수 없다. 모든 annihilation operator가 우측으로 옮겨졌기 때문.^[각주:3]

가장 단순한 해결방법은 Dyson series에 들어가는 interaction Hamiltonian이 normal-ordered product가 아니라고 선언하는 것이다. 그렇다면 당연히 따라와야 하는 질문은 '그렇게 고생해서 normal ordering을 정의했는데, 왜 실제 계산에서는 사용하지 않는가?'이다. 여기에 대해서는 Wilsonian EFT가 답을 줄 수 있다.

현대적인 관점에서 모든 양자장론은 (암묵적으로 UV cutoff를 가정하는) 유효장론이다. UV cutoff가 존재하지 않는 등각장론(CFT)이 있지 않냐고 반문할 수 있으나 등각장론은 UV cutoff를 임의로 높게 설정해도 수학적인 문제가 생기지 않는 유효장론으로 여기는 것이 타당하다. Scale-free한 임계현상이 등각장론으로 기술된다고 해서 그 임계현상을 보이는 물리계를 무한히 확대해도 등각장론으로 기술할 수 있는 것은 아니지 않은가? 헬륨-4의 람다점을 기술하는 등각장론을 원자핵 스케일인 1fm대에도 적용할 수 있다고 말하고 다니려면 꽤 많은 용기가 필요할 것이다.

위 관점을 도입할 경우 우리가 실제로 S-matrix를 계산하기 위해 그리는 Feynman diagram에 사용되는 vertex rule들은 (bare action에서 UV 자유도를 적분하여 제거(integrate-out)해서 얻은) Wilsonian action에서 유래한 것으로 봐야 한다. 다르게 이야기한다면, 우리가 Feynman diagram에 집어넣은 vertex는 renormalised interaction Hamiltonian에 대응되며, 이 vertex를 확대해보면 내부에서 UV 자유도가 bare interaction Hamiltonian에 대응되는 vertex를 갖는 loop을 이루며 돌고 있는 것으로 보아야 한다는 것이다. 도표를 이용해 계산할 경우 bare interaction Hamiltonian으로부터 renormalised interaction Hamiltonian이 구해질 때 normal ordering에 대응되는 과정이 없으므로, Dyson series를 normal ordered된 bare interaction Hamiltonian으로부터 시작했다고 하더라도 실제 계산에 대응되는 renormalised interaction Hamiltonian은 더 이상 normal-ordered product가 아니게 된다. Wilsonian EFT를 가정할 경우 interaction Hamiltonian을 normal-ordered product로 가정하는 것이 오히려 불편하며, normal ordering을 가정하지 않으므로 자연스럽게 tadpole diagram을 계산에 추가하게 되는 것이다.

여담으로 Peskin&Schroder에서 point-splitting regularisation을 ABJ anomaly 계산에 사용하는 모양이다. Axiomatic한 맥락에서만 봐서 실제 계산에서 중요하게 등장하는줄은 몰랐지 =_=;; [본문으로]
빈 방문할 때 생각하기 시작했으니 거의 한달 가량 고민한 듯. [본문으로]
여담이지만 교수님들은 골치아픈 문제로 골탕먹이려는 학생을 좋아하는 경향이 있다. 이론입자물리 대학원생 자리를 알아보고 있는 학생이라면 이 문제를 사용해도 좋다. Use at your own peril and good luck. [본문으로]

저작자표시 비영리 변경금지

'Physics > Concepts' 카테고리의 다른 글

Wilsonian renormalisation과 Wilson-Fisher 고정점 (1)	2025.03.10
볼츠만 엔트로피와 클라우지우스 엔트로피의 등가성 (6)	2022.08.02
IR divergence of Coulomb potential (0)	2021.10.25
블랙홀은 진짜 시공간에 뚫린 "구멍"일까? (3)	2021.04.04
힘과 가상입자의 교환 (2)	2021.01.13

Posted by 덱스터

2022. 8. 2. 08:45 Physics/Concepts

볼츠만 엔트로피와 클라우지우스 엔트로피의 등가성

2010.08.03 - 엔트로피 - 고전적인 정의

2010.11.22 - 열역학 제 2 법칙과 엔트로피 증가의 법칙

(현재) 밥 벌어먹는 주제와는 다소 거리가 있지만 열역학 및 통계역학은 개인적으로 애착이 있는 주제인데, 공학 전공 대신 이학 전공을 택하기로 마음먹은 계기가 된 학문이기 때문이다. 특히 엔트로피의 정의 및 열역학 제 2법칙의 정량적 형식화는 물리학을 전공으로 택하기로 마음먹은 직접적인 계기가 된 주제이기 때문에 더욱 애착이 있는 편이다. 여튼, 트위터에서 엔트로피의 정의에 등장하는 로그에 대한 이야기가 나와서 엔트로피에 대해 떠들다 보니 예전에 완전히 해소하지 못했던 의문에 대해 다시 생각해보게 되었다.

고전열역학과 통계역학은 서로 다른 "공리계"에 바탕을 둔 이론 체계인데, 어떻게 한 쪽의 엔트로피의 정의가 다른 쪽의 엔트로피의 정의에 대응된다고 할 수 있는가?

학부 졸업하고 한참이 지난 이제서야 이 질문에 대해 답할 수 있게 되어서 정리해보는 것이 이번 포스트의 목적이다.

---

고전열역학의 알파와 오메가는 열기관(heat engine)이다. '증기기관의 효율 개선'이란 공학적인 목표와 밀접한 관계를 갖고 발전한 학문인데다가 열역학의 가장 기본적인 물리량이라 할 수 있는 온도부터 열기관을 이용해 정의되며, 따라서 어떤 계에 열역학이 있을 경우 대응되는 열기관을 고려하는 것이 매우 자연스럽다.^[각주:1] 실제 열역학의 응용은 열기관이 요구하는 닫힌 사이클에 한정되지 않지만, 가장 중요한 개념은 열기관이란 점을 분명히 해 두자.

한편 통계역학은 원자론과 경험적 실재를 조화시키는 것을 목표로 한다. 통계역학의 전신이라 할 수 있는 기체분자운동론(kinetic theory of gases)은 수많은 "원자"로^[각주:2] 구성된 기체를 어떻게 부피, 온도, 압력 등 매우 적은 갯수의 물리량으로 정확하게 기술할 수 있는가를 설명하기 위한 이론이다. 기체분자운동론보다 다양한 물리계를 다루는 통계역학은 마찬가지로 엄청나게 많은 자유도를 가진 계의 행동을 기술하는데는 그 계의 정확한 상태(혹은 미시상태microstate)를 알 필요 없이 중요한 몇 개의 물리량만 알아도 충분하다는 경험적 실재에 바탕을 두고 있다. Jaynes로부터 시작한 통계역학과 정보이론 사이의 접점도 이런 관점에서 이해할 수 있다. (대)정준 앙상블((grand)canonical ensemble)은 거시계의 중요한 물리량으로 결정되는 거시상태(macrostate)를 알고 있을 때 실제 계가 어떤 미시상태에 있을 확률을 추정하는 문제의 답인데, 이 문제는 전형적인 주어진 정보(거시상태)로부터 원하는 정보(어떤 미시상태일 확률)를 추정하는 베이지언 추정의 사례다.

본문으로 넘어가기 전 이 포스트에서는 모두 평형상태, 준평형상태(quasi-equilibrium) 혹은 평형에 가까운 상태(near equilibrium)만 다룬다는 점을 분명히 하기로 하자. 애초에 이 범주에서 벗어나는 경우는 아직까지도 연구주제이기도 하고.

---

역사적으로는 고전열역학이 기체분자운동론과 같이 발전했지만, 고전열역학의 현대적인 재구성에서는 전혀 통계역학적인 관점을 필요로 하지 않는다. 흥미로운 점은 고전열역학의 세 "공리" 중 물리량을 정량적으로 지정하는 것은 하나(열역학 제 1법칙)뿐이라는 사실이다. 뉴턴역학의 세 "공리" 중 제 2 법칙에 대응된다고 해야 할까.

0. 열평형은 존재하며 온도를 정의할 수 있다. (A와 B가 열평형을 이루고 B와 C가 열평형을 이루면 A와 C 또한 열평형을 이룬다. 이 때 A, B, C 모두 같은 온도를 갖는다.)
1. 열은 에너지의 이동이며, 에너지는 보존된다.
2.1. 열은 낮은 온도에서 높은 온도로 흐를 수 없다. (Clausius)
2.2. 열을 순수하게 일로 변환할 수 없다. (Kelvin-Planck)

위의 열역학 법칙 중 정량적으로 정의되는 것은 (에너지의 이동으로 정의되는) 열밖에 없다. 에너지는 고전역학에서 정량적으로 정의되기 때문. 그리고 위의 열역학 법칙으로부터 정의되는 온도는 모스 굳기계처럼 상대적인 순서만 정의된다는 것을 기억하도록 하자; 온도가 높은 열원에서 온도가 낮은 열원으로 열이 흐른다는 것은 결정할 수 있지만, 온도가 높은 열원이 온도가 낮은 열원보다 얼마나 뜨거운가는 답할 수 없다. '얼마나 뜨거운가?'란 정량적인 질문에 답하기 위해서는 열역학 법칙으로부터 정의되는 온도에 구조를 좀 더 더해 열역학적 온도로 바꾸어야 한다.

켈빈으로 정의되는 절대온도는 정확히는 열역학적 온도로, 이상적인 가역기관의 열효율을 이용하여 온도에 절대값을 줄 수 있다는 것을 이용한 것이다.^[각주:3] 참고로 실제 측정에 쓰이는 온도의 SI 정의는 ITS-90 및 그 저온 확장인 PLTS-2000으로, 열역학적 온도의 근사이며 완전히 일치하지는 않는다. 고전열역학에서 온도가 정의되는 과정은 위에 링크해둔 예전 글을 참조하도록 하자. 여튼, 열역학적 온도 $T$를 정의하고 나면 열역학적 온도를 이용해 엔트로피(의 변화)를 정의할 수 있다.

$$ dS_C := \left. \frac{\delta Q}{T} \right|_{\text{rev.}} $$

여기서 rev.는 가역과정(reversible process)를 나타낸다. 이 미분이 왜 상태함수인 엔트로피 $S_C$를 정의하는지는 예전 글에서 다뤘으므로 넘어가기로 한다. 대학물리에서 배우는 엔트로피의 정의는 위의 꼴을 갖는데, 편의상 우변에 적힌 미분량을 제일 먼저 적은 클라우지우스의 이름을 따서^[각주:4] 클라우지우스 엔트로피라고 부르기로 하자. $S_C$의 아래첨자 C는 Clausius를 나타낸다.

---

통계역학은 완전히 다른 "공리계"에서 출발한다. 보통 동일 선험확률의 원리(principle of equal a priori probability)라 부른다.

0. 주어진 거시적 성질에 대응되는 모든 미시상태는 동등한 확률을 갖고 실현된다.

그리고 이 성질을 '증명'하기 위해 오늘도 많은 이론가들이 머리를 싸매고 있지만 우리의 관심사는 두통을 얻는 것이 아니므로 일단 그렇다고 받아들이기로 하자. 위 "공리"에서 다음 보조가설이 유도된다.

0.1. 거시적 물리량은 대응되는 미시상태의 수가 줄어들지 않는 방향으로 움직이는 경향을 갖는다.

그렇다면 거시적 물리량에 대응되는 미시상태의 수 $\Omega$는 어떻게 측정할까? 편의상 내부 자유도가 없는 (이상)기체를 가정할 경우, 미시상태의 수는 거시적 물리량과 일치하는 위상공간(phase space)의 부피로 정의한다. 기체의 위상공간 중 위치 $x$가 가질 수 있는 범위는 기체가 가둬진 상자의 부피 $V$로 주어질테고 운동량 $p$가 가질 수 있는 범위는 기체가 갖는 총 에너지 $E$에 의해 결정될테니, 미시상태의 수 $\Omega$는 거시적 물리량인 기체의 총 에너지 $E$와 기체가 가둬진 상자의 부피 $V$에 의해 결정된다.

$$ \Omega = \Omega(E, V) $$

문제는 미시상태의 수 $\Omega$가 별로 좋은 물리량이 아니라는 것이다. '경우의 수'로도 해석될 수 있는 $\Omega$는 동일한 부피와 동일한 에너지를 가진 같은 기체가 또 있을 경우 두배가 되는 것이 아니라 제곱이 된다. 좀 더 구체적으로 이야기하자면, 전체 계를 두 부분계(subsystem)로 나눴을 때 전체 계가 갖는 미시상태의 수 $\Omega_{\text{tot}}$는 부분계 1의 미시상태의 수 $\Omega_1$과 부분계 2의 미시상태의 수 $\Omega_2$의 곱으로 적히게 된다.

$$ \Omega_{\text{tot}} = \Omega_1 \times \Omega_2 $$

우리에게 익숙한 물리량의 행동은 크게 세기 성질(intensive property)과 크기 성질(extensive property)로 나눠지는데, 미시상태의 수 $\Omega$는 두 행동 중 어느 것과도 일치하지 않는다. 하지만 로가리듬을 이용하면 미시상태의 수 $\Omega$를 크기 성질로 바꿀 수 있다.

$$ \log \Omega_{\text{tot}} = \log \Omega_1 + \log \Omega_2 $$

보통은 이쯤에서 $\log \Omega$를 이용해 볼츠만 엔트로피 $S_B$를 정의하는데, 아직까지는 위에서 정의한 클라우지우스 엔트로피 $S_C$와의 관계가 불분명하므로 $W$라고 적기로 하자.

$$ W := \log \Omega (E,V) $$

이제 몇가지 보조가설을 도입하여 $W$의 성질 및 $W$로부터 온도를 정의하는 방법에 대해 알아보자.

1. 열평형은 존재하며, 전체 미시상태의 수가 극대화되는 거시상태에 대응된다.
2. 열은 온도가 높은 부분계에서 온도가 낮은 부분계로 이동한다.

대부분의 통계역학 교육과정에서처럼 부피에 대한 의존도는 무시하고 에너지에 대한 의존도만 살리기로 하자. 부분계 1과 부분계 2로 나눈 전체 계의 에너지를 $E$라고 할 때, 전체 계의 미시상태 수 $W_{\text{tot}}$는^[각주:5] 다음과 같이 적을 수 있다.

$$ W_{\text{tot}} (E;E_1) = W_1 (E_1) + W_2 (E - E_1) $$

여기서 $E_1$은 부분계 1이 나눠가진 에너지다. 평형상태에 대응되는 에너지 $E_1^\ast$는 $W_{\text{tot}}$의 극대화 조건으로부터 구할 수 있다. 첫번째 극대화 조건은 '미분이 0일 것'이다.

$$ \left. \frac{\partial W_{\text{tot}}}{\partial E_1} \right|_{E_1 = E_1^\ast} = \left. \frac{\partial W_1 (E_1)}{\partial E_1} \right|_{E_1 = E_1^\ast} - \left. \frac{\partial W_2 (E_2)}{\partial E_2} \right|_{E_2 = E - E_1^\ast} = 0 $$

두번째 극대화 조건은 '2계미분이 음수일 것'이다.

$$ \left. \frac{\partial^2 W_{\text{tot}}}{\partial E_1^2} \right|_{E_1 = E_1^\ast} = \left. \frac{\partial^2 W_1 (E_1)}{\partial E_1^2} \right|_{E_1 = E_1^\ast} + \left. \frac{\partial^2 W_2 (E_2)}{\partial E_2^2} \right|_{E_2 = E - E_1^\ast} < 0 $$

잠시 두번째 조건에 대한 사족을 덧붙이고 온도의 정의로 넘어가기로 하자. 만약 두번째 극대화 조건보다 강한 다음 조건을 계의 미시상태 수 $W$에 대해 요구하면 그 계는 (같은 조건을 만족하는) 다른 계와 항상 열평형을 이룰 수 있다.

$$ \frac{\partial^2 W}{\partial E^2} < 0 $$

대부분의 경우 암묵적으로 고려하는 물리계가 1계미분에 대한 조건 $\frac{\partial W}{\partial E} > 0$과 함께 위의 성질을 만족할 것을 요구하며, 통계-열역학적으로 보통인 계(normal system in the statistical-thermodynamic sense)라고 부르기도 한다.^[각주:6] 물론 모든 계가 이 조건을 만족하는 것은 아니다. 힐베르트 공간의 차원이 유한한 양자계가 대표적인 사례. 다른 사례로는 끈이론이 있는데, 고에너지이론에서는 끈의 에너지가 충분히 높을 경우 끈의 미시상태 수가 에너지에 따라 지수적 이상으로 증가($\Omega \gtrsim e^{\alpha E}$)해 이 조건을 만족하지 못하는 경우가 존재한다. 이와 관련된 온도를 하게도른 온도(Hagedorn temperature)라고 하는데, 보통은 상전이점에 가까워져 통계역학적인 물리를 기술하기 위해 썼던 모형이 더 이상 유효하지 않아 발생하는 것으로 해석한다.

첫번째 보조가설에 대한 이야기(열평형의 존재)는 이정도로 하고, 이제 두번째 보조가설인 '열의 흐름 방향'으로 넘어가자. 열이 흘러야 하는 방향으로부터 온도의 대소관계를 정의할 수 있다. 만약 부분계 1이 가진 에너지가 평형상태에 대응되는 에너지보다 낮은 상태($E_1 < E_1^\ast$)라면 $E_1$이 증가하는 방향과 $W_{\text{tot}}$이 증가하는 방향이 동일할 것이다.

$$ E_1 < E_1^\ast \Rightarrow \frac{\partial W_{\text{tot}}}{\partial E_1} = \frac{\partial W_1 (E_1)}{\partial E_1} - \left. \frac{\partial W_2 (E_2)}{\partial E_2} \right|_{E_2 = E - E_1} > 0 \Rightarrow \frac{\partial W_1}{\partial E_1} > \frac{\partial W_2}{\partial E_2} $$

이 경우 $E_1$이 증가하려 하기 때문에 부분계 1의 온도 $t_1$은 부분계 2의 온도 $t_2$보다 낮을 것이다.

$$ E_1 < E_1^\ast \Rightarrow t_1 < t_2 $$

반대의 경우($E_1 > E_1^\ast$) 또한 생각해 볼 수 있다. 중간 계산을 건너뛰고 결론만 이야기한다면, 다음과 같은 식을 얻는다.

$$ E_1 > E_1^\ast \Rightarrow \frac{\partial W_1}{\partial E_1} < \frac{\partial W_2}{\partial E_2} \,,\, t_1 > t_2 $$

여기서 한가지 패턴을 눈치챌 수 있는데, 온도의 대소관계는 미시상태 수에 대한 에너지 미분 $\frac{\partial W}{\partial E}$의 대소관계와 반대라는 것이다. 따라서 $\frac{\partial W}{\partial E} > 0$를 만족하는 보통계의 경우 온도에 대한 단조증가함수 $\phi(t) > 0$를 다음과 같이 정의할 수 있다.

$$ \phi(t) := \left( \frac{\partial W}{\partial E} \right)^{-1} \,,\, t_1 < t_2 \Rightarrow \phi(t_1) < \phi(t_2) $$

이제 남는 문제는 $\phi(t)$를 고전열역학에서 정의되는 열역학적 온도 $T$로 취급할 수 있다는 것을 보이는 것이다. 이 문제만 해결되면 볼츠만 엔트로피 $S_B = W$가 클라우지우스 엔트로피 $S_C$에 대응됨은 자동으로 따라오는데, 볼츠만 엔트로피의 변화량을 클라우지우스 엔트로피 정의의 우변처럼 적을 수 있기 때문이다.

$$ \phi(t) = T \Rightarrow \frac{\partial S_B}{\partial E} = \frac{1}{T} \Rightarrow dS_B = \frac{dE}{T} \Leftrightarrow \left. \frac{\delta Q}{T} \right|_{\text{rev.}} = dS_C $$

그렇다면 $\phi(t) = T$를 어떻게 보일 수 있을까? 고전열역학에서 열역학적 온도 $T$가 어떻게 정의되었는지 기억하는가? 똑같은 방법을 쓰면 된다. 가역열기관(reversible heat engine)을 도입해서 열 교환비가 정확히 $\phi(t)$의 비로 주어짐을 보이면 된다.

---

가역열기관 중 가장 잘 알려진 카르노 기관(Carnot engine)을 이용하기로 하자. 영문/한국어를 불문하고 위키백과 설명에는 카르노 기관이 이상기체를 작동 유체으로 이용한다고 되어 있으나, 일반적인 가역기관으로 추상화할 경우에는 카르노 기관의 작동 유체가 이상기체일 필요가 없다. 열역학 및 통계역학 교육에서 명시적으로 언급하는 경우가 드문 것이 아쉬운 부분.

구체적으로는 다음과 같이 카르노 기관을 구성한다.

등온과정은 온도 $t$ 혹은 $\phi(t)$가 일정한 과정으로 구성한다.
단열과정은 미시상태의 수 $\Omega$ 혹은 그 로그값인 $W = \log \Omega$가 일정한 과정으로 구성한다.

등온과정은 같은 온도를 갖는 열기관과 열원 사이의 열 교환이므로 가역과정이고, 위의 방식대로 정의된 단열과정은 미시상태의 수가 늘어나지 않았기 때문에^[각주:7] 되돌릴 수 있어 가역과정이다. 등온-단열-등온-단열 네 단계를 통해 원 상태로 돌아오는 카르노 순환(Carnot cycle)은 다음과 같은 도표로 나타낼 수 있다. 비록 양 축을 온도(의 함수)인 $\phi(t)$와 미시상태의 수인 $W$로 구성했지만, 실제 열기관의 상태를 결정하는 독립변수는 열기관의 에너지 $E$와 부피 $V$이다.

높은 온도에서의 등열팽창(AB)-높은 온도에서의 단열팽창(BC)-낮은 온도에서의 등열수축(CD)-낮은 온도에서의 단열수축(DA) 네 과정으로 구성되는 카르노 기관

이제 구성한 카르노 기관의 열 교환비를 계산해보자. 등열팽창 과정인 A-B에서 열기관이 얻는 열 $Q_h$는 A와 B에서의 에너지 차이인 $E_B - E_A$로 주어진다. 이때 열기관의 상태가 움직이는 곡선은 온도 $\phi(t)$가 상수인 곡선 $\frac{\partial W}{\partial E} = \phi(t_h)^{-1}$이므로, 고온부에서 얻은 열은 다음과 같이 적을 수 있다.

$$ Q_h = E_B - E_A = \left( \left. \frac{\partial W}{\partial E} \right|_{t=t_h} \right)^{-1} (W_B - W_A) = \phi(t_h) (W_B - W_A) $$

마찬가지로 저온부에서 버리는 열은 다음과 같이 적을 수 있다.

$$ Q_l = E_C - E_D = \left( \left. \frac{\partial W}{\partial E} \right|_{t=t_l} \right)^{-1} (W_C - W_D) = \phi(t_l) (W_C - W_D) $$

그리고 단열과정의 정의 때문에 $W_B = W_C$와 $W_A = W_D$라는 추가조건을 얻으며, 열 교환비로 다음 표현을 얻는다.

$$ \frac{Q_l}{Q_h} = \frac{\phi(t_l) (W_C - W_D)}{\phi(t_h) (W_B - W_A)} = \frac{\phi(t_l)}{\phi(t_h)} = \frac{T_l}{T_h} $$

이제 가역열기관의 열 교환비를 열역학적 온도로 정의하는 고전열역학에서와 같이 온도에 대한 양의 단조증가함수 $\phi(t)$를 열역학적 온도 $T$로 정의하면 된다. 다만 $\phi(t) = (\partial W / \partial E)^{-1}$는 에너지의 차원을 가지므로, 단위를 변환해줄 상수인 볼츠만 상수 $k_B$를 도입해서 온도와 차원을 맞춰준다.

$$ \phi(t) := k_B T = \left( \frac{\partial W}{\partial E} \right)^{-1} $$

이제 볼츠만 상수를 넘겨주면 많은 통계역학 책에서 그냥 적고 시작하는 다음 식을 얻을 수 있다.

$$ \frac{1}{T} = k_B \frac{\partial \log \Omega (E,V)}{\partial E} = \frac{\partial}{\partial E} \left( k_B \log \Omega \right) = \frac{\partial S_B}{\partial E} $$

이 식이 주어질 경우 어떻게 볼츠만 엔트로피의 변화량 $d S_B$를 클라우지우스 엔트로피의 변화량 $d S_C$에 대응시킬 수 있는지는 위에서 이미 이야기했으므로 생략하기로 한다.

마찬가지의 이유에서 열역학이 존재하는 블랙홀을 이용한 열기관을 생각할 수 있다. 이 사실을 AMPS 불의 벽Firewall(방화벽으로 번역하기도 하는데 의미상 불의 벽이 더 자연스럽다) 역설을 주제로 한 특강(2014년 봄)을 들으며 깨달았는데, 대학원에 들어오고 나서 열기관으로서의 블랙홀을 고려하는게 최신 연구 주제(내가 아는 한 이 문제를 고려한 논문은 2014년 4월의 Clifford Johnson의 논문이 최초이다)라는 것을 알고는 상당히 놀랐던 기억이 있다. [본문으로]
실제로는 분자이지만 '연속체가 아닌 이산적인 작은 입자로 구성된다'란 핵심 아이디어를 공유한다는 점에서 원자론의 일종으로 취급할 수 있다. [본문으로]
구체적으로는 이상적인 가역기관의 열 교환비에 대응된다. 비율로 정의된다는 특성상 온도간 차이는 의미가 없고 온도간의 비율만이 의미를 갖는다. 절대온도의 다른 정의방법인 '이상기체의 부피'와 연관지으려면 통계역학의 '열역학적 온도'와 동치성을 보인 뒤 기체분자운동론을 이용하는 방법을 쓸 수 있다. 기체분자운동론을 이용해 이상기체상태방정식을 구하는 것은 많은 교재에서 다루는 내용이므로 생략하기로 하자. [본문으로]
폐곡선을 따라 우변의 미분량을 적분하면 0보다 작은 값을 얻으며, 가역과정의 경우에는 0이 된다는 정리를 클라우지우스 정리(Clausius theorem)라고 한다. 열역학 제2 법칙의 정량화된 버전 중 하나. [본문으로]
편의상 미시상태의 수를 $W$라고 적을 경우 로가리듬이 붙은 경우를 의미한다고 이해하기로 하자. [본문으로]
이 표현은 Kubo의 통계역학 책에서 쓰는데, 보편적인 표현은 아닌 듯 하다. 참고로 $(d^2 W/ d E^2) < 0$이란 조건은 비열(specific heat)이 양수일 조건과도 일치하며, 블랙홀은 반대 조건을 만족하는 열역학계이기 때문에 불안정하고 궁극적으로는 호킹 복사에 의해 증발한다. [본문으로]
동일 선험확률의 원리에서 유도되는 보조가설이 '미시상태의 수가 줄어들 수 없음'이었음을 상기하자. [본문으로]

저작자표시 비영리 변경금지

'Physics > Concepts' 카테고리의 다른 글

Wilsonian renormalisation과 Wilson-Fisher 고정점 (1)	2025.03.10
Tadpole, normal ordering, and Wilsonian renormalisation (0)	2025.01.30
IR divergence of Coulomb potential (0)	2021.10.25
블랙홀은 진짜 시공간에 뚫린 "구멍"일까? (3)	2021.04.04
힘과 가상입자의 교환 (2)	2021.01.13

Posted by 덱스터

2021. 10. 25. 06:46 Physics/Concepts

IR divergence of Coulomb potential

This series is divergent; therefore, we may be able to do something with it. -- Oliver Heaviside

$\frac{1}{r}$꼴을 갖는 Coulomb potential은 IR 발산이 있는 것으로 유명하다. 좀 더 구체적으로 말하자면, 학부 역학 수준에서 계산할 수 있는 궤도방정식을 풀어 얻는 Rutherford scattering의 미분단면적(differential cross-section)을 계산할 경우 다음과 같은 $\sin^{-4} (\theta/2)$의 꼴을 갖는다는 것이 알려져 있다.

$$ \frac{d\sigma}{d\Omega} \propto \frac{1}{\sin^4 (\theta/2)} $$

이 식을 적분하여 얻는 총산란단면적(total cross-section)은 발산한다.

$$ \sigma_{\text{tot}} = \int \frac{d \sigma}{d \Omega} d \Omega \propto \int \frac{d(\cos \theta)}{\sin^4 (\theta/2)} \to \infty$$

양자역학에서 Coulomb potential이 주어졌을 때의 산란문제를 풀 때도 이 성질과 관련된 현상이 나타난다. Griffiths 양자역학에서는 Coulomb potential을 Yukawa potential의 질량이 없는 극한으로 생각하기 때문에 등장하지 않지만 Landau 3권이나 교수님 세대의 메인 레퍼런스(...)란 느낌이 있는 Shiff책을 뒤적이다 보면 asymptotic region에서 파동함수가 평면파인 $e^{ikz}$로 수렴하는 것이 아니라 로그가 붙은 추가적인 위상항(phase factor)이 등장하는 것을 볼 수 있다.

$$ \psi \sim e^{ikz + (i/k) \log [k(r-z)]} $$

교재에서는 이런 Coulomb potential의 IR 발산에 대해 'Coulomb potential이 장거리 상호작용(long-range interaction)이기 때문에 발생한다'는 설명을 써놓지만, 구체적으로 무한원점에서 0으로 수렴하는 다른 potential들과 어떻게 다른지에 대해 설명하는 경우는 드물다^[각주:1]. 왜 이런 현상이 일어나는지 고전역학적으로 이해하는 것이 이 포스트의 목표.

---

Coulomb potential이 주어졌을 때 그 potential을 따라 움직이는 시험 입자(test particle)의 궤도방정식을 푸는 문제는 몇 안 되는 정확하게 풀 수 있는 고전역학 문제이다. 심지어 궤도방정식 위키백과 페이지가 있을 정도. 시간에 대한 거리의 미분방정식을 각도에 대한 거리의 미분방정식으로 바꾼 뒤 $u = 1/r$이란 변수변환으로 조화진동자 방정식으로 바꾸는 과정이나 이렇게 얻은 궤도방정식으로부터 충돌 파라메터(impact parameter)에 대한 산란각(scattering angle)의 방정식을 얻는 과정은 많은 교재에서 충분히 다루고 있으니 여기서는 생략하기로 하자^[각주:2].

여기서는 eikonal 근사의 변종으로 Coulomb potential에서의 산란을 풀어보자. Eikonal은 기하광학에서 빛의 경로를 계산하기 위해 쓰는데, WKB 근사라고 생각해도 좋다. 여담으로 eikonal은 해밀턴이 기하광학을 풀기 위한 수학적 기법을 다듬으면서 같은 기법이 고전역학에도 적용될 수 있음을 알아차리면서 현재의 해밀턴역학과 심플렉틱기하를 만들어내는 계기가 되었고, 슈뢰딩거의 파동방정식은 기하광학의 eikonal 방정식에서 영감을 얻었다고 한다.

고전역학이든 양자역학이든 산란 문제에서 eikonal 근사란 '직선 근사'라고 생각하면 된다^[각주:3]. 구체적으로 이야기한다면, 입자의 경로를 1) 아무런 산란이 없는 직선 경로에 2) 산란을 일으키는 포텐셜의 효과를 집어넣어 얼마나 직선 경로에서 벗어나는지 섭동계산으로 구하는 방법이 되겠다.

이제 Coulomb potential에서의 고전적인 산란 문제에 eikonal 근사를 적용해보자. Landau 1권에서는 뉴턴역학을 기반으로 eikonal 근사를 사용하지만 여기서는 해밀턴역학을 기반으로 eikonal 근사를 써보기로 한다^[각주:4]. 먼저 해밀토니안을 다음과 같이 적는다.

$$ H = \frac{p^2}{2} - \frac{k}{r} $$

해밀턴 운동방정식은 금방 적을 수 있다.

$$ \dot{\vec{r}} = \{ H , \vec{r} \} = \vec{p} \,,\, \dot{\vec{p}} = \{ H , \vec{p} \} = - \frac{k \vec{r}}{r^3} $$

이 역학계의 산란문제를 eikonal 근사로 푸는 것은 다음과 같은 ansatz를 이용해 섭동전개 파라메터 $k$에 대해 푸는 것으로 생각할 수 있다.

$$ \vec{p} = \vec{p}_0 + k \vec{p}_1 (t) + k^2 \vec{p}_2 (t) + \cdots \,,\, \vec{r} = \left( \vec{b} + \vec{p}_0 t \right) + k \vec{r}_1 (t) + k^2 \vec{r}_2 (t) + \cdots $$

여기서 $\vec{p}_0$는 asymptotic region에서의 운동량이고, $\vec{b}$는 충돌 파라메터의 역할을 한다. 이렇게 해석하려면 $\vec{b} \cdot \vec{p}_0 = 0$이란 조건을 추가로 얹어주는 것이 좋다. 섭동이 없는 원래 경로에서 시간 $t$의 원점을 재정의하는 것으로 이 조건을 맞출 수도 있고.

이제 위의 방정식을 풀어보자. 방정식을 풀려면 경계조건을 줘야 하는데, 가장 먼저 생각할 수 있는 경계조건은 다음 경계조건이다.

$$\vec{r}_{i>0} (-\infty) = \vec{p}_{i>0} (-\infty) = 0$$

언듯 보기에는 문제가 없는 경계조건으로 보인다. $t = -\infty$는 산란이 일어나기 한참 전의 과거이므로 섭동이 없는 원래 경로와 일치해야 한다는 직관과도 맞고. 하지만 이 경계조건은 절대로 맞춰줄 수 없다. Coulomb potential의 꼬리가 너무 길기 때문. 우선 이 문제를 무시하고 그냥 방정식을 풀어보자.

$\vec{p}_1$에 대한 운동방정식은 다음과 같이 주어진다.

$$ k \dot{\vec{p}}_1 (t) = - \frac{k (\vec{b} + \vec{p}_0 t)}{(b^2 + p_0^2 t^2)^{3/2}} $$

이 식에 처음 얹은 경계조건을 넣고 풀면 다음과 같은 답을 얻는다.

$$ \vec{p}_1 (t) = - \int_{-\infty}^t \frac{\vec{b} + \vec{p}_0 \tau}{(b^2 + p_0^2 \tau^2)^{3/2}} d\tau = -\frac{1}{ab^2} \left[ \left( 1 + \frac{at}{\sqrt{1 + a^2 t^2}} \right) \hat{b} - \frac{\hat{a}}{\sqrt{1 + a^2 t^2}} \right] $$

쌍곡함수로 변수변환을 하면 적분을 쉽게 할 수 있다. 문제를 풀 때 새로 정의한 변수들은 다음과 같다.

$$ \hat{b} := \frac{\vec{b}}{b} \,,\, \vec{a} := \frac{\vec{p}_0}{b} \,,\, \hat{a} := \frac{\vec{a}}{a} = \frac{\vec{p}_0}{p_0} $$

$k^1$ 차수에서 운동량 변화는 단순히 $\vec{p}_1 (+\infty)$를 읽어내면 된다.

$$\Delta \vec{p}_1 := \vec{p}_1 (+\infty) = - \frac{2 \hat{b}}{ab^2} = - \frac{2 \vec{b}}{p_0 b^2}$$

마찬가지로 $k^2$ 차수에서 운동량 변화는 $\vec{p}_2 (+\infty)$를 읽어내면 되는데, $\vec{p}_2$는 $\vec{r}_1$에 대한 해가 있어야 풀 수 있다^[각주:5].

$$k^2 \dot{\vec{p}}_2 = - k^2 \left[ \frac{\vec{r}_1}{r_0^3} - \frac{3 \vec{r}_0 (\vec{r}_0 \cdot \vec{r}_1)}{r_0^5} \right]$$

따라서 $\vec{r}_1(t)$를 풀어야 한다. 우선 식을 적어보자.

$$\vec{r}_1 (t) = \int_{-\infty}^{t} \vec{p}_1 (\tau) d\tau = - \frac{1}{ab^2} \int_{-\infty}^{t} \left[ \left( 1 + \frac{a\tau}{\sqrt{1 + a^2 \tau^2}} \right) \hat{b} - \frac{\hat{a}}{\sqrt{1 + a^2 \tau^2}} \right] d\tau$$

눈치가 빠른 분들은 알아차리셨겠지만, 이 정적분은 잘 정의되질 않는다. 두번째 항이 $\sim \tau^{-1}$의 꼴을 하고 있기 때문에 무한대에서 로그 발산이 있기 때문이다. 첫번째 항은 정적분으로 처리하고 두번째 항은 정적분을 포기하고 부정적분으로 처리할 경우 다음 식을 얻는다.

$$\vec{r}_1 (t) = - \frac{ e^{\sinh^{-1} (at)}}{a^2 b^2} \hat{b} + \left. \frac{\sinh^{-1}(at)}{a^2 b^2} \hat{a} \right|_{-\infty}^{t}$$

$x \in \mathbb{R}$일 때 $\sinh^{-1} x = \log (x + \sqrt{1+x^2})$이므로, 두번째 항의 발산은 예상대로 로그 발산임을 확인할 수 있다. 이 로그 발산은 다음과 같이 이해할 수 있다. Coulomb potential에서의 에너지 보존을 생각하면 무한대에서의 입자의 속력을 $v$라고 할 때 asymptotic region에서의 입자의 속력 $v$는 다음과 같다.

$$ \frac{v^2}{2} = \frac{v_0^2}{2} + \frac{k}{r} \Rightarrow v \sim v_0 + \frac{c}{r}$$

따라서 아무런 힘을 못 느끼고 $v_0$의 속력으로 이동하는 섭동이 없는 경로와 Coulomb potential의 영향을 받아 섭동이 있는 경로 사이의 변위(displacement)를 계산하면 다음과 같아진다.

$$ \Delta r \sim \int (v - v_0) dt \sim \int \frac{c}{r} dt \sim \int \frac{1}{dr/dt} \frac{c}{r} dr \sim \frac{c}{v_0} \log r $$

$r^{-1}$보다 빠르게 떨어지는 다른 potential의 경우 입자가 멀어져 가면서 potential로부터 받는 영향이 충분히 빠르게 줄어들어 섭동이 없는 경로와 potential의 영향을 받은 경로 사이의 변위가 일정하게 유지된다. 하지만 Coulomb potential의 경우 potential의 영향이 0으로 줄어드는 속도가 느려 아무리 멀어지더라도 변위의 차이가 계속 누적되는 것이다. 발산하는 총산란단면적이나 양자역학 산란 문제를 풀 때 평면파에 로그만큼의 위상항이 추가로 붙는 현상은 이 흔적이라고 이해할 수 있다.

---

여튼, $k^2$ 차수의 운동량 변화를 계산하는 문제로 돌아오자. 발산이 있으면 잡으면 되는 법이다.

가장 단순한 해법은 $t = - \infty$를 기준점으로 잡지 않고 $t = 0$를 기준점으로 잡는 것이다. 실제로 worldline quantum field theory(WQFT)를 도입해서 post-Minkowskian 계산을 하는 팀에서 이런 접근을 취하고 있는데, 이 접근법은 일관성이 있다는 장점이 있지만 asymptotic variable을 새로 계산해야 하는 번거로움이 있다.

다른 해법은 로그 발산을 미리 섭동계산의 경계조건에 반영하는 것이다. 구체적으로는 다음과 같이 로그 발산을 $\vec{r}_1^{(0)}$로 뽑아내고 $\vec{r}_1^{(1)}$에 대한 방정식을 푸는 것.

$$ \vec{r}_1 (t) = \vec{r}_1^{(0)} (t) + \vec{r}_1^{(1)} (t) \,,\, \vec{r}_1^{(0)} (t) = \frac{\sinh^{-1} (at)}{a^2 b^2} \hat{a} $$

로그 발산을 갖는 경계조건을 $\vec{r}_1^{(0)}$로 뽑아내었기 때문에 남는 경계조건은 $\vec{r}_1^{(1)} (-\infty) = 0$이 되며, $\vec{r}_1 (t)$는 다음과 같이 풀린다.

$$ \vec{r}_1 (t) = \vec{r}_1^{(0)} (t) + \vec{r}_1^{(1)} (t) = - \frac{ at + \sqrt{1 + a^2 t^2}}{a^2 b^2} \hat{b} + \frac{\log \left( at + \sqrt{1 + a^2 t^2} \right)}{a^2 b^2} \hat{a} $$

위 해를 $\vec{p}_2$에 대한 운동방정식에 집어넣으면 $k^2$ 차수의 운동량 변화를 구할 수 있다. 적분구간이 $(-\infty, +\infty)$로 대칭적이라는 것을 이용하면 식을 좀 다 단순화할 수 있다.

$$ \Delta \vec{p}_2 = \int_{-\infty}^{+\infty} \left[ \frac{1}{a^2 b^5 (1 + a^2 \tau^2)} - 3 \frac{\sqrt{1 + a^2 \tau^2} - a\tau \log (a\tau + \sqrt{1 + a^2\tau^2})}{a^2 b^5 (1 + a^2 \tau^2)^{5/2}} \right] \hat{b} d\tau \\ - \int_{-\infty}^{+\infty} \left[ \frac{3a^2\tau^2}{a^2 b^5 (1 + a^2 \tau^2)^{5/2}} \right] \hat{a} d\tau $$

얼핏 봐서는 적분이 꽤 복잡하게 보이는데, 의외로 적분하고 나면 값 자체는 단순하다.

$$ \Delta \vec{p}_2 = - \frac{2 \vec{a}}{a^4 b^5} = - \frac{2 \vec{p}_0}{p_0^4 b^2}$$

$k$를 전부 살린 산란 후 운동량은 다음과 같은데

$$\vec{p} (+ \infty) = \left( 1 - \frac{2 k^2}{p_0^4 b^2} \right) \vec{p}_0 - \frac{2k}{p_0 b^2} \vec{b} + \mathcal{O}(k^3)$$

제곱해보면 $k^2$ 차수에서 에너지 보존이 성립한다는 것도 확인할 수 있다.

$$ \left| {\vec{p} (+ \infty)} \right|^2 = p_0^2 + \mathcal{O}(k^3) $$

Landau 3권에는 있다 (566쪽 주석). 이 포스트와는 다른 설명을 보고 싶다면 란다우를 보세요. [본문으로]
진짜로 상관없는 여담이지만, 고등학생을 대상으로 한 물리 경시대회가 있던 시절 궤도방정식을 푸는 문제가 나온 적이 있다. 문제에 전혀 손도 못 댄 것이 분해서 그날 돌아오자마자 Marion의 해당 파트를 잡고 수식 유도과정을 전부 외워버렸는데, 다음 해 경시대회에는 궤도방정식과 관련된 문제가 전혀 등장하지 않았다. [본문으로]
다만 Weinberg의 양자역학 교재에서는 WKB근사로 취급하고 있어서 약간 다르다. Landau 3권의 quasi-classical 근사로 말하고 있다고 봐도 좋을 듯. [본문으로]
따로 작성하던 노트가 해밀턴역학 기반이라 뉴턴역학으로 옮겨적기 귀찮아서(...) 그렇다. 뉴턴역학에 적용하는 것은 연습 문제로 남긴다. [본문으로]
고전역학 교재에서 eikonal 근사로 산란문제를 푸는 것을 배웠고 Coulomb potential에 적용하는 연습문제도 풀어봤는데 IR 발산을 본 기억이 없다면 1차 근사까지만 배웠기 때문일 가능성이 높다. [본문으로]

저작자표시 비영리 변경금지

'Physics > Concepts' 카테고리의 다른 글

Tadpole, normal ordering, and Wilsonian renormalisation (0)	2025.01.30
볼츠만 엔트로피와 클라우지우스 엔트로피의 등가성 (6)	2022.08.02
블랙홀은 진짜 시공간에 뚫린 "구멍"일까? (3)	2021.04.04
힘과 가상입자의 교환 (2)	2021.01.13
다이온(dyon) 관련 잡담 약간 (1)	2020.11.16

Posted by 덱스터

2021. 4. 4. 10:18 Physics/Concepts

블랙홀은 진짜 시공간에 뚫린 "구멍"일까?

얼마 전 계산을 하나 추가하고 내용을 완전히 갈아엎다시피 한 논문을 재투고~~했는데 에디터가 전혀 반응을 보이지 않고 있다. 에디터 반응을 기다리는 동안 생각도 정리할 겸 간략하게 적어보는 정리 포스트.~~ 포스트 작성 도중 레프리에게로 넘어간 것을 확인했다. 좋은 리포트가 돌아오기만을 기다려야...

---

"블랙홀은 머리카락이 없다(no-hair)"는 말이 있다. 단순하게 설명하면 '블랙홀은 질량, 스핀, 전하에 의해 완전히 결정된다'는 의미이고, 좀 더 수학적인 세부사항을 덧붙이면 '사건의 지평선이 특이점(singularity)이 아닌 일반상대론의 진공해는 알려진 (Schwarzschild/Kerr/Reissner-Nordström/Kerr-Newman) 블랙홀 해만 존재한다'가 된다. 블랙홀을 시공간상의 "구멍"처럼 말하곤 하는데, '텅 빈 허공이 무슨 특징을 가질 수 있겠느냐'는 관점에서 보면 블랙홀에게 머리카락이 없다는 말은 꽤나 그럴듯하게 들린다. 물론 그래서 양자중력을 고민하는 사람들이 머리를 쥐어뜯고 있지만.

물론 흔히 말하는 "블랙홀은 머리카락이 없다"의 블랙홀은 온 우주에 딱 그 블랙홀 하나만 존재하는 이상화된 조건에서의 블랙홀에 대한 정리이기 때문에 실제로 우리가 보는^[각주:1] 블랙홀에게도 적용된다고 이야기하려면 약간의 논리적 도약이 필요하다. 주변에 아무것도 없는 홀로 남겨진 블랙홀과 주변에 온갖 물체들이 날아다니는 실제 우주에 존재하는 블랙홀이 비슷한 성질을 갖고 있으리라 믿는 것은 합리적이지만, 그 둘이 비슷한 수준이 아니라 완전히 동일하다고 주장하는 것은 아무래도 다른 이야기가 되지 않겠는가?

그렇다면 좀 더 현실적인 상황에 놓인 블랙홀에 대해 '머리카락이 없다'는 것은 무슨 의미일까? 이상화(idealised)된 해로서의 블랙홀과 현실적인 블랙홀의 차이는 후자의 경우 블랙홀이 주변에 날아다니는 물체의 중력에 의해 영향을 받는다는 것이다. 따라서 '머리카락이 없다'는 성질의 현실적인 상황으로의 일반화로서 '주변 물체로부터 받는 영향이 없다'는 성질로 해석하는 가능성이 있다. 그리고 실제로 일반상대론의 블랙홀들은^[각주:2] 이 성질을 만족한다.

---

바닷가에 충분히 오래 있었던 사람이라면 누구나 몸으로 경험하게 된다. 거대한 달의 중력을.

달과 함께 바닷가에 바닷물이 들이닥치고 빠져나가는 현상을 조석(潮汐) 혹은 밀물과 썰물이라고 한다. 조석은 달이 지구에 미치는 중력이 일정하지 않기 때문에 생기는 현상이다. 만유인력은 뉴턴의 역제곱법칙을 따르므로, 달에 가까울수록 달의 중력을 강하게 느끼고 달에서 멀수록 달의 중력을 약하게 느끼게 된다. 이렇게 위치에 따라 조금씩 변하는 달의 중력에서 평균값을 빼면 달을 향하는 방향으로는 상대적으로 당기는 힘이 작용하고 달과 수직한 방향으로는 상대적으로 압축하는 힘이 작용하는 것처럼 보이게 되는데, 이를 조석력(潮汐力, tidal force)이라고 한다. 여담으로 일반상대론을 이해하는데 조석력은 매우 중요한데, 유한한 크기를 갖는 자유낙하하는 물체는 등가원리에 의해 중력 그 자체는 경험할 수 없어도 '중력의 차이' 즉 조석력은 경험하기 때문이다. 일반상대론 강의에서 geodesic deviation을 적어도 한 번 정도는 언급하고 지나가는 이유이기도 하며, 가끔씩 보이는 '자유낙하하는 물체가 측지선(geodesic)을 따라 움직이지 않으니 등가원리가 위배된다'는 주장에 대해 내가 '아니 그건 아니지...'라 반응하는 이유이기도 하다. 등가원리는 크기가 없는 이상화된 자유낙하하는 물체에 대해서만 적용되지 시공간의 곡률을 느끼는 유한한 크기의 점입자로 근사된 물체에 적용되는 것이 아니니까.

여튼 조석력으로 다시 돌아와서, 조석력을 받는 물체가 그 조석력에 대해 어떻게 반응하는지를 나타내는 물리량을 러브 수(Love number)라고 한다. 아우구스투스 에드워드 휴 러브(Augustus Edward Hough Love)의 지구에 대한 조석력의 영향에 대한 연구로부터 붙은 이름으로, 하필 이름이 이름이라 수많은 논문들의 말장난(...)의 원천이 되기도 한다.

손으로 만져가며(?) 실험하기 좋은 전자기학에 빗대보자면 러브 수는 전기 감수율(electric susceptibility)에 대응된다. 물체에 전기장을 걸 경우 전기장에 의해 물체 내부의 전하들 중 양전하는 전기장이 향하는 방향으로, 음전하는 전기장이 향하는 반대 방향으로 힘을 받게 된다. 따라서 전기장에 의해 물체 내부의 전하들이 움직이게 되며, 그 결과로서 물체 전체적으로 전하의 불균형이 발생하는 것을 유전 분극(dielectric polarisation)이라고 한다. 그리고 전기장이 충분히 작을 경우 이 현상에 의해 발생한 극성이 전기장의 세기와 정비례할 것으로 기대할 수 있는데, 이 비례상수를 전기 감수율이라고 한다.

그렇다면 러브 수는 조석력에 대한 어떤 반응을 가리키는 것일까? 우리가 가장 쉽게 관찰할 수 있는 조석력에 대한 반응은 아무래도 밀물과 썰물, 혹은 해수면 높낮이의 반응이다. 이를 다르게 말한다면 '물체의 표면이 조석력에 의해 변형된다'고 할 수 있는데, 이렇게 물체의 표면이 조석력에 어떻게 반응하는지를 나타내는 물리량을 1종 러브 수(Love number of first kind) 혹은 러브 수 $h$라고 표기한다. 블랙홀의 경우에는 1종 러브 수가 조석력에 의해 사건의 지평선의 위치가 움직이는 것을 나타낸다고 할 수 있으며, 이렇게 정의되는 1종 러브 수는 고전적으로 유한한 값을 갖는다는 것이 알려져 있다.

다만 우리에게 좀 더 쓸모있는 러브 수는 2종 러브 수(Love number of second kind) 혹은 러브 수 $k$로, 2종 러브 수는 조석력을 받는 물체가 중력의 원천(source)으로서 어떻게 변형되는가를 나타낸다. 앞서 잠시 언급했던 전자기학으로 돌아가보자. 전기 감수율은 (전기적으로 중성인) 물체가 전기장 안에 놓였을 때 전기장에 의해 획득하게 되는 전기쌍극자(electric dipole)를 나타내는데, 이것을 '외부 전기장에 의해 물체가 얻는 유도된 쌍극자 모먼트(induced dipole moment)'로 볼 수 있다. 다시 중력으로 돌아오면, 2종 러브 수는 외부 중력원에 의해 받는 조석력으로 물체가 얻는 유도된 질량 극자 모먼트(induced multipole moment)를 나타낸다고 할 수 있다. 편의상 사중극자(quadrupole)에 대응되는 $k_2$를 예로 들자면, 한 방향으로는 확장하고 그 수직한 방향으로는 압축하는 조석력을 받는 물체가 중력원으로서 어떻게 찌그러지는지를 나타낸다고 할 수 있다.

---

최근 러브 수에 대한 사람들의 관심이 다시 증가한 이유 중 하나로 중력파 관측이 있다. 이론적으로 민감도가 충분히 높은 지상 간섭계 중력파 관측소에서 얻은 중력파 데이터로부터 중성자별의 2종 러브 수를 결정할 수 있기 때문이다. 실제로 LIGO/VIRGO 증력파 관측소에서 중성자별의 쌍성 병합(neutron star binary coalescence)에 대해 관측한 중력파 데이터를 보면 조석 변형률 파라메터(tidal deformability parameter)에 대한 분석이 있는 것을 확인할 수 있다. 조석 변형률은 결국 중성자별의 내부 구조에 의해 결정되기 때문에 중성자별을 이루는 핵물질(nuclear matter)의 상태방정식(equation of state)에 대한 정보가 일부 반영되고^[각주:3], 따라서 양자색역학에 대한 보다 심도 있는 이해에 관심을 갖는다면 핵물질의 상태방정식을 결정하는 관측량 중 하나가 될 2종 러브 수에 대해서도 어느 정도 관심을 가질 수 밖에 없는 셈이다.

그렇다면 블랙홀의 경우에는 어떨까? 블랙홀의 경우에는 모든 2종 러브 수가 사라진다는 것이 알려져 있다. 블랙홀이 회전하고 있을 경우에 대해서는 약간의 논란이 있었지만 현재로서는 없는 것이 맞다는 쪽으로 결론이 내려지는 분위기이고. 그리고 포스트의 앞에서 잠시 언급한 '머리카락이 없다'는 성질의 현실적인 블랙홀에 대응되는 버전으로서 이 성질을 이해할 수도 있다. 다른 가능한 관점으로 사라지는 2종 러브 수를 일종의 미세 조정(fine-tuning)으로 이해할 수도 있는데, 이건 최근 러브 수가 사라지는 것과 관련있는 숨겨진 대칭성이 있다는 주장이 나온 상태라 받아들이기는 미묘하다. 어쨌든 러브 수가 사라진다는 것은 블랙홀이 실제로 "구멍"과도 같아서 외부에서 어떤 자극을 주어도 그 자극에 대한 정보가 구멍 속으로 사라진다는 것으로 보아도 좋지 않을까?

---

여기까지는 고전적인 블랙홀의 이야기였다. 그리고 양자장론이 우리에게 가르켜 준 것이 하나 있다고 한다면, 고전적인 성질은 많은 경우 양자역학을 고려하기 시작하면 더 이상 성립하지 않는다는 것이다. 그렇다면 블랙홀의 사라지는 러브 수도 양자역학을 고려하면 실제로는 0이 아닌 것은 아닐까?

그리고 최근에 재투고를 위해 수정한 논문이 정확히 이 문제를 건드리고 있다. 양자효과를 고려하면 블랙홀의 러브 수는 실제로는 0이 아니라 유한한 값을 얻는다는 것이 주된 결론. 앞서 블랙홀의 러브 수가 사라지는 것을 머리카락이 없는 성질로 보거나 숨겨진 대칭성에 의한 성질로 이해할 수 있다는 이야기를 했는데, 이 관점의 연장선상에서 블랙홀이 실제로는 양자역학적인 머리카락을 갖는다고 해석하거나 숨겨진 대칭성에 anomaly가 있다고 해석할 수 있을 것이다. 구체적인 계산방법에 대해서는 다음 기회에 언급하기로.

가끔 반농반진으로 "우리는 양성자보다 블랙홀을 더 잘 이해하고 있다"는 농담을 하곤 하는데, 어쩌면 그 이유가 블랙홀에 대해서는 양자역학에 의한 효과를 깊게 생각하지 않았기 때문일지도 모르겠다는 생각이 든다.

얼마 전까지만 해도 블랙홀을 "본다"고 하면 무슨 소리냐고 한 소리 들었겠지만, EHT 이후 우리는 실제로 블랙홀을 "보게" 되었다. 과학의 힘은 대단해! [본문으로]
4차원으로 한정지을 경우. 다른 차원의 블랙홀은 약간 다른 성질을 갖는 경우가 있다. [본문으로]
다만 아주 많은 정보를 담고 있지는 않다. 2종 러브 수가 핵물질의 상태방정식과는 관련 없는 관계식(I-Love-Q 관계식이라고 한다)을 만족하는 것으로 보이기 때문. inspirehep.net/literature/1220233 [본문으로]

저작자표시 비영리 변경금지

'Physics > Concepts' 카테고리의 다른 글

볼츠만 엔트로피와 클라우지우스 엔트로피의 등가성 (6)	2022.08.02
IR divergence of Coulomb potential (0)	2021.10.25
힘과 가상입자의 교환 (2)	2021.01.13
다이온(dyon) 관련 잡담 약간 (1)	2020.11.16
Analyticity, causality, Kramers-Kronig relations, and all that (2)	2020.08.23

Posted by 덱스터

2021. 1. 13. 21:15 Physics/Concepts

힘과 가상입자의 교환

표준적인 물리 커리큘럼을 따라 배우면 상호작용에 대한 관점이 대체로 다음 진화(?)과정을 거치게 된다.

힘 → 장과 포텐셜 → 가상입자의 교환

힘을 장과 포텐셜로 다시 이해하게 되는 과정은 대부분의 경우 문제 없이 넘어가는 반면, 장과 포텐셜에 의한 상호작용을 가상입자의 교환으로 다시 이해(?)하게 되는 과정은 많은 경우 '그렇다고 하니 그런가보지 뭐...'라고 넘기게 된다. 이렇게 근본적인 부분에 대해서는 의문을 갖고 제대로 된 설명을 요구하는 것이 마땅함에도 불구하고 말이다^[각주:1].

상호작용을 가상입자의 교환으로 이해하는 이유는 무엇일까. 우선은 굴러다닐 수 있는 의자에 앉은 두 사람끼리 캐치볼을 하면 주고 받는 공의 운동량에 의해 서로 멀어지는 과정으로 설명하는 사기(...)는 잠시 잊어버리기로 하자. 이 관점을 제대로 이해하기 위해서는 다음과 같은 배경지식이 필요하다.

1. 양자역학의 섭동이론(perturbation theory)
2. 질량이 없는 입자의 에너지를 이해할 정도의 특수상대론
3. 상호작용을 매개하는 장의 양자화와 Fock space

학부 수준에서는 3번이 좀 무서울 수 있는데 어차피 필요한 배경지식은 다 제공할 예정이니 학부 수준의 양자역학만 제대로 알고 있으면 된다. 대표적인 먼거리힘(long-range force)인 중력이나 전자기학은 스핀 때문에 쓸데없이 복잡하니 질량이 없는 유가와(Yukawa) 상호작용을 생각하기로 하자. 목표는 다음을 보이는 것이다.

유가와 입자에 해당하는 장의 원천(source)이 되는, 거리 $r$만큼 떨어진 두 질점 사이에 유가와 입자의 '교환'에 해당하는 효과에 의해 $\Delta E = -g^2/4 \pi r$만큼의 에너지가 추가로 발생한다.

다르게 말하자면 $1/r$꼴의 포텐셜이 '단일 양자의 교환'으로 볼 수 있는 과정을 통해 만들어지는 것을 확인하자는 것이다. 질점은 정지해 있다고 가정할 예정이니 상대론까지 갈 필요 없이 비상대론적인 계산으로 충분하다 (다만 편의상 $c=1$로 둘 예정).

편의상 두 질점을 $A$와 $B$라고 하고, $A$는 원점 $\vec{0}$에, $B$는 원점이 아닌 $\vec{r} \neq \vec{0}$에 두기로 하자. 그리고 유가와 입자에 해당하는 장(유가와 장^[각주:2])을 $\phi(t, \vec{x})$라고 하자 (시간 $t$에 대한 의존성은 중요하지 않으니 앞으로 표시하지 않겠다). 이런 계의 동역학(dynamics)을 기술하기 위해 제일 먼저 할 수 있는 일은 라그랑지안(Lagrangian)을 적는 것이다.

$$ L = L_{A+B} + \int d^3 \vec{x} \frac{[\dot{\phi}(\vec{x})]^2 - [\vec{\nabla} \phi(\vec{x})]^2}{2} - g \int d^3 \vec{x} ~ \phi(\vec{x}) J(\vec{x}) $$

$L_{A+B}$는 질점 $A$와 $B$의 라그랑지안이고 어차피 움직이지 않는다고 가정할 예정이니 구체적인 생김새는 알 필요가 없다. 실제 계산에서는 그냥 에너지 $E$를 줄 예정. 중간의 적분은 유가와 장의 자유 라그랑지안(free Lagrangian)이다. 섭동이론에서는 나머지 부분을 무시한 채 이 부분을 양자화하는 것으로 유가와 입자를 얻는다. 구체적으로는 $\phi (\vec{x})$를 다음과 같이 전개하게 된다(이 유도과정을 알고 싶다면 Tong의 양자장론 노트를 읽으면 좋다.).

$$ \phi (\vec{x}) = \int \frac{d^3 \vec{k}}{(2\pi)^3} \frac{1}{\sqrt{2 E(\vec{k})}} \left[ a_{\vec{k}} e^{- i E(\vec{k}) t + i \vec{k} \cdot \vec{x} } + a^{\dagger}_{\vec{k}} e^{ i E(\vec{k}) t - i \vec{k} \cdot \vec{x} } \right] $$

현재 고려하고 있는 유가와 입자는 질량이 없는 입자이기 때문에 $E(\vec{k}) = |\vec{k}|$란 조건을 만족한다. 일반적으로는 $E(\vec{k}) = \sqrt{\vec{k}^2 + m^2}$. 여기서 $a_{\vec{k}}$와 $a^\dagger_{\vec{k}}$는 흔히 mode operator라고 부르는데, 단순조화진동자(simple harmonic oscillator)의 대수를 만족한다.

$$ [a_{\vec{k}_1} , a^{\dagger}_{\vec{k}_2}] = (2 \pi)^3 \delta^3 (\vec{k}_1 - \vec{k}_2) $$

단순조화진동자의 스펙트럼은 자연수로 나타낼 수 있는데, 장론에서는 이 자연수가 '그 운동량을 갖는 입자가 몇 개 있는가'를 나타내는 숫자가 된다^[각주:3]. 예컨대 생성 연산자 $a^\dagger_{\vec{k}}$를 상태 $| \psi \rangle$에 작용하게 되면 얻는 상태 $ a^\dagger_{\vec{k}} | \psi \rangle$은 $| \psi \rangle$에 비해 운동량 $\vec{k}$를 갖는 유가와 입자가 하나 더 있는 상태가 된다.

마지막 적분인 $-g \int \phi J$는 질점 $A$와 $B$가 유가와 장의 원천임을 나타낸다. 상호작용의 세기 $g$는 섭동전개를 하기 위해 도입한 형식적인 파라메터. 어차피 질점 $A$와 $B$는 움직일 일이 없으니 $J(\vec{x}) = \delta^3(\vec{x}) + \delta^3 (\vec{x}-\vec{r})$로 취급하면 되는데, 나중에 논의를 편하게 하기 위해 $J_A (\vec{x}) = \delta^3 (\vec{x})$와 $J_B (\vec{x}) = \delta^3 (\vec{x} - \vec{r})$로 나누기로 하자. 각각 $J_{A/B}$는 질점 $A/B$가 유가와 장의 원천이 됨을 나타낸다. 이제 유가와 장에 대한 전개식을 집어넣어 interaction Hamiltonian을 계산할 경우 다음 식을 얻는다.

$$ H_{int} = g \int \phi J = g \int \frac{d^3 \vec{k}}{(2\pi)^3} \frac{1}{\sqrt{2 E(\vec{k})}} \left[ a_{\vec{k}} e^{- i E(\vec{k}) t } \left( 1 + e^{ i \vec{k} \cdot \vec{r} } \right) + a^{\dagger}_{\vec{k}} e^{ i E(\vec{k}) t } \left( 1 + e^{ - i \vec{k} \cdot \vec{r} } \right) \right]$$

위의 식을 찬찬히 뜯어보면 $H_{int}$는 주어진 상태 $| \psi \rangle$에 작용할 경우 유가와 입자를 하나 더하거나 ($a^\dagger | \psi \rangle$) 하나 빼는 ($a | \psi \rangle$) 연산자라는 사실을 알 수 있다. 따라서 $| \psi \rangle$가 명확한 유가와 입자의 갯수를 갖는 상태일 경우 $\langle \psi | H_{int} | \psi \rangle = 0$임을 알 수 있다.

여기까지 왔으면 모든 준비가 끝났다. 양자역학 섭동계산을 통해 유가와 입자가 없이 질점 $A$와 $B$만 존재하는 상태 $| \psi^{(0)} \rangle$의 $g^2$ order 에너지 보정을 찾으면 된다. 섭동전개의 유도과정을 설명하는건 귀찮(...)으니 여기에서 위키백과의 유도과정을 보자. $H_{int} = gV$로 적고 결과만 옮겨적을 경우 다음과 같이 쓸 수 있다.

$$ E (g) = E^{(0)} + g^2 \int \frac{d^3 \vec{k}}{(2 \pi)^3} \frac{1}{E^{(0)} - (E^{(0)} + E(\vec{k}))} \left| \frac{1 + e^{i \vec{k} \cdot \vec{r}}}{\sqrt{2 E(\vec{k})}} \right|^2 + O(g^3) $$

여기서 $\langle \psi^{(0)} | V | \psi^{(0)} \rangle = 0$는 위에서 설명한 $H_{int}$의 성질로부터 나온다. 유가와 입자의 에너지가 $E(\vec{k}) = |\vec{k}|$라는 것을 이용하면 다음과 같이 정리할 수 있다.

$$ E (g) - E^{(0)} = - g^2 \int \frac{d^3 \vec{k}}{(2 \pi)^3} \frac{2 + e^{i \vec{k} \cdot \vec{r}} + e^{-i \vec{k} \cdot \vec{r}}}{2 k^2} + O(g^3) $$

이제 위의 식에 해석을 줘 보자. 적분 분자의 2는 잘 살펴보면 $H_{int}^A = g \int \phi J_A$로 질점 $A$에 의해 유가와 입자가 생성되었다가 다시 $H_{int}^A$에 의해 질점 $A$가 유가와 입자를 흡수하여 처음 상태로 돌아가는 과정과 질점 $B$에 대해 같은 현상이 일어나는 과정으로부터 나왔음을 알 수 있다. 자기 자신과 상호작용하는 과정이기 때문에 이를 자체에너지(self-energy) 보정이라고 한다.

$$ E_{s} (g) = - g^2 \int \frac{d^3 \vec{k}}{(2 \pi)^3} \frac{2}{2 k^2} = \sum_{k \neq \psi^{(0)}} \frac{| \langle k | H_{int}^A | \psi^{(0)} \rangle |^2}{E^{(0)} - (E^{(0)} + E(\vec{k}))} + \frac{| \langle k | H_{int}^B | \psi^{(0)} \rangle |^2}{E^{(0)} - (E^{(0)} + E(\vec{k}))} $$

실제 계산을 수행하려고 하면 $\int d^3 k / k^2$꼴의 적분이기 때문에 이 값은 발산함을 알 수 있다. 양자장론의 모든 곳에서 튀어나오는 무한대중 하나가 바로 이런 자체에너지 보정이다. 우리가 실제로 관심을 갖는 것은 질점 $A$와 $B$ 사이에 유가와 장이 상호작용을 매개함으로서 생기는 에너지이므로, 자체에너지 보정은 좌변으로 넘겨서 잊어버릴 수 있다. 따라서 실제 에너지 변화는

$$ E (g) - E_s (g) - E^{(0)} = - g^2 \int \frac{d^3 \vec{k}}{(2 \pi)^3} \frac{e^{i \vec{k} \cdot \vec{r}} + e^{-i \vec{k} \cdot \vec{r}}}{2 k^2} + O(g^3) = - \frac{g^2}{4 \pi r} + O(g^3) $$

으로, 다음과 같이 다시 적을 수 있다.

$$ - g^2 \int \frac{d^3 \vec{k}}{(2 \pi)^3} \frac{e^{i \vec{k} \cdot \vec{r}} + e^{-i \vec{k} \cdot \vec{r}}}{2 k^2} = \sum_{k \neq \psi^{(0)}} \frac{ \langle \psi^{(0)} | H_{int}^B | k \rangle \langle k | H_{int}^A | \psi^{(0)} \rangle + \langle \psi^{(0)} | H_{int}^A | k \rangle \langle k | H_{int}^B | \psi^{(0)} \rangle}{E^{(0)} - (E^{(0)} + E(\vec{k}))} $$

우변의 분자에 등장하는 $\sum_{k} |k \rangle \langle k|$이 identity operator를 분해한 것으로 볼 수 있음을 고려하면 분자에 등장하는 표현들, 예컨대

$$\langle \psi^{(0)} | H_{int}^B | k \rangle \langle k | H_{int}^A | \psi^{(0)} \rangle$$

를 $| \psi^{(0)} \rangle$ 상태에서 $A$ 질점이 (가상의) 유가와 입자를 하나 만들어낸 다음 $B$ 질점이 그 입자를 흡수하는 과정으로 볼 수 있다. 이런 해석을 바탕으로 장에 의한 상호작용을 그 장에 해당하는 가상입자의 교환으로 이해하게 된다.

'나는 질문 할 생각을 못했는데!'라고 좌절할 필요는 없다. 당장 이 글을 쓰고있는 사람도 그렇듯 이런 근본적인 부분을 몇개 놓치더라도 물리로 어떻게든 밥은 벌어먹고 살 수 있으니까(...). [본문으로]
스칼라장(scalar field)이란 표현이 더 자주 쓰이지만 장의 이름은 그다지 중요한 것이 아니니 대충 넘어가기로 하자. [본문으로]
여담으로 미분방정식인 슈뢰딩거 방정식을 풀어서 파동함수를 구해놓고 왜 굳이 생성-소멸 연산자(creation-annihilation operator)를 이용해서 조화진동자를 대수적으로 다시 푸는지 의문을 가졌던 적이 있었는데, 양자장론을 배우면서 그 의문이 해소되게 되었다. [본문으로]

저작자표시 비영리 변경금지

'Physics > Concepts' 카테고리의 다른 글

IR divergence of Coulomb potential (0)	2021.10.25
블랙홀은 진짜 시공간에 뚫린 "구멍"일까? (3)	2021.04.04
다이온(dyon) 관련 잡담 약간 (1)	2020.11.16
Analyticity, causality, Kramers-Kronig relations, and all that (2)	2020.08.23
To believe or not to believe, that is the question (0)	2020.07.25

Posted by 덱스터

2020. 11. 16. 08:51 Physics/Concepts

다이온(dyon) 관련 잡담 약간

최근에 썼던 논문은 중력 버전의 다이온에 대한 1-룹 계산이었다. 학사논문도 자기단극자와 관련된 주제였을만큼 자기단극자에 대한 관심이 많은 편이었으니 자기단극자의 중력 버전에 대해서도 관심이 있을 수 밖에 없었는데, 원래 논문의 목표는 현 논문의 결론과는 꽤 많이 달랐다. 계산이 죄다 어긋나서 목표가 달성 불가능할 것으로 보이자 목표를 뒤집어서 뒤집은 결론을 논문으로 만들어버린 것인데, 학사논문도 비슷한 과정을 통해서 논문이 되었으니 기묘한 평행선이라고 할 수 있을지도 모르겠다. '왜 아무도 명시적으로 이야기하지 않는 거지?'라고 여기는 것 중 하나가 논문의 부록A가 된 '전자와 자기단극자 둘을 동시에 기본입자로 취급하면서 UV cut-off가 둘의 질량보다 위에 존재하는 EFT는 있을 수 없다'는 논증인데, 트위터에서 간략하게 언급한 적이 있다.

그나저나 초록에 대해 약간 이야기하자면 자기단극자를 기본입자로 발견하지 못했다는 이야기가 나오는데, 기본입자를 '질량/스핀/전하로 상태가 결정되는 점입자'라고 정의하면 자기단극자는 절대로 기본입자로서 발견될 수가 없다. 의외로 이 이야기를 명시적으로 하는 곳이 없음.
— Dexter Kim (@AstralDexter) July 7, 2020

이유는 단순한데, 어떤 입자가 기본입자로서 기술되려면 고전적인 반지름이 Compton wavelength보다 작아야 한다. 전자의 경우 이 비가 대충 미세구조상수쯤 되는데, 자기단극자는 이 비가 미세구조상수의 역수가 되어서 기본입자로 기술되는게 불가능함.
— Dexter Kim (@AstralDexter) July 7, 2020

물론 아무도 이런 이야기를 하지 않은 것은 아니고 부록에 인용으로 언급했던 weak gravity conjecture(WGC)의 자하 버전에서 비슷한 논증을 하는데^[각주:1], 여기서는 입자로서 다루는 것에 대한 명시적은 이야기는 하지 않는다. 여튼 이런 특성을 고려한다고 도입한 추가 계산이 10일만에 쓴 짧은 논문의 바탕이 되었다는 점에서 꽤나 운이 좋았던 편. 저 짧은 논문을 쓸 때는 아드레날린 과다방출(..)로 불면증에 심하게 시달려서^[각주:2] 약간 제정신이 아닌 상태에서 썼는데, 결과적으로 꽤나 도발적인 결론이 나와버렸다. 실제로 쓸만한 결과일지는 시간이 지나봐야 알겠지만.

---

여튼 자기단극자 이야기나 계속해보자. 전하와 자하는 그 물체가 광자와 상호작용함을 나타내는데, 둘을 구분하는 것은 무엇일까? 논문 서론에서 언급했듯 와인버그는 전하와 자하는 광자의 두 편광과 어떻게 상호작용하는가---나선도(helicity)의 부호와 상관없이 상호작용하는가 아니면 부호에 따라 반대 방향으로 상호작용하는가---로 구분됨을 보였다. 이 차이로 인해 전하와의 상호작용은 일반적인 벡터포텐셜 $A_{\mu}$로 적히고, 자하와의 상호작용은 dual potential이라고 자주 부르는 $B_{\mu}$로 적히게 된다. $A_{\mu}$가 $dA = F$란 미분형식 방정식으로 적히는 것과는 반대로 dual potential $B_{\mu}$는 $dB = \ast F$란 미분형식 방정식을 만족한다. 전자기학을 배우면서 전자기장은 벡터포텐셜 $A_{\mu}$로 그 동역학을 기술할 수 있다고 배우는 학부생 입장에서는 '잘 와닿지는 않지만 그런가보다~' 싶은 설명이지만, 이렇게 자하의 동역학을 기술하기 위해서는 일반적인 벡터포텐셜 $A_{\mu}$로는 불가능하다는 결론은 사실 학부 수준에서 배우는 양자역학만으로도 논증할 수 있다. 대부분의 양자역학 학부 과정에 아로노프-봄 효과를 포함하기 때문.

논증은 간단하다. 다음 조건들이 모순됨을 보이면 된다.

1) 전기-자기 이중성 (electric-magnetic duality) : 전하와 자하 사이에 이중성이 양자역학 수준에서도 존재한다.

2) 국소성 (locality) : 입자가 전자기장과의 상호작용으로 얻는 효과는 그 입자가 위치한 점에서의 장의 값으로 결정된다.

3) $A_{\mu}$의 완전성 : 전자기장의 모든 효과는 $A_{\mu}$장으로 완벽하게 기술할 수 있다.

4) $A_{\mu}$의 게이지 대칭성 : $A \to A + d \lambda$에 해당하는 게이지 대칭에 대해 물리가 변하지 않는다.

구체적으로는 dual Aharonov-Bohm effect를 상상하면 된다. 솔레노이드로 생성되는 원통형 영역에 제한된 자기장 대신 똑같이 원통형 영역에 제한된 전기장을 걸어두고^[각주:3] 그 주변을 도는 자하를 상상하는 것. 이제 그 주변을 도는 자하가 Aharnonov-Bohm effect의 전하처럼 $A_{\mu}$장으로부터 위상의 변화를 얻을 수 있는지 계산해보면 된다. 답은 아니오. 왜냐하면 이런 모양의 전기장은 전기장이 0이 아닌 원통형 영역 안에서 값을 갖는 스칼라 포텐셜 $\phi$에 값을 잘 주는 것으로 완벽하게 구현할 수 있기 때문. 원통형 영역 밖에서는 $A_{\mu}$장의 값이 항등적으로 0이 되도록 해를 구할 수 있으므로, 자하는 $A_{\mu}$와 상호작용해야만 한다면 dual Aharonov-Bohm effect는 존재할 수 없다. 구체적인 해는 여러분의 지적 유희를 위한 연습문제(...)로 남겨두기로 하자^[각주:4].

---

논문의 원래 목표는 (중력 버전의 자하에 해당하는) NUT charge를 가진 물체가 있을 때, 이 물체의 동역학을 어떻게 기술할 것이냐였다. 물체가 실제로 존재한다면 힘을 걸어서 가속시키거나 감속시킬 수 있어야 하지 않겠냐는게 기본 문제의식. 이 문제의식의 흔적이 부록C인 effective one-body formalism이다. 결과적으로는 계산이 도저히 아귀가 맞지 않아서 반년 이상 헤매다가 방향을 뒤집어서 '일반상대론의 NUT charge를 자하의 중력 버전으로 해석하는 것은 다양한 가능성을 고려해봐도 1-룹 계산에서 붕괴한다'로 결론을 내버리긴 했지만 말이다. 결국 이 결론을 내면서 전기-자기 이중성에 대한 관심 때문에 마찬가지로 관심을 갖게 되었던 Taub-NUT space에 대한 관심이 많이 죽어버리고 말았다.

그나저나 자하는 실존할 것인가? 많은 사람들이 '자하는 근시일에 발견된다'가 안전한 베팅이라고 믿고 있고 나도 이 대열에 합류한 상태이긴 한데, 디락이 말년에 자기단극자의 존재 가능성에 대한 입장을 선회했다는 것을 알게 되고는 마음이 약간은 흔들리는 중. 약간의 검색을 돌려보니 도서관에서 본 것은 이 proceeding인 모양이다.

1981년 ICTP에서 디락의 논문 50주년을 기념해서 자기단극자에 대한 컨퍼런스가 열렸던 모양인데 참석이 어려웠던 디락의 편지가 제일 앞 장에 실려있다. 실험에서 도저히 나오질 않는 것을 보다 보니 이제는 존재한다고 믿지 않는다고.
— Dexter Kim (@AstralDexter) May 8, 2020

혹시나 해서 Arkani-Hamed가 썼던 논문을 열어봤는데 역시나 있었다. 역시 기대를 져버리지 않는 Arkani-Hamed. [본문으로]
평균적으로 하루 서너시간 정도밖에 못 잔 듯 하다. 논문 작성 막바지에는 거의 항상 있는 일인듯. [본문으로]
실험적으로는 극성을 가진 유전체를 길게 잘 늘어놓는 것으로 구현할 수 있을 것이다. [본문으로]
여담으로 이 사실을 발견하고는 '전기-자기 이중성은 양자역학 수준에서는 깨져야만 하는구나!'하고 신나서 MS word로 논문 비슷한 무언가를 타닥타닥 작성했던 흑역사(?)가 있다. 버려야 하는 가정은 1)번이 아니라 3)번이란 것을 깨달은 것은 대학원 들어온 뒤 끈이론 공부하면서. 원고가 원고로만 남은 것이 다행이군... [본문으로]

저작자표시 비영리 변경금지

'Physics > Concepts' 카테고리의 다른 글

블랙홀은 진짜 시공간에 뚫린 "구멍"일까? (3)	2021.04.04
힘과 가상입자의 교환 (2)	2021.01.13
Analyticity, causality, Kramers-Kronig relations, and all that (2)	2020.08.23
To believe or not to believe, that is the question (0)	2020.07.25
Canonical transformations and equivalence of Hamiltonians (0)	2020.02.23

Posted by 덱스터

2020. 8. 23. 00:50 Physics/Concepts

Analyticity, causality, Kramers-Kronig relations, and all that

제목은 아는 사람들은 다 아는(?) 책인 PCT, Spin and Statistics, and All That을 참고했다. 물론 나는 읽다 만(...) 책이지만. 이 포스트의 출발점은 다음 트윗 타래. 한번 정도는 정리해두는 것이 좋겠다는 생각이 들었다.

수학에서는 단위허수를 보통 i로 적습니다만 전기공학에서는 j로 적는 경우가 많죠. 전류를 i로 쓰기 때문일지도 모르겠군요. 여튼, 두 단위허수 사이에는 부호 차이가 있다고 생각하여 i=-j라고 두는 경우도 많습니다. i^2=(-i)^2=-1이므로, 둘 다 단위허수로 간주할 수 있죠. https://t.co/rQxIMfHk4O
— Dexter Kim (@AstralDexter) August 21, 2020

이렇게 부호 차이를 두고 해석하는 것은 진동하는 해를 복소수를 이용해 단순화할 때 오일러의 공식을 어떻게 이용하느냐와 관련이 있습니다. https://t.co/OusfC01PWn
— Dexter Kim (@AstralDexter) August 21, 2020

이 차이를 단순한 convention만의 문제라고는 할 수 없는데, 특정 부호가 다른 부호보다 선호되는 이유는 이 부호가 (retarded) Green’s function의 인과율과 해석적 성질을 결정하기 때문입니다. https://t.co/SZ3FRAvjmz
— Dexter Kim (@AstralDexter) August 21, 2020

'세상에서 가장 아름다운 공식'이란 별명이 있는 오일러 공식의 장점(?)은, 네이피어수 (혹은 자연상수) $e$ 위에 올라가는 수학적 물체(mathematical object의 번역으로 이게 맞는지 모르겠다) $a$가 무엇이든 $a^2 = -1$이란 조건을 만족하기만 하면 된다는 것이다.

\[ a^2 = -1 \Rightarrow e^{a \theta} = \cos(\theta) + a \sin(\theta)\]

여기서 $a$는 일반적인 숫자(복소수체에서는 확실히 성립하는데 일반적인 체에서도 되는지는 모르겠다)나 행렬(사원수quaternion는 $2 \times 2$ 행렬과 대응관계를 맺기 때문에 사원수에서도 위의 식이 적용된다), 혹은 클리포드 대수Clifford algebra의 원소(기하대수geometric algebra 계산에서 이 성질을 이용한다) 등 무엇이든 될 수 있다. 그냥 1이 잘 정의되어 있고 제곱해서 -1이 되는 물체가 있다고 하면 언제든 쓸 수 있다는 의미. 다른 특기할 점은 위 공식이 다루기 까다로운 경우가 많은 삼각함수trigonometric function를 지수함수exponential function로 바꾸는 역할을 한다는 것이다. 따라서 주기성을 갖는 물리량이 있는 물리계에서는 위 공식을 반대로 적용해 삼각함수로 써지는 물리량을 지수함수의 '실수부'로 놓는 작업을 자주 한다.

\[ \cos(\theta) = \text{Re}[e^{i \theta}] \]

여기까지는 학부 2학년 수준에서 얼마든지 다루는 내용.

전기공학에서는 교류회로를 다룰 때 단위허수 $j$를 $j^2 = -1$으로 도입해 전류와 같은 물리량을 다음과 같이 쓰곤 한다.

\[ I(t) = \text{Re}[I_0 e^{j (\omega t + \delta)}] \]

일반적으로 쓰는 단위허수 $i$가 있는데 왜 하필 $j$일까? 트윗 타래에서 언급했듯 $j = -i$라고 여기는 경우가 있기 때문이다. $(-1)^2 = +1$이므로, 애초부터 단위허수에는 부호를 선택하는 자유도가 남아있었던 셈. $j=-i$라고 여기는 이유는 푸리에 전개가 다음과 같은 꼴을 취하기 때문이다.

\[ F(t) = \sum_{\omega} \tilde{F} (\omega) e^{-i \omega t} \]

처음 식과 비교해보면 지수함수에 올라간 항은 $-i \omega t$로, $j \omega t$와 부호 차이를 갖고있다. $j = -i$란 인식은 이 차이에서 비롯된 것. 그렇다면 왜 푸리에 전개는 위와 같은 꼴을 택하는 것일까? 예컨대 다음과 같은 표현도 수학의 관점에서 볼 때 푸리에 전개로서는 딱히 결격사유가 없다.

\[ F(t) = \sum_{\omega} \tilde{F} (\omega) e^{+i \omega t} \]

문제는 인과율causality로부터 얻는 주파수 공간frequency space의 함수 $\tilde{F}(\omega)$가 갖길 원하는 해석적 성질analytic property에 있다. 일반적으로 푸리에 전개를 통해 해석하는 (실)함수 $F(t)$는 입력에 따라 어떤 출력을 예상할 수 있는지를 나타내는 반응함수response function이고, 인과율과 계의 시간불변성time invariance을 가정할 경우 시간차 $t$가 양수일 경우에만 0이 아닌 값을 갖는다.

\[ t<0 \Rightarrow F(t) = 0 \]

그리고 이렇게 '한쪽 방향으로만 값을 갖는 함수'는 라플라스 변환Laplace transform을 쓸 수 있다. 이 방향은 나중에 브롬위치 적분Bromwich integral을 이야기할 기회가 생기거든 돌아오기로 하자. 여튼, 주파수 공간의 함수 $\tilde{F}(\omega)$는 다음과 같이 주어진다.

\[ F(t) = \sum_{\omega} \tilde{F}(\omega) e^{\mp i \omega t} \Rightarrow \tilde{F}(\omega) = \int F(t) e^{\pm i \omega t} dt \]

일반적으로 $\tilde{F} (\omega)$는 실수값만 갖지는 않고, 실수부와 허수부를 모두 갖는다. 따라서 다음과 같은 질문을 해볼 수 있다; 어차피 복소수 값을 갖는 복소함수라면, $\tilde{F} (\omega)$를 복소해석학complex analysis을 통해 다뤄 볼 수는 없을까? 안타깝게도 $\tilde{F}$는 전체 $\omega$ 복소평면에서 해석적인 성질을 가질 수는 없다. 단순하게 복소수 $\omega = \omega_1 + i \omega_2$를 실수부와 허수부로 나누어서 분석해보자.

\[ \tilde{F}(\omega_1 + i\omega_2) = \int F(t) e^{\mp \omega_2 t \pm i \omega_1 t} dt \]

위 표현은 $\mp \omega_2 < 0$일때 $F(t)$가 어지간히 이상한 함수가 아닌 이상 수렴한다. 반대로, $\mp \omega_2 >0$일때 많은 경우 발산해버리고 말 것이다. 따라서, 다음과 같은 결론을 내릴 수 있다.

\[ \tilde{F}(\omega) = \int F(t) e^{+ i \omega t} dt \]로 정의할 경우, $F(t)$가 인과율을 따른다는 성질은 $\tilde{F}$는 위쪽 반평면upper half plane에서 해석적인 성질을 갖는다는 성질로 이어진다.
\[ \tilde{F}(\omega) = \int F(t) e^{- i \omega t} dt \]로 정의할 경우, $F(t)$가 인과율을 따른다는 성질은 $\tilde{F}$는 아래쪽 반평면lower half plane에서 해석적인 성질을 갖는다는 성질로 이어진다.

일반적으로 $\tilde{F}(\omega)$는 위쪽 반평면에서 해석적인 성질을 갖는 것이 바람직하다고 여겨지기 때문에 푸리에 변환의 부호가 $F(t) = \sum_{\omega} \tilde{F} e^{-i\omega t}$로 결정되는 것이다. 힐베르트 변환Hilbert transform을 이용해 반응함수의 실수부와 허수부를 관계짓는 Kramer-Kronig 관계식 또한 이 부호의 선택에 의존한다. 'Kramer-Kronig 관계식을 증명하기 위해 그리는 적분 컨투어contour를 왜 위쪽 반평면에서 닫아야만 하는가?'란 질문에 대해 답을 주기 때문. 이유는 적분에 들어가는 integrand가 위쪽 반평면에서 완전히 해석적인 성질을 가지므로, 위쪽 반평면으로 컨투어를 닫아야 0이 되기 때문이다. 아래쪽 반평면에서는 무슨 일이 일어날지 모른다는 것은 또 다른 이야기.

\[ \tilde{F}(\omega) = \int F(t) e^{+ i \omega t} dt \,,\, \text{Im} [\omega_0] \le 0 \Rightarrow \frac{\tilde{F} (\omega)}{\omega - \omega_0} \, \text{analytic on upper half plane} \]

이렇게 사소해 보이는 부호 하나에도 그 부호를 선택해야만 하는 이유가 있기 마련이다.

저작자표시 비영리 변경금지

'Physics > Concepts' 카테고리의 다른 글

힘과 가상입자의 교환 (2)	2021.01.13
다이온(dyon) 관련 잡담 약간 (1)	2020.11.16
To believe or not to believe, that is the question (0)	2020.07.25
Canonical transformations and equivalence of Hamiltonians (0)	2020.02.23
Elementary introduction to Dirac brackets (2)	2019.01.29

Posted by 덱스터

2020. 7. 25. 00:56 Physics/Concepts

To believe or not to believe, that is the question

For a physicist, on the other hand, every system is open, and (more to the point) approximate. One never really expects that the mathematical problem one formulates and then solves will provide an exact or complete description of a physical system.

한편 물리학자에게 모든 계는 열려있고 (더욱 중요하게는) 근사적이다. 그 누구도 어떤 물리계에 대해 형식화하고 풀어낸 수학적 문제가 그 계에 대해 완벽하거나 완전한 묘사를 줄 것으로 절대 기대하지 않는다.

- Ingmar Saberi(https://arxiv.org/abs/1801.07270)

한번은 기계 설계였나 강의를 들을 당시 조별 프로젝트 발표를 할 일이 있었습니다. 뭔가 간단한 로봇을 설계하는 일이었는데, 제가 속한 조보다 앞서 발표하던 조에서 로봇에 예상하고 있는 부하가 걸리면 변형이 얼마나 일어나는지 계산한 결과를 발표하고 있었습니다. 뭐 숫자와 식을 알고 있으니 단순한 산수일테고, 산수 끝에 얻은 변형에 대한 예측값은 10^-20 m였던가 그렇습니다. 참고로 원자핵의 크기를 대략 10^-15 m 정도로 보죠.

그 슬라이드를 보고는 발표를 듣던 교수님이 '숫자놀음은 집어치워라'라면서 대노하셨고 (그 정도로 작은 값이면 그냥 변형이 없는 것이란 말을 덧붙이면서요) 옆에서 비슷한 숫자를 슬라이드에 집어넣고 있었던 같은 조원은 깜짝 놀래서 재빠르게 숫자를 0으로 바꿨습니다. 세 팀이 조별 프로젝트 발표를 하면 그 중 가르침이 되는 팀이 꼭 있는 법이죠.

그래서 준비해 본, '어디까지 방정식을 믿을 것인가?'란 주제 하에 묶을 여러 문제들입니다. 물리는 결국 목표로 삼은 현상에 대한 모형을 세우고 그 모형을 이해하는 것으로 목표로 삼은 현상을 이해하는 것인 셈이니, 세워놓은 모형이 어디까지 현상을 제대로 기술하고 있는가에 대해 감을 갖고 있어야겠죠. 깊게 생각 안하고 공부만 하다 보면 '언제 모형을 믿으면 안된다'는 감이 없는 경우가 자주 있단 말이죠. 짤막하게 작성해 두고 아마 생각나는대로 업데이트하지 않을까 싶네요.

참, 이 포스트는 Paul J. Nahin의 Mrs. Perkins's Electric Quilt: And Other Intriguing Stories of Mathematical Physics란 책의 내용에서 영감을 받았습니다. 비록 도서관에서 빌려놓고 시간이 없어 서론만 읽은 뒤 방치해뒀다가 연체되어서 연체비만 물고 뒷쪽은 하나도 못 읽었지만 말이죠.

---

의외로 물리학을 하나도 안 배운 사람이 물리학을 어느정도 배운 사람보다 이상하다는 것을 빠르게 알아차리는 물리학에 대한 문장이 있습니다.

"전하가 자기장 안에서 받는 힘은 전하의 이동 방향과 수직이므로 자기장은 일을 하지 못한다."

이 문장은 왜 틀린 문장일까요?

문장의 전제는 맞습니다. 전하가 자기장 안에서 받는 힘은 로렌츠힘으로 기술되고, 이 힘은 전하가 이동하는 방향과 항상 수직이기 때문에 로렌츠힘에 의해 전하가 에너지를 얻는 경우는 없죠. 하지만 자기장은 일을 하지 못한다는 사실이 아닙니다. 사이클로트론과 같은 입자가속기에서는 자기장의 세기를 변화시키는 것으로 입자를 가속시키기는 하지만 이건 자기장이 변하면서 패러데이 법칙에 의해 전기장이 생성되는 원리이기 때문에 반례가 되는 것은 아닙니다. 그러니까, 가만히 있는, 혹은 정적인 자기장이 일을 하는 경우입니다. 그리고 누구나 어릴 적 자석을 가지고 놀아봤다면 모를래야 모를 수가 없는 반례이기도 하죠.

가만히 있는 자석과 조금 떨어진 곳에 가만히 있는, 자화되지 않은 철조각을 가만히 두면 철조각은 자석을 향해 날아들죠. 중력을 거스르고 날아오르는 경우도 많고요. 정적인 자기장이라도 일을 할 수 있다는 살아있는 반례죠. 물론 철조각이 자화되면서 남는 에너지를 운동에너지로 바꾸는 과정이므로 로렌츠힘에 의한 일은 아니지만, 자기장(혹은 자력)이 일을 하지 못하는 것은 아니지 않습니까.

그리고 여기에는 약간의 뒷이야기가 있습니다. 고전역학과 통계역학만 가정할 경우, 자력은 일을 할 수 없는 것이 맞습니다. 이를 보어-판레이우언 정리라고 부르죠. 그러니까 처음에 제시된 문장은 고전역학과 통계역학만 가정한 범위 안에서는 틀린 문장은 아닌 셈이죠. 단지 우리 우주가 그 범위 안에 온전히 속하지 않는 것일 뿐. 포스트의 처음에 인용한 문장이 더없이 적절하지 않습니까?

---

다음 업데이트에서는 블랙홀에 대해 이야기해보려고 합니다. 아마 트위터에서 자주 떠들어댄 문제이니 이미 아실 분들도 있을 지 모르겠군요.

저작자표시 비영리 변경금지

'Physics > Concepts' 카테고리의 다른 글

다이온(dyon) 관련 잡담 약간 (1)	2020.11.16
Analyticity, causality, Kramers-Kronig relations, and all that (2)	2020.08.23
Canonical transformations and equivalence of Hamiltonians (0)	2020.02.23
Elementary introduction to Dirac brackets (2)	2019.01.29
Frobenius Theorem in General Relativity (0)	2016.09.29

Posted by 덱스터

2020. 2. 23. 12:40 Physics/Concepts

Canonical transformations and equivalence of Hamiltonians

최근 주로 계산하고 있는 것은 산란진폭(scattering amplitude)을 이용해서 천체를 점입자로 근사했을 때 두 천체 사이의 상호작용을 얻는 일. 정확히는 천체를 점입자로 근사하고 두 점입자가 만드는 계(system)의 유효 해밀토니안(effective Hamiltonian) 계산이다. 중력포텐셜 계산이라고 이야기하기도 한다. 대충 이 논문에서 한 일에 스핀을 던져넣는 작업인데, 주로 저번에 했던 일에서 제대로 정리하지 못했던 부분을 청소(...)하고 있다.

중력의 성가신 점은 좌표변환이 중력의 게이지 대칭이라는 것이다. 덕분에 중력포텐셜은 게이지를 어떻게 잡느냐에 의존하는 물리량이 되어버리고 만다. 산란진폭을 이용해서 구하는 중력포텐셜은 $\vec{p} \cdot \vec{r}$이 등장하지 않는 isotropic gauge의 포텐셜. 물론 그렇다고 중력포텐셜을 마음대로 쓸 수 있다는 것은 아니다. 서로 생긴 꼴이 다른 중력포텐셜이 실제로는 같은 동역학을 준다면, 두 중력포텐셜의 표현식 사이를 이어주는 canonical transformation이 존재해야 한다. 그러니까 $H_1 (p,q)$가 $H_2 (P,Q)$와 동등하다면 적당한 변수변환 $P(p,q), Q(p,q)$가 존재해서 $H_2 (P,Q) = H_1(p(P,Q),q(P,Q))$이면서 canonical conjugate relation인 $\{ P, Q \}_{\text{P.B}} = \{ p, q\}_{\text{P.B}} $이 (이제부터 Poisson bracket의 subscript인 P.B는 생략하도록 하자) 유지되어야 한다는 것. 흥미로운 점은 서로 다른 해밀토니안을 비교하는데 다음과 같은 식을 만족하는 generator $g$가 존재하는지의 여부로 두 해밀토니안이 물리적으로 동등한지 확인하기도 한다.

$$ H_2(p,q) - H_1(p,q) = \{ H_1 , g \} + \mathcal{O} (G^n, p^{2n})$$

예를 들면 이 논문의 4.1장에서 하는 논의라던가. 뒷 항은 $n-1$-PN order에서 보이지 않는 항들이다. 이 식을 어떻게 이해할 수 있을까?

의외로 답은 간단하다. $p, q$에서 $P,Q$까지 이어지는 continuous canonical transform을 상상해보자. 대충 $\tilde{p}(p,q;\alpha), \tilde{q}(p,q;\alpha)$란 연속함수가 존재하고 $\forall \alpha, \{ \tilde{p}, \tilde{q} \} = \{ p,q \}$면서 $\tilde{p}(p,q;0) = p, \tilde{p}(p,q;1) = P(p,q)$를 만족한다고 형식화할 수 있다. 이 경우 해밀토니안은 $H=H_1(p,q)=H_2(P,Q)$로 고정되어 있는 상태이다. 해밀토니안이 만드는 flow는 그대로 있고 그 flow를 기술하는 canonical variable들의 coordinate frame이 이동하는 것으로 볼 수 있다.

이제 관점을 바꿔보자. canonical variable들의 coordinate frame을 고정하고 해밀토니안이 만드는 flow를 흐르게 시키는 관점이다. 정확히는 $\tilde{p},\tilde{q}$를 좌표축으로 고정한 뒤 $H(\tilde{p},\tilde{q};\alpha)=H_1(p(\tilde{p},\tilde{q}),q(\tilde{p},\tilde{q}))$가 변수 $\alpha$에 대해 어떻게 흐르는지 보는 것이다. 이 경우 $\frac{d}{d\alpha}$는 symplectic vector field이므로 여기에 대응되는 (local) generator $G$가 존재한다. 식으로 쓰자면

$$ \exists G, \frac{\partial}{\partial \alpha} H(\tilde{p},\tilde{q};\alpha) = \{ H(\tilde{p},\tilde{q};\alpha) , G \} $$

이 되는 셈. 다르게 표현하면 다음의 벡터장(vector field) 방정식을 만족하는 벡터장 $\{ G, \bullet \}$가 존재한다고 할 수 있다.

$$ \exists G, \frac{\partial}{\partial \alpha} \{ H , \bullet \} = \mathcal{L}_{\{ G, \bullet \}} \{ H, \bullet \} $$

위 식에서 $\mathcal{L}$은 리 미분(Lie derivative)을 의미한다.

위에 적은 미분꼴의 방정식을 차분(difference)꼴로 바꾸면 우리가 이해하고 싶었던 식이 된다.

$$ H_2(p,q) - H_1(p,q) = \{ H_1 , g \} + \mathcal{O} (G^n, p^{2n})$$

미분방정식을 차분방정식으로 바꾸는 과정의 논리적 구멍을 메꾸고 싶다면 다음과 같은 미분형식(differential form) 꼴로 바꾼 방정식을 고려할 수 있다.

$$ \delta H(\alpha) = \{ H(\alpha), g \} \,,\, g = G \delta \alpha $$

문제에 perturbation parameter $\epsilon$이 존재한다고 가정할 경우, 위의 방정식은 다음과 같은 차분방정식으로 변경시킬 수 있다.

$$ \Delta H = \{ H, g \} \,,\, \frac{\Delta H}{H} \sim \frac{g}{H} \sim \epsilon $$

Post-Newtonian expansion의 경우 이 perturbation parameter는 $\epsilon = \frac{G\mu}{r c^2} \simeq \frac{p^2}{\mu^2 c^2}$이 된다. 이름대로 $\frac{1}{c}$을 perturbation parameter로서 이해할 수 있다는 의미.

23Feb2020 수정사항: 미분형식 꼴로 바꾼 방정식을 이용한 논증 추가.

저작자표시 비영리 변경금지

'Physics > Concepts' 카테고리의 다른 글

Analyticity, causality, Kramers-Kronig relations, and all that (2)	2020.08.23
To believe or not to believe, that is the question (0)	2020.07.25
Elementary introduction to Dirac brackets (2)	2019.01.29
Frobenius Theorem in General Relativity (0)	2016.09.29
Particles in Curved Space (1)	2016.08.08

Posted by 덱스터

2019. 1. 29. 20:08 Physics/Concepts

Elementary introduction to Dirac brackets

대학원 고전역학에서 다룰만한 내용으로 교수님과 이야기하다가 Dirac bracket 이야기가 나와서 간단(?)하게 트위터에서 주절거렸던 내용을 정리. 해당 타래는 이것.

이왕 Dirac bracket 이야기가 나왔으니 간단하게 아이디어 설명.

뉴턴역학/라그랑주역학은 2계미분방정식을 이용하기 때문에 초기조건으로 함수의 값과 도함수값을 요구한다. 해밀턴역학은 2계미분방정식을 1계미분방정식으로 바꿔서 초기조건에 함수의 값만 필요하도록 바꾼 것으로 이해할 수 있다.
— Dexter Kim (@AstralDexter) January 29, 2019

이 관점은 계의 상태를 함수의 값으로만 나타낼 수 있다는 이점이 있다. 위상공간(phase space)는 이런 관점에서 도입된 것. 위상공간의 모든 점은 계의 상태 중 하나를 나타내며, 계가 시간에 따라 변화하는 것은 위상공간에서 어떤 궤적을 그리는지로 표현할 수 있게 된다.
— Dexter Kim (@AstralDexter) January 29, 2019

해밀턴역학에서 동역학을 부여하는 것은 해밀토니안 함수인데, 위의 위상공간 관점에서 해밀토니안 함수를 생각해보면 이 함수는 위상공간 위에서 점들이 어떤 방향으로 움직여야 하는지를 결정한다고 할 수 있다. 따라서 해밀토니안 함수를 위상공간 위에 정의된 벡터장과 대응시켜 줄 수 있다.
— Dexter Kim (@AstralDexter) 2019년 1월 29일

이 때 벡터장은 해밀토니안 함수에 의해 위상공간 상의 점이 어느 방향으로 얼마나 빠르게 이동해야 하는지를 나타낸다. 해밀토니안 함수와 벡터장을 대응시켜주는 역할을 하는 것이 포아송 괄호(Poisson bracket). 이 모든 것을 가져다가 수학적으로 깔끔하게 한 것이 심플렉틱(symplectic) 기하.
— Dexter Kim (@AstralDexter) 2019년 1월 29일

위의 논의는 위상공간의 모든 점이 계의 가능한 상태에 전부 대응될 때 성립한다. 위상공간의 일부만 계의 가능한 상태에 대응되는 경우, 즉 제약조건이 있는 계(constrained system)의 경우에는 조금 더 머리를 써야 한다. 이걸 형식화한 것이 디락 괄호(Dirac bracket).
— Dexter Kim (@AstralDexter) 2019년 1월 29일

제약조건이 있는 계라는 뜻은 위상공간 위에서 실제로 계가 움직일 수 있는 공간이 부분다양체(submanifold)를 이룬다는 의미이며, 이 부분다양체는 '위상공간 위에서 정의된 어떤 함수의 값이 0이 되는 제약조건을 만족하는 집합'으로 형식화할 수 있다.
— Dexter Kim (@AstralDexter) 2019년 1월 29일

이제 포아송 괄호를 이용하여 해밀토니안을 위상공간 위의 벡터장으로 바꾸는 과정을 생각해보자. 일반적으로 해밀토니안에 대응되는 벡터장은 제약조건을 만족하는 부분다양체 위의 점이 부분다양체 밖으로 벗어나는 방향을 포함하게 된다.
— Dexter Kim (@AstralDexter) 2019년 1월 29일

이제 문제는 부분다양체 안에서 출발한 점은 부분다양체 위에 그대로 남아있도록 해밀토니안에 대응되는 벡터장에서 부분다양체 밖으로 벗어나도록 하는 방향을 잘라내는 것이다. 디락 괄호(Dirac bracket)는 이 잘라내는 과정을 자동화하는 역할을 한다.
— Dexter Kim (@AstralDexter) 2019년 1월 29일

디락 괄호는 다음 두 관찰에서 출발한다.
1. 제약조건에 해당하는 함수들의 값은 실질적으로 0이니 아무리 다른 함수에 더하고 빼도 상관없다.
2. 제약조건에 해당하는 함수들을 포아송 괄호를 이용하여 벡터장으로 만들 경우 일반적으로 그 벡터장은 0이 아니다.
— Dexter Kim (@AstralDexter) 2019년 1월 29일

해밀토니안 함수로 돌아가서 생각해보자. 해밀토니안 함수에 실질적으로는 값을 변화시키지 않는 제약조건에 해당하는 함수들을 더한다고 할 때, 우리가 결정해야 할 것은 그 함수들을 얼마나 더할 것인가이다.
— Dexter Kim (@AstralDexter) 2019년 1월 29일

이 문제는 이렇게도 표현할 수 있다. '해밀토니안 함수가 만든 벡터장에 제약조건들이 만드는 벡터장을 어떻게 더해야 그 벡터장이 제약조건을 만족하는 부분다양체 위에 남아있도록 할 수 있을까?' 디락 괄호에서 포아송 괄호 뒤에 붙는 보정항들은 이 문제에 대한 계산을 수행하는 역할을 한다.
— Dexter Kim (@AstralDexter) 2019년 1월 29일

모든 미분방정식은 충분한 숫자의 변수를 도입하는 것으로 1계미분방정식으로 만들 수 있다. 예컨대 $y''+y=0$이란 미분방정식이 있다면 $x=y'$이란 독립변수 $x$를 도입하여 $x'+y=0$으로 만들 수 있다. 해밀턴역학도 어떤 의미에서는 그런 접근의 연장선상에 놓여있다. 르장드르 변환과도 엮여있기 때문에 좀 복잡한 방식으로 이 과정을 이용하기는 하지만.

트윗 타래에서 설명했듯, 해밀턴역학에서 해밀토니안 함수는 위상공간 위에서의 흐름(flow)을 만들어내는 물체로 생각할 수 있다. 해밀토니안 함수와 그에 대응되는 흐름 혹은 벡터장을 연결해주는 역할을 하는 것이 포아송 괄호(Poisson bracket)이다. 연결 방법은 $H \to \{H,\bullet \}$. 물론 위상공간 위에서의 흐름을 만들어내는 해밀토니안이 실제 계의 동역학과 관계가 있어야 할 이유는 없다. 보다 추상적인 임의의 함수도 포아송 괄호를 통해 위상공간 위에서 흐름을 만들어낼 수 있으며, 일반적으로는 계의 보존량 $Q$를 이용해 이런 흐름을 만들어낼 때 $Q$를 대칭 생성자(symmetry generator)라고 부른다. 이쪽은 운동량 사상(moment map)과 연결되는 방향이지만 이 글의 주제에서는 벗어나니 다음 기회에^[각주:1].

임의의 함수는 포아송 괄호를 통해 위상공간 위에서의 벡터장과 대응될 수 있다.

위의 관점은 계의 모든 변수가 독립변수인 경우에는 문제 없이 적용이 가능하지만 계의 모든 변수가 독립변수가 아닌 경우, 즉 제약조건(constraint)이 존재하는 계의 경우에는 위의 관점을 적용하는데 무리가 있다. 이 경우 좌표를 새로 잘 정의해서 새 좌표에서는 모든 변수가 독립변수가 되도록 하는 것으로 위의 관점을 살려내는 방법이 있다. 물론 새 좌표를 찾는다는 것은 원칙상 가능하다는 뜻이고, 이 좌표를 찾는 일이 항상 쉬우리란 보장은 없다. 다른 방법은 디락의 디락 괄호(Dirac bracket)를 도입하는 것.

잠시 원래 이야기에서 벗어나 역사적인 맥락을 살펴보면, 디락이 디락 괄호의 도입을 생각하게 된 이유는 양자전기역학이었다고 한다. 디락은 포아송 괄호를 교환자(commutator)로 교체하는 것으로 고전계를 양자화할 수 있다는 것을 발견했는데, 같은 방법을 전자기학에 적용하려니 뭔가 잘 안 맞는다는 것을 알게 된 것이다. 디락은 가우스 법칙에 의해 전자기장이 가질 수 있는 값에 제약이 생기는 것이 원인이라는 것을 알게 되었고, 제약조건이 있는 계의 포아송 괄호에 해당하는 물체를 어떻게 찾아낼 것인가를 고민한 결과 디락 괄호를 찾아내게 된다.

다시 원래 이야기로 돌아와서, 제약조건이 있다는 뜻은 전체 위상공간 중 그 부분집합에 해당하는 $f_i(\vec{p},\vec{q})=0$을 만족하는 $(\vec{p},\vec{q})$만 실제 계의 상태를 나타낸다는 관점으로도 이해할 수 있다. 일반적으로 해밀토니안에 의해 만들어지는 흐름은 이 제약조건을 만족하는 위상공간 속 부분다양체(submanifold) 위에서 출발하더라도 그 밖을 벗어나게 되리라고 예상할 수 있다.

해밀토니안에 의해 만들어지는 흐름(연두)은 제약조건을 만족하는 부분다양체(연파랑) 위에서 출발하더라도 그 부분다양체 위에서 움직이는 방향(녹색)과 그 부분다양체에서 벗어나는 방향(적색)을 모두 포함한다.

이제 문제는 포아송 괄호를 통해 얻은 해밀토니안 함수에 대응되는 흐름에서 제약조건을 만족하지 못하게 하는 방향의 흐름을 제거하는 것이다. 위의 그림에서 적색 화살표에 해당하는 성분을 제거하는 것이 목표인 셈. 이 목표는 제약조건을 만족하는 경우 0이란 값을 갖는 제약조건에 해당하는 함수 $f_i$들을 적당히 더하는 것으로 이루어진다. $f_i$에 의해 만들어지는 흐름 $\{f_i,\bullet\}$은 일반적으로 0이 아니기 때문. 수식으로 나타내면 다음과 같다.

\[ H \to \{ H, \bullet \}_{\text{Dirac}} = \{ H + c_i f_i , \bullet \} \]

이제 문제는 1. 충분한 숫자의 $f_i$를 찾아서 어떤 방향으로 벗어나더라도 벗어나는 방향을 제거할 수 있을 것 2. 계수들 $c_i$를 결정할 것 두가지로 나뉘게 된다. 첫번째 문제에 대한 답은 제약조건을 primary/secondary constraint와 1st class/2nd class constraint로 분류하는 과정과 관련이 있는데^[각주:2] 여기서는 일단 충분한 숫자의 $f_i$들을 구했다고 가정하기로 하자.

디락 괄호는 포아송 괄호에 보정을 가해서 제약조건을 만족시키도록 한 것으로 볼 수 있다.

계수들 $c_i$는 어떤 해밀토니안 함수를 통해 생성된 흐름이더라도 제약조건 $f_i$의 값을 0으로 유지시켜야 한다는 것으로부터 구할 수 있다. 따라서 다음 방정식의 해를 구해야 한다는 뜻이다.

\[ \forall i \,, \{ H, f_i \}_{\text{Dirac}} = 0 \]

이 문제는 다음 가설풀이(ansatz)를 적용해서 풀 수 있다. 이런 가설풀이를 도입하는 이유는 포아송 괄호의 성질들 중 필요한 성질들을 보존하기 위함인데, 그 이야기까지 하기에는 글이 너무 길어지므로 대충 넘어가기로 하자.

\[ c_i(H) = - \{ H, f_j \}M^{ji} \]

위의 가설풀이를 적용하면 이제 풀어야 할 방정식은 아래와 같이 바뀐다.

\[ \{ H, f_i \}_{\text{Dirac}} = \{ H, f_i \} - \{ H, f_k \} M^{kj} \{ f_j, f_i \} = 0\]

고맙게도 위 방정식은 단순한 역행렬 계산으로 풀 수 있다.

\[ M^{ij} \text{ is the solution to } M^{ij} \{ f_j, f_k \} = \delta^i_k \]

이 정도가 디락 괄호의 핵심적인 아이디어에 속한다.

오스카 와일드의 표현을 따르자면 '다음 기회가 있다면'.(...) [본문으로]
나도 잘 구분 못한다. 어차피 아이디어를 이해할 때 명칭은 아주 중요한 것은 아니니 대충 넘어가자. [본문으로]

저작자표시 비영리 변경금지

'Physics > Concepts' 카테고리의 다른 글

To believe or not to believe, that is the question (0)	2020.07.25
Canonical transformations and equivalence of Hamiltonians (0)	2020.02.23
Frobenius Theorem in General Relativity (0)	2016.09.29
Particles in Curved Space (1)	2016.08.08
Fermi-Walker transport (2)	2014.12.24

Posted by 덱스터

2016. 9. 29. 21:58 Physics/Concepts

Frobenius Theorem in General Relativity

수업시간에 마주한 Frobenius' theorem이 특수상대론의 유명한 문제인 '회전하는 원반의 둘레는 얼마인가?'와 연결된다는 것을 깨닫고 작성을 시작한 노트. 별 내용도 없는데 생각보다 작성하는데 시간이 오래 걸렸다. 특수상대론을 다루는 부분은 작업 시작한 날 3시간만에 전부 정리했는데 나머지 부분에서 제대로 된 설명을 만드느라 헤매서....

처음 쓰기 시작했을 때는 '오 이거 재미있다!'란 생각으로 타자를 쳤는데 다 치고 나니까 '뭐야 이거 당연한 소리였잖아...'란 느낌만 든다. 안 그런 일이 드물기는 하지만...

Frobenius Theorem in General Relativity.pdf

저작자표시 비영리 변경금지

'Physics > Concepts' 카테고리의 다른 글

Canonical transformations and equivalence of Hamiltonians (0)	2020.02.23
Elementary introduction to Dirac brackets (2)	2019.01.29
Particles in Curved Space (1)	2016.08.08
Fermi-Walker transport (2)	2014.12.24
Computation and Heat (2)	2014.06.23

Posted by 덱스터

2016. 8. 8. 14:36 Physics/Concepts

Particles in Curved Space

(필명으로 운영하는 이 블로그 말고) 나중에 제대로 된 개인 홈페이지를 만들었을 때 올려놓아도 괜찮겠다 싶어서 학생 세미나도 준비할 겸 작성한 텍. 쓰다보니 너무 길어졌다.

Notion of Particles in Curved Space public.pdf

Unruh effect를 다루기 위해 넣은 Unruh-DeWitt detector는 진짜 열적 분포를 갖는 결과가 나오도록 하고 싶었는데 계산을 간단히 하려고 1+1차원에 갇혀있었던 것이 문제가 된 듯. 노트의 각주에 달아놓기는 했지만 3+1차원에서 계산하면 열적 분포가 제대로 나온다. 조금 신경쓰이는 부분은 $1/E$에 비례하는 항 때문에 구한 response function이 E에 대해 우함수가 아니라는 것인데, 이건 전이 확률이 에너지 준위차에만 의존하지 않고 에너지가 높은 쪽으로 전이하는 확률과 낮은 쪽으로 전이하는 확률이 서로 다르다는 것을 의미해서 그렇다. 여태 본 계산 중에는 이런 계가 없었던 것으로 기억하는데 무언가 잘못한 것이 있는 것은 아닌가 싶어서.

저작자표시 비영리 변경금지

'Physics > Concepts' 카테고리의 다른 글

Elementary introduction to Dirac brackets (2)	2019.01.29
Frobenius Theorem in General Relativity (0)	2016.09.29
Fermi-Walker transport (2)	2014.12.24
Computation and Heat (2)	2014.06.23
Dirac Equation(1) (4)	2013.12.15

Posted by 덱스터

2014. 12. 24. 20:56 Physics/Concepts

Fermi-Walker transport

Lense-Thirring effect가 과제로 나와서 이책 저책을 찾아보다가 Fermi-Walker transport란걸 알게 되었다. 검색을 조금 돌려보니까 이런 논문도 나오는데, 이 논문까지 읽을 필요는 없을듯. Fermi-Walker transport의 식은 다음과 같이 주어진다.

\[\frac{D_F A^{\mu}}{Ds}=(w^{\mu} u_{\nu}-u^{\mu}w_{\nu})A^{\nu}\] \[\mathbf{u}=\frac{d}{ds}, \mathbf{w}=\nabla_{\mathbf{u}}\mathbf{u}\] \[s \text{ is (natural) parametrisation of the curve; }\mathbf{u}\cdot\mathbf{u}=1\]

notation이 이것저것 섞여있긴 한데 알아들을 분들은 다 알아들으리라 믿고(...)

그래서 이게 뭐냐? 위키백과 항목에는 '평행이동(parallel transport)의 일반화'라고 서술되어 있지만 그 말은 별로 옳지 않아 보인다. 그림으로 보는게 가장 이해하기 편할 듯.

평행이동을 곡면좌표계(curvilinear coordinates)에서 유도하는 과정을 보면 위의 그림이 된다.

그리고 이게 Fermi-Walker transport. 이동시킬 곡선에 평행한 성분은 계속 평행하고 수직한 성분은 계속 수직하게 이동시키는 과정. 따라서 이동시키는 곡선이 '직선'(혹은 측지선-geodesic)인 경우 Fermi-Walker transport는 평행이동과 같아진다. Fermi-Walker transport의 식 유도는 벡터 $\mathbf{A}$를 가져다가 곡선의 접선(tangent)인 $\mathbf{u}$에 평행한 성분과 수직한 성분으로 나눈 뒤 수직한 성분의 변화율을 $\mathbf{u}\cdot\mathbf{A_\perp}=0$을 미분해서 얻으면 된다. 감이 안 잡히면 LPPT Problem book in Relativity and Gravitation의 문제 11.7에서 풀어주고 있으니 그 책을 확인해보는 것도 좋을듯. 이 책은 어둠의 경로가 아니더라도 http://www.nrbook.com/relativity/에서 볼 수 있다.

저작자표시 비영리 변경금지

'Physics > Concepts' 카테고리의 다른 글

Frobenius Theorem in General Relativity (0)	2016.09.29
Particles in Curved Space (1)	2016.08.08
Computation and Heat (2)	2014.06.23
Dirac Equation(1) (4)	2013.12.15
볼츠만 분포 (0)	2013.09.20

Posted by 덱스터

2014. 6. 23. 01:42 Physics/Concepts

Computation and Heat

과제로 제출했던 논문 리뷰(?)입니다. TeX으로 치느라 살짝 고생하긴 했는데 이쁘게 찍히는 것 보면 고생한 보람은 있네요. ~~(졸업논문 손봐야 하는데 놀고 있냐)~~

주된 내용은 Landauer의 1961년 논문인 "Irreversibility and Heat Generation in the Computing Process"로 촉발된 계산의 에너지 소모와 이후 Bennett의 논문으로 밝혀진 '계산 자체는 에너지를 소모하지 않는다 - 정보의 삭제가 에너지 소모의 원인이다'를 다룹니다. 원래 과제는 첫 논문만 보면 되는 거였는데 수랏길에 들어서 버렸...=_=;;

처음부터 영문으로 작성했던거라 개인정보만 조금 고쳐서 올립니다.

Computation and Heat - Public.pdf

p.s. '계산의 최소 에너지 소모'를 생각해봤으면 '계산능력의 한계'에 대해서도 생각해볼 수 있겠죠. 위키백과의 '계산 한계' 항목을 참고하세요. '브레머만 한계'는 양자역학적으로 얻은 '단위질량의 계산기가 행할 수 있는 최고 계산 속도'인데, 재미있게도 비슷한 크기의 제한조건을 '베켄슈타인 한계'와 '정보의 최대 전파 속도'인 광속 c로부터 구할 수 있습니다.(문제를 만들라는 과제도 있었는데 거기에 낸 문제입니다.) 정보를 최대한으로 꾹꾹 눌러 담으면 블랙홀이 됩니다. 그리고 그 정보를 한번에 처리하는데 들어가는 시간(즉 단일 clock 시간이죠)은 빛이 블랙홀의 지름을 통과하는데 걸리는 시간보다 짧을 수 없죠. 상수에 대한 dependence를 구해보면 대충 $\frac{c^2}{\hbar}$이 되어야 한다는 것을 알 수 있습니다. 순수하게 고전적인~~(블랙홀 엔트로피가 고전적인지는 모르겠군요 쿨럭;;)~~ 논의입니다.

p.s.2. 베켄슈타인 한계를 베켄슈타인 본인이 정리한 항목이 있어서 링크 걸어둡니다.

저작자표시 비영리 변경금지

'Physics > Concepts' 카테고리의 다른 글

Particles in Curved Space (1)	2016.08.08
Fermi-Walker transport (2)	2014.12.24
Dirac Equation(1) (4)	2013.12.15
볼츠만 분포 (0)	2013.09.20
열역학 제 2 법칙과 엔트로피 증가의 법칙 (3)	2010.11.22

Posted by 덱스터

2013. 12. 15. 19:02 Physics/Concepts

Dirac Equation(1)

디락방정식을 기억만으로 재구성해보는 작업을 하고 있는데, 그 와중에 조금 정리할 필요가 있다 생각되어 쓰는 글.

디락방정식의 도입 동기는 매우 간단하다. 그 이전까지 제시된 방정식들에 문제가 있었기 때문. 슈뢰딩거 방정식은 시간과 공간을 같게 다루지 않으며(공간에 대해서는 이계미분, 시간에 대해서는 일계미분), 클라인-고든 방정식은 시간에 대해 일계가 아니라는 문제가 있다. 시간에 대해 일계가 아니면 갖는 문제는 초기조건을 충분히 주지 못하기 때문에 문제가 된다. 시간에 대한 미분은 위상의 변화와 관련이 있는데, 위상의 차이는 측정할 수 있어도 위상이 변하는 속도는 측정할 방법이 없기 때문.


\text{Schroedinger equation: derivatives on time and}
\\\text{space are not treated on a equal footing.}
\\i\hbar\frac{\partial}{\partial t}\Psi=\left[-\frac{\hbar^2}{2m}\frac{\partial^2}{\partial x^2}+V(x) \right ]\Psi
\\\\\text{Klein-Gordon equation: the equation treats time}
\\\text{as a second order derivative.}
\\\left[\frac{\partial^2}{\partial t^2}-\frac{\partial^2}{\partial x^2}+m^2 \right ]\Psi=0\text{ (natural units)}

디락이 생각한 해는 상당히 간단하다. 클라인-고든 방정식에 제곱근을 취하는 것.


\text{Dirac's solution: take the root!}
\\\^H=i\frac{\partial}{\partial t}\;,\;\^p=-i\frac{\partial}{\partial x}
\\\\\left[-\frac{\partial^2}{\partial x^2}+m^2 \right ]\Psi=-\frac{\partial^2}{\partial t^2}\Psi\text{ (natural units)}
\\(\^p^2+m^2)\Psi=\^H^2\Psi
\\\\\Rightarrow(\alpha\cdot\^p+\beta m)\Psi=\^H\Psi

이러면 \alpha와 \beta에 대해 다음과 같은 10개의 관계식을 얻는다.

\begin{matrix}
\alpha_i\alpha_j+\alpha_j\alpha_i=2\delta_{ij} & \cdots\text{ 6 equations}\\ 
\alpha_i\beta+\beta\alpha_i=0  & \cdots\text{ 3 equations}\\
\beta^2=1 & \cdots\text{ 1 equation}
\end{matrix}

일단 \alpha와 \beta는 우리가 일반적으로 보는 숫자가 아닌 것은 확실하다. 제곱해서 1이 되며 다른 숫자와 곱했을 때 0이 되는 복소수는 없기 때문. 따라서 이 녀석들은 행렬로 보는 것이 타당하다. 제곱을 할 수 있으므로 행렬 중 정사각행렬이 되어야 하는데, 그렇다면 정사각행렬 중 몇 짜리 정사각행렬을 써야 할까? n\times n 행렬은 모두 n^2개의 자유도를 갖는다. 그런데 위에서 최소한 10개의 조건이 필요하다는 결론을 얻었으므로, 최소한 4\times4행렬이 필요하다는 것을 알 수 있다. 이렇게 되면 6개의 자유도가 남는데, 이 자유도는 어디에 쓸 수 있을까? 다시 원래의 디락방정식으로 돌아와 보자.(틀린 설명입니다.) 미분은 좌표계를 바꾸면 변하게 되어 있으나 정지질량은 변하지 않는다. 따라서 식을 좀 더 깔끔하게 쓰려면 다음과 같이 정리하는 편이 낫다.

\text{Dirac equation}
\\(-i\alpha\cdot\nabla+\beta m)\Psi=i\frac{\partial}{\partial t} \Psi
\\\beta m \Psi=i\left[\frac{\partial}{\partial t}+\alpha\cdot\nabla \right ]\Psi
\\=i\left[\frac{\partial}{\partial x_0}+\alpha_1\frac{\partial}{\partial x_1}+\alpha_2\frac{\partial}{\partial x_2}+\alpha_3\frac{\partial}{\partial x_3} \right ]\Psi

약간의 불만사항: 질량은 변하지 않는데 쌩뚱맞은 \beta가 붙어 있다. 양 변에 \beta를 곱해서 좀 더 보기 쉽게 만들어주고, ~~남는 6개의 자유도를 이용해~~(틀린 표현입니다) 이 숫자들에게 추가적인 제한조건을 걸어주도록 하자. 이 제한조건은 '로렌츠 변환을 만족할 것'. 로렌츠 변환은 결국 4차원에서의 회전에 해당하기 때문에 4C2=6개의 제한조건을 의미한다. ~~남은 6개의 자유도를 완벽하게 구속할 수 있다는 의미이다.~~

\text{Multiply each side by }\beta
\\m \Psi=i\left[\beta\frac{\partial}{\partial x_0}+\beta\alpha_1\frac{\partial}{\partial x_1}+\beta\alpha_2\frac{\partial}{\partial x_2}+\beta\alpha_3\frac{\partial}{\partial x_3} \right ]\Psi
\\\\\text{Redefine the numbers: Introduce the }\gamma^\mu\text{ matrices.}
\\\gamma^0\equiv\beta,\;\gamma^i\equiv\beta\alpha_i
\\\Rightarrow\gamma^\mu\gamma^\nu+\gamma^\nu\gamma^\mu=2g^{\mu\nu}
\\\\\text{Introduce more restrictions (six) to impose}
\\\text{covariance under Lorentz transforms.}
\\L^\mu_{\;\nu}\equiv\frac{\partial x'^\mu}{\partial x^\nu},\;L^{\;\;\mu}_{\nu}\equiv (L^\nu_{\;\mu})^{-1}=\frac{\partial x^\mu}{\partial x'^\nu}
\\\\x^\mu\to x'^\mu=L^\mu_{\;\nu} x^\nu,\;\partial_\mu\to\partial'_\mu=L^{\;\;\nu}_{\mu}\partial_\nu
\\\gamma^\mu\to\gamma'^\mu=L^\mu_{\;\nu}\gamma^\nu
\\\\\Rightarrow \gamma^\mu\partial_\mu\to\gamma'^\mu\partial'_\mu=L^\mu_{\;\nu}L^{\;\;\nu}_{\mu}\gamma^\nu\partial_\nu=\gamma^\mu\partial_\mu

이렇게 로렌츠 불변 형식의 디락방정식이 완성된다.

\text{Thus, the Dirac equation in its final form}
\\\text{nicely incorporates Lorentz covariance.}
\\\\m\Psi=i\gamma^\mu\partial_\mu\Psi\Rightarrow(i\gamma^\mu\partial_\mu-m)\Psi=0
\\\\(i\gamma^\mu\partial_\mu-m)\Psi=(i\gamma'^\mu\partial'_\mu-m)\Psi

나중에는 디락방정식의 감마행렬에 대해 클리포드 대수란 말이 나오게 되는데(기본적으로는 anticommute하는 숫자들에 대한 대수를 의미한다. n-form이 한 사례) 아직은 그렇게 복잡하게 생각할 필요는 없다고 생각해서 정리해봤다. 조금만 더 만지작만지작 거리면 spin이 자기모멘트를 나타낸다는 것과 g-factor가 2가 된다는 것도 보일 수 있는데(처음의 \alpha와 \beta를 쓰는 형식에서 운동량을 canonical momentum으로 바꾼 뒤 제곱해서 정리하면 자기장과 내적한 꼴의 에너지 항을 얻는다) 그것까지 하기는 귀찮다. 언젠가 (2)를 쓰게 되면 그때나...

사실 목적은 기억만으로 수소원자를 푸는 것이었는데(디락방정식을 이용해서 수소원자 모형을 풀면 답에 자연스럽게 fine structure까지 포함된다) 어디선가 헤매고 있다. 일단은 디락 양자역학 책을 열어봐야 하나.

공부합시다!

수정(24 Dec 2013)

감마행렬이 4X4 행렬이라는 논리전개과정이 매우 불분명해서 제외. 대수학을 좀 더 공부해야 할 필요가 있습니다 엉엉 ㅠㅠ

저작자표시 비영리 변경금지

'Physics > Concepts' 카테고리의 다른 글

Fermi-Walker transport (2)	2014.12.24
Computation and Heat (2)	2014.06.23
볼츠만 분포 (0)	2013.09.20
열역학 제 2 법칙과 엔트로피 증가의 법칙 (3)	2010.11.22
엔트로피 - 고전적인 정의 (7)	2010.08.03

Posted by 덱스터

2013. 9. 20. 23:31 Physics/Concepts

볼츠만 분포

수업시간에 교수님이 하신 설명이 마음에 안 들어서(...) 처음부터 재구성. canonical ensemble을 이용한다. 다른 말로 계와 주변부(environment) 사이에 에너지 교환만 일어난다는 의미.

계와 주변부의 에너지가 특정 비율로 분배될 확률은 그 분배법이 얼마나 많은 가능한 상태의 수를 갖는가에 직접적으로 비례한다. 사실, 그 확률은 이 상태의 수에만 비례한다는 것이 통계역학의 기본 공리중 하나이다(postulate of equal a priori probability). 총 에너지를 E, 계의 에너지를 \varepsilon이라 하면 그 상태에 있을 확률은 다음과 같이 쓸 수 있다.

P(\varepsilon)\propto \Omega_{e}(E-\varepsilon)\Omega_{s}(\varepsilon)

여기서 \Omega_s는 에너지에 따른 계의 경우의 수, \Omega_e는 주변부의 경우의 수. 그런데 이 식은 쓰기 매우 불편하다. 실제로 다루는 물리량이 \Omega가 아니기 때문. 열역학에서 다루는 물리량은 보통 두가지로 나뉘는데,^[각주:1]

1. 강성적 성질(intensive property): 계의 크기와는 독립적인 물리량. 압력, 온도, 밀도 따위. 계의 질량과는 독립적인 성질이라고도 설명한다.^[각주:2]

2. 종량적 성질(extensive property): 계의 크기에 직접적으로 비례하는 물리량. 부피, 엔트로피 따위. 계의 질량에 직접적으로 비례하는 성질이라고도 설명한다.

\Omega는 이 둘 중 어느 하나에도 속하지 않는다. 계의 크기가 두배가 되면 \Omega는 제곱이 되기 때문. 따라서 좀 더 사용하기 용이한 물리량은 \Omega의 로그값이 된다.^[각주:3] 물리적으로는 다음 식이 더 유용하다는 것.

\ln P(\varepsilon) = \ln\Omega_{e}(E-\varepsilon)+\ln\Omega_{s}(\varepsilon)+c

그런데 이러면 사용하기 너무 복잡하다는 문제가 있다. 이 때 이용하는 것이 주변부의 크기는 매우 크기 때문에 선형으로 근사해도 별 문제가 없다는 사실이다. 로그를 테일러 전개를 사용해 1차식으로 만들어주는 것이다. 그리고 이 과정에서 등장하는 미분량은 우리가 잘 알고 있다. 바로 \beta

\\\ln P(\varepsilon) = \ln\Omega_{e}(E-\varepsilon)+\ln\Omega_{s}(\varepsilon)+c\\=\ln\Omega_{e}(E)-\frac{\partial\ln\Omega_e(E)}{\partial E}\varepsilon+\ln\Omega_{s}(\varepsilon)+c\\=\ln\Omega_{e}(E)-\beta\varepsilon+\ln\Omega_{s}(\varepsilon)+c

따라서 원래대로 확률을 구하기 위해 지수를 취해주면

\therefore P(\varepsilon)=\exp(\ln\Omega_{e}(E)-\beta\varepsilon+\ln\Omega_{s}(\varepsilon)+c)

또는

P(\varepsilon)\propto\Omega_s(\varepsilon)\exp(-\beta\varepsilon)

를 얻는다. 바로 심심하면 보이는 볼츠만 분포.

노승탁, 『공업열역학』, 4판, 문운당 을 참고하고 내용 추가. [본문으로]
이 설명으로부터 뉴턴의 세계관에서는 질량이 어떤 의미를 갖는지 유추할 수 있다. '질량은 계의 현신'이랄까. [본문으로]
Reif책이 이런 방식으로 서술한다고 기억하는 중. 어쨌든 재미있는 논증이다. [본문으로]

저작자표시 비영리 변경금지

'Physics > Concepts' 카테고리의 다른 글

Computation and Heat (2)	2014.06.23
Dirac Equation(1) (4)	2013.12.15
열역학 제 2 법칙과 엔트로피 증가의 법칙 (3)	2010.11.22
엔트로피 - 고전적인 정의 (7)	2010.08.03
Hamiltonian formulation(1) (4)	2010.07.14

Posted by 덱스터

2010. 11. 22. 13:30 Physics/Concepts

열역학 제 2 법칙과 엔트로피 증가의 법칙

2010/08/03 - 엔트로피 - 고전적인 정의

이제 어째서 제 2 법칙이 엔트로피가 생성된다는 법칙으로 이어지는지 살펴보자. 우선 전 글에서 우리가 확인한 두 가지 사항은 다음과 같다.

1. 카르노 기관을 뛰어넘는 효율을 갖는 기관은 없다.

2. 이상적인 과정만 존재하는 경우에는
$$\oint\left(\frac{\delta Q}T\right)_{\text{ideal}}=0$$
이 성립하고, 그 값을 엔트로피의 변화량이라 정의할 수 있다.

이제 우리가 증명해야 할 것은 위의 두 가지 중간결론만 가지고 다음 결론을 이끌어내어야 한다는 것이다.

$$dS\ge\frac{\delta Q}{T}$$

이 말은 이렇게도 해석할 수 있다.

$$0=\oint dS\ge\oint\frac{\delta Q}{T} \\0\ge\oint\frac{\delta Q}{T}$$

이 결론을 확인하기 위해 임의의 실제과정 사이클을 생각하고, 그 사이클에서 흡열과정과 출열과정을 나누어보자. 편의상 흡열과정은 완전히 이상적이지만 출열과정이 실제과정이라고 하자. 그렇다면 열기관의 효율은 이상과정의 효율을 넘을 수 없으므로

$$\eta_\text{real}=1-\frac{Q_{l_\text{real}}}{Q_h}\le\eta_\text{ideal}=1-\frac{Q_{l_\text{ideal}}}{Q_h} \\\therefore Q_{l_\text{real}}\ge Q_{l_\text{ideal}}$$

라는 결론을 얻는다. 즉, 출열과정에서는

$$\int\left(\frac{\delta Q}{T}\right)_\text{real/exo}\le\int\left(\frac{\delta Q}{T}\right)_\text{ideal/exo}$$

이 성립한다는 것이다.^[각주:1] 물론 아래에 T라는 함수가 붙기 때문에 저 적분이 항상 옳은가는 엄밀하게 증명되지 않았다. 하지만 적분경로를 나누어 각각 T가 일정하다고 볼 수 있는 미세한 구간으로 분할하면

$$\int\delta Q_\text{real/exo}\le\int\delta Q_\text{ideal/exo}\leftrightarrow \frac1T\int\delta Q_\text{real/exo}\le\frac1T\int\delta Q_\text{ideal/exo}\\\leftrightarrow \int\left(\frac{\delta Q}{T}\right)_\text{real/exo}\le\int\left(\frac{\delta Q}{T}\right)_\text{ideal/exo}$$

이므로, 이 부등식은 어떤 적분경로를 택하더라도 성립한다고 할 수 있다. 비슷한 논의를 이용해 흡열과정에서도 같은 부등호가 성립함을 보일 수 있다.

$$eq=\eta_\text{real}=1-\frac{Q_l}{Q_{h_\text{real}}}\le\eta_\text{ideal}=1-\frac{Q_l}{Q_{h_\text{real}}} \\\therefore Q_{h_\text{real}}\le Q_{h_\text{ideal}} \\\therefore\int\left(\frac{\delta Q}{T}\right)_\text{real/endo}\le\int\left(\frac{\delta Q}{T}\right)_\text{ideal/endo}$$

그러므로 일반적으로

$$\int\left(\frac{\delta Q}{T}\right)_\text{ideal}\ge\int\left(\frac{\delta Q}{T}\right)_\text{real}$$

혹은 어떤 적분경로를 택하더라도 위의 부등식이 성립해야 하기 때문에

$$\left(\frac{\delta Q}{T}\right)_\text{ideal}\ge\left(\frac{\delta Q}{T}\right)_\text{real}$$

이 성립한다. 맨 처음에 증명하고자 했던 식의 우변은 이상적인 과정과 실제 과정을 전부 포함하므로 이렇게 증명은 완료되었다.

$$dS\ge\frac{\delta Q}{T}$$

훈련소에서 없는 기억을 되살려가며 해낸 증명인데^[각주:2], 배울 때에는 조금 다르게 배웠었던 것으로 기억한다. 나중에 기회가 되면 다시 찾아봐야지 뭐.

적분에서는 출열과정의 열이 음수로 계산된다. 효율을 따질 때에는 방출된 열의 절대값만을 따졌으므로 부등호가 반전된다. [본문으로]
첫 주인 가입교 기간 동안에는 할 일이 없다. [본문으로]

저작자표시 비영리 변경금지

'Physics > Concepts' 카테고리의 다른 글

Dirac Equation(1) (4)	2013.12.15
볼츠만 분포 (0)	2013.09.20
엔트로피 - 고전적인 정의 (7)	2010.08.03
Hamiltonian formulation(1) (4)	2010.07.14
Contravariant/Covariant/Metric tensor와 Kronecker delta (2)	2010.02.28

Posted by 덱스터

2010. 8. 3. 13:00 Physics/Concepts

엔트로피 - 고전적인 정의

2008/12/21 - 제레미 리프킨, 엔트로피

무질서도로 번역되는 엔트로피(Entropy)란 개념은 열역학 제 2법칙과 밀접한 관계를 갖습니다. 제 2법칙이 엔트로피 증가의 법칙으로 통용되는 것만 보아도 그것을 쉽게 알 수 있겠지요.

엔트로피에 대한 접근은 크게 두가지로 볼 수 있습니다.(정보 이론에서도 다룬다고 하는데 이건 무시.. 세스 로이드의 『프로그래밍 유니버스』란 책에서 간략하게 다루고 있는데 그걸 참고하셔도 좋을 듯 합니다.) 하나는 완전한 고전역학적인 접근이고 다른 하나는 완전한 통계역학적인 접근입니다. 고전역학적인 접근은 우리가 어느 물체에 대해 평균적인 값으로 측정하는 물리량(압력이나 부피, 밀도 등)을 기반으로 엔트로피를 정립해 나가는 것이고 통계역학적인 접근은 분자들의 상태의 수를 이용해서 엔트로피를 정립해 나가는 방식입니다. 보통은 통계역학적인 접근, 혹은 미시적인 접근을 주로 사용하지만 좀 독특한(일반적인 접근인 미시적인 접근과는 반대되는 접근이라는 점에서) 접근방식인 고전역학적인 접근을 써 보려고 합니다.^[각주:1]

먼저 카르노 기관(순환Cycle)을 짚고 넘어가야 합니다. 카르노 기관은 엔트로피라는 개념이 정립되기 전부터 등장해서 엔트로피를 고전적으로 정의하는데 커다란 버팀목이 되었던 가상적인 엔진입니다. 이 엔진의 특징은 '모든 과정이 역으로 진행 가능하다'입니다.

카르노 기관(Carnot engine/cycle)

모든 과정이 역행 가능한 기관. 네 단계로 구성된다.

1. 등온팽창. 엔진과 같은 온도를 가진 열 공급원에서 에너지를 흡수한다. 같은 온도를 갖기 때문에 이 과정은 역으로 동일하게 진행될 수 있다.
2. 단열팽창. 엔진은 외부와 열 교환을 할 수 없다. 이때 팽창은 준정적Quasi-static으로 일어난다. 준정적이란 말은 평형상태와 유사하게라는 뜻으로, 이 경우에는 기체(또는 유체working fluid)의 팽창이 내부의 압력과 외부의 압력이 동일한 상태에서 일어나는 것이다. 이렇게 준정적인 과정으로 기체가 팽창할 경우 과정은 역으로 진행될 수 있다.
3. 등온압축. 엔진과 같은 온도를 가진 열 흡수원에 에너지를 방출한다. 등온팽창과 마찬가지의 이유로 역으로 동일하게 진행될 수 있다.
4. 단열압축. 단열팽창과 마찬가지로 열 교환을 할 수 없으며, 마찬가지의 조건과 이유로 과정은 역으로 진행할 수 있다.

그리고 열역학 제 2법칙의 공리가 등장합니다. 두 가지 공리가 있습니다.^[각주:2]

Clausius Statement
열은 자연적으로 저온부에서 고온부로 전달될 수 없다.^[각주:3]

Kelvin-Plank Statement
단일열원에서 열을 얻어 모두 일로 바꾸는 것은 불가능하다.

살펴보겠지만, 두 공리는 서로 동등한 관계를 지닙니다. 둘 중 하나만 부정되어도 다른 하나마저 부정되어야 하지요. 먼저 첫 서술을 부정해 보겠습니다. 열이 자동적으로 저온에서 고온으로 이동하는 겁니다. 그러면 어떤 순환이 두 열원 사이에서 작동하면서 저온부에 버리는 열이 고온으로 이동하면 외부에서 보기에는 고온에서 얻은 열을 전부 일로 바꾼 것으로 보이게 됩니다. 둘 째 서술이 부정되는 것이지요.

둘 째 서술을 부정해 볼까요? 단일열원에서 열을 얻어 모두 일로 바꾸는 기관을 냉동기에 연결합니다. 그러면 저온부에서 고온부로 스스로 이동하는 현상이 일어나게 됩니다. 첫 서술이 부정되는 겁니다. 결국 서로 동치라고 볼 수 있겠지요.

뭐 어찌되었든, 이를 이용하면 카르노 기관이 최고의 효율을 가진 기관이라는 것을 보일 수 있습니다. 카르노 기관은 기본적으로 외부에 영향을 미치지 않는 기관입니다. 모든 과정을 그대로 역으로 진행할 수 있기 때문이지요. 하지만 이 기관보다 효율이 좋은 기관을 도입한다면? 이런 이상적인 기관에서 일을 얻어서 카르노 기관을 역으로 진행시키는 데 사용한다면 열이 역류하는 현상이 일어납니다. 이는 Clausius의 서술에 위배되기 때문에 결국 그런 기관은 존재할 수 없다는 것이지요.

그리고 동일한 열원 사이에서 작동하는 카르노 기관들은 전부 같은 효율을 지닙니다. 하나가 다른 하나보다 더 효율이 좋으면, 하나를 냉동기로 사용하고 하나를 냉동기를 작동시키는 엔진으로 사용하면 열이 역류하는 현상을 볼 수 있겠지요. 이 역시 Clausius의 서술과 반대되기 때문에 존재할 수 없습니다.

그러면 같은 열원이란 무엇일까요? 동일한 온도를 가진 열원을 같은 열원이라고 말합니다. 그리고 카르노 기관의 효율은 그 기관이 작동하는 두 열원의 온도의 함수로 주어집니다. 이는 고온부와 저온부 그리고 그 사이에 중간단계의 열원이 존재함을 가정하고 고온부와 저온부 사이에서 작동하는 기관 하나, 고온부와 중간단계 사이에서 작용하는 기관 하나, 중간단계와 저온부 사이에서 작동하는 기관 하나를 놓은 다음 고온부에서 바로 저온부로 연결된 기관과 중간단계를 걸처 작동하는 기관 둘의 합이 같은 효율을 가져야 한다는 것을 이용해서 보일 수 있습니다.^[각주:4]고온부의 온도를 $t_h$, 저온부의 온도를 $t_l$, 중간 단계의 온도를 $t_m$이라고 한다면 저온부와 고온부 사이 그러니까 $t_h$와 $t_l$ 사이에서 작동하는 카르노 기관의 효율은 이런 꼴로 나타날 것입니다.

$$\eta_{hl}=F(t_h,t_l)=1-\frac{Q_l}{Q_h}$$

$Q$는 카르노 기관에서 들어오거나 나가는 열의 양을 말하고, 첨자는 그 온도를 말합니다. 앞으로는 편의상 열을 주고받는 비율에 초점을 맞추겠습니다. 이 열을 주고받는 비율은 다음과 같이 식의 형태로 쓸 수 있지요.
$$\frac{Q_l}{Q_h}=f(t_h,t_l)$$

중간 단계에 걸쳐있는 나머지 두 카르노 기관에 대해서도 같은 식을 써 볼 수 있습니다.
$$\frac{Q_h}{Q_m}=f(t_h,t_m) \\\frac{Q_m}{Q_h}=f(t_m,t_l)$$

그리고 효율이 같다는 것에서 다음 식을 유도할 수 있습니다.

$$\eta_{hl}=1-\frac{Q_l}{Q_h}=\eta_{h|m|l}=1-\frac{Q_h}{Q_m}\frac{Q_m}{Q_l} \\\frac{Q_l}{Q_h}=\frac{Q_h}{Q_m}\frac{Q_m}{Q_l} \\\therefore f(t_h,t_l)=f(t_h,t_m)f(t_m,t_l)$$

마지막 식을 다음과 같이 정리할 수 있는데

$$\frac{f(t_h,t_l)}{f(t_m,t_l)}=f(t_h,t_m)$$

이렇게 되면 좌변에서만 $t_l$이 등장하므로, $f$는 변수분리가 가능한 함수가 됨을 알 수 있습니다. $t_l$만 변화했을 때 값이 변해서는 안 되기 때문에 분모인 함수가 $t_l$에 의해 받는 영향만큼 분자의 함수가 영향받아야 되기 때문이죠. 그러면 일단 함수를 나눈 다음 생각해 봅시다. 함수 $f$를 대충 분리해서
$$f(t_1,t_2)=\phi(t_1)\theta(t_2)$$

라고 둔다면

$$f(t_h,t_m)=\frac{\phi(t_h)}{\phi(t_m)}$$

을 얻게 되지요. 그런데 우리는 온도의 측정에 제한을 둔 적이 없기 때문에 함수 $\phi$를 온도를 정의하는데 사용할 수도 있습니다. 이를 열역학적 온도라고 부릅니다.

$$T=\phi(t)$$

이제 열역학적 온도를 이용해 카르노 기관의 열효율을 정의할 수 있게 됩니다.

$$\eta_{hl}=1-\frac{T_l}{T_h}=1-\frac{Q_l}{Q_h}$$

물론 이를 이용해 기준온도를 두고^[각주:5]다른 열역학적 온도를 측정하는 것도 가능하지요. 위의 식에서 흡수/방출하는 열이 온도와 정확히 비례하기 때문입니다.

$$T_2=\frac{Q_2}{Q_1}~T_1$$

이제 엔트로피를 도입할 수 있게 됩니다. 먼저 다음 값을 한번의 카르노 순환(cycle)에 대해서 계산해 봅시다.

$$\oint \frac{\delta Q}T$$

이때 $Q$는 계 안으로 흘러들어오는 열로 정의합니다. 단열과정에서는 열이 전혀 흐르지 않기 때문에 등온과정만 생각하면 되는데, 등온과정에서 $T$는 일정하므로 적분은 다음과 같습니다.

$$\oint \frac{\delta Q}T=\frac{Q_h}{T_h}+\frac{-Q_l}{T_l}$$

(두번째 항에 음의 부호가 붙어있는 이유는 저온부로 열이 방출되기 때문입니다.) 그런데 위에서 카르노 기관의 등온과정에서 흡수하거나 방출하는 열은 온도에 비례한다고 정의내렸었죠.^[각주:6]따라서 저 값은 영이 됩니다.
$$Q\propto T \\\therefore\oint \frac{\delta Q}T=\frac{Q_h}{T_h}-\frac{Q_l}{T_l}=0$$

더군다나 어떤 열역학적인 기구라고 하더라도 이상적으로만 작동하고 원래대로 돌아오는 주기운동을 하는 경우라면 수많은 작은 카르노 기관을 모아 만들 수 있습니다. 그러므로 이상적인 경우만 존재한다면 다음 결론을 얻습니다.
$$\oint\left(\frac{\delta Q}T\right)_{\text{ideal}}=0$$

다른 뜻으로는, 위 미분값이 완전미분이라는 것이지요. 완전미분량이기 때문에 위 미분을 어떤 스칼라 함수의 미분으로 볼 수 있다는 것입니다. 스칼라 함수라면 상태에 의존하는 값이라는 의미고, 그러므로 상태에만 의존하는 이 스칼라 함수를 하나의 물리량으로 볼 수 있다는 뜻입니다. 이 물리량이 바로 엔트로피입니다. 대신 엔트로피의 차이만 정의되지 엔트로피의 절대값은 정의되지 않습니다. 위치에너지와 비슷하지요.^[각주:7]

$$\left(\frac{\delta Q}T\right)_{\text{ideal}}= dS \\\therefore\oint dS=0$$

통계역학 이전의 열물리에서 엔트로피라는 물리량이 어떻게 얻어졌는지를 보이는 것은 끝났고, 열역학 제 2법칙의 또 다른 버젼인 '엔트로피는 계속 생성된다'는 다음에 다루어 보도록 하죠. 스포일러: 이건 어떤 순환이라고 하더라도 이상적인 경우보다 효율이 떨어진다는 사실을 이용해 증명합니다.

많이 오래 전에 쓰다 만 글이라 문체가 조금 다릅니다. 별로 상관없지만...-.-;;

열역학 제 1법칙에 대한 확실한 이해가 필요할 수 있습니다. 제 1법칙은 에너지 보존의 법칙과 동치입니다. [본문으로]
공리는 '증명 불가능한 가정'입니다. 수학에서도 공리를 필요로 하는 것처럼, 물리학에서도 공리를 필요로 합니다. 뉴턴역학에서는 뉴턴의 세 법칙으로 공리가 나타났지요. 양자물리에서는 슈레딩거 방정식이 공리로 이용됩니다. [본문으로]
확률적으로 가능성이 낮은 것이지 불가능한 것은 아닙니다. 열역학 제 2 법칙은 사실 진리라기보다는 확률적으로 어쩔 수 없이 성립하는 결과라는 것이 대체적인 입장이구요. [본문으로]
시험문제에 나오더군요 OTL. 노승탁, 『최신 공업열역학』4판, 문운당, p.103~105 [본문으로]
기준온도는 물의 삼중점으로 273.16K입니다. [본문으로]
보인 것이 아니라 정의한 것입니다. 열역학적 온도를 정의하면서 따라온 부가적인 정리에 가까우니까요. [본문으로]
일반상대론이 등장하면서 '절대값'이 중요해졌다는 것도 통계역학적으로 열역학을 다루기 시작하면서 엔트로피의 절대값이 중요해졌다는 것과 닮았습니다. [본문으로]

저작자표시 비영리 변경금지

'Physics > Concepts' 카테고리의 다른 글

볼츠만 분포 (0)	2013.09.20
열역학 제 2 법칙과 엔트로피 증가의 법칙 (3)	2010.11.22
Hamiltonian formulation(1) (4)	2010.07.14
Contravariant/Covariant/Metric tensor와 Kronecker delta (2)	2010.02.28
자기 단극자, Dirac String, 기타 등등 (0)	2010.01.01

Posted by 덱스터

2010. 7. 14. 16:39 Physics/Concepts

Hamiltonian formulation(1)

2009/05/06 - Lagrangian formulation(1)

Electromagnetism in Schrodinger Eqn.이라는 글을 쓰다가 생각해보니 쓸데없는 식이 들어와 글을나누었다. 그러면 일단, 시작해보자.

Lagrangian을 사용하는 역학을 조금만 비틀어주면 Hamiltonian을 사용하는 정석적(?)인 Hamilton역학을 얻는다. 먼저 Lagrangian의 정의는 운동에너지와 위치에너지의 차이이다. 이 내용을 수식으로 쓴다면

$$L(q_i,\dot{q_i},t)=T-V=\frac12mv^2-V$$

이다. 그리고 Lagrangian을 이용한 운동방정식(Euler-Lagrange equation이라고 부른다)은 각 일반화된 좌표(generalized coordinates) q_i마다 다음과 같다.

$$\frac{\partial{L}}{\partial{q_i}}-\frac{d}{dt}\frac{\partial{L}}{\partial{\dot{q_i}}}=0$$

여기에 Legendre 변환만 취해주면 Hamiltonian을 얻는다. 치환하고자 하는 물리량은 일반화된 속도 벡터.(좌표의 시간변화율을 말한다.) 일단 Lagrangian을 좌표의 시간변화율로 편미분해주자.

$$p_i=\frac{\partial L}{\partial\dot {q_i}}$$

이 값을 conjugate momentum이라고 부른다. 이제 Legendre 변환을 취한다.

$$H(q_i,p_i,t)= \sum_i p_i\dot{q_i}-L(q_i,\dot{q_i},t)$$

독립변수가 변하는 것에 주목할 것.(일반적으로 우변의 항은 일반좌표의 시간변화율 d(q_i)/dt가 남아있기 때문에 Hamiltonian으로 쓰려면 모두 p_i로 바꾸어야 한다.) 좌표를 일반적인 직교좌표계로 두고 계산해보자.

$$p_i=\frac{\partial L}{\partial\dot{x_i}}=m\dot{x_i}\\H= \sum_i p_i\dot{x_i}-L=\sum_i\frac12m\dot{x_i}^2+V\\H=\sum_i\frac{{p_i}^2}{2m}+V$$

얼레. 에너지다.(독립변수인 p_i로 쓴 점에 유의) 이래서 보통 Hamiltonian을 에너지라고 해석하기도 한다(양자역학을 배울 때 Hamiltonian을 에너지라고 가르치기도 하는데 그 이유가 여기있다). 그렇다면 운동방정식은 어떻게 될까? 우선 Lagrangian을 쓸 때 운동방정식은 이것이었다.

$$\frac{\partial{L}}{\partial{q_i}}-\frac{d}{dt}\frac{\partial{L}}{\partial{\dot{q_i}}}=0$$

Hamiltonian은 일반좌표의 성분이 전부 Lagrangian에서 나오기 때문에(Hamiltonian은 Lagrangian의 일반좌표 q_i와 일반좌표의 시간변화율 d(q_i)/dt 두 독립변수 중 시간변화율을 conjugate momentum으로 바꾼 것이다. 따라서 앞쪽의 p_i는 일반좌표 q_i와 독립적인 변수가 되고, 따라서 편미분하면 0이 된다.)^[각주:1] 위의 식을 이렇게 바꿀 수 있다.

$$\frac{\partial L}{\partial q_i}=-\frac{\partial H}{\partial q_i}=\frac d{dt}\frac{\partial L}{\partial \dot{q_i}}=\dot {p_i}\\\frac{\partial H}{\partial q_i}=-\dot{p_i}$$

하나의 운동방정식을 구했다. 이제 두 번째 운동방정식을 구할 차례다.(Lagrangian의 운동방정식이 N차원 변수 x의 값과 그 시간변화율에 대한 2계도함수라면 Hamiltonian의 운동방정식은 N차원 변수 x와 N차원 변수 p에 대한 1계도함수이다. 따라서 하나씩 더 필요.) 우선 Lagrangian과 Hamiltonian의 완전미분을 생각해보자.

$$dH= \sum_i (\dot{q_i}~dp_i + p_i~d\dot{q_i})-dL \\dL=\sum_i\left(\frac{\partial L}{\partial\dot {q_i}}~d\dot{q_i}+\frac{\partial L}{\partial{q_i}}~dq_i\right)+\frac{\partial L}{\partial t}dt$$

식을 정리하면 다음처럼 된다.(p_i의 정의를 이용)

$$dH= \sum_i \left(\dot{q_i}~dp_i + p_i~d\dot{q_i}-\frac{\partial L}{\partial\dot {q_i}}~d\dot{q_i}-\frac{\partial L}{\partial{q_i}}~dq_i\right)-\frac{\partial L}{\partial t}dt \\dH= \sum_i \left(\dot{q_i}~dp_i -\frac{\partial L}{\partial{q_i}}~dq_i\right)-\frac{\partial L}{\partial t}dt$$

그런데 Hamiltonian은 conjugate momentum과 일반화된 좌표, 시간에 대한 종속변수이므로

$$dH= \sum_i\left(\frac{\partial H}{\partial{p_i}}~dp_i+\frac{\partial H}{\partial{q_i}}~dq_i\right)+\frac{\partial H}{\partial t}dt$$

가 되어여만 한다.(완전미분의 정의를 생각해보자.) 언제 어디서나 어떤 경우에도 바로 위의 식과 그 위의 식이 일치해야 하므로, 우리가 내릴 수 있는 결론은

$$\frac{\partial H}{\partial{p_i}}=\dot{q_i}~,~\frac{\partial H}{\partial t}=-\frac{\partial L}{\partial t}$$

이다. 그리고 Hamiltonian을 시간에 대해 완전 미분한 결과는

$$\frac{dH}{dt}=\sum_i\left(\frac{\partial H}{\partial{p_i}}~\dot{p_i}+\frac{\partial H}{\partial{q_i}}~\dot{q_i}\right)+\frac{\partial H}{\partial t} \\=\sum_i\left(-\frac{\partial H}{\partial{p_i}}\frac{\partial H}{\partial{q_i}}+\frac{\partial H}{\partial{q_i}}\frac{\partial H}{\partial{p_i}}\right)+\frac{\partial H}{\partial t} \\=\frac{\partial H}{\partial t}$$

이라 Hamiltonian이 시간에 대한 explicit dependence가 없을 경우 일정한 값을 갖는다.

Lagrangian을 쓸 때와 Hamiltonian을 쓸 때의 차이점은 Lagrangian이 N개의 차원을 갖는 일반화된 좌표공간에서의 움직임을 2계도함수로 풀 때(Euler-Lagrange 방정식이 2계도함수이다) Hamiltonian은 2N차원의 일반화된 좌표-운동량공간(위상공간-phase space-으로 부른다)에서의 움직임을 1계도함수로 푼다는 것이다. 작아 보이는 차이지만 좌표와 좌표의 시간변화율은 완전히 독립이 아니기 때문에 perturbation을^[각주:2] 다룰 경우 Hamiltonian이 유리하다고 한다.(좌표와 운동량은 독립된 변수로 취급한다.)

다음번에는 Classical Dynamics of Particles and Systems 5판 7.11에 Hamilton's principle을 꼬아서 운동방정식을 유도하는 특이한 방법이 있어서 그걸 다뤄볼 생각이다. 아직 Lagrangian formulation(2)도 쓰지 않은 판에 이걸 쓸 지는 의문이기는 하지만. 이 방법이 Feynman의 경로적분(path integral)과 밀접한 관련이 있어보이는데 그것까지 할 지는 모르겠다.

ps. 고전역학에서 양자역학으로 넘어가는 데에는 위에 나온 미분방정식들보다는 푸아송 괄호(Poisson bracket)가 더 큰 역할을 했다. Shankar책에서 고전적인 계가 어떻게 양자역학적으로 바뀌는지에 대한 부분이 나오는데(아마 quantization이라고 하면서 푸아송 괄호를 commutator로 바꾸고 값에 ih-bar를 붙였던 것 같다) 참조하면 좋을 것이다.

그런데 그냥 변수가 다르니 편미분하면 0이라고 생각하는게 쉬울지도... [본문으로]
Perturbation theory란 정확한 값을 구할 수 없기 때문에 근사값을 점차 좁혀가는 방법을 말한다. 원주율을 유리수의 합으로 계산하는 것과 비슷하다. [본문으로]

저작자표시 비영리 변경금지

'Physics > Concepts' 카테고리의 다른 글

열역학 제 2 법칙과 엔트로피 증가의 법칙 (3)	2010.11.22
엔트로피 - 고전적인 정의 (7)	2010.08.03
Contravariant/Covariant/Metric tensor와 Kronecker delta (2)	2010.02.28
자기 단극자, Dirac String, 기타 등등 (0)	2010.01.01
Lagrangian formulation(1) (2)	2009.05.06

Posted by 덱스터

1 2

« | » 2025.3
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

'Physics/Concepts'에 해당되는 글 35건

'Physics > Concepts' 카테고리의 다른 글

'Physics > Concepts' 카테고리의 다른 글

'Physics > Concepts' 카테고리의 다른 글

'Physics > Concepts' 카테고리의 다른 글

'Physics > Concepts' 카테고리의 다른 글

'Physics > Concepts' 카테고리의 다른 글

'Physics > Concepts' 카테고리의 다른 글

'Physics > Concepts' 카테고리의 다른 글

'Physics > Concepts' 카테고리의 다른 글

'Physics > Concepts' 카테고리의 다른 글

'Physics > Concepts' 카테고리의 다른 글

'Physics > Concepts' 카테고리의 다른 글

'Physics > Concepts' 카테고리의 다른 글

'Physics > Concepts' 카테고리의 다른 글

'Physics > Concepts' 카테고리의 다른 글

'Physics > Concepts' 카테고리의 다른 글

'Physics > Concepts' 카테고리의 다른 글

'Physics > Concepts' 카테고리의 다른 글

'Physics > Concepts' 카테고리의 다른 글

'Physics > Concepts' 카테고리의 다른 글

카테고리

태그목록

공지사항

달력

최근에 올라온 글

최근에 달린 댓글

글 보관함

티스토리툴바