Physicists know they can approximate everything by harmonic oscillators, though.

- R. Chapling(https://rc476.user.srcf.net/asymptoticmethods/am_notes.pdf)

최근 논문을 쓰며 망각의 늪(?)에 방치해두었던 미분방정식에 대한 지식을 다시 되살려야 할 필요가 있어서 간단하게 작성해보는 시리즈. Green's function과 Sturm-Liouville 문제에 기회가 되면 특수함수와 Lie군을 다뤄보고 싶은데 마지막 항목은 초기하함수와 SL(2,R)군 사이의 관계에 대해서는 공부해야 할 필요가 있어서 할 수 있을지 모르겠다. 언제나(?) 그렇듯 미분방정식은 2계미분방정식만 고려할 생각.

 

어차피 편미분방정식이라고 해서 개념적으로 바뀌는 것은 없으니 상미분방정식만 생각하기로 하자. 우선은 homogeneous equation을 생각하기로 한다.

\[ \left[p(x) \frac{d^2}{dx^2} + q(x) \frac{d}{dx} + r(x) \right] f(x) = 0 \]

일반적으로 이 방정식의 해는 둘로 주어지며, 두 해를 각각 $f_1(x)$과 $f_2(x)$라고 부르기로 하자. 둘 중 하나만 알고 있을 때 다른 하나를 구하는 방법은 Kreyzig 공학수학에 나와 있을테니[각주:1] 두 해를 전부 알고 있다고 가정해도 무리는 없을 것이다.

 

homogeneous equation의 특징은 두 해 $f_1(x)$와 $f_2(x)$에 대해 두 해의 임의의 선형조합 $\alpha f_1 + \beta f_2$ 또한 homogeneous equation을 만족한다는 것이다. 선형미분방정식이 선형대수학을 만나는 지점이다. 그래서 위의 방정식을 다음과 같이 선형연산자 $\mathcal{L}$을 도입하여 선형연산자 방정식의 모양으로 바꿔 쓰기도 한다.

\[ \mathcal{L} = \left[ p(x) \frac{d^2}{dx^2} + q(x) \frac{d}{dx} + r(x) \right] \Rightarrow \mathcal{L} f(x) = 0 \]

많은 경우 homogeneous solution의 계수 $\alpha$와 $\beta$는 초기조건으로 결정하며[각주:2], 초기조건은 함수 $f(x)$의 $x=x_0$에서 함수값 $f(x_0)$와 1계미분값 $\frac{df}{dx}(x_0)$으로 주어진다. 이 문제는 다음과 같은 행렬방정식으로 나타낼 수 있다.

\[ \begin{pmatrix} f(x_0) \\ \frac{df}{dx}(x_0) \end{pmatrix} = \begin{pmatrix} f_1(x_0) & f_2(x_0) \\ \frac{df_1}{dx}(x_0) & \frac{df_2}{dx}(x_0) \end{pmatrix} \begin{pmatrix} \alpha \\ \beta \end{pmatrix} \]

위 식의 우변에 등장하는 행렬을 Wronskian matrix라고 부르며, 이 행렬의 행렬식(determinant)을 Wronskian이라고 한다. 일반적으로 Wronskian을 계산해 0이 되지 않는 것을 확인하는 것을 '구한 homogeneous solution들이 선형독립인가'를 묻는 질문이라고 말하는데, 위 행렬방정식 꼴을 보면 다음의 동등한 질문으로 바꿔 쓸 수 있음을 알 수 있다. "우변의 행렬의 역행렬을 구해 일반적인 초기조건 $f(x_0)$와 $\frac{df}{dx}(x_0)$를 만족하는 homogeneous solution을 찾을 수 있는가?"

 

그렇다면 선형대수학의 관점을 inhomogeneous equation에 어떻게 적용할 수 있을까? 일단 inhomogeneous equation을 적어보자.

\[ \left[p(x) \frac{d^2}{dx^2} + q(x) \frac{d}{dx} + r(x) \right] f_p(x) = s(x) \Rightarrow \mathcal{L} f_p = s \]

위에서 $f_p(x)$는 particular solution이라고 하며, 일반적으로 위 방정식을 만족하는 해는 homogeneous solution을 포함한 꼴인 $f_p(x) + \alpha f_1(x) + \beta f_2(x)$으로 주어진다. 여기서 자유롭게 결정할 수 있는 계수인 $\alpha$와 $\beta$를 결정하는 기준은 경계조건이 된다. 경우에 따라 위 식의 $s(x)$를 source term이라고 부르는데, 보편적으로 쓰는 용어인지는 모르겠다.

 

Green's function method는 위 식의 우변을 다음과 같이 바꿔쓸 수 있다는 점을 이용한다[각주:3].

\[ s(x) = \sum_{y} \delta(x,y) s(y) \]

일부러 Dirac delta $\delta(x,y) = \delta(x-y)$를 잘 쓰지 않는 꼴로 적어두었는데, 행렬을 적는 일반적인 방법과 유사성이 잘 드러나도록 하기 위한 조치이다[각주:4]. 만약 미분연산자 $\mathcal{L}$의 역연산자 $\mathcal{L}^{-1}$가 존재한다고 한다면, inhomogeneous equation은 양변의 좌측에 $\mathcal{L}^{-1}$를 붙여 다음과 같이 적을 수 있다.

\[ f_p(x) = \sum_{y} \left[ \mathcal{L}^{-1} \delta(x,y) \right] s(y) = \sum_{y} G(x,y) s(y) \]

미분방정식의 풀이가 행렬곱(?)으로 바뀌는 셈[각주:5]. 문제는 $G(x,y) = \mathcal{L}^{-1} \delta(x,y)$를 어떻게 구할 것이냐가 된다.

 

Green's function은 결국 다음 방정식을 푸는 문제이다.

\[ \mathcal{L} G(x,y) = \delta(x,y) \]

편의상 미분방정식을 푸는 구간을 $(a,b)$라고 하고, $a$에서의 경계조건을 만족하는 homogeneous solution을 $f_1$, $b$에서의 경계조건을 만족하는 해를 $f_2$라고 하자. $\delta(x,y)$는 $x \neq y$에서 0이기 때문에, $G(x,y)$는 대충 다음과 같은 모양을 취할 것으로 예상할 수 있다.

\[ G(x,y) \propto \left\{ \begin{aligned} f_1(x) && a \le x < y \\ f_2(x) && y < x \le b \end{aligned} \right. \]

혹은 다음과 같이 표현할 수도 있다.

\[ G(x,y) = \left\{ \begin{aligned} f_1(x) g_1(y) && a \le x < y \\ f_2(x) g_2(y) && y < x \le b \end{aligned} \right. \]

이런 때 쓰기 위해 Heaviside step function이 있지만 위 꼴이 보다 다루기 쉬우니 일단은 이 꼴을 쓰기로 하자. Green's function $G(x,y)$는 $x$에 대한 2계미분에서 Dirac delta가 나와야 하기 때문에 $x$에 대해 연속적이어야 하므로[각주:6], homogeneous solution들을 쌓아올리기 위해 도입하는 계수 $g_{1,2}(y)$는 다음 조건을 만족해야 한다.

\[ f_1(y) g_1(y) = f_2(y) g_2(y) \]

이제 이 Green's function에 대한 ansatz를 Green's function이 만족해야 하는 방정식에 집어넣어보자.

\[ \left[ \frac{d^2}{dx^2} + \frac{q(x)}{p(x)} \frac{d}{dx} + \frac{r(x)}{p(x)} \right] G(x,y) = \frac{\delta(x,y)}{p(x)} \]

Dirac delta가 들어간 방정식을 푸는 일반적인 방법은 양변에 Dirac delta의 support가 있는 neighbourhood를 적분하는 것이다.

\[ \int_{y-0^+}^{y+0^+} dx \left[ \frac{d^2}{dx^2} + \frac{q(x)}{p(x)} \frac{d}{dx} + \frac{r(x)}{p(x)} \right] G(x,y) = \int_{y-0^+}^{y+0^+} dx \frac{\delta(x,y)}{p(x)} \]

위 식을 계산하게 되면 다음과 같은 조건을 얻게 된다.

\[ \frac{d G(x = y + 0^+,y)}{dx} - \frac{d G(x = y - 0^+,y)}{dx} = f_2'(y) g_2(y) - f_1'(y) g_1(y) = \frac{1}{p(y)} \]

1계미분에 대한 적분은 Green's function이 연속적이라는 조건 때문에 사라진다. 위의 연속성 조건이랑 병렬로 놓고 보면 어디서 많이 본 것 같은 꼴이지 않은가? 두 조건을 행렬방정식으로 적어보자.

\[ \begin{pmatrix} 0 \\ \frac{1}{p(y)} \end{pmatrix} = \begin{pmatrix} f_1(y) & f_2(y) \\ \frac{df_1}{dx}(y) & \frac{df_2}{dx}(y) \end{pmatrix} \begin{pmatrix} - g_1(y) \\ g_2(y) \end{pmatrix} \]

역행렬을 계산해서 $g_1$과 $g_2$를 풀면 다음과 같은 답을 얻는다.

\[ \begin{pmatrix} - g_1(y) \\ g_2(y) \end{pmatrix} = \frac{1}{Wr[f_1,f_2](y)} \begin{pmatrix} \frac{df_2}{dx}(y) & - f_2(y) \\ - \frac{df_1}{dx}(y) & f_1(y) \end{pmatrix} \begin{pmatrix} 0 \\ \frac{1}{p(y)} \end{pmatrix} = \frac{1}{p(y) Wr[f_1,f_2](y)} \begin{pmatrix} - f_2(y) \\ f_1(y) \end{pmatrix} \]

여기서 $Wr[f_1,f_2] = f_1 f_2' - f_2 f_1'$는 Wronskian이다. 결론적으로, Green's function은 다음과 같이 적을 수 있다.

\[ G(x,y) = \left\{ \begin{aligned} \frac{f_1(x) f_2(y)}{p(y) Wr[f_1,f_2](y)} && a \le x < y \\ \frac{f_2(x) f_1(y)}{p(y) Wr[f_1,f_2](y)} && y < x \le b \end{aligned} \right. \]

  1. 아마 $f_2 (x) = u(x) f_1 (x)$꼴의 ansatz를 써서 $u(x)$에 대해 푸는 방법이었던 것 같다 [본문으로]
  2. 경계조건으로 결정하기도 하지만 그쪽은 Sturm-Liouville 문제의 맥락에 어울린다. [본문으로]
  3. 일반적으로 적분을 적는 곳에 합을 적어둔 것이 불편할 수 있는데, 적분과 합은 본질적으로 동일하다. [본문으로]
  4. 또한 이렇게 쓰면 항등행렬(identity matrix)과 Dirac delta가 본질적으로는 같다는 사실이 매우 명확해진다. [본문으로]
  5. 다만 이 방법이 작동하려면 $s(y)$가 "너무 크지 않다"는 조건이 필요하다. 보통 $L^1$ 조건(함수의 절대값을 전체 구간에서 적분한 값이 유한할 것)을 만족하면 문제는 없다고 생각하면 된다. [본문으로]
  6. 전문적인 용어로 $x$에 대해 $C^0$. 만약 연속성이 없다면 1계미분에서 Dirac delta가 나오고 2계미분은 Dirac delta의 미분이 되어 우변을 만족할 수 없게 된다. [본문으로]
Posted by 덱스터


오늘도 하라는 공부는 안 하고 트위터에서 놀다가 함수해석학과 양자역학 이야기가 나와서 위 글을 다시 검토하던 중, '유한 차원에서라면-선형대수학의 영역이라면- 교환자(commutator)가 identity의 상수배가 나오지 않는다는 것을 증명할 수 있지 않을까?'란 생각이 들었다. 결론: 매우 쉽게 보일 수 있다.


아이디어는 매우 쉽다. 2×2 행렬은 Pauli matrice에 identity를 더해 기저로 잡은 복소수체 벡터공간의 원소로 생각할 수 있다. 3×3 행렬은 Gell-mann matrice에 identity를 더하면 된다. 일반적으로 n×n 행렬은 SU(n) 군의 생성자(generator)에 identity를 더해 기저로 잡은 복소수체 벡터공간의 원소로 생각할 수 있다.


\text{In general, a }n\times n\text{ matrix can be thought as} \\\text{an element of a vector space spanned by the set} \\\\\{I,g_1,g_2,\dots,g_{n^2-1} \} \\\\\text{where }I\text{ is the identity matrix and }g_i\text{'s are the} \\\text{generators of SU(}n\text{) group. Note that all bases} \\\text{except for }I\text{ are traceless.}


이제 n×n 행렬 두개를 가져다 교환자를 구성한 뒤 trace를 구하면 0이 됨을 쉽게 알 수 있다. 그런데 identity는 trace가 n이므로, identity의 상수배는 trace가 0일 수 없다. 따라서 유한차원에서 작용하는 연산자(operator)들의 교환자는 identity의 상수배가 될 수 없다.


\text{Let }A\text{ and }B\text{ be arbitrary }n\times n\text{ matrices and let} \\\\A=\alpha_0I+\alpha_ig_i, B=\beta_0I+\beta_ig_i \\\\\text{where summation over }i\text{ is implied. Then the trace} \\\text{of the commutator }[A,B]=AB-BA\text{ vanishes.} \\\\Tr([A,B])=Tr(\gamma_ig_i)=0 \\\gamma_i=\sum_{j,k}C_{ijk}\alpha_j\beta_k \\\\\text{The }C_{ijk}\text{'s are the structure constants. Since identity} \\\text{and its scalar multiple cannot be traceless, commutators} \\\text{in finite dimensional linear algebra cannot be a multiple} \\\text{of identity.}


이제 함수해석학을 배워야 하는 이유가 하나 더 추가되었다(...)




수정: 잠결에 생각해보니 너무 어렵게 풀었네요. 결론은 똑같지만 trace가 0이어야 한다는 것은 다음 trace의 기본 성질로부터 훨씬 쉽게 보일 수 있습니다.


\text{Trace has the following properties} \\\\Tr(cA+dB)=cTr(A)+dTr(B) \\Tr(AB)=Tr(BA) \\\\\text{where lowercase letters are scalars. Therefore} \\\\Tr([A,B])=Tr(AB)-Tr(BA)=0


그러면 위에서 일반적인 연산자를 identity와 SU(n) 군의 생성자를 이용한 기저로 나타내는 것이 무슨 의미를 갖는지 생각해볼 수 있겠죠. 알려진 것과 같이 양자역학에서는 모든 측정가능량이 연산자로 주어집니다. 그리고 임의의 측정량이 있을 때, 여기에 identity의 상수배를 더하는 것은 측정량의 기준점을 이동한다는 의미가 됩니다. 단순히 모든 고유값(eigenvalue)들을 일정한 값만큼 이동하는 것과 동일하니까요. 따라서 identity는 실제 물리적인 의미를 갖는 부분이 아니라고 생각할 수 있습니다. 결국 n개의 독립적인 상태를 가질 수 있는 계가 있다면 이 계에서 얻을 수 있는 모든 측정량들은 SU(n) 리 대수(Lie algebra)의 원소로 생각할 수 있다는 뜻이 되겠죠. 이젠 군론을 배웁시다 야호!


Posted by 덱스터

이전에 쓴 글 중 양자역학의 유래라는 글이 있었다. 현대 양자역학의 근간이 되는 파동방정식 풀이법과 행렬을 이용한 선형대수 연산 및 고유값을 사용하게 된 기원 등을 다룬 글인데,[각주:1] 오랜만에 덧붙일만한 내용이 생각나서 새로운 글을 쓰기로 했다.

 

저번 글에서 양자역학이 형성되어 온 두가지 갈래길을 알아보았다. 이번에는 그 두 갈래길이 남아 아직도 영향을 미치고 있는 묘사(picture)에 대해 살펴보자.

 

수업을 듣던 중 교수님께서 에너지나 운동량 등의 측정값이 양자화되는 이유를 질문하셨다. 누군가가 경계조건(boundary condition)으로 고유값이 결정되기 때문이라고 했고 교수님은 공부를 열심히 했다고 칭찬하시고는 넘어가셨는데 필자가 보기에는 반만 맞는 답이었다. 하지만 타과생인지라 물리학과에 반기를 들기보다는 조용히 넘어갔다. 어째서 반만 맞는 답일까?

 

양자역학은 두 경로를 통해 발전했다. 하나는 슈뢰딩거(Erwin R. Schrödinger)의 '파동성을 핵심으로 하는 파동역학'이고, 나머지 하나는 하이젠베르크(Werner Heisenberg)의 '양자성을 핵심으로 하는 행렬역학'이다. 파동역학을 양자역학의 원류로 본다면 물리량이 양자화되는 이유는 경계조건이 존재하기 때문인 것이 맞다. 하지만 행렬역학을 양자역학의 원류로 본다면 물리량의 양자화는 공리(postulate)가 된다. 실제 양자역학은 두 원류가 합쳐진 형태로 발전했기 때문에 이런 의미에서 그 답은 반만 맞는 것이다. 그렇다면 이 두가지 관점은 어떻게 남아있을까?

 

슈뢰딩거의 파동역학은 전자파(electron wave-electromagnetic wave가 아니다!)와 같이 물체에게 파동성이 존재하므로 이미 존재하는 파동광학 등의 결과를 물질로 확장하는 것으로부터 출발하였다. 때문에 시간에 따라 변하는 것은 물질의 상태(state)가 되고, 이것이 반영되어 측정하는 물리량(operator를 말한다)은 시간에 불변하는 것으로 간주되었다. 빛이 화면에 닿아 상을 만들 때 화면의 상태가 변하기 때문에 화면에 그려지는 상이 변화한다고 보기보다는 빛의 상태가 변하기 때문에 상이 변화한다고 생각하는 것이 더 자연스럽지 않은가? 우리가 존재하는 공간이 변화한다고 보는 것보다는 그 공간에 놓인 물질이 변화한다고 보는 것이 아무래도 자연스럽기 때문에 대부분의 학부 양자역학 교재에서는 슈뢰딩거 묘사(Schrödinger picture)를 쓰는 경우가 많다. 슈뢰딩거 묘사를 쓸 경우 운동방정식은 다음과 같다. 잘 보면 고전적인 파동방정식과 닮았다.

 

$$\dot{\left|\psi\right>}=\frac{\mathbf{H}}{i\hbar}\left|\psi\right>$$

 

이번엔 하이젠베르크의 행렬역학을 따라가 보자. 하이젠베르크의 행렬역학은 전 글에서 설명했다시피, 물리량을 측정할 경우 그 값이 양자성을 가진다는 것에서부터 출발하였다. 수소원자스펙트럼은 불연속적으로 분포되어있지 않은가. 그렇기 때문에 하이젠베르크에게 변화하는 것은 물질의 상태가 아닌 물질의 측정값, 즉 물리량이 변화하게 된다. 같은 물질을 다른 시간에 측정하면 다른 물리량을 내놓는 것이므로 물질은 그대로 있고 물리량이 변화해야 한다는 의미이다. 안을 알 수 없는 기계장치가 들어있는 상자가 있고 그 상자의 벽에 화면이 설치되어 있어 시시각각 변화하는 숫자를 보여준다고 상상해보자. 이 경우 상자 자체가 변화한다기 보다는 상자의 화면에 찍히는 숫자가 변화한다고 보는 것이 자연스럽다. 하이젠베르크 묘사(Heisenberg picture)를 쓸 경우 운동방정식은 다음과 같다. 해밀토니안 역학에서 이런 방정식을 본 적이 있을 것이다.

 

$$\dot{\mathbf{A}}=\frac1{i\hbar}\left[\mathbf{A},\mathbf{H}\right]+\frac\partial{\partial{t}}\mathbf{A}$$

 

마지막으로 흔히 상호작용 묘사(interaction picture) 혹은 폴 아드리엔 모리스 디락(Paul Adrien Maurice Dirac)의 이름을 딴 디락 묘사(Dirac picture)를 생각해보자. 이 묘사방법은 양자장론(Quantum Field Theory)이 등장하면서 입자가 만들어지고 사라지기니 특정한 상태를 규정짓기가 힘들어지자 도입한 것으로 볼 수 있다. 물리적인 계(system)의 진화를 규정짓는 것이 해밀토니안(Hamiltonian)인데 이 묘사에서는 해밀토니안을 두가지로 나눈다. 일반적으로 우리가 측정하는 '입자'를 만들어주는 자유장 해밀토니안(free field Hamiltonian)과[각주:2] 이 입자들 사이의 상호작용을 기술하는 상호작용 해밀토니안(interaction Hamiltonian)으로 나누고, 각각 H_0와 H_int로 이름붙인다. 우리가 측정하는 모든 물리량은 자유장 해밀토니안에 따라 변화하고, 우리가 측정할 대상이 되는 상태들은 상호작용 해밀토니안에 따라 변화한다. 하이젠베르크 묘사를 설명하면서 쓴 예제를 사용해 본다면 상자의 화면에 등장하는 숫자가 변화하는데, 상자 자체도 조금씩은 모양을 바꾼다는 것으로 생각할 수 있다. 상자의 모양에 따라 화면에 등장하는 숫자 또한 영향을 받는다면 1. 상자의 모양마다 숫자가 어떻게 나타나는지 2. 상자의 모양이 시간에 따라 어떻게 변화하는지로 나누어 설명하는 것이 편리하다. 때문에 상호작용 묘사에서는 운동방정식이 조금 복잡하다.

 

$$\mathbf{H}=\mathbf{H_0}+\mathbf{H_{int}}\\ \dot{\mathbf{A}}=\frac1{i\hbar}\left[\mathbf{A},\mathbf{H_0}\right]+\frac\partial{\partial{t}}\mathbf{A}\\ \dot{\left|\psi\right>}=\frac{\mathbf{H_I}}{i\hbar}\left|\psi\right>\\\\ \text{where }\mathbf{H_I}\text{ is the solution of}\\ \dot{\mathbf{H_I}}=\frac1{i\hbar}\left[\mathbf{H_I},\mathbf{H_0}\right]+\frac\partial{\partial{t}}\mathbf{H_I}\\ \mathbf{H_I}(t=t_0)=\mathbf{H_{int}}$$

 

물리 덕후 소리를 들을 정도로 이곳 저곳 다 파고 들어가며 닥치는대로 공부하다 보니 물리학 개념이 어떻게 발전해왔는가에 대해서도 이것 저것 알게 된 것이 많다. 아무래도 이런 이해가 있다 보니까 정리가 좀 잘 되는듯. 다음 학기 학부 졸업논문이나 잘 써야 할텐데...

  1. 엄청나게 많은 깨져있는 수식을 복구하느라 조금 힘들었다. 이런 글 엄청 많을텐데...ㅠㅠ [본문으로]
  2. 이 '입자들'로 상태공간을 확장(span)하기 때문이다. 아무래도 알기 쉬운 것들로 공간을 나타내는 것이 더 보기 좋으니까. [본문으로]
Posted by 덱스터
이전버튼 1 이전버튼

블로그 이미지
A theorist takes on the world
덱스터
Yesterday
Today
Total

달력

 « |  » 2024.4
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30

최근에 올라온 글

최근에 달린 댓글

글 보관함