カテゴリー「サイエンス」の12件の記事

2018年6月17日 (日)

最小二乗法の心(2)

前回のブログ を書いた後、最小二乗法について検索してみました。

正規方程式

前記事にも追記していますが、あの「デタラメな」解法には裏付けがあり、式 (1) は正規方程式と呼ばれるものとのことです。

\[ {}^t\!X\boldsymbol{y} = {}^t\!XX\boldsymbol{\alpha} \tag{1} \]

正規方程式は次のように求まります。式 (2) のように両辺が必ずしも一致していない時に近似解を求めることを考えます。

\[ \boldsymbol{y} \fallingdotseq X\boldsymbol{\alpha} \tag{2} \]

式 (2) の両辺の差(の二乗)は式 (3) になります。

\[\begin{align} \|X\boldsymbol{\alpha} - \boldsymbol{y}\|^2 &= ({}^t\!\boldsymbol{\alpha}{}^t\!X - {}^t\!\boldsymbol{y})(X\boldsymbol{\alpha} - \boldsymbol{y})\\ &= {}^t\!\boldsymbol{\alpha}{}^t\!XX\boldsymbol{\alpha} - 2\ {}^t\!\boldsymbol{\alpha}{}^t\!X\boldsymbol{y} +{}^t\!\boldsymbol{y}\boldsymbol{y} \tag{3} \end{align}\]

式 (3) が最小となる時、即ち式 (3) を \(\boldsymbol{\alpha}\) で微分したものが \(0\) となる時、正規方程式 (1) が導かれます。なお、 \(\boldsymbol{\alpha}\) での微分とは勾配( \(\alpha\) による \(\operatorname{grad}\) )のことです。

距離(の2乗)を最小にしたら?

最小二乗法は y 方向の誤差(の2乗)が最小になるような直線を決定するわけですが、データと直線との距離(の2乗)が最小になるように直線を決定してはどうかという件について、幾つか記事が有りました。特に 相関係数に関する一考察 に詳しい考察が有ります。その記事では \(x\),\(y\) の入れ替えやデータの回転に対する回帰直線の性質を考察しています。それらについては、重要性が理解できなかったのですが、終わりの方で、直線との距離(の2乗)が最小になるような直線は「多変量解析の主成分分析に対応しているようである」と有ったのに興味が惹かれました。

他の記事で、最小二乗法で求めた回帰直線の特徴として、以下のことが記されていました。

  • 誤差の平均は \(0\)
  • 分散が最小になる

この特徴が、直線との距離(の2乗)が最小になるような直線の場合はどうなるのか興味が有りますが、自力で解決するのはチョット・・・。

最後に、直線 \(y=ax+b\) とデータ \((x_i,\ y_i)\) との距離の2乗を書いておきます。これが最小になる直線が気になるのでした。

\[ \sum\frac{(y_i - ax_i - b)^2}{(a^2 + 1)} \]

2018年6月12日 (火)

最小二乗法の心

YouTube で見た数学動画からのネタ第2弾です。動画は下記に有ります。

【大学数学】最小二乗法(回帰分析)【確率統計】

\((x_i,\ y_i)\quad i=1,\dots,n\) をデータとしたとき、最小二乗法で直線 \(y=ax+b\) の傾き \(a\) と切片 \(b\) を求めよという問題です。動画では

\[ \sum (y_i - ax_i - b)^2 \tag{1} \]

が最小になるように \(a\), \(b\) を求めています。

ここでは、別の方法で \(a\), \(b\) を求めることにします。まず \(y_i = ax_i + b\quad i=1,\dots,n\) を行列を用いて式 (2) のように書きます。

\[ \begin{pmatrix} y_1\\ \vdots\\ y_n \end{pmatrix} = \begin{pmatrix} x_1 & 1\\ \vdots & \vdots\\ x_n & 1 \end{pmatrix} \begin{pmatrix} a\\ b \end{pmatrix} \tag{2} \]

これを \(\boldsymbol{y}=X\boldsymbol{\alpha}\) と置くことにします。式 (2) から \(a,\ b\) を求めたいのですが、行列 \(X\) が正方行列でないため一般に解は有りません。それでも無理矢理 \(a,\ b\) を求めるために、式 (2) の両辺に \({}^t\!X\) を掛けることで \(\boldsymbol{\alpha}\) に掛かる行列を正方行列にします。

\[\begin{align} {}^t\!X\boldsymbol{y}&={}^t\!XX\boldsymbol{\alpha}\\ \begin{pmatrix} \sum x_iy_i\\ \sum y_i \end{pmatrix} &= \begin{pmatrix} \sum x_ix_i & \sum x_i\\ \sum x_i & n \end{pmatrix} \begin{pmatrix} a\\ b \end{pmatrix} \tag{3} \end{align}\]

そして、式 (3) を解いて \(a,\ b\) を求めると、それが最小二乗法の解になります。

\[ \frac{1}{\sum{x_ix_i}n-\sum{x_i}\sum{x_i}} \begin{pmatrix} n & -\sum{x_i}\\ -\sum{x_i} & \sum{x_ix_i} \end{pmatrix} \begin{pmatrix} \sum{x_iy_i}\\ \sum{y_i} \end{pmatrix} = \begin{pmatrix} a\\ b \end{pmatrix} \]

このデタラメな方法でうまく行く根拠は説明できないのですが、何故か最小二乗法の答えに一致するのです。

追記1:下記に説明が有りました。

最小二乗法の行列表現(単回帰,多変数,多項式)

ところで、式 (1) で \(ax_i+b\) は直線上の点です。したがって、式 (1) は \(y\) 方向の誤差(距離)を考えていることになります。即ち、最小二乗法は \(y\) 方向の誤差が最小になる直線を求めているわけです。しかし、本当の距離はデータから直線に下した垂線の長さなのだから、その長さが最小になる直線を考えるべきだと思うのですが、どうなのでしょうか?

y 方向の誤差 直線とデータとの距離

2018年5月 5日 (土)

ある漸化式の一般項

YouTube で数学の大学入試問題を解説している動画が幾つも有り、そのうちの1つで扱っている問題に興味を持ったので、それについて書きます。動画は次の所に有ります。

YouTube の動画:横浜市立(医)漸化式

問題は、次の漸化式の一般項を求めよというものです。

\[ a_{n+2} - 5a_{n+1} + 6a_n - 6n = 0 \tag{1}\\ a_1 = a_2 = 1 \]

おそらく、動画でやっている方法が普通の解法だと思うのですが、ここでは、行列を用いてこの問題を解いてみることにします。

式 (1) において、 \(6n\) が無ければ、次の式 (2) で行列のn乗を計算すれば良いのですが、 \(6n\) が有るのでそう単純ではありません。一工夫必要になります。

\[ \begin{pmatrix} a_{n+2}\\ a_{n+1} \end{pmatrix} = \begin{pmatrix} 5 & -6\\ 1 & 0 \end{pmatrix}^n \begin{pmatrix} a_2\\ a_1 \end{pmatrix} \tag{2} \]

式 (1) を行列で表すと式 (3) になります。

\[\require{color} \begin{pmatrix} a_{n+2}\\ a_{n+1}\\ b_{n+1}\\ 1 \end{pmatrix} = \begin{pmatrix} 5 & -6 & \textcolor{red}6 & 0\\ 1 & 0 & 0 & 0\\ 0 & 0 & 1 & 1\\ 0 & 0 & 0 & 1 \end{pmatrix}^n \begin{pmatrix} a_2\\ a_1\\ b_1\\ 1 \end{pmatrix} \tag{3} \]

この行列の右下部分

\[\begin{array}{cc} 1 & 1\\ 0 & 1 \end{array}\]

が工夫した箇所です。この部分は

\[ \begin{pmatrix} n+1\\ 1 \end{pmatrix} = \begin{pmatrix} 1 & 1\\ 0 & 1 \end{pmatrix} \begin{pmatrix} n\\ 1 \end{pmatrix} \]

のように、特定の要素を 1 大きくする働きが有ります。したがって、初期値を適当に選べば、その要素は項番号と同じものになります。これと式 (3) の第1行3列の \(6\) とで \(6n\) の働きをさせることが出来ます。

さて、式 (3) の行列を \(A\) と置きます。 \(A\) のn乗を計算するために、 \(A\) を式 (4) のように分解します。

\[ A = PJP^{-1} \tag{4} \]

\(J\) は対角行列・・・にしたいところなのですが、今回の \(A\) は対角化出来ないのが悩ましいところです。とりあえず、なるべく対角行列に近いものに変形します( Jordan 標準形)。 \(A\) の特性方程式

\[ \det(x - A) = (x - 3)(x - 2)(x - 1)^2 = 0 \]

より、固有値は \(x = 3, 2, 1\) となります。これらの固有値に対応するベクトル \(\boldsymbol{p}_1, \boldsymbol{p}_2, \boldsymbol{p}_3, \boldsymbol{p}_4\) を並べると \(P\) が求まり、式 (5) になります(この辺りの計算が面倒です)。固有値 \(1\) は重複しているので、それに対応するベクトル(独立なもの)も2つ並べています。

\[ P = (\boldsymbol{p}_1 \boldsymbol{p}_2 \boldsymbol{p}_3 \boldsymbol{p}_4) = \begin{pmatrix} 3 & 2 & 6 & 18\\ 1 & 1 & 6 & 12\\ 0 & 0 & 2 & 1\\ 0 & 0 & 0 & 2 \end{pmatrix} \tag{5} \]

この時 \(J\) は式 (6) になります。

\[ J = \begin{pmatrix} 3 & 0 & 0 & 0\\ 0 & 2 & 0 & 0\\ 0 & 0 & 1 & 1\\ 0 & 0 & 0 & 1 \end{pmatrix} \tag{6} \]

以上より \(A^n\) が求まります。

\[\begin{align} A^n &= PJ^nP^{-1}\\ &= P \begin{pmatrix} 3^n & 0 & 0 & 0\\ 0 & 2^n & 0 & 0\\ 0 & 0 & 1 & n\\ 0 & 0 & 0 & 1 \end{pmatrix} P^{-1} \end{align} \tag{7} \]

ここに \(P^{-1}\) は式 (8) となっています。

\[ P^{-1} = \frac{1}{4} \begin{pmatrix} 4 & -8 & 12 & 6\\ -4 & 12 & -24 & -24\\ 0 & 0 & 2 & -1\\ 0 & 0 & 0 & 2 \end{pmatrix} \tag{8} \]

そして、式 (3) で \(a_2 = a_1 = 1, b_1 = 1\) とおいて計算すると一般項は式 (9) となります。ただし、式 (9) で求まるのは \(a_{n+2}\) なので \(a_n\) に書き換えた方が良いかも知れません。

\[ a_{n+2} = \frac{1}{2}(7\cdot 3^{n+1} - 20\cdot 2^{n+1} + 6n + 21) \tag{9} \]

以上の方法は、連立方程式を解いたり、逆行列を求めたりと手間がかかるので、入試問題の解法としては適さないでしょう。その点で YouTube で示された方法が良いと思います。そもそも、ここで行った行列に関する操作は、高校の範囲を越えていますし。しかし、遷移行列という単純なアイデアで解いて行くところは気に入っています。

2018年2月17日 (土)

ドレスト光子の本買いました

ドレスト光子についての本「ドレスト光子」 (ISBN978-4-254-21040-8) を買いました。「ドレスト光子」で検索すると、種々の書籍通販サイトの当該書籍ページが幾つもヒットします。極め付けは当該書籍の閲覧ページです。
「ドレスト光子」の閲覧
ただし、ここで見れるのは第2章のみです。これを見て、面白そうだったので購入しました(印刷の普通の本)。

2章、4章そして付録Aがドレスト光子の質量獲得を理解するための参考になりそうなので、そこを重点的に読んでいます。計算は丁寧に説明されています。丁寧過ぎて、木を見て森を見ずという感は有ります--読む側の能力の問題なのですが。この本を読む目的は、ドレスト光子の質量獲得の理解ですが、そこに到達するには暫く掛かりそうです。取り敢えず、気付いたことを書いてみます。

ドレスト光子の意味

「ドレスト光子」は dressed phton 即ち、ドレスを纏った光子のことです。では、ドレスを纏った光子とはどういう意味でしょうか。それは、以下のようになっています。

ナノ寸法領域での光と電子・正孔のハミルトニアンは式 (1) になります。

\[\begin{align} \hat{H} = &\sum_{\boldsymbol{k}\lambda}\hbar\omega_{\boldsymbol{k}}\hat{a}^\dagger_{\boldsymbol{k}\lambda}\hat{a}_{\boldsymbol{k}\lambda}\\ &+ \sum_{\alpha\gt F,\beta\lt F}(E_\alpha - E_\beta)\hat{b}^\dagger_{\alpha\beta}\hat{b}_{\alpha\beta} + \hat{H}_\mathrm{int} \tag{1} \end{align}\]

ここに \(\hat{a}^\dagger_{\boldsymbol{k}\lambda}\) (\(\hat{a}_{\boldsymbol{k}\lambda}\)) は光子の生成(消滅)演算子、 \(\hat{b}^\dagger_{\alpha\beta}\) (\(\hat{b}_{\alpha\beta}\)) は電子・正孔対の生成(消滅)演算子です。 \(\alpha, \beta\) は電子・正孔対のエネルギー準位、 \(F\) はフェルミ準位です。 \(\hat{H}_\mathrm{int}\) は光子と電子・正孔対の相互作用です。さまざまな状態の光子や電子・正孔対について和を取っていることが、ナノ寸法領域の特徴(だそう)です。

式 (1) をあれこれ変形して行くと、式 (2) のハミルトニアンが得られます。

\[\begin{align} \tilde{H} &= \hat{U}^{-1}\hat{H}\hat{U}\\ &= \sum_{\boldsymbol{k}\lambda}\sum_{\alpha\gt F,\beta\lt F}\left[ \hbar\omega'_\boldsymbol{k}\tilde{a}^\dagger_{\boldsymbol{k}\lambda}\tilde{a}_{\boldsymbol{k}\lambda} + (E'_\alpha - E'_\beta)\tilde{b}^\dagger_{\alpha\beta}\tilde{b}_{\alpha\beta} \right] \tag{2} \end{align}\]

式 (2) では、見かけ上相互作用が無くなっています。 \(a\) や \(b\) の上に付いているのが \(\hat{}\) から \(\tilde{}\) に変わっているに注意して下さい。その \(\tilde{a}\), \(\tilde{b}\) は式 (3), (4) になっています。

\[\begin{align} \tilde{a}_{\boldsymbol{k}\lambda} &= \hat{a}_{\boldsymbol{k}\lambda} - iN_\boldsymbol{k}\sum_{\alpha\gt F,\beta\lt F}\left( \rho^*_{\alpha\beta\lambda}(\boldsymbol{k})\hat{b}_{\alpha\beta} + \rho^*_{\beta\alpha\lambda}(\boldsymbol{k})\hat{b}^\dagger_{\alpha\beta} \right) \tag{3}\\ \tilde{b}_{\alpha\beta} &= \hat{b}_{\alpha\beta} - i\sum_{\boldsymbol{k}\lambda}\left( \rho_{\alpha\beta\lambda}(\boldsymbol{k})\hat{a}_{\boldsymbol{k}\lambda} + \rho^*_{\beta\alpha\lambda}(\boldsymbol{k})\hat{a}^\dagger_{\boldsymbol{k}\lambda} \tag{4} \right) \end{align}\]

式 (3) は右辺第1項の光子が第2項の電子・正孔対の衣を纏っていることを表しています。そして、 \(\boldsymbol{k}\), \(\lambda\) について和を取った \(\sum_{\boldsymbol{k}\lambda}\tilde{a}_{\boldsymbol{k}\lambda}\), \(\sum_{\boldsymbol{k}\lambda}\tilde{a}^\dagger_{\boldsymbol{k}\lambda}\) によって表される光子がドレスト光子です。また、式 (4) は光子と電子・正孔対が入れ替わってほぼ同じ形になっています。即ち、電子・正孔対も光子の衣を纏っていることになります。

グラスファイバー先端のモデル化

グラスファイバー先端のドレスト光子はどのように扱うのかと思っていたら、なんと、単純に原子を1次元格子振動子として計算を進めていました。式 (5) がその1次元格子振動子のハミルトニアンです。

\[ H = \sum_{i=1}^N\frac{\boldsymbol{p}_i^2}{2m_i} + \sum_{i=1}^{N-1}\frac{k}{2}(\boldsymbol{x}_{i+1} - \boldsymbol{x}_i)^2 + \sum_{i=1,N}\frac{k}{2}\boldsymbol{x}_i^2 \tag{5} \]

ここで \(\boldsymbol{x}_i\), \(\boldsymbol{p}_i\), \(m_i\) は \(i\) 番目の原子の(平衡位置からの)変位、運動量、質量、 \(k\) はバネ定数です。

式 (5) にドレスト光子のハミルトニアンやドレスト光子とフォノンとの相互作用などを付加して考察対象となるハミルトニアンが得られるのですが、今回は割愛します。

ところで、私が興味あるのは、 \(A_\mu\) を電磁ポテンシャルとしたとき、式 (6) を導くことです。そのためにはラグランジアン密度を決定する必要が有るのですが、この本からそれを読み解いて行きたいと思っています。

\[ (\Box + m^2)A_\mu = 0 \tag{6} \]

2018年1月14日 (日)

ドレスト光子

光に質量を与えたい -3- で超伝導体内で光が質量を獲得するカラクリが多少分かったわけですが、そもそもの発端は近接場光が質量を獲得することを理解したいということでした。その近接場光に関して新たに資料を見つけました。それが次の3点です(PDF ファイル)。

近接場光による光技術の質的変革
ドレスト光子によるバルク結晶シリコン発光素子
大津教授の講演資料

この中に出て来るキーワードで次のものが目に入りました。

  • ドレスト光子
  • 物質中の励起と光子が結合した場

ドレスト光子とは物質励起の衣をまとった光子という意味です。光子と電子とが結合した状態を表す準粒子がドレスト光子であるとの説明も有りました。

「物質中の励起と光子が結合した場」は、真空が相転移してゲージ場が質量を獲得するということを連想させます。たぶん、近接場光(ドレスト光子)を場の理論として説明するということは既に出来ているのでしょう。近接場光に対して持っていた疑問が、いよいよ解消できるかも知れません。

2017年12月10日 (日)

転がっている球はいつ止まる?

転がっている球は止まらない?

「ビリヤードで、転がっている球はいつ止まるのか?」以前から考えていました。最初に考えたのは以下のようなものです。しかし、たぶん、これは間違っていると思います。

\(\omega\)
\(v\)
\(\mu mg\)

台を転がる球の運動は、次の式で表されます。

\[ \begin{align} m\dot{v} &= \mu mg \tag{1-1}\\ I\dot{\omega} &= -\mu mgr \tag{1-2} \end{align} \]
 \(m\) :球の質量  \(v\) :球の速度  \(\mu\) :摩擦係数
 \(g\) :重力加速度 \(I\) :慣性モーメント(\(=2/5\cdot mr^2\))
 \(\omega\) :球の角速度 \(r\) :球の半径

摩擦係数 \(\mu\) は、球の進行方向に摩擦が働くときに正としています。したがって (1-1), (1-2) のような符号になっています。図では摩擦が右向きに描かれており (1-1) は一見、加速しているように見えますが、 \(\mu\) が負のとき摩擦は左向きに働くことになります。また、右向きに摩擦が働くと回転は減少します。

(1-2) は慣性モーメントに \(2/5\cdot mr^2\) を代入すると次の (1-2') になります。

\[ \frac{2}{5}r\dot{\omega} = -\mu g \tag{1-2'} \]

球の転がりに滑りが無い時は、\(v = r\omega\) が成り立ちます。そこで、 \(v - r\omega\) を計算します。まず (1-1), (1-2') より、

\[ \dot{v} - r\dot{\omega} = \frac{7}{2}\mu g \tag{1-3} \]

これを時間で積分すると (1-4) になります。

\[ v - r\omega = \frac{7}{2}\mu gt \tag{1-4} \]

ただし、\(t = 0\) で \(v - r\omega = 0\) としました(つまり、初期条件として、球の転がりに滑りは無いとした)。

(1-4) で、\(\mu > 0\) とすると、\(v > r\omega\) となります。即ち、球の速度に比べて、回転は遅くなります。その場合、摩擦は球の進行の逆方向に働きます。これは \(\mu < 0\) を意味します。つまり、初期状態で \(\mu > 0\) でも、瞬間的に \(\mu < 0\) に変わります。

(1-4) で \(\mu < 0\) とすると、\(v < r\omega\) となります。即ち、球の速度に比べて、(前方)回転は速くなります。その場合、摩擦は進行方向に働きます。これは \(\mu > 0\) を意味します。つまり、初期状態で \(\mu < 0\) でも、瞬間的に \(\mu > 0\) に変わります。

このように、転がりに滑りが無い球は、 (1-4) の \(\mu\) を確定出来ず、計算を実行出来ません。唯一 \(\mu = 0\) の時だけ (1-4) は計算可能ですが、これは摩擦が無いことを意味し、球は永久に転がり続けるという、つまらない解になります(私の知りたいのは、球はどのくらい転がった後に止まるのかということです)。

これなら止まります

上記のおかしな結果は (1-1) が原因ではないかと思っています。 (1-1) は、移動する物体が直方体のような転がらないものの場合には成り立ちますが、球の場合は成り立たないのかも知れません。

そこで (1-1) を仮定しないで計算を進めることにします。 (1-2') より、

\[ r\dot{\omega} = -\frac{5}{2}\mu g \tag{2-1} \]

が得られます。球の転がりに滑りが無い(\(v = r\omega\))とすると (2-1) は

\[ \dot{v} = -\frac{5}{2}\mu g \tag{2-2} \]

となります。これを積分して、転がっている球が停止するまでの時間が分かります。

ある書籍での解法

「ビリヤードの解析とシミュレーター」という書籍には (2-2) と異なる結果が載っていました。それは次のようなものです。

その書籍では、球に作用する力を、併進速度を減少させる力 \(F_1\) と回転速度を減少させる力 \(F_2\) に分けて扱い、その合計が摩擦力 \(\mu mg\) になるとしています。

\[ F_1 + F_2 = \mu mg \tag{3-1} \]

\(F_1\), \(F_2\) は次の方程式を満たします(\(v = r\omega\) を仮定)。

\[ \begin{align} F_1 &= -m\dot{v}\\ F_2 &= -\frac{I}{r}\dot{\omega}\\ &= -\frac{2m}{5}\dot{v} \end{align} \]

\(F_1\) と \(F_2\) の比を取ると、

\[ \frac{F_1}{F_2} = \frac{5}{2} \tag{3-2} \]

となります。これと (3-1) より、次の (3-3), (3-4) が得られます。

\[ \begin{align} F_1 = \frac{5}{7}\mu mg \tag{3-3}\\ F_2 = \frac{2}{7}\mu mg \tag{3-4} \end{align} \]

即ち、併進の方程式は

\[ m\dot{v} = -\frac{5}{7}\mu mg \tag{3-5} \]

となり、これを積分して、転がっている球が停止するまでの時間が分かります。

私には (3-1) が納得出来ないので (3-5) が正しいか疑問ですが、 (2-2) が正しいと言い切る自信も有りません。

2017年9月17日 (日)

光に質量を与えたい -3-

超伝導体内で光が質量を獲得することについて、あれこれ検索していたところ
Anderson-Higgs-Kibble 機構の検証と超伝導 Interlayer Coupling 機構の解明
が見つかり、たいへん参考になりました。上記文献は

超伝導現象がゲ-ジ場の対称性が自発的に破れることによって発現し、それに伴ってゴ-ルドスト-ンモ-ド (Goldstone mode) が発生するが、これを実験的に観測しようとする
ことについての報告書ですが、研究の背景と動機について書かれた部分に、光が質量を獲得する仕組みが解説されています。それを参考に質量の獲得についてまとめてみます。

ラグランジアンから始めるのが理論的には美しい(と思う)のですが、ラグランジアンというものは訳が分からず、いきなり定義するのは困難なものなので、エネルギー(ハミルトニアン)から始めることにします。

クーパー対 \(\psi(\boldsymbol{q})\) が電磁相互作用している系のハミルトニアン \(H\) (およびハミルトニアン密度 \(\mathscr{H}\))は次のようになります。 \[\begin{align} H =& \int \mathscr{H}d\boldsymbol{q}\\ \mathscr{H} =&\ \psi^\dagger(\boldsymbol{q})\frac{1}{2m}\left(\boldsymbol{p}-\frac{e}{c}\boldsymbol{A}(\boldsymbol{q})\right)^2\psi(\boldsymbol{q})\\ &+ V(\psi^\dagger(\boldsymbol{q})\psi(\boldsymbol{q})) + \frac{1}{8\pi}(\boldsymbol{E}^2+\boldsymbol{B}^2) \tag{1} \end{align}\] 第1項から判るように、クーパー対は非相対論的に扱っています。超伝導体内部では静電場は存在しないので \[\begin{align} A_0 &= 0\\ \boldsymbol{E} &= -\frac{1}{c}\frac{\partial\boldsymbol{A}}{\partial t} \tag{2} \end{align}\] と取ることが出来ます。また、相互作用項 \(V(\psi^\dagger(\boldsymbol{q})\psi(\boldsymbol{q}))\) は今の問題には関与しないので省略できます。

クーパー対は基底状態からの励起として南部・ゴールドストーンモードの励起が有るとして、 \[ \psi(\boldsymbol{q}) = \sqrt{n_0}e^{i\theta(\boldsymbol{q})} \tag{3} \] と置くとハミルトニアン密度は \[ \mathscr{H} = \frac{\hbar^2 n_0}{2m}\left(\operatorname{grad}\theta-\frac{e}{c\hbar}\boldsymbol{A}\right)^2 + \frac{1}{8\pi}(\boldsymbol{E}^2+\boldsymbol{B}^2) \] となります。 \(\boldsymbol{B} = \operatorname{rot}\boldsymbol{A}\), \(\operatorname{rot}\operatorname{grad}\theta = 0\) なので、 \(\operatorname{grad}\theta - (e/c\hbar)\boldsymbol{A} \longrightarrow \boldsymbol{A}'\) と置き換えてもハミルトニアン密度は変わりません。その \(\boldsymbol{A}'\) を改めて \(\boldsymbol{A}\) と置くとハミルトニアン密度は \[ \mathscr{H} = \frac{n_0e^2}{2mc^2}\boldsymbol{A}^2 + \frac{1}{8\pi}(\boldsymbol{E}^2 + \boldsymbol{B}^2) \tag{4} \] となります。

以下、簡単のため微分を次のように表記することにします。 \[ A_{\mu,\nu} \equiv \frac{\partial A_\mu}{\partial x_\nu} \] また、添字が上か下かということについては区別しないことにします。

さて、このハミルトニアン密度からラグランジアン密度 \(\mathscr{L}\) を求めます。両者には \[ \mathscr{L} = \pi_i A_{i,0} - \mathscr{H} \tag{5} \] の関係が有ります。ここに \(\pi\) は運動量密度です。ハミルトン形式では運動量(密度)は先に決めておくものなのですが、式 (4) でどれが運動量密度なのかよく判りません。これでは式 (5) が計算できません。上記文献ではラグランジアン密度は \[ \mathscr{L} = -\frac{n_0e^2}{2mc^2}\boldsymbol{A}^2 + \frac{1}{8\pi}(\boldsymbol{E}^2 - \boldsymbol{B}^2) \tag{6} \] と記されているので、取り敢えず式 (6) から運動量密度を計算してみました(式 (2) を考慮)。 \[\begin{align} \pi_i &= \frac{\partial\mathscr{L}}{\partial A_{i,0}}\\ &= \frac{1}{4\pi c^2}A_{i,0} \end{align}\] これを使って式 (5) を計算すると式 (6) になることは確認できました。そこで、ラグランジュ方程式 \[ \frac{\partial}{\partial x_j}\frac{\partial\mathscr{L}}{\partial A_{i,j}} - \frac{\partial\mathscr{L}}{\partial A_i} = 0 \] を計算すると(\(\boldsymbol{B}=\operatorname{rot}\boldsymbol{A}\) を考慮) \[ \left(\Box + \frac{4\pi ne^2}{mc^2}\right)\boldsymbol{A} = 0 \tag{7} \] が得られます(\(\Box\) の符号は (+,---))。この式は光 \(\boldsymbol{A}\) が質量 \(4\pi ne^2/(mc^2)\) を持つことを表しています。なお、式 (7) の算出に当たり、クーロン・ゲージ \(\operatorname{div}\boldsymbol{A}=0\) を用いました。

今回の過程を見ると、クーパー対 \(\psi(\boldsymbol{q})\) を式 (3) と置いたことで式 (6) の第1項が得られ、それが式 (7) の質量項になっていることが解ります。光の質量獲得のカラクリが少し理解できた気になりました。

ところで、電磁気というやつは単位系に幾つか流儀が有って、その確認に手間取りました。電磁気の単位系について便利なページが有ったのでリンクを張っておきます。
電磁気学の種々の単位系

2017年8月19日 (土)

魚の模様の出来る仕組み

魚の模様の出来る仕組みについて、何年か前にサイエンス Zero で見たことがあったのですが、その仕組みがどうだったか忘れていました。録画していたわけでもないので、再度確認出来ずにいたのですが、先日、その番組を見ることが出来ました。今度は忘れないように、ここにメモしておきます。

タテジマキンチャクダイの写真

その番組では、タテジマキンチャクダイの縞模様について説明が有りました。タテジマキンチャクダイは、体が成長すると縞模様の本数が増えて縞の間隔が一定に保たれます。その仕組みは、色素の活性化因子と抑制因子によって説明出来ます。

まず、縞模様の形成は次のようになっています。

  1. 細胞は色素の活性化因子を生成する。
  2. その活性化因子は細胞に更に活性化因子を生成するよう働きかける。
  3. 活性化因子は細胞に抑制因子も生成するよう働きかける。(活性化因子が無いと抑制因子は生成されない)
  4. 2 種類の因子は周りの細胞に拡散する。
  5. その拡散速度は抑制因子の方が速い。
  6. 着色された細胞から少し離れた所は抑制因子の方が多くなり、着色されない。

このようにして出来た縞模様は、身体の成長により間隔が広がります。すると、着色された細胞からある程度離れた個所には抑制因子が届かず、その箇所の細胞が着色されます。こうして、身体が成長しても縞の間隔が一定に保たれるという訳です。

A B C 活性化因子 抑制因子 活性化因子 抑制因子

図を用いて説明します。細胞 A と C は着色されているとします。それらから発生した抑制因子が活性化因子より早く色素細胞 B に到達すると B は着色されません。これにより、縞が形成されます。そして、 A と C の間隔が広がり、抑制因子が B に到達しなくなると、 B の生成する活性化因子により B は着色され、その結果、縞の間隔が一定に保たれることになります。

実は、2 種類の因子で模様を形成する仕組みは、チューリングによって方程式が与えられています。それが次式です。
\[ \left\{ \begin{aligned} \frac{dX_r}{dt}&=f(X_r,Y_r)+\mu(X_{r+1}-2X_r+X_{r-1})\\ \frac{dY_r}{dt}&=g(X_r,Y_r)+\nu(Y_{r+1}-2Y_r+Y_{r-1}) \end{aligned} \right. \] \(X, Y\) がそれぞれ活性化因子と抑制因子です。添え字 \(r\) は細胞を示す番号です。 \(f, g\) などを具体的に決めて計算すると、縞模様の形成の様子をシミュレートすることが出来ます。

ところで、上記方程式は 1 次元についてしか言っていないように思うのですが、これで 2 次元もカバー出来ているのが不思議です。

番組では、縞模様の形成の他にも、肺の形成や細胞性粘菌の集団の振る舞いなどが紹介されていましたが、ここでは省略します。

魚の模様の出来る仕組みについて、目がテンでも放送されたことが有るようです。 目がテン!ライブラリー 生き物(模様)の科学 に解説が掲載されています。

2017年2月19日 (日)

光に質量を与えたい -2-

超伝導体内で光が質量を獲得する仕組みを知りたくて、インターネット上の資料を幾つか当たってみたのですが、未だ納得できるレベルに至っていません。取り敢えず、解った所をまとめておきます。

光の質量の獲得は秩序変数 \(\Delta\) に対する現象論(ギンツブルグ・ランダウ理論)として記述できます。秩序変数とは相転移を特徴付ける量で、考察の対象に応じて選択されます(秩序変数の超伝導相転移を参照)。この秩序変数を用いて、電磁場が無い時のラグランジアン密度は臨界点近傍で \[ \mathscr{L}=\Delta^*i\partial_t\Delta-\frac{1}{2m}\nabla\Delta^*\cdot\nabla\Delta +b|\Delta|^2+c|\Delta|^4 \tag{1} \] と表されます。ここに \(m\) はクーパー対の質量です。

(1) 式の微分を次のような共変微分に置き換えることで電磁場を導入します。 \[ \begin{eqnarray} \nabla \rightarrow \boldsymbol{D} = \nabla - i\tilde{e}\boldsymbol{A} \tag{2}\\ \partial_t \rightarrow D_t = \partial_t - i\tilde{e}\phi \tag{3} \end{eqnarray} \] すなわち、ラグランジアン密度は (4) 式になります。 \[ \begin{align} \mathscr{L} =& \Delta^*iD_t\Delta - \frac{1}{2m}\boldsymbol{D}\Delta^*\cdot\boldsymbol{D}\Delta\\ & + b|\Delta|^2 + c|\Delta|^4 + \mathscr{L}_\mathrm{em} \tag{4} \end{align} \] ここに \(\mathscr{L}_\mathrm{em}\) は電磁場のラグランジアン密度です。

\(\Delta = |\Delta|e^{i\theta}\) とおき、簡単のため \(|\Delta|\) が時間依存しないとします。そして \[ \begin{eqnarray} \tilde{\boldsymbol{A}} = \boldsymbol{A} - \frac{\nabla\theta}{\tilde{e}} \tag{5}\\ \tilde{\phi} = \phi - \frac{\partial_t\theta}{\tilde{e}} \tag{6} \end{eqnarray} \] を用いると、ラグランジアン密度は \[ \mathscr{L} = \tilde{e}|\Delta|^2\tilde{\phi} - \frac{\tilde{e}^2|\Delta|^2}{2m}\tilde{\boldsymbol{A}}^2 + \mathscr{L}_\mathrm{em} \tag{7} \] となります。このラグランジアン密度より \(\tilde{\boldsymbol{A}}\) の運動方程式は、 \(M=(\tilde{e}^2|\Delta|^2/(2m))^{1/2}\) とおいて、 \[ (\Box + M^2)\tilde{\boldsymbol{A}} = 0 \tag{8} \] となります。ただし、ローレンツゲージ \(\partial_\mu\tilde{A}^\mu = 0\) を仮定しました。 (8) 式は光子 \(\tilde{A}\) が質量 \(M\) を持っていることを表しています。

(1) 式から出発して光子が質量を獲得することが解った訳ですが、超伝導体のラグランジアン密度が (1) 式になることが理解できていません。 BCS の平均場理論によるとハミルトニアン \(H_\mathrm{mf}\) は \[ \begin{align} H_\mathrm{mf} =& -\mu c_i^\dagger c_i + c_i^\dagger t_{ij}c_j\\ & + \frac{1}{2}\langle c_i^\dagger c_j^\dagger\rangle V_{ijkl}c_k c_l + \frac{1}{2}c_i^\dagger c_j^\dagger V_{ijkl}\langle c_k c_l\rangle\\ & - \frac{1}{2}\langle c_i^\dagger c_j^\dagger\rangle V_{ijkl}\langle c_k c_l\rangle \tag{9} \end{align} \] で、 \(\Delta_{ij} = V_{ijkl}\langle c_k c_l\rangle\) が秩序変数になるのですが、これからラグランジアン密度 (1) 式の導き方が判りません。一般的にラグランジアン \(L\) とハミルトニアン \(H\) の間には \[ L = p\dot{q} - H \tag{10} \] の関係がありますが、これに (9) 式を適用するにはどうしたら良いのでしょうか。 (1) 式の質量 \(m\) は (9) 式ではどこに隠れているのでしょうか。

2016年12月 4日 (日)

光はとっくに質量を獲得していた

近接場光がきっかけで光が質量を獲得することに興味を持ち、光が質量を持つ模型という記事を見つけたことを、以前、当ブログの光に質量を与えたいで書きましたが、この「光が質量を持つ模型」よりもっと前から光は質量を獲得していたようです。その現象は超伝導体内部で発生しているそうです。超伝導体内部には光(電場も磁場も)は侵入できず、それは超伝導体内部で光が質量を獲得している表れであるということです。下記の記事に説明が有ります(PDF ファイル)。ただ、今ひとつ解った気になれませんけど。

質量の起源
対称性の自発的破れとヒッグス機構
南部理論と物性物理学

また、下記

ノート置き場

より「超伝導の基礎に関するノート」をクリックすると PDF 「超伝導の基礎に関するノート」がダウンロードされます。

超伝導体内部で光が質量を獲得する機構を、いづれ理解できたらまとめたいと思っています。

より以前の記事一覧