本記事は以下の過去記事の内容を用います.
等式制約あり凸最適化問題の基礎をまとめる - エンジニアを目指す浪人のブログ
制約なし凸最適化問題に対するニュートン法と,ニュートンステップの定義,解釈,性質をまとめる - エンジニアを目指す浪人のブログ
降下法の枠組みと,厳密直線探索,バックトラッキング直線探索の概要をまとめる - エンジニアを目指す浪人のブログ
等式制約あり凸最適化問題に対するニュートン法(Newton's method)のアルゴリズムとその数理的な基礎についてまとめておくことにしました.Boyd and Vandenberghe(2004)の10章2節(の1と2)をベースにしています.
=================================================================================
目次
0. 準備
1. ニュートンステップの定義と解釈と性質
1.1. 目的関数の二次近似の最適点
1.2. 一次の最適性条件の一次近似の解
1.3. ニュートンデクリメント
1.4. 実行可能な降下方向
1.5. アフィン不変性
2. アルゴリズム
[ 0. 準備 ]
冒頭の過去記事(等式制約あり凸最適化問題の基礎)[ 0. 準備 ][ 1. 等式制約あり凸最小化問題 ]と同じです.
冒頭の過去記事(制約なし凸最適化問題に対するニュートン法と,ニュートンステップの定義)の内容も必要です.
冒頭の過去記事(降下法の枠組み)の内容も必要です.
[ 1. ニュートンステップの定義と解釈と性質 ]
[ 1.1. 目的関数の二次近似の最適点 ]
以下の等式制約あり凸最適化問題を考えます., 行列 です.
(1.1.1)
の のまわりのテイラー展開の二次近似 を考えると,問題(1.1.1)は以下で近似できます.これは についての凸最適化問題です.また,冒頭の過去記事(等式制約あり凸最適化問題の基礎)(2.1)で表現することができ,解析的に解くことができます.
(1.1.2)
KKT行列は正則であると仮定し,等式制約あり凸二次最小化問題(1.1.2)の解析的な解としてのニュートンステップ を定義していきます.いいかえると,ニュートンステップは の のまわりの二次近似 を最小化するために に加えるべきものです.
KKT系は以下となります.
(1.1.3)
ニュートンステップはKKT行列が正則となる点上において(のみ)定義します.このときニュートンステップを得ることができます.
(1.1.4)
制約なし凸最適化問題に対するニュートン法と同様の考察ができます.関数 が二次関数であれば, は等式制約あり問題の最適点に一致し, は元の問題(1.1.1)の双対問題の最適点です. が に近いとき は の正確な近似になっています. したがって,点 が最適点 に近いとき は の非常に良い見積もりになります.またこのとき は双対問題の最適点 の非常によい見積もりになります.
[ 1.2. 一次の最適性条件の一次近似の解 ]
冒頭の過去記事(等式制約あり凸最適化問題の基礎)(1.5)(1.6)にある,KKT方程式を再掲します.
(1.2.1)
(1.2.2)
はこの最適性条件の一次近似の解として解釈することができます. をそれぞれ に代入します.また を のまわりのテイラー展開の一次近似を として以下を得ます.これらはKKT系(1.1.3)と同じものです.
(1.2.3)
(1.2.4)
[ 1.3. ニュートンデクリメント ]
等式制約あり問題のニュートンデクリメントは,冒頭の過去記事(制約なし凸最適化問題に対するニュートン法)(2.2.3)と同じく,以下とします.
(1.3.1)
制約なし問題のときと同様に, は準最適性条件 の の二次近似に基づく近似になっています.また停止基準として用いられます.
(1.3.2)
本記事[ 1.1. 目的関数の二次近似の最適点 ]
(1.2.1)
(1.1.3)
(1.1.3)
制約なし問題と同様に,ニュートンデクリメントはヘッセ行列により定義された二次ノルムの意味でのニュートンステップの長さとして解釈できます.
(1.3.3) (1.3.1)
制約なし問題と同様に,ニュートンデクリメントによる は の での方向微分として解釈できます.
(1.3.4)
(1.3.2)
[ 1.4. 実行可能な降下方向 ]
と仮定します. のとき を実行可能方向(feasible direction)といいます.このとき, の形式のあらゆる点もまた実行可能です,すなわち です.小さい について が成り立つとき, を降下方向(descent direction)といいます.
ニュートンステップはつねに実行可能方向です(ただし が最適点のときは です).じっさいに(1.1.3)より です.さらに(1.3.4)よりニュートンステップは降下方向です.
[ 1.5. アフィン不変性 ]
制約なし問題に対するニュートンステップとニュートンデクリメントと同様に,等式制約あり問題においてもそれらはアフィン不変です.
関数 を定義します.冒頭の過去記事(制約なし凸最適化問題に対するニュートン法と,ニュートンステップの定義)(2.1.1)~(2.2.4)を再掲します.
(1.5.1)
(1.5.2)
(1.5.3) 連鎖律(文献[2])
(1.5.4) 連鎖律(文献[2])
以下を得ます.
(1.5.5)
(1.5.1)
以下の最適化問題を考えます.
(1.5.6)
(1.5.7)
でのニュートンステップ と比較して以下を得ます.
(1.5.8)
(1.5.9)
さらに以下を得ます.点列 と は線形変換 で関連づけられます.
(1.5.10) (1.5.1)(1.5.8)
ニュートンデクリメントはニュートンステップと同様にアフィン不変です.冒頭の過去記事(制約なし凸最適化問題に対するニュートン法と,ニュートンステップの定義)(2.2.5)と同様に計算できるので,ここでは結果のみ示します.
(1.5.11)
[ 2. アルゴリズム ]
等式制約あり凸最適化問題に対するニュートン法のアルゴリズムを以下に示します.制約なし問題とほぼ同じです.
この方法は( が最適点でないかぎり)実行可能降下方法(feasible descent method)です.冒頭の過去記事(制約なし凸最適化問題に対するニュートン法と,ニュートンステップの定義)(1.1.2)同様に以下が成り立つからです.
(2.1)
(1.3.3)
=================================================================================
以上,等式制約あり凸最適化問題に対するニュートン法と,ニュートンステップの定義,解釈,性質をまとめました.
参考文献
[1] Boyd, S., and Vandenberghe, L. (2004), Convex Optimization, Cambridge University Press.
[2] Stanford University Stephen Boyd先生のノート http://210.43.0.57/moocresource/data/20100601/U/stanford201001009/review7_single.pdf