読者です 読者をやめる 読者になる 読者になる

エンジニアを目指す浪人のブログ

情報系に役立ちそうな応用数理をゆるめにメモします

ディリクレ過程の定義を考えるその3 (サンプリング)

本記事は以下の2つの記事の続きです.これらの記事で用いた記号を説明なしで用います.

ディリクレ過程の定義を考えるその1 (ディリクレ過程の定義を調べる) - エンジニアを目指す浪人のブログ

ディリクレ過程の定義を考えるその2 (ランダムな確率測度とはなにか) - エンジニアを目指す浪人のブログ

これまでに考えてきたことから,ディリクレ分布とディリクレ過程について,それらからサンプリングする方法は以下のようにまとめられそうです.

[ディリクレ分布]
・事前に { \displaystyle k } 個のパラメータ { \displaystyle (\alpha_1,\cdots,\alpha_k) } を決める.
{ \displaystyle \omega } が一つ決まると, ディリクレ分布 { \displaystyle \mathscr{D}(\alpha_1,\cdots,\alpha_k) } にしたがう { \displaystyle k } 個の確率が生成される.

[ディリクレ過程]
・事前にパラメータとして { \displaystyle (\Theta,\mathscr{A}) } 上の測度 { \displaystyle \alpha } を決める.
{ \displaystyle \omega } が一つ決まると, { \displaystyle (\Theta,\mathscr{A}) } 上の確率測度が1つ生成される.この確率測度 { \displaystyle P } はあらゆる可測分割 { \displaystyle (B_1,\cdots,B_k) } について { \displaystyle (P(B_1),\cdots,P(B_k)) \in \mathscr{D}(\alpha(B_1),\cdots,\alpha(B_k))} を満たしている(すなわち { \displaystyle P } の有限次元周辺分布はディリクレ分布である).可測分割の取り方は無限にあるので,サンプリングされる確率(分布)は非常に複雑である(ディリクレ過程 { \displaystyle P } は確率1で離散確率測度であることがわかっています.Sethuraman(1994),あるいは加藤先生の講義ノートにあるディリクレ過程の構成を眺めれば離散であるというイメージはわくと思います).

 


以上,3つの記事でディリクレ過程の定義について考えてみました.当初の目的「どのようなものかイメージできる程度まで文献を調べる」が達成できたかどうかは微妙なところです...

 

 

参考文献
[1] Antoniak, C. (1974), Mixtures of Dirichlet processes with applications to Bayesian nonparametric problems, The Annals of Statistics, Vol.2, No.6, pp.1152-1174.
[2] Ferguson, T. (1973), Bayesian analysis of some nonparametric problems, The Annals of Statistics, Vol.1, No.2, pp.209-230.
[3] Sethuraman, J. (1994), A constructive definition of Dirichlet priors, Statistica Sinica, 4, pp.639-650.
[4] 東京大学 加藤賢悟先生の講義ノート
https://docs.google.com/viewer?a=v&pid=sites&srcid=ZGVmYXVsdGRvbWFpbnxra2F0b3N0YXR8Z3g6MmE0NmFkYmU5MzM4YjllNg


以下の記事も理解の助けになるとおもいます.
http://tmasada.cocolog-nifty.com/blog/2011/02/post-144e.html