Particle Filterのお勉強

1.はじめにw

1.1 参考文献

1.2 自己組織化状態空間モデルと粒子フィルタによるパラメータ推定

本稿ではKitagawa (1993, 1996)，Gordon et al. (1993)で提案された粒子フィルタ(particlefilter)，粒子固定ラグ平滑化 (particle fixed-lag smoother)，Kitagawa (1998) で提案された自己組織化状態空間モデルと粒子フィルタによるパラメータ推定を解説する．

普及しなかった非線形・非ガウス型の状態推定アルゴリズム

Kalman (1960) 以降，線形・ガウス型状態空間モデルの状態推定はカルマン・フィルタ(Kalman Filter) を用いるのが一般的となり，カルマン・フィルタは 1960 年代以降，科学・技術・社会科学の多くの分野で幅広く用いられてきた．
状態空間モデルが非線形・非ガウス型である場合は一般にはカルマン・フィルタは使用できないが，モデルを線形で一次近似し，その範囲内であれば，拡張カルマンフィルタが適用可能である．
しかし，線形近似の範囲内から外れる場合は状態推定が適切に行えないなどの問題があることも古くからよく知られてきた．
そのため，1970 年代以降カルマン・フィルタの限界を解決するべくより一般的な状態推定アルゴリズムが、 Kitagawa (1987), Kramer and Sorenson (1988), Tanizaki(1993) 等で提案されてきた．
しかし，これらの手法は，アルゴリズムの複雑さや次元の呪いなどの問題，さらに当時は CPU の能力不足などにより、広く普及することはなかった．

解決策としての粒子フィルタ

そのような状況を打開すべく，Kitagawa (1993, 1996)， Gordon et al. (1993) が提案したアルゴリズムが、「粒子フィルタ (particle filter)」である．
これは非線形・非ガウス状態空間モデルの状態推定アルゴリズムであり，モンテカルロ法 (モンテカルロ・シミュレーション) によって実現される．
ベイズの定理に基づく比較的シンプルな手法であり，プログラムが非常に容易であるという特徴を有する．
モンテカルロ法を用いるため，計算機の負荷が小さいとは言いがたいが，提案された 1990 年代初頭以後， CPU や並列化計算 (近年では GPGPU[General-Purpose computing on GPU]) 等の急速な発展により計算負荷の問題は徐々に解消されてきている．

普及を始める粒子フィルタ

粒子フィルタはその提案後直ちに多くの分野に応用され，現在では時系列解析を含め科学・技術・社会科学において標準的手法となっている．
邦文による入門としては比較的初期に執筆された北川 (2005)，樋口 (2005)，伊庭 (2005)，谷崎 (2006)，矢野・佐藤 (2006)，生駒 (2008) など，近年執筆されたものとしては樋口 (2011a,b)，中村・樋口 (2009) などがある．
英文による入門としては Doucet et al. (2001)，Liu (2002), Ristic et al. (2004)，Cappeet al. (2007)， Candy (2009)，Prado and West (2010)，Doucet and Johansen (2011) などがある．
また，応用例としては，粒子フィルタと遺伝的アルゴリズムの類似性に着目した樋口 (1996)，気象学に応用した樋口 (2011b)，金融市場に適用した佐藤・高橋 (2005)，矢野・佐藤 (2006) などがある．

動学的マクロ経済モデルへの粒子フィルタの応用

本稿では，この粒子フィルタの応用例として，実物景気循環モデル (Real Business CyclesModel，以下 RBC) の 2 次近似の状態推定を行う．RBC は近年，マクロ経済学でしばしば
用いられる動学的マクロ経済モデルの基礎である．
また，RBC を 2 次近似 (定常状態近傍での 2 次までの Taylor 展開) したものは非線形状態空間モデルとなるため，その推定は粒子フィルタの典型的応用例と言える．
なお，RBC を始めとした動学的マクロ経済モデルへの応用は Fernandez-Villaverde and Rubio-Ramirez (2007)， An and Schorfheide (2007)，Yano (2009)，Yano et al. (2010)，矢野他 (2011) 等，既に多数に渡るため，関連文献はDeJong and Dave (2011) 等を参照されたい．

本稿の構成

本稿の構成は以下の通りである．
第 2 節で粒子フィルタの基礎と適用例，第 3 節で粒子固定ラグ平滑化，第 4 節で粒子固定ラグ平滑化へのリサンプル・ムーブ法の適用を解説する．
その後，第 5 節で自己組織化状態空間モデルとパラメータ推定について解説し，第 6 節で粒子フィルタによる RBC の状態推定を説明する．
最後にまとめと今後の課題を述べる．

2.粒子フィルタ

2.1 状態空間モデル

状態空間モデル

粒子フィルタは，以下に述べる非線形・非ガウス状態空間モデルを推定対象として想定している．
まず，時点「$t$」の状態「$x_t$」が状態「$x_{t-1}$」に依存して確率的に決まる場合を考える．
さらにその状態「$x_t$」から確率的に観測値「$y_t$」が生成されているとする．
なお，状態は未知(直接観測することが不可能) であり，観測値は既知 (直接観測が可能) であると仮定する．
この状況を表すと図 1 となる．

図1 状態空間モデル

状態「$x_t$」の時間変化を関数「$f$」，状態「$x_t$」から観測値「$y_t$」への変換を関数「$h$」で表すと，ここまでの設定は以下の 2 式に集約される．

$\Large \displaystyle x_t=f(x_{t-1},\xi_s,\upsilon_t)\ \ \ \ \ \ \ \ \ $(2.1)「システム方程式」

$\Large \displaystyle y_t=h(x_t,\xi_m,\epsilon_t)\ \ \ \ \ \ \ \ \ \ \ \ $(2,2)「観測方程式」

式 (2.1) をシステム方程式，式 (2.2) を観測方程式と呼び，この 2 式をまとめて「非線形・非ガウス状態空間モデル」もしくは「一般化状態空間モデル」という (以下，状態空間モデル)．
なお，「$\upsilon_t$」はシステムノイズ，「$\epsilon_t$」は観測ノイズであり，「$\xi_s$」と「$\xi_m$」は、それぞれシステム方程式と観測方程式のパラメータである．
また，「$\theta'=[\xi_{s}', \xi_{m}']$」と表す．
なお式 (2.1)，(2.2)の詳細は付録 A1 に記述する．
式 (2.1) は，状態 xt が条件付き確率分布で

$\Large \displaystyle x_t \sim \mathbb{P}(x_t|x_{t-1})\ \ \ \ \ \ \ \ \ \ \ \ \ $(2-3)

と表され，式 (2.2) は，観測値「$y_t$」が条件付き確率分布で

$\Large \displaystyle y_t \sim \mathbb{P}(y_t|x_{t})\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ $(2-4)

と表されることを示している．
なお，ここで ∼ は「条件付き確率分布 P(xt|·) から確率変数 xt がサンプリングされること」を示す．
なお，本稿では確率分布を P(·)，確率密度関数を p(·) と表す．
ただし，以下では誤解が生じない限り確率分布と確率密度関数を単に分布と表現する．
本稿で我々が考える問題は，時点 1 から時点 t までの観測値「$y_t$」を所与とした時，式 (2.1)，(2.2) の状態空間モデルを用いて，「未知の状態「$x_t$」を推定する」ことである．
このような問題を状態推定という．
以下，時点「$1$」から時点「$t$」までの観測値「$y_t$」の組を「$y_{1:t} = \{y_1, y_2, . . . , y_t\}$」と表すことにする．
状態推定では，状態「$x_t$」と観測値「$y_{1:t} = \{y_1, y_2, . . . , y_t\}$」を用いて，予測分布 (predictive distribution)，フィルタ分布 (filtering distribution)，平滑化分布 (smoothing distribution)をそれぞれ以下のように定義する．

　　　予測分布：$\Large \displaystyle x_{t|t-1} = \mathbb{P}(x_t|y_{1:(t-1)})\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ $(2-5-1)

　フィルタ分布：$\Large \displaystyle x_{t|t} = \mathbb{P}(x_t|y_{1:t})\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ $(2-5-2)

　　平滑化分布：$\Large \displaystyle x_{t|T} = \mathbb{P}(x_t|y_{1:T})\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ $(2-5-3)

ただし，1 ≤ t ≤ T である．
予測分布は「$y_{1:(t-1)}$」(時点$1$から時点$t-1$までの観測値) を所与として状態「$x_t$」の分布を求めること，
フィルタ分布は「$y_{1:t}$」(時点$1$から時点$t$までの観測値) を所与として状態「$x_t$」の分布を求めること，
平滑化分布は「$y_{1:T}$」(時点$1$から時点$T$までの観測値) を所与として状態「$x_t$」の分布を求めることである．

2.2 粒子フィルタ

粒子フィルタで特徴的な発想は，推定すべき分布 (予測分布・フィルタ分布・平滑化分布) を「状態ベクトル「$x_i^t$」とその点に対応する『尤度』「$w_i^t$」の集合で近似する」ところにある．
本来であれば，推定すべき分布の解析解が得られれば最も良いはずであるが，粒子フィルタが想定する非線形・非ガウス状態空間モデルでは、そのような解析解が得られることはほとんどない．
そのため，モンテカルロ法で状態ベクトル「$x_t^i$」を発生させ，さらにその尤度「$w_t^i$」を適切に評価して経験分布を構成する．

たとえば，フィルタ分布「$p(x_t|y_{1:t})$」を経験分布で近似することを考えよう．
粒子フィルタでは以下のような記法が採用されることが多い．

$\Large \displaystyle p(x_t|y_{1:t})\simeq \sum_{i=1}^{M}\frac{w_t^i}{\sum_{i=1}^{M}w_t^i}\delta(x_t-x_{t|t-1}^i)$

2.10 線形・ガウス型の状態空間モデル

今、時刻「$t$」のm次元ベクトルの観測時系列を「$y_t(t=1,...,T)$」とする
この観測値に関連した観測値を表現するのに必要な変量を一つのベクトルに納めたものを「$x_t$」と書く事にする。
この「$x_t$」は、状態ベクトルと呼ばれ、観測する事はできない量（統計では潜在変数という）である。
状態空間モデルと通常呼ばれる「線形・ガウス型の状態空間モデル」は、これらの確率変数間の関係を以下のような線形モデルと正規ノイズの二つの式で表したものである。

$\Large \displaystyle x_t=F_t x_{t-1}+G_t v_t\ \ \ \ \ $(1)「システムモデル」

$\Large \displaystyle y_t=H_t x_{t}+w_t\ \ \ \ \ \ \ \ \ \ \ \ $(2)「観測モデル」

ただし、「$x_i$」は、k次元の状態ベクトルである。

3.状態推定

3.1 一般的な粒子フィルタアルゴリズム

1.粒子フィルタのイメージ

2.粒子フィルタのアルゴリズム

1.粒子の生成

大量の粒子をランダムに生成する。
粒子には位置や向きといった推定したい状態変数を好きなだけ持たせて構わない。
それぞれの粒子は重みを持ち、系の実際の状態と粒子の状態が合致する可能性が重みによって (確率的に) 表される。
最初の重みは全て同じとする。

2.予測

粒子の次の状態を予測する。
あなたが予測した実際の系の振る舞いに基づいて、全ての粒子を移動させる。

3.更新

観測値に基づいて粒子の重みを更新する。
観測値に近い粒子には観測値から遠い粒子よりも大きい重みが割り当てられる。

4.再サンプリング

確率が非常に低い粒子を破棄して、確率の高い粒子のコピーで置き換える。

5.推定値の計算

もし必要なら、粒子の重み付き平均と重み付き共分散行列を計算して状態の推定値を得る。

3.2 モンテカルロ法を使った確率分布の計算

3.3 粒子フィルタのプログラミング

Step0. 初期値の設定

以下の、初期値時刻「$t=t_0$」と「$N$」個の潜在変数を定めます。

$\Large \displaystyle \{ x_{t_0}^{(n)}\}_{n\in [1,...,N]}$

粒子フィルタではこの潜在変数の集合の元を粒子と呼び、粒子を更新していくことで潜在変数を推定していきます。
粒子の初期値は適当に1つずつ決めてもいいし，乱数で決めていってもいいし，通常は全て同じ値で初期化することさえ問題ありません．
今回は全て同じ値で初期化することにします
(今回はハイパーパラメータ「$\theta_{sys}$」も「$\theta_{obs}$」もこの段階で何らかの値に定めます．色んな値に変えて遊びましょう．)

Step1. 1期先予測（予測）

各粒子の1単位時間先の潜在変数をサンプリングします．

$\Large \displaystyle \forall n\ x_i^{(n)}\sim p(x_t^{(n)}|x_{t-1}^{(n)})$

このステップは各粒子ごとに独立なため，並列に実行することが可能です．
各粒子で同じ値のものがあったとしても，サンプリングが確率的に揺らぐようなモデルである限りは1期先の予測はバラバラな値に予測されます．
こういう事情から粒子が同じ値をもつことを許しても何の問題もないわけです．

Step2. 予測確率計算（重み付け）

所与の「$y_t$」と先に得られた潜在変数の予測値「$x_t^{(n)}$」を観測モデルに代入することで予測確率を計算します．

$\Large \displaystyle \mu_t^{(n)}=p(y_t|x_t^{(n)})$

各粒子の予測確率を計算したらこれらを正規化します．

$\Large \displaystyle \tilde{\mu}_t^{(n)}=\frac{\mu_t^{(n)}}{\sum_{n=1}^N\mu_t^{(n)}}$

Step3. 粒子の更新（観測＆リサンプリング）

所与の「$y_t$」と先に得られた潜在変数の予測値「$x_t^{(n)}$」を観測モデルに代入することで予測確率を計算します．

$\Large \displaystyle \forall n\ c_t^{(n)}\sim Categorical(c_t^{(n)}|)$

$\Large \displaystyle x_t^{(n)}=c_t^{(n)^T} \begin{pmatrix} x_t^{(1)} \\ \vdots \\ x_t^{(N)} \end{pmatrix} $

「$c_t^{(n)} \in \{ 0,1\}^N$」は、ある成分の値が1でそれ以外が0の値を持つ「$N$」次元のベクトルです．
「$c_t^{(n)} $」は、ステップ2で計算した重み「$\tilde{\mu}_t$」をパラメータとするカテゴリカル分布から生成します．
このステップによって実現確率の低い粒子は実現確率のより高い粒子に取って代わられる可能性が出てきます．
極限的には最適な粒子が大多数を占めるようになっていく感じです．
「$t\rightarrow t+1$」として、ステップ1に戻ります．

$\large \displaystyle \large 1:Algorithm Particle_filter(X_{t-1},u_t, z_t):\\ \large 2:\ \ \ \bar{X_t}=X_t = 0\\ \large 3:\ \ \ for\ M=1\ to\ M\ do\\ \large 4:\ \ \ \ \ \ sample\ x_t^{[m]}\sim p(x_t|u_t, x_{t-1}^{[m]})\\ \large 5:\ \ \ \ \ \ w_t^{[m]}=p(z_t|x_{t}^{[m]})\\ \large 6:\ \ \ \ \ \ \bar{X_t}=\bar{X_t}+\lt x_t^{[m]},w_t^{[m]}\gt\\ \large 7:\ \ \ endfor\\ \large 8:\ \ \ for\ M=1\ to\ M\ do\\ \large 9:\ \ \ \ \ \ draw\ i\ with \ probalility\propto w_t^{[i]}\\ \large 10:\ \ \ \ add\ x_t^{[i]}\ to\ X_t\\ \large 11:\ endfor\\ \large 12:\ return\ X_t $

4.粒子フィルタ

4.1 モンテカルロ近似

非ガウス分布の近似

図3の右最上段のパネルに示すように、一般に条件分布「$p(x_t|y_{1:j})$」は、非ガウス分布なので、その分布は何らかの形での近似が必要である。
代表的な方法は、大別して以下の二つに分けられる。

解析的表現の補助利用のあるもの
数値的表現のみ

4.2 アルゴリズム

ServiceData

Byte0: 73
Byte1: 40
Byte2: 64

bit1: 1=人の動きを検知、0=人の動きを不検知

Byte3: 00
Byte4: 42

動体を検出してからの時間（秒）

Byte5: 01

bit6: 明るい
bit7: 暗い

5.遺伝的アルゴリズムとの類似性

6.粒子フィルタのプログラミング例

6.1 動機

問題を考える

こんな問題を考えよう。移動している複数の物体があって、それらを追跡したいとする。
追跡する物体は複数のジェット戦闘機や複数のミサイルかもしれないし、球場でクリケットをしている人々かもしれない。
なんでもいい。これまでに学んだフィルタにこの問題を扱えるものはあるだろうか？
残念ながら、どのフィルタも理想的ではない。この問題の特徴を考えよう:

多峰性 (マルチモーダル): ゼロ個、一つ、あるいは複数の物体を同時に追跡したい。
遮蔽 (オクルージョン): 物体が他の物体を隠し、複数のオブジェクトから観測値が一つしか得られない場合がある。
非線形な観測値: レーダーは物体への距離を観測するので、(x,y,z) の座標に変換するとき非線形な平方根が必要になる。
ガウス分布に従わないノイズ: 背景が大きく変化すると、コンピュータービジョンのアルゴリズムが背景を物体と誤認する場合がある。
連続: 物体の位置と速度 (つまり状態) は時間の経過とともに滑らかに変化する。
多変量: 位置、速度、旋回速度といった複数の属性を追跡したい。
未知のプロセスモデル: 系のプロセスモデルを私たちは知らない。

これまでに学んだフィルタはどれも、こういった制約があるとき上手く動作しない:

離散ベイズフィルタ:

離散ベイズフィルタは最も多くの制約に対応できる。
多峰性であり、非線形な観測値を処理でき、非線形な振る舞いに対応できるよう拡張することもできる。
しかし、このフィルタは離散的かつ単変量である。

カルマンフィルタ:

カルマンフィルタはガウス分布に従うノイズを持った単峰性の線形系に対して最適な推定値を生成する。
この問題ではどの仮定も成り立たない。

無香料カルマンフィルタ:

UKF は非線形、連続、多変量の問題に対応できる。しかし多峰性ではなく、遮蔽を処理することもできない。
また UKF はガウス分布と少しだけ異なる分布に従うノイズなら処理できるが、ノイズがガウス分布から大きく離れている場合や問題が非常に非線形な場合は上手く処理できない。

拡張カルマンフィルタ:

EKF は基本的に UKF と同じ強みと弱みを持つ。
ただし EKF はガウス分布に従わないノイズと非線形性からの影響をさらに受けやすい。

6.2 モンテカルロサンプリング

粒子フィルタの処理は、モンテカルロサンプリング

無香料カルマンフィルタの章で、ガウス分布を非線形な系で変換したときの効果を説明するために次のような図を示した:

非線形な変換を適用したガウス分布

左のグラフは次のガウス分布に独立に従う 3,000 個の点を示す:

$\Large \displaystyle \mu= \begin{bmatrix} 0 \\ 0 \end{bmatrix}, \Sigma= \begin{bmatrix} 32 & 15 \\ 15 & 40 \end{bmatrix} $

右のグラフはそれらの点を次の関数に通したときに得られる点を示す:

$\Large \displaystyle x=x+y$

$\Large \displaystyle y=0.1x^2+y^2$

ランダムに生成された有限個の点 (サンプル) を使って結果を計算する手法をモンテカルロ法 (Monte Carlo method, MC) と呼ぶ。
アイデアは簡単だ: 状態を表現するサンプル (点) を十分多く生成し、モデル化している系にそれらの点を通し、変換された点から結果を計算する。
簡単に言えばこれが粒子フィルタの処理である。本書を通して使ってきたベイズフィルタのアルゴリズムが数千個の粒子に適用される。
一つ一つの粒子は系の状態の可能性を表す。数千個の粒子から状態の推定値を取り出すときは重み付き統計量が使われる。

6.3 一般的な粒子フィルタアルゴリズム

粒子フィルタのアルゴリズムを一般的に説明すると次のようになる:

1.粒子の生成

大量の粒子をランダムに生成する。
粒子には位置や向きといった推定したい状態変数を好きなだけ持たせて構わない。
それぞれの粒子は重みを持ち、系の実際の状態と粒子の状態が合致する可能性が重みによって (確率的に) 表される。
最初の重みは全て同じとする。

2.予測

粒子の次の状態を予測する。
あなたが予測した実際の系の振る舞いに基づいて、全ての粒子を移動させる。

3.更新

観測値に基づいて粒子の重みを更新する。
観測値に近い粒子には観測値から遠い粒子よりも大きい重みが割り当てられる。

4.再サンプリング

確率が非常に低い粒子を破棄して、確率の高い粒子のコピーで置き換える。

5.推定値の計算

もし必要なら、粒子の重み付き平均と重み付き共分散行列を計算して状態の推定値を得る。

6.4 モンテカルロ法を使った確率分布の計算

非

6.5 粒子フィルタ

非

6.6 SIRフィルタ──完全な例

非