目次
Math
Analysis
Experiment
Simulations

統計的予測

実測データで条件づけたパラメータの不確実性を減少させる推定に対し,実測データで条件づけた未観測のデータについての不確実性を更新するのが予測です.実際の現場だとこっちを使いたい事も多いですよね.

機械学習なんかはこれをいかにセクシーでエレガントにやるかを競っているわけです.神経科学的には,BMIの実装だったり,脳の知覚モデルなんかを理解していく上で必要になります.しかし絶対というわけでもないのでさらっと,とりあえずベイズの予測だけいれておきます.

▶︎
all
running...

ベイズ予測

まずは分かりやすいベイズ予測.これまでに観測されたデータを用いたベイズ推定で求めた事後分布を使って,

ベイズ予測の手順

p(θD)=p(Dθ)p(θ)p(D)事後分布の推定p(DnewD)=p(Dnewθ)p(θD)dθ予測\begin{align} p(\theta|\mathbf{D}) = \frac{p(\mathbf{D}|\theta) p(\theta)}{p(\mathbf{D})} \qquad \text{事後分布の推定} \nonumber \\ p(D^{new}|\mathbf{D}) = \int p(D^{new}|\theta)p(\theta|\mathbf{D})d\theta \qquad \text{予測} \end{align}

のような事をして,未観測のデータを予測します.p(DnewD)p(D^{new}|\mathbf{D}) はデータ集合 D\mathbf{D} を観測した状態で,次に観測されると思われるデータの予測値の分布で,これを事後予測分布と言います.

式を解釈すると,パラメータ θ\theta が取りうる値の全ての範囲で,パラメータ θ\theta がある値を取る確率 p(θ)p(\theta) で重みづけした p(D1newθ)p(D^{new}_1|\theta) の足し合わせを D1newD^{new}_1 の確率,p(D2newθ)p(D^{new}_2|\theta) の足し合わせを D2newD^{new}_2 の確率,というように計算することで DnewD^{new} が取りうる値の予測分布を求めるものです.
 ここで,尤度 p(Dnewθ)p(D^{new}|\theta) は未観測データの尤度になりますが,事前に観測されているデータと同じ生成過程で生成されているとすれば事後分布の計算の際に用いた尤度 p(Dθ)p(\mathbf{D}|\theta) と同じものを使うことが出来ます.

こうして得られた事後予測分布から,期待値を取ったりして点推定しても良いし,そのまま分布として扱ってもいいです.