Panzeri-Treves '96について
Panzeri and Treves, Analytical estimates of limited sampling biases in different information measures, Network: Computation in Neural Systems 7 (1996) 87.
を読むときには気をつけたほうがいい。ちょっとはまりポイントがあって読むのに時間がかかった。それについて書く。これが他の人の助けになればいいな。あとは連続カーネルでのsmoothingに興味が無ければそこはすっ飛ばしても大丈夫というのがアドバイス。
ちなみにこの論文はレートコーディングの情報量[1]のupwardbiasの補正公式を与えるものだ。
問題は式(A4)にある。
〈pNk(i|s)〉= pk(i|s) + 1/Ns kC2pk-2(i|s) [q(i|s) - p2(i|s)] + higher order
(オリジナルの式ではp, qに皆チルダがついているけど、webでは出せないから略した。またp(i|s) ≡〈pN(i|s)〉。)
ここでqの定義は(18)式にσ=0を代入して
q(i|s) = ∫mi-1 midr P(r|s) = p(i|s)
となる。ここで mi はi番目のbinの上限である。けど、これはおかしい。ここがハマリポイント。本当は一般論としては(A4)の式は
〈pNk(i|s)〉 = pk(i|s) + kC2pk-2(i|s) [〈pN2(i|s)〉- p2(i|s)] + higher order
であるべきはず。
じゃ、なんで大体正しい結果が出たかというとたまたまビンの占有数はポアソン分布だから
〈(n(i,s))2〉-〈n(i,s)〉2 = 分散 =〈n(i,s)〉
pN(i|s) ≡ n(i,s)/Ns
〈(pN(i|s))2〉- p(i|s)2 = p(i|s)/Ns
だから。この右辺がq(i|s)にたまたま一致しちゃう。ここでn(i,s)は問題のビンの観測度数。p(i|s)2/Nsに相当する部分はまた別なところから出てくるようだけどその議論は割愛。
あともう一つ要注意なのは式(A1)の和Σの上のカレット。これは(A1)の次の3行目に書いてあるとおり期待確率 p(i|s)がゼロのビンを取り除くことを表している。しかし、補正公式を実際に使っている場面では、これを観測度数がゼロのビンを取り除く意味に取っている人がいる。というか私も最初、そう勘違いしました。例えば期待度数が1ならばポアソン分布なので観測度数がゼロになるのはむしろきわめてよく起こることであるけど、そういう時にこのビンを取り除いてはいけない。
で、期待度数λとすると私の計算では
Σkpoisson pdf(k, λ) k log k -λlogλ
が補正値なのだけど、期待度数が0.3ですら補正 0.42を与えて、λ= ∞の補正値1/2とさして違わない[2]。
しかし現実問題として期待度数が0.3でビンが空になっているのか、期待度数が0でビンが空になっているのか実験から決めることはほとんど不可能だと思う。この点でかなり不便な公式ではある。
期待度数が0.1でもまだ補正は0.23だからいっそのこと期待度数に関わらず1/2という式の方が良いかも。実際、そこにbinがあると言うことは、ほかの刺激では占有されていると言うことなのだから、その刺激でも0.1くらい期待度数があると考える方が自然だと思う、ニューロンの反応のノイジーさを考えると。実際自分の持っているニューロンの実データでもその方が良く合った。(合ったというのは刺激提示前の発火つまり情報量ゼロのはずのところの結果がどれだけゼロに近いか。)
しかし期待度数に関わらずという事にすると結局文献[3]に一致する。
[1] Optican L.M. and Richmond B.J., Temporal Encoding of Two-Dimensional Patterns by Single Units in Primate Inferior Temporal Cortex. III. Information Theoretic Analysis, J. Neurophys. 57 (1987) p.162
[2] 蛇足だけどこの式はλ=1だと0.57くらいになり1/2より大きい。実際その方が補正が正確だった。
[3] Treves and Panzeri, The Upward bias in Measures of Informaiton Derived from Limited Data Samples, Neural Comput. 7 (1995) 399
刺激が10個あるとします。刺激1には10Hz、刺激2には20Hz、...刺激10には平均100Hzのポアソン過程で反応するようなニューロンをまた考えます。この発火確率が分かっている状態で、実際に観測されたスパイクからどの刺激が与えられたかデコードするとします。


