Site cover image

Site icon imageSen(Qian)’s Memo

This website is Donglin Qian (Torin Sen)’s memo, especially about machine learning papers and competitive programming.

(講義ノート)乱択アルゴリズム第9回

前回は📄Arrow icon of a page link(講義ノート)乱択アルゴリズム第8回

ボールと瓶に対するポアソン近似

  • 各ビンiiは確率PiP_iで選ばれる(カテゴリ分布)。
    • もちろん、iPi=1\sum_i P_i = 1
  • これをmm回繰り返す。

こうすると、二項分布の3つ以上の選択肢があるようになると考えられ、これは多項分布である。

多項分布に従う時、以下のようなことになる。

Pr[Xi=k]=mCkpik(1pi)mkmkk!pkepi(mk)=(pim)kkepim=μkemuk!Pr[X_i = k] = {}_m C_k p_i^k (1 - p_i)^{m-k} \approx \frac{m^k}{k!} p^k e^{-p_i(m-k)} \\ = \frac{(p_i m)^k}{k} e^{-p_i m} = \frac{\mu^k e^{-mu}}{k!}

ここでは、kkmmよりずっと小さく、その時は(1pi)mkepi(mk)(1-p_i)^{m-k} \approx e^{-p_i (m-k)}と置き換えている。

するとこれによってポアソン分布を導けた。

二項分布に従い毎回確率ppで起きる事象について、nn回の試行について考える。この時、np=constnp=constと固定して、極限でnn\to\inftyとすれば、同様にポアソン分布が得られる。このような場面での計算にポアソン分布を使うと言い、という感じ

Pr[y=k]=μkeμk!Pr[y=k] = \frac{\mu^k e^{-\mu}}{k!}

ポアソン分布の性質は以下の通り。

E[y]=μ,V[y]=μ\mathbb{E}[y]=\mu, V[y]=\mu

μ\muへの集中度合

例えば、Pr[y=μ]Pr[y=\mu]を計算してみる。二項分布では、試行回数を増やすと、真ん中に集中するけどぴったりμ\muとなる確率は1/n1/\sqrt{n}のオーダーで減少していた。これはポアソン分布でも同様に成り立つ。スターリングの近似を使う。

k!=2πk(k/e)kPr[y=μ]μkeμ2πμμkeμ=12πμk! = \sqrt{2 \pi k} (k / e)^k \\ Pr[y=\mu] \approx \frac{\mu^k e^{-\mu}}{\sqrt{2\pi \mu} \mu^{k} e^{-\mu}} = \frac{1}{\sqrt{2 \pi \mu}}

翻って、Pr[y=μ+Δ],μΔμPr[y=\mu + \Delta], -\mu \leq \Delta \leq \muの間に収まる(つまりy[0,2Δ]y \in [0, 2 \Delta]に収まる確率を計算してみる。

Pr[y=μ+Δ]=μμ+Δeμ(μ+Δ)!=μμ+Δeμ2π(μ+Δ)(μ+Δ)μ+Δe(μ+Δ)=12πμ1+(Δ/μ)eΔ(1+(Δ/μ))μ+Δ=12πμ1+(Δ/μ)Pr[y=\mu + \Delta] = \frac{\mu^{\mu + \Delta} e^{-\mu}}{(\mu + \Delta)!} = \frac{\mu^{\mu + \Delta} e^{-\mu}}{\sqrt{2 \pi (\mu + \Delta)}(\mu + \Delta)^{\mu + \Delta} e^{-(\mu + \Delta)}} \\ = \frac{1}{\sqrt{2 \pi \mu} \sqrt{1 + (\Delta / \mu)}} \frac{e ^ \Delta}{(1 + (\Delta / \mu))^{\mu + \Delta}} = \frac{1}{\sqrt{2 \pi \mu} \sqrt{1 + (\Delta / \mu)}}

ここでは、最後にeΔe^\Deltaの項の分母で極限をとってるわけではないが、eeを作り出すと考えると、そこが1になって、ちょうど打ち消し合う。わりとy=μy = \muの場合とも整合性取れてそう。

ポアソン分布の和はポアソン分布

yiPoi(μi)iyiPoi(iμi)y_i \sim Poi(\mu_i) \Rightarrow \sum _i y_i \sim Poi(\sum_i \mu_i)

つまり、ポアソン分布のパラメタの和を取ったものに従う変数は、別々のポアソン分布だと考えた時の変数の和と同じ。

証明は以下の通り。

Pr[y1+y2=k]=0k1kPr[y1=k]Pr[y=kk1]=0k1keμμ1k1k!eμ2μ2kk1(kk1)!=e(μ+μ2)k!kμ1k1μ2kk1k!k1!(kk1)!=e(μ1+μ2)(μ1+μ2)kk!Pr[y_1 + y_2 = k] = \sum_{0 \leq k_1 \leq k} Pr[y_1 = k] Pr[y = k - k_1] = \sum_{0 \leq k_1 \leq k} \frac{e^{-\mu} \mu_1^{k_1}}{k!} \frac{e^{-\mu_2} \mu_2^{k-k_1}}{(k-k_1)!} \\ = \frac{e^{-(\mu + \mu_2)}}{k!} \sum_k \mu_1^{k_1} \mu_2^{k-k_1} \frac{k!}{k_1!(k-k_1)!} = \frac{e^{-(\mu_1 + \mu_2)}(\mu_1 + \mu_2)^k}{k!}

ボールとビンとポアソン分布

p1,p_1, \cdotsが固定されているとする。XiX_imm回ボールを投げた時のii番目のビンのボールの数とする。

yi(m)Poi(mp2)y_i^{(m)}\sim Poi(m p_2)だとする。

次に、以下のようにベクトルを定める。

  • xm=(x1(m),,xn(m))\mathbf{x}^m = (x_1^{(m)}, \cdots, x_n^{(m)}) これは各要素は相関している。
  • ym=(y1(m),,yn(m))\mathbf{y}^m = (y_1^{(m)}, \cdots, y_n^{(m)}) これは各要素は独立している。

これについて、条件付等価性が成り立つ。成り立つならば、相関している難しい分析を独立している簡単な分析ですり替えられる。

iyi(m)=k\sum_{i} y_i^{(m)} = kが成り立つとき、xk\mathbf{x}^kym\mathbf{y}^mの分布が一致するという特徴がある。

つまり、ポアソン分布に従う変数の和がkkで固定されるなら、ボールビンのxk\mathbf{x}^kと等しくなる。

まず、両辺をそれぞれ展開する。

Pr[xk=(k1,,kn)]forthis  condition(iki=k)=k!i=1npik2pikiki!Pr[\mathbf{x}^k = (k_1, \cdots, k_n)] \:\: \mathrm{for \: this \; condition} \: \: (\sum_i k_i = k) \\ = k! \prod _{i=1}^n p_i^{k_2} \frac{p_i^{k_i}}{k_i !}

次に、ym\mathbf{y}^mを展開する。これは前提があるので、条件付確率である。以下のように導ける。

Pr[ym=(k1,,kn)iki=k]=i=1nempi(mpi)ki/ki!emmk/k!i=1nempiemi=1nmkimkk!i=1n(pikiki!)=11eΔ2/μ×Θ(1μ)0k1keμ1μ1k1k1!eμ2μ2kk1(kk1)!Pr[\mathbf{y}^m = (k_1, \cdots, k_n) | \sum_i k_i = k] = \frac{\prod_{i=1}^n e^{-mp_i} (mp_i)^{k_i} / k_i!}{e^{-m} m^k / k!} \\ \frac{\prod_{i=1}^n e^{-m p_i}}{e^m} \frac{\prod_{i=1}^n m^{k_i}}{m^k} k! \prod_{i=1}^n (\frac{p_i ^ {k_i}}{k_i!}) \\ = 1 \cdot 1 \cdot e^{--\Delta^2 / \mu} \times \Theta(\frac{1}{\sqrt{\mu}}) \\ \sum_{0 \leq k_1 \leq k} \frac{e^{-\mu_1} \mu_1 ^ {k_1}}{k_1!} \frac{e^{-\mu_2} \mu_2 ^{k - k_1}}{(k-k_1)!}

ポアソン近似の範囲

以下のように取りうる範囲が抑えられる。

非負のf:RnR+f : \mathbb{R}^n \to \mathbb{R}_+があり、E[f(xm)]\mathbb{E}[f(\mathbf{x}^m)]mmに対して広義単調増加か、広義単調減少が成り立つとする。この時以下のように成り立つ。

E[f(xm)]2E[f(ym)]\mathbb{E}[f(\mathbf{x}^m)] \leq 2 \mathbb{E}[f(\mathbf{y}^m)]

証明

E[f(ym)]=k=0E[f(ym)iyi(m)=k]Pr[iyi(m)=k]=k=0E[f(xk)]Pr[iyi(m)=k]\mathbb{E}[f(\mathbf{y}^m)] = \sum_{k=0} ^ \infty \mathbb{E}[f(\mathbf{y}^m) | \sum_i y_i^{(m)} = k] Pr[\sum_i y_i^{(m)} = k] \\ = \sum_{k=0} ^ \infty \mathbb{E}[f(\mathbf{x}^k)] Pr[\sum_i y_i^{(m)} = k]

まず、先ほど示した条件付等価性で置き換えられる。

k=mE[f(xk)]Pr[iyi(m)=k]k=mE[f(xk)]Pr[iyi(m)m]E[f(xm)]2×E[f(y(m))]\geq \sum_{k=m} ^ \infty \mathbb{E}[f(\mathbf{x}^k)] Pr[\sum_i y_i^{(m)} = k] \geq \sum_{k=m} ^ \infty \mathbb{E}[f(\mathbf{x}^k)] Pr[\sum_i y_i^{(m)} \geq m] \\ \Rightarrow \mathbb{E}[f(\mathbf{x}^m)] \leq 2 \times \mathbb{E}[f(\mathbf{y}^{(m)})]

最初の不等号では、ffは非ゼロなので成り立ち、2つ目の不等号はE[f]\mathbb{E}[f]は広義単調増加なので成り立つ。もし、広義単調減少であると考えたいときは、Pr[iyi(m)m]Pr[\sum_i y_i^{(m)} \leq m]で置き換えればよい。

そして、最後にiyi(m)\sum_i y_i^{(m)}はポアソン分布Poi(m)Poi(m)に従う(ポアソン変数の和もまたポアソン変数である)ことから、これがmmを超える確率ということに。これは1/21/2よりは大きい値になるので、最後の結果が成り立つということ。

ポアソン化は何がうれしいか

  1. xm\mathbf{x}^mの相関を消したい。
  2. だが、xk\mathbf{x}^kymi=1yi=k\mathbf{y}^m | \sum_{i=1} y_i = kの分布が同じ。

この時、代わりにポアソン分布の変数ym\mathbf{y}^mをみればいい。

具体例

コイントスをmm回繰り返す。表がppの確率で出るとき、表の回数Bi(m,p)Bi(m,p)であり、裏の回数はBi(m,1p)Bi(m, 1-p)である。

ここで、kPoi(m)k \sim Poi(m)とおして、kk個コイントスをする。この時、表の回数と裏の回数は独立である。