チェルノフ上界
参考: https://ludu-vorton.hatenablog.com/entry/2019/06/06/073000#チェルノフ上界Chernoff-bounds
モーメント母関数によって、定義されている。
モーメント母関数
確率変数Zについて、MZ(λ)=E[eλZ]であること。λで1階微分すると期待値、2階微分すると分散が得られる。ここではλだが、よくtともかかれる。
通常のチェルノフ上界
Pr[Z≥E[Z]+t]≤minλ≥0MZ−E[Z](λ)e−λtPr[Z≤E[Z]−t]≤minλ≥0ME[Z]−Z(λ)e−λt ここで、MZ−E[Z]とは、モーメント母関数の確率変数がZではなく代わりにZ−E[Z]であるということであり、E[eλ(Z−E[Z])]である。
証明
∃λ≥0を取る。すると、指数関数は単調増加なので、同様にZ≥E[Z]+t⇔exp(λZ)≤exp(λ(E[Z]+t))が成り立つ。
次に両辺を、exp(λE[Z])で割ると、これ自体は正なので不等号の向きが変わらず以下のようになる。
Z≥E[Z]+t⇔exp(λZ−λE[Z])≥exp(λt)Pr[Z≥E[Z]+t]⇔Pr[exp(λZ−λE[Z])≥exp(λt)]Pr[exp(λ(Z−E[Z]))≥exp(λt)]≤E[λ(Z−E[Z])]e−λt 最後、マルコフの不等式を使った。ここでは、Pr[Z≥t]≤tE[Z]である。
具体的な値を代入した例
Xi∈[0,1]で互いに独立であり、X=∑i=1nXiである。この時、以下が成り立つ。
∀ϵ>0,Pr[X≥(1+ϵ)E[X]]≤exp(−3ϵ2E[X])Pr[X≥(1−ϵ)E[X]]≤exp(−2ϵ2E[X]) Pr[Z≥E[Z]+t]≤minλ≥0 ここで、Zは確率変数であり、mZ(s)はモーメント母関数。
直感的確認
Xiがベルヌーイ分布、Xがガウシアンと仮定する。
チェルノフ上界を用いた経験中央値の評価
R上の分布Dについて、F:R→[0,1]をDの累積分布関数だとする。そこで、F(a)=1/2となる中央値aを知りたい。
定理
∀ϵ,δ>0であり、s=O(ϵ2log(1/δ))個のサンプルが得られるとする。この時、サンプルからの経験的な中央値は、少なくとも1−δ以上の確率で[F−1(1/2−ϵ),F−1(1/2+ϵ)]が成り立つ。
気持ちとして、累積分布関数の値域で、1/2±ϵとなる確率を評価している感じ。
証明
Xiという確率変数を、i番目のサンプルがF−1(1/2−ϵ)より小さいならば1、それ以外ならば0とする。X=∑Xiとする。
この時、E[Xi]=1/2−ϵとなる(それはそう)。これがサンプルs個あるとなっているので、全体では、E[X]=∑(1/2−ϵ)=(1/2−ϵ)sである。
ここで、チェルノフ上界を用いて、1/2−ϵより小さい値=理想的な中央値から外れるサンプルの数の上界を抑える。
Pr[X≥(1+ϵ)E[X]]≤exp(−3ϵ2E[X])≤2δ そして、(1+ϵ)E[X]=(1+ϵ)(1/2−ϵ)≤s/2であるから、上のチェルノフ上界での評価は以下のようになる。
Pr[X≥2s]≤2δ⇒Pr[X<2s]≥1−2δ これはまさに経験中央値が越える確率を抑えるというもので、同様に及ばないのも2δ未満であるので、これで示せた。
チェルノフ上界を用いたBoosting
Boostingという、成功確率が1/2+ϵとなるアルゴリズムを、1−δ以上の確率で成功するまで上げていく運用法がある。
ある確率変数Xが2/3以上の確率で、X∈Iを満たすとする。
この時、XをO(log(1/δ))回サンプリングしたときの経験中央値は1−δ以上の確率でIに含まれる。
乱択クイックソートの解析
まず、∀k>1について、乱択クイックソートの比較回数は32knlogn回以下である確率は、1−nk−11以上である。つまり、k回アルゴリズムを走らせたら、すごい速度でソートが失敗する確率が下がっていく。
証明
Xiを、A[i]の深さを示す確率変数だとする。クイックソートでいう比較回数は深さに依存している。pivotに選ばれるのが遅いとどんどん深さが増えていくし、深さがその値が他のpivotとの比較された回数である。
よって、この時比較回数は∑i=1nXiである。
再帰呼び出しを考える。pivotはt∈[0,∣Aj∣)から一様に選んでいる。
「バランスが取れている」をpivotがAをソートした後に、真ん中の1/3に入っている31∣Aj∣≤t≤32∣Aj∣であるということ。これの確率は1/3以上である。
バランスしていると、次の再帰を考えるとき、真ん中の1/3に入っているので、どう悪くても文カチした両方のうち大きい方でも2/3以下なので、∣Aj+1∣≤32∣Aj∣である。
次に、YiをAjにおいて「バランスが取れている」なら1、それ以外なら0とする。
E[Yi]≥1/3で、Yiはそれぞれ独立である。
d=32klogn,Y=∑j=1dYjとして、E[y]≥d/3である。