(講義ノート)乱択アルゴリズム第11回

前回やったこと。

分布 $p$ からサンプル可能の時、

まず、補題として、 $p=u \Rightarrow ||p||_2^2=1/n$ が成り立つ。ってそれはそうである。

この時、 $||p-u||_1 > \epsilon \Rightarrow ||p||_2^2 > 1/n + \epsilon^2 / n$ が成り立つ。

衝突確率は $||p||_2^2 = \sum_{i \in [n]} p(i)^2$ である。

これを踏まえてアルゴリズムを考える。 $s$ 回サンプリングして、衝突回数を $k$ とする。

衝突回数の割合、つまり $k/_{s}C_2$ を $||p||_2^2$ の推定値として使う。

もし、 $k/{}_{s}C_2 - 1/n \geq \epsilon^2/n$ ならば拒否する。そうでなければ受理をするというアルゴリズム。

今回の授業の内容。

$\mathbb{E}[X] = ||p||_2^2$ とする。目標は、以下が成り立つこと。ある定数 $C$ があるとき、サンプリングしたものが、 $\delta$ 以上ずれる確率はたかだか $1/3$ であるという。

S=\frac{C \sqrt{n}}{\delta^2} \Rightarrow Pr[X \notin (1 \pm \delta) \mathbb{E}[X]] < \frac{1}{3}

チェビシェフの不等式を使うと、以下が成り立つ。

Pr[X \notin (1 \pm \delta) \mathbb{E}[X]] \leq \frac{V[X]}{\delta^2 (\mathbb{E}[X])^2}

ここで、 $V[X] = V[\sum_{1 \leq a < b \leq s} X_{ab}]$ 。総和の中の $X_{ab}$ は、 $a$ 番目と $b$ 番目のサンプルが一致するという意味。

V[X] = V[\sum_{1 \leq a < b \leq s} X_{ab}] = \mathbb{E}[(\sum_{1 \leq a < b \leq s} X_{ab})^2] - \mathbb{E}[\sum_{1 \leq a < b \leq s} X_{ab}]^2

分散の書き換えをまず行う。分散は独立(今回の場合は $a,b$ が互いに独立)でない限り、簡単に分解できない。

面倒なことになるが、 $\mathbb{E}[]^2$ については丁寧に展開することができる。後ろの項も同様に展開できる。

\mathbb{E}[(\sum_{1 \leq a < b \leq s} X_{ab})^2] - \mathbb{E}[\sum_{1 \leq a < b \leq s} X_{ab}]^2 \\ = \mathbb{E}[\sum_{a,b} X_{ab}^2 - \sum_{a, b, a^\prime, b^\prime} X_{ab} X_{a^\prime b^\prime} + \sum_{a, b, b^\prime} X_{ab} X_{a b^\prime} + \sum_{a, a^\prime, b^\prime} X_{ab} X_{a^\prime b^\prime} \\ + \sum_{a, a^\prime, b} X_{ab} X_{a a^\prime} + \sum_{a, b, b^\prime} X_{ab} X_{b b^\prime} ] - \mathbb{E}[\sum_{1 \leq a < b \leq s} X_{ab}^2]

これについて、 $a,b,a^\prime, b^\prime$ についての総和で見ると、打ち消し合える。

\sum_{a,b} \mathbb{E}[X_{ab}] + \sum_{a,b,a^\prime, b^\prime} \mathbb{E}[X_{ab}] \mathbb{E}[X_{a^\prime, b^\prime}] + \mathbb{E} + \mathbb{E} + \mathbb{E} + \mathbb{E} \\ - \sum_{a,b}\mathbb{E}[X_{ab}]^2 - \sum_{a,b,a^\prime, b^\prime} \mathbb{E}[X_{ab} X_{a^\prime b^\prime}] - \sum - \sum - \sum - \sum \\

よう分からんが成り立つらしい。

$O(\frac{\sqrt{n}}{\epsilon^2})$ のサンプルアルゴリズム。

以上のようなアルゴリズムになる。

これがなぜ正当？

\mathbb{E}[y_i] = Pr[y_i = 1] = 1- Pr[X_i = 0] - Pr[X_i = 1] \\ = 1 - e^{-m p(i)} - e^{-m p(i)} \times m p(i) \\ \approx 1 - (1 - mp(i)) - (1 - mp(i))mp(i) = m^2 p(i)^2

分布が一様であるか？どうかを応用して、2つの分布が同じ分布かどうかを検査できる。

$p$ が既知の分布 $q$ と一致するか？

まず、 $q$ が $K$ で理参加できる、つまり $\forall i, q(i) = k_i / K, k_i \in \mathbb{R}$ と書けるとする。

$q$ からのサンプルは、そのように離散化させたもののなかで、対応区間を選ぶのと等しい。