Site cover image

Site icon imageSen(Qian)’s Memo

This website is Donglin Qian (Torin Sen)’s memo, especially about machine learning papers and competitive programming.

(講義ノート)統計的機械学習第13回

前回はこちら。📄Arrow icon of a page link(講義ノート)統計的機械学習第12回 。内容は位相線形空間、コンパクト集合、ミンコフスキー和であった。

位相線形空間とは、関数ノルムというのを定義した関数でも線形代数っぽく扱えるようにしたもの。関数のノルムでよくあるのが、supf(x)=f\sup|f(x)|=||f||であり、fg=supfg||f-g||= \sup| f-g |

三角不等式、同次性/斉次性だけを満たす半ノルムというのも考えた。

u+vu+vαu=au||u+v|| \leq ||u|| + ||v|| \\ ||\alpha u|| =|a| ||u||

u=0u=0u=0 \Leftrightarrow ||u||=0については成り立たず、\Rightarrowは成り立つが逆は成り立たない。

距離空間においてのコンパクト性も考えた。

KXK \subseteq Xが点列コンパクトであるとは、KKが位相(開集合の集合族)であるが、に含まれる任意の点列(xn)nN(x_n)_{n \in \mathbb{N}}に対して、KKの中の点に収束する部分列が存在することである。

位相空間論においての、一般的なコンパクト性とは「有限の大きさを持つ」という意味でしかない。位相空間(X,A)(X,A)がコンパクトであるとは、i=1mUiX\bigcup_{i=1}^m U_i \supseteq Xとなるような被覆UUがあるということ(XXに含まれていないような元を含む集合もあり得る)。そのうえで、どんな{Ui}i=1m\{ U_i \}_{i=1}^mでもその中にある有限個の要素からなる集合jUjX\bigcup_{j} U_j \supseteq Xになれるということ。

線形汎関数と劣線形性も考えた。半ノルムのように汎関数l:XRl: X \to \mathbb{R}に関して、三角不等式と斉次性は満たすのならば劣線形汎関数である(半ノルムみたいだよね)

l(x+y)l(x)+l(y)l(λx)=λl(x)l(x+y) \leq l(x) + l(y) \\ l(\lambda x) = \lambda l(x)

有名なものとしてゲージ汎関数がある。

R\mathbb{R}体上のノルム線形空間XXの部分空間KKが凸集合であるとする。0を内点として含むとする。

ゲージ汎関数は以下のもの。xx1/a1/aをしてもKKに含まれるとき、そうなる一番小さいaaということ

つまり、許される区間KKに与えられた値を押し込むのに、一番最低限で割るいくつが必要か?ってこと

pK:XR0pK(x)=inf{aR01axK}p_K : X \to \mathbb{R}_{\geq 0} \\ p_K(x) = \inf \{ a \in \mathbb{R}_{\geq 0} | \frac{1}{a} x \in K\}
A±B={a±baA,bB}A \pm B = \{ a \pm b | a \in A, b \in B \}

ミンコフスキー和/差がある。2つの集合A,BA,Bの各元についてそれぞれの和/差をA×B|A| \times |B|通りエミュレートしたい。

凸集合A,BA,Bのミンコフスキー和/差は同じく凸集合になる。

ハーン・バナッハの拡張定理

Image in a image block

部分空間YXY \subseteq X上でggよりもppが常に上に来るなら、XX上でもggを拡張することができるし、同様にppよりも常に下に来る。

つまり、部分空間で線形汎関数ggを見つけられたら、それは全体の空間でも成り立つということ!

ppは劣線形汎関数であるが、凸関数もそれの一種類である。なので、ある区間だけで凸関数より下なら、すべての区間でもそりゃ凸関数の下だからだよね。

これはあくまで存在を保証しているが、具体的にどう構築するのかはわからない。

ノルム線形空間での分離超平面定理

Image in a image block

2つの集合A,BA,Bがかぶっておらず、どちらかが開集合であるとする。

この時、何かしらの超平面が存在し、A,BA,Bの元をそれぞれきれいに分けることができるという意味。

証明

Image in a image block

ミンコフスキー差を考える。いずれか一方が開集合なので、KKも空ではない開凸集合である。

次に、x0Kx_0 \notin Kとなるようなものを選ぶ。y0Ky_0 \in Kだとして、x0x_0y0y_0x0x_0^-を考えられる。

また、差のK=K{y0}K^- = K - \{ y_0 \}で再びミンコフスキー差を考えられる。(自分自身の元の1つと全部ミンコフスキー差を計算する感じ)KK^-自体も空ではない開凸集合。

0=y0y0K0=y_0 - y_0 \in K^-は成り立つが、KK^-はゲージ汎関数である。なぜなら、KK^-は凸集合で0を含むので、必ずゲージ汎関数pKp_K^-を作ることができる。

x0x_0は0でもなく、KK^-にも含まれていない。そして、X0X_0^-を1点x0x_0^-だけで構築される区間(span演算)を作っている。1点しかないので、一次元線形空間である。x0Xx_0^- \in Xである以上、それをもとに拡張した一次の線形線形空間もXXの部分空間である。そして当然だがλ=0\lambda=0とすれば00も入っているとわかる。

Image in a image block

X0X_0^-上の汎関数fff(λxo):=λf(\lambda x_o^-) := \lambdaと定義すると、ffは線形汎関数(線形空間から実数へ写像する関数)。X0X_0^-自体は1点だけで構築された一次元線形空間なので、X0X_0^-上とはλx0\lambda x_0^-と書いていい。

線形汎関数の定義により、f(0)=0f(0)=0である。ゲージ汎関数の定義から、pK(0)=0p_K^-(0)=0も成り立つ。

なので、KK^-に含まれていないので、ゲージ汎関数が1以上となり、λ\lambdaを外に出せたりして、不等式を作れる。λ\lambdaが正であるという前提であり、λ\lambdaが負ならそれはそれで少し変わるだけ。

Image in a image block

さきほどのハーン・バナッハの定理を使えば、拡張できるということ。なのでうまいことFFを見つければ、XX全体で成り立つと拡張できる。先ほど成り立つとした式について

Image in a image block

Image in a image block

Image in a image block

分離超平面定理(閉集合とコンパクト集合間)

ハーン・バナッハの定理の幾何形ともいわれる。

Image in a image block

先ほどと違い、A,BA,Bの一方が閉集合、もう一方がコンパクトであるとする。

この時、すべてのA,BA,Bの元について、間に挟むことができるα\alphaが存在する。

証明

Image in a image block

閉集合同士のミンコフスキー差なのでCCも閉集合。この時、0が含まれていないので0の開近傍とCCが交わらないような半径rrを持つ開近傍は確かにある先ほどの分離超平面定理を使うと、確かに成立する。

Image in a image block

Uˉ=V\bar{U} = V打と稠密になる。閉包に含まれているならFFが0、それ以外なら0ではないようにしたい。

Image in a image block

{z}\{z\}はコンパクトである理由は、有限個の開被覆を持つということだが、これは明kに有限個の開被覆を持つ。

実数値連続関数集合上の線形汎関数に対するリースの表現定理

Image in a image block

あるボレル正則測度があれば、積分の形で書ける。

ある条件を満たす線形汎関数はすべてある測度に従った積分で表現できる。ならばその測度の性質を調べるという戦略が取れる。

Discriminatory

nRn \in \mathbb{R}、以下を満たす符号付ボレル測度が零測度のみの時は、f:RRf:\mathbb{R \to R}n-discriminatoryである。

wRn,bR,f(wTx+b)dμ(x)=0\forall w \in \mathbb{R}^n, \forall b \in \mathbb{R}, \int f(w ^T x + b) d \mu(x) = 0

万能近似定理

いよいよ、万能近似定理についての説明の道具はすべてそろった。

Image in a image block

Σn\Sigma_nのあるの閉包がC([0,1]n)C([0,1]^n)と等しい、稠密である。

つまり、任意のffについて、NNで近似できる。

証明