https://arxiv.org/abs/1706.00038
Introduction
既存のアルゴリズムでは、以下のグラフィルカルモデルのようにNoisy LabelからGround-truthを得るモデルを使っている。
この論文では、Conditionla Random Fieldという以下の無向のグラフィカルモデルを用いた手法を開発した。hは隠れたバイナリ変数。
無向グラフィカルモデルの定式化については、📄
NNDL 第11章 独立した複数のモデルの訓練による効用 を見るとわかる。
Robust Discriminative Neural Network
小さいCleanなデータセットと大きなNoisyなラベルから訓練して、よいDNNを作る。サンプルはxであり、ラベルはone-hotのy=(0,1,0,⋯)Tとなる。ラベルの中で、Cleanなもので確定したのはy^である。
提案したグラフィカルモデルでは、y,y^のいずれもxに依存している。Noisyなラベル存在するときに、この相関から真のラベルを推測していく。Noisy Labelの分布はp(y∣y^,x)で表す。ここに、h∈Hで表す二値変数を導入する。
CRFモデルは、パラメタ化されたエネルギー関数Eθを用いて、ポテンシャルスコアを定義する。
Eθ(y,y^,h,x) そして、ボルツマン分布を定義する。
pθ(y,y^,h∣x)=Zθ(x)1exp(−Eθ(y,y^,h,x))Zθ(x)=∑y∈YN∑y^∈YC∑h∈Hexp(−Eθ(y,y^,h,x))