Sen(Qian)’s Memo

マルチラベルでのPUのフレームワークを提案している。1つのサンプルには複数のラベルがつくが、付いているラベル以外のラベルを含まないとは限らない。こういう条件で、Rank Lossの形をPU2014のように、Ramp損失を導入した。また、PUで計算するときの目的関数についても導出をした(マルチラベルでは結構重要なので見るといいかも)

→Read more

2024-05-10

PU Cost-Sensitive Density Estimation 一旦放置 Outlier Detection Paper

2015-ICML-[uPU] Convex Formulation for Learning from Positive and Unlabeled Data

PU学習で2014-RampはR_Xの書き換えをするとき、余事象を使うことで損失項の和が定数にできるというテクを使った。ここでは、余事象を使って書き換えずに普通に代入したとき、損失関数の差が線形関数(-zにしている)になるとしても、いい性質があると提案した。後は外れ値検出のDiscussionがあるが難しくてわからなかった。

→Read more

2024-05-10

PU Cost-Sensitive Class Prior Paper

2014-NIPS-[Ramp]Analysis of Learning from Positive and Unlabeled Data

PU学習について、式変形すれば重み付きの既存のPositiveとNegativeの学習に帰着できる。損失はPNならHingeが普通だが、PUの場合目的関数から損失項を減らせるRamp損失のほうがいい。そのうえ、Class Priorの間違った推定が与える影響も説明されている。理論的には、PUはPNの性能とたかだか2√2倍までしか悪くならない。

→Read more

2024-05-07

Noisy-Label Sample-Selection Paper

2022-ICLR-Sample Selection with Uncertainty of Losses for Learning with Noisy Labels

→Read more

2024-04-23

Noisy-Label Co-Training Paper

2019-PMLR-[SELFIE] Refurbishing Unclean Samples for Robust Deep Learning

1. ラベルのp(y|x)の各クラスごとのエントロピーを測って、低い=ほぼクラスyかほぼクラスyではない、ということならp(z|x)を最大化するzを新しいラベルにする。 2. backwardするときは、それなりに正しいと思われるサンプル(損失が少ない上位X割)とrelabeledされたデータだけで計算。 3. このアルゴリズムで信頼できるサンプルを選べるが、そのラベル修正込みのサンプルで、訓練を頭からもう1回やり直す=restartでロバストなモデルを作っている SELFIEは高ノイズ環境に強い！

→Read more

2024-04-19

Noisy-Label 一旦放置 Paper

2017-NIPS-Toward Robustness Against Label Noise in Training Deep Discriminative Neural Networks

→Read more