Sen(Qian)’s Memo

This website is Donglin Qian (Torin Sen)’s memo, especially about machine learning papers and competitive programming.

PU4/4

2024-05-12

2016-NIPS-Theoretical Comparisons of Positive-Unlabeled Learning against Positive-Negative Learning

なぜ時たまPUはPNよりも性能が良くなるのか。その理論的な条件を示した。統計的学習理論の知識をふんだんに使うとこれが示せる。そのうえ、性能が良くなるのはどういうときか？を比で考察して評価をした。特に、Uデータが無限に取れる場合は、理論上はPNやるよりはPUかNUをやった方がエラー上界の収束が早い。

→Read more

2024-05-11

PU Multi-Label Case-Control SCAR Ranking Single-Training-Set Paper

2016-CVPR-Multi-label Ranking from Positive and Unlabeled Data

マルチラベルでのPUのフレームワークを提案している。1つのサンプルには複数のラベルがつくが、付いているラベル以外のラベルを含まないとは限らない。こういう条件で、Rank Lossの形をPU2014のように、Ramp損失を導入した。また、PUで計算するときの目的関数についても導出をした(マルチラベルでは結構重要なので見るといいかも)

→Read more

2024-05-10

PU Cost-Sensitive Density Estimation 一旦放置 Outlier Detection Paper

2015-ICML-[uPU] Convex Formulation for Learning from Positive and Unlabeled Data

PU学習で2014-RampはR_Xの書き換えをするとき、余事象を使うことで損失項の和が定数にできるというテクを使った。ここでは、余事象を使って書き換えずに普通に代入したとき、損失関数の差が線形関数(-zにしている)になるとしても、いい性質があると提案した。後は外れ値検出のDiscussionがあるが難しくてわからなかった。

→Read more

2024-05-10

PU Cost-Sensitive Class Prior Paper

2014-NIPS-[Ramp]Analysis of Learning from Positive and Unlabeled Data

PU学習について、式変形すれば重み付きの既存のPositiveとNegativeの学習に帰着できる。損失はPNならHingeが普通だが、PUの場合目的関数から損失項を減らせるRamp損失のほうがいい。そのうえ、Class Priorの間違った推定が与える影響も説明されている。理論的には、PUはPNの性能とたかだか2√2倍までしか悪くならない。

→Read more

2024-02-17

PU Sample-Selection Paper Negative Assumption