Sen(Qian)’s Memo

This website is Donglin Qian (Torin Sen)’s memo, especially about machine learning papers and competitive programming.

Memorization Effect

2024-10-16

2024-ICLR-[Label Wave]Early Stopping Against Label Noise Without Validation Data

DNNがNoisy Dataを学習するとき、毎エポックの予測が変わったサンプルの数(の移動平均)を指標にすると、最初はまず下がっていき(正しく学習する)、次に上がり(ここからNoisy Labelにもフィットし始めてしまう)、最後に下がる(Noisy Labelの学習を成功しつつある)というトレンドが見える。なので、最初の下がっていく谷で、early stoppingするぞ。

→Read more

2024-07-27

PU Paper Self-supervised Curriculum Learning Self-Training Self-Paced Learning Knowledge Distillation Memorization Effect

2020-ICML-[Self-PU]Self Boosted and Calibrated Positive-Unlabeled Training

→Read more

2024-06-02

PU Sample-Selection Paper Bias Memorization Effect OHO^~Small Loss Trick

2019-NIPS workshop-[aaPU] Revisiting Sample Selection Approach to Positive-Unlabeled Learning- Turning Unlabeled Data into Positive rather than Negative

まずはnnPUで訓練し、ある程度信頼できるモデルにする。Noisy LabelのSmall Loss Trickを使い、そのあとから、Unlabeledの中のlossが大きいものを選んで、Positive扱いにする。しかし、Uから選んだPositive扱いのものは、nnPUでmaxを取った項の中での計算はさせない(強い過学習傾向がnnPUでさえ見られてしまう).

→Read more

2024-04-11

Noisy-Label Memorization Effect Optimal transport Curriculum Learning Paper

2023-NIPS-[CSOT]Curriculum and Structure-Aware Optimal Transport for Learning with Noisy Labels

Noisy Labelのまま予測した値の行列Pに対して、-log Pを重みとした最適輸送をすることでDenoisingがおのずとできるというテクがある。この論文では、最適輸送は100%輸送するというのではなく、最初は50%などと少な目に輸送することで、コストが最も低い部分の輸送=運びやすい輸送=間違ってなさそうなサンプルを運ばせることができる。これでカリキュラム学習を実現させている。

→Read more

2024-03-13

Noisy-Label Memorization Effect Curriculum Learning Paper