Sen(Qian)’s Memo

VisionTransformerはAttentionメカニズムを利用してるが、最初の数個のAttention Blockは情報理論的にみると、情報量が少ない。ならば、「最初に数個とかではなく、消してよさげなAttention Blockを見つけておけば、推論時にそのBlockを消すことで、モデルの軽量化できるよね？」というのを考え付いた。

→Read more

2024-10-29

Paper weakly-supervised-learning Aggregation Observation Detail Article

2023-ICML-A Universal Unbiased Method for Classification from Aggregate Observations

様々なAggregate Observationの手法に対して、不偏のRisk Functionを提案した。これの訓練をするためには、ある比率を求める必要がある。その比率はEMアルゴリズムで別の目標値を訓練するうちに副次的に求まる。あとは様々なAggregate Observationに対してフレームワークを統合させて、答えを出した。

→Read more

2024-10-24

Detail Article Algebra

Lie代数まとめ

→Read more

2024-10-21

Paper Theoretical Analysis Teleportation Detail Article 未完成

2024-ICLR-Improving Convergence and Generalization Using Parameter Symmetries

違うパラメタでも同じような損失関数の値をとることがDNNではある。これについて、より勾配が急なところにテレポートして勾配降下すればいいので、

→Read more

2024-10-18

Paper Noisy-Label Partial Label Learning Complementary Label Detail Article

2024-AIII-[NPN]Adaptive Integration of Partial Label Learning and Negative Learning for Enhanced Noisy Label Learning

Noisy Labelで学習させるとき、識別器の予測のtop-kの予測を「ありうるかもしれないラベル」と考えれば、(与えられたラベルにこれらを加えたものが)Partial Label Learningとして学ばせることができる。そして、このラベルの補ラベルを考えると、Negative Label Learningもすることができる。各エポックごとにPartial Labelを更新し、それの補集合のラベルの補ラベルも作れて、それらを組み合わせたObjectiveとして学習させている。正則化手法では、強いと弱いデータ拡張を用いている

→Read more

2024-10-16

Paper Auto Driving Detail Article

2024-CoRL-DRIVEVLM: The Convergence of Autonomous Driving and Large Vision-Language Models

VLMでの自動運転はVLMに1. 画像から物体を認識, 2. 物体の種類や動きを分析させる, 3. これをもとに自分の動くべき軌道を考える　の3ステップ。しかしすべてVLMに任せると計算コストが高く高頻度で更新できない。なので、計算コストが低い既存の手法を組み合わせる。画像認識については画像から3D物体認識させて、それをCVで今の視覚に投影させるとどうなるかを判定させ、それで信頼できるような物体検出をする。軌跡については、既存手法でVLMの出力軌跡を参考にして高頻度で軌跡を更新させる。

→Read more

2024-10-07

Detail Article Diffusion Model

Diffusion Modelについてのメモ

→Read more

2024-10-05

Paper PU Negative Assumption Moving Average Case-Control Detail Article

2023-TPAMI-[PULDA]Positive-Unlabeled Learning With Label Distribution Alignment

DIstPU余と同様に、Negative Assumptionに対抗するために識別器によるUデータの識別結果のうちclass priorの割合だけPであるようにするMAEをつけた。 DistPUではMixupもして、本体とmixupの両方にEntropy項をつけた。この手法では、識別データが識別境界から一定以上のマージンを持つような項をつけている。そのマージン項についてuPU, nnPUのようなリスク書き換えを行って新たなObjective Functionを作った。

→Read more