Site cover image

Site icon imageSen(Qian)’s Memo

This website is Donglin Qian (Torin Sen)’s memo, especially about machine learning papers and competitive programming.
NLP

2024-ICLR-Multiscale Positive-Unlabeled Detection of AI-Generated Texts

LLM生成の文章かどうかの識別は短文においては非常に難しい。 そもそも短文は人間もLLM生成の文章も似ているので、いっそのことUnlabeldとして認識して、nnPUの枠組みを導入する。 この時、「class priorにあたる値は、文章の長さにのみ依存する」という前提のもので(ハイパラをいじりながら)実験した結果、先行研究を上回った。

2020-ICLR-Pretrained Encyclopedia: Weakly Supervised Knowledge-Pretrained Language Model

2023-Proceedings of the VLDB Endowment-Self-training for Label-efficient information extraction from semi-structured web-pages

2023-NIPSWorkshop-Weakly Supervised Detection of Hallucinations in LLM Activations

Transformerについての勉強メモ