[NLP Paper Review] BART: Denoising Sequence‑to‑Sequence Pre‑training for Natural Language Generation, Translation, and Comprehension

2025. 6. 15. 17:47

[NLP Paper Review] DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter (1)	2025.06.17
[NLP Paper Review] Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer (0)	2025.06.16
[NLP Paper Review] Megatron-LM: Training Multi-Billion Parameter Language Models Using Model Parallelism (3)	2025.06.14
[NLP Paper Review] ALBERT: A Lite BERT for Self-supervised Learning of Language Representations (3)	2025.06.13
[NLP Paper Review] XLNet: Generalized Autoregressive Pretraining for Language Understanding (2)	2025.06.12

📌 논문 정보