AI/PAPER

[NLP Paper Review] Megatron-LM: Training Multi-Billion Parameter Language Models Using Model Parallelism

2025. 6. 14. 21:43

[NLP Paper Review] Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer (0)	2025.06.16
[NLP Paper Review] BART: Denoising Sequence‑to‑Sequence Pre‑training for Natural Language Generation, Translation, and Comprehension (4)	2025.06.15
[NLP Paper Review] ALBERT: A Lite BERT for Self-supervised Learning of Language Representations (3)	2025.06.13
[NLP Paper Review] XLNet: Generalized Autoregressive Pretraining for Language Understanding (2)	2025.06.12
[NLP Paper Review] RoBERTa: A Robustly Optimized BERT Pretraining Approach (2)	2025.06.11

📌 논문 정보