이 시리즈는 NLP 분야의 핵심 논문들을 정리하고 리뷰하는 글입니다.논문의 주요 기여와 핵심 개념을 개인적으로 이해한 관점에서 풀어내며실제 프로젝트나 연구에 어떻게 적용할 수 있을지에 대한 생각도 함께 담았습니다. 📌 논문 정보논문 제목: Language Models are Few-Shot Learners저자/소속: Tom B. Brown 외 30명 / OpenAI출판 연도 / 학회: 2020년 / NeurIPS 2020링크: arXiv:2005.14165 ✍🏻 TL;DR – 한 줄 요약GPT-3는 파인튜닝 없이도 프롬프트만으로 다양한 NLP 태스크를 수행할 수 있으며, 특히 few-shot 세팅에서는 전통적인 fine-tuned 모델과 비슷한 수준의 성능을 보여주었습니다. 🫣 연구 배경 & 문제점..
이 시리즈는 NLP 분야의 핵심 논문들을 정리하고 리뷰하는 글입니다.논문의 주요 기여와 핵심 개념을 개인적으로 이해한 관점에서 풀어내며실제 프로젝트나 연구에 어떻게 적용할 수 있을지에 대한 생각도 함께 담았습니다. 📌 논문 정보논문 제목: Improving Language Understanding by Generative Pre-Training (GPT-1)저자/소속: Alec Radford, Karthik Narasimhan, Tim Salimans, Ilya Sutskever / OpenAI출판 연도 / 학회: 2018년 / OpenAI Preprint링크: 논문 PDF ✍🏻 TL;DR – 한 줄 요약Transformer 기반 언어 모델을 대규모 비지도 학습으로 사전 훈련한 후, 소량의 지도 학..
이지스퍼블리싱 출판사의 서평단 활동으로제공받은 도서를 읽고 솔직하게 작성한 리뷰입니다.📚 책 소개오늘 소개할 책은 ⌜Do it! LLM을 활용한 AI 에이전트 개발 입문 (이성용)⌟이다. 📍 책 선택 이유 몇 달 전부터 AI 분야에서 가장 주목받는 키워드 중 하나인 AI 에이전트에 대해 자주 접해왔고 개념적으로는 알고 있었지만 실제로 프로젝트를 진행해 본 경험은 없어 항상 시도해보고 싶다는 생각만 하며 미뤄두고 있었다. 그러던 중 이지스퍼블리싱에서 관련 도서가 출간된다는 소식을 알게 되었고 자연스럽게 다시 관심이 생겼다. 평소에도 Do it! 시리즈를 통해 실습 위주의 구성과 친절한 설명에서 큰 도움을 받아왔기 때문에 이번 책 역시 실습 중심으로 잘 구성되어 있을 것이라는 기대가 생겼다. 이제 막 ..