- 2021년 1학기 자연어처리 스터디 커리큘럼 및 세부계획입니다
🔔 스터디 소개
-
이번 학기 저희 NLP(자연어처리)팀은 실전(대회, 프로젝트 등)에서 NLP를 활용할 수 있는 것을 목표로 진행합니다. 그렇지만 기초부터 천천히 모델 하나하나 살펴볼 예정이니, 크게 부담가지실 필요는 없습니다!
-
먼저 교재에 대해 말씀드리자면, NLP 관련하여 가장 최근에 출판된 책인 «한국어 임베딩»을 스터디 교재로 선정하였습니다. 실전에서 활용하려면 최신 모델과 그 내용을 숙지하는 것이 중요하다고 생각했기 때문입니다. 또한, ‘한국어 NLP’관련하여 가장 상세하게 ‘한국어로’ 설명되어 있습니다. 그렇기에 그동안 영어 NLP를 영어로 공부하신 분들에게도 도움이 될 만한 스터디가 되고자 합니다. 단, 교재에 딥러닝 부분의 설명은 거의 없습니다. 이러한 부분은 «딥러닝을 이용한 자연어 처리 입문»에서 필요한 내용만 보충할 예정입니다.
-
교재 공부를 끝마치면, 두 팀으로 나누어 3주동안 팀프로젝트를 진행합니다. 챗봇 개발, 기사/리뷰 분석 혹은 NLP 관련 대회 등 각 팀별로 주제를 선정하여 학기 말에 결과물을 내는 것을 목표로 합니다. 흐지부지되는 것을 막고자, 각 주차에 팀별 진행 현황을 브리핑합니다. 기말고사가 끝난 이후, 프로젝트 최종 결과물을 발표합니다.
🔔 모집 대상
- 한국어 NLP에 관심이 있으신 분
- NLP 관련 프로젝트를 해보고 싶으신 분
- Python 기초 문법을 숙지하신 분
- 선형대수학, 통계학, 확률론, 뉴럴 네트워크 등의 Data Science 기초 지식이 있으신 분
🔔 스터디 방식
- 각 주차의 발제자가 해당 내용을 설명하며, 나머지 팀원은 예습&복습을 해옵니다
- 교재에 있는 코드는 모두 실행하여 봅니다. (ratsgo github 참고)
- 프로젝트 기간에는 팀별 진행 현황을 공유합니다.
- 반드시 프로젝트 결과물을 제출해야 합니다.
🔔 교재
- 한국어 임베딩(이기찬 저)
🔔 커리큘럼
🔔 참고 사이트
- ratsgo blog : https://ratsgo.github.io/blog/categories/
- ratsgo github : https://github.com/ratsgo/embedding
- 딥러닝을 이용한 자연어 처리 입문 : https://wikidocs.net/book/2155
- CS224n@Stanford : https://www.youtube.com/playlist?list=PL3FW7Lu3i5Jsnh1rnUwq_TcylNr7EkRe6
- Text Analytics@Korea : https://www.youtube.com/playlist?list=PLetSlH8YjIfVzHuSXtG4jAC2zbEAErXWm