- 2021년 1학기 강화학습+생성모델 스터디 커리큘럼 및 세부계획입니다
🔔 스터디 소개
-
인공지능이라고 하면 어떤 생각이 떠오르시나요? 알파고? 로봇? 자율주행? 사람들이 흔히 생각하는 인공지능이라고 하면 스스로 학습해서 똑똑해지는 존재라고 생각을 하게 됩니다. 하지만 현재 인공지능이라고 이야기되는 대부분의 기술들은 지도학습을 의미하고 있습니다. 이러한 지도학습에는 결국에는 라벨이 존재해야 한다는 단점이 존재합니다. 예를 들어 지도학습으로 로봇이 움직이게 하려면 걸을 때 매 순간 특정 정답지가 존재해야 합니다 1ms마다 연산을 하는 로봇이라고 하면 매 ms마다 모든 엑츄에이터에 대한 정답지가 존재해야 한다는 의미이죠. 이는 현실적으로 불가능 합니다. 또한 그런 정답지를 아는 상황이면 굳이 신경망을 사용하지 않고도 로봇을 제어할 수 있습니다 하지만 인간이 처음 걸음마를 배울 때는 그렇지 않죠. 매 순간 걸어보고 “내가 이렇게 행동했을 때 이렇더라”라는 경험을 가지고 학습을 진행하게 됩니다. 강화학습은 인간이 어떠한 능력을 배우는 알고리즘을 모방한 알고리즘입니다. 학습자가 로봇이 걸으면 보상을 주고 로봇이 못 걸으면 패널티를 주는 식으로 학습을 진행하게 되죠. 인간이 학습하는 방식과 가장 유사한 인공지능이라는 매력적인 요소를 가지고 있는 것이 강화학습입니다.
-
하지만 사실 강화학습은 아직 관련 일자리가 부족한 것은 사실입니다. 최근에 SK, 삼성, LG등에서 관심을 보이고 적용 가능한 연구가 활발히 진행되고 있지만 아직은 시작 단계입니다. 그렇기 때문에 강화학습과 더불어 생성 모델에 대해서도 같이 공부하고자 합니다. 이러한 생성 모델은 그 자체로도 많은 쓰임새가 있지만, 최근 강화학습 논문을 보면 생성모델과 결합하여 강화학습을 더 강력하게 만들고 있습니다.
-
이번 스터디를 통해 스스로 환경에 대해서 적용 가능한 강화학습 알고리즘을 만들어서 학습시켜 보는 것을 목적으로 하고 있습니다. 또한 생성 모델을 통해 이미지, 자연어등을 스스로 생성해내는 인공지능 모델을 학습하는 것 또한 목적으로 하고 있습니다.
-
이번 스터디는 많이 어려울 예정입니다. 온갖 수식이 난무하고 강화학습 알고리즘을 구현하기 위해서는 정말 많은 코딩이 필요하죠. 이러한 어려움을 알고 강화학습과 생성에 대해 알고 싶으시다면 환영입니다.
-
매 수업마다 먼저 관련 주제에 대해 이론적인 공부를 하게 됩니다. 헤당 공부가 끝나면 그 전 시간의 이론을 바탕으로 구현한 과제이자 개인의 코드를 리뷰하는 시간을 가지게 될 것입니다.
🔔 모집 대상
- 강화학습과 생성 모델에 관심이 있는 분들
- 딥러닝에 능숙하신 분들
- 파이썬에 능숙하신 분들
🔔 스터디 방식
- 매주 강화학습 부분, 생성 부분 과제를 나갈 겁니다.
-
스터디는 총 3시간으로 진행될 예정입니다.
-
강화학습 부분: 책에서 읽은 내용 중 이해 안되는 부분이나 헷갈리는 부분 질문을 합니다. 해당 질문이 다 끝나면 과제 코드 리뷰 진행
- 생성 모델 부분 : 과제 코드 리뷰 진행하면서 모르는 내용 정리
🔔 커리큘럼
🔔 교재
- 수학으로 풀어보는 강화학습 원리와 알고리즘