2021년 2학기 데이터마이닝 스터디 커리큘럼 및 세부계획입니다


🔔스터디 소개

  • 모든 분야에서 데이터를 다루고 활용하는 능력은 중요시되고 있으며, 이미 많은 기업에서 데이터 관련 역량을 검증하려 합니다. 데이터마이닝은 데이터베이스, 인공지능, 머신러닝을 아우르는 개념으로 그만큼 다양한 분야의 지식이 필요합니다. 이 지식이 탄탄하다면, 각자의 도메인에서 충분히 활약할 수 있습니다.

  • 시중에는 수많은 데이터마이닝 관련 좋은 교재와 강의들이 있어 혼자서도 공부할 수 있습니다. 하지만 자신이 무엇이 부족한지 모르면 언젠가 한계에 부딪히게 됩니다. 또한 이론과 코드 실습을 통해서 개념을 완벽하게 이해했다 해도 그것을 실제 분석에 활용하는 것은 다른 문제입니다. 데이터마이닝 스터디의 목적은 자신이 배운 내용들을 피드백받고, 공유하는 데 있습니다.

  • 그동안의 학교수업이나 여러 특강에서 공부하는 데이터마이닝은 어떤 사람에게는 너무 쉽거나, 어떤 사람에게는 너무 어려웠을 것입니다. 저희 데이터마이닝 스터디는 머신러닝 기초를 함께 공부하며, 선택 발제를 통해 자신이 탄탄하게 공부하고 싶은 분야를 팀원들과 같이 공부합니다. 머신러닝의 기초가 부족한 분들은 주교재의 내용들을 쭉 따라가면 되고, 다른 분야를 공부하고 싶은 분들은 스터디원과 상의해 같은 교재로 공부하며 선택 발제를 진행할 수 있습니다.

  • 프로젝트 기간은 유동적으로 1~2주 진행될 것이며 스터디 시간에 배운 내용들을 활용할 수 있을 것입니다.


🔔모집 대상

1. 데이터마이닝에 관심이 있으신 분

2. 스터디 기간에 성실하게 참여하실 수 있는 분

3. (중요) 활발하게 의견 공유하시는 분 – 피드백이 주가 되는 스터디인 만큼 적극적인 태도는 필수입니다!

4. 기초통계, 선형대수학을 이해하시는 분


🔔스터디 방식

  • 저희 스터디는 크게 3가지 부분으로 이뤄져 있습니다. (1) 머신러닝 기초이론, (2) 코드 리뷰 및 실습, (3) 선택 발제입니다.

(1) 머신러닝 기초이론은 교재를 기반으로 이론을 학습하는 것이며 정기 스터디가 있기 전까지 해당 내용을 익혀야 합니다.

(2) 코드 리뷰 및 실습은 기초이론 부분의 교재 연습문제를 중심으로 코드를 작성해오는 것이며 한 두 문제 정도는 스터디 시간에 같이 작성해봅니다.

(3) 선택 발제는 자신이 공부하고 싶은 분야를 자유롭게 선택해 교재를 선택하고 각자 공부해 발제자가 되었을 때 공유하는 것입니다. 이 때 분야가 겹치는 스터디원이 있다면 같은 교재를 사용해 더 적극적인 피드백이 오갈 수 있도록 합니다.

효율적인 코드 리뷰와 적극적인 피드백을 위해, 2팀으로 나눠서 진행합니다. 다만, 스터디원분들의 다양한 지식 접근을 위해서 선택 발제는 팀을 합쳐서 진행합니다. 발제자는 (1) 머신러닝 기초이론과 (2) 코드 리뷰 및 실습에 해당하는 발제준비를 해야 하며, 스터디 시간에 라이브로 진행됩니다. 선택 발제는 말그대로 선택, 필수가 아닙니다. 10번의 스터디 중 각각 2~3번의 발제를 맡게 될 것입니다.


🔔교재

주교재

1. 핸즈온 머신러닝 2판 Aurelien Geron 저 ISBN : 9791162242964

image

참고하면 좋은 자료

1. 코세라 기계학습 강의

머신러닝분야에서 고전 같은 강의로 복잡한 이론들을 이해하기 쉽게 알려줍니다. 기초가 부족하신 분들에게 강력 추천하는 강의입니다. 다만, 프로그래밍 언어가 MATLAB/Octave로 처음에 익히는데 시간이 걸릴 수 있습니다. 하지만 코딩 과제의 난이도가 어렵지 않으므로 꼭 다 해보는 것을 추천합니다.

2. 점프 투 파이썬

파이썬 기초가 부족하신 분들은 이 곳에서 파이썬을 익히시기 바랍니다.


🔔커리큘럼

image


2021-02 데이터 마이닝 팀장 손수용 올림