[광주 인공지능 사관학교 1기] 9장 미니 프로젝트
※ 이 글은 광주 인공지능 사관학교 과정이 종료된 후 작성된 것입니다.
※ 비기숙사(광주 거주)임을 알려드립니다.
※ 일기 형식으로 적을 예정이기에 말투에 불편함 없길 바랍니다.
*날짜: 2020.08.29 오후09:30
1. 자연어 처리 & 추천 시스템 미니 프로젝트
2020.08.26 ~ 08.28
1) 팀 구성: 3~4인이 한 팀
2) 주제 (3개 중 선택 또는 자유 주제 가능)
① 네이버 영화 크롤링 후 추천 시스템 제작
② 유튜브 영상/댓글 데이터를 통해 새로운 영상/댓글이 좋아요를 받을 확률 계산
③ 뉴스 기사를 크롤링해서 기사의 본문을 넣으면 헤드라인을 뽑아주는 seq2seq 모델 구축
3) 기한: 수목금 수업시간 + 주말, 08.29(월) 수업시간에 발표
2. 팀 구성
- 학생들의 의견을 먼저 반영해 팀 구성, 나머지는 임의로 구성.
- 나는 여학생 2명과 함께 진행
3. 주제
- 네이버 영화 크롤링 후 추천 시스템 제작
4. 원하는 결과
- 사용자가 원하는 장르 1~3개 선택하면 평점이 높은 영화(30개) 중 랜덤으로 3개만 출력
5. 역할
- 추천 시스템 모델링
- 코사인 유사도를 통해 장르에 대한 유사도 적용
- 평점이 10점인 영화는 제외(이유: 평가수가 너무 적은 영화들 + 소수의 매니아만 보는 영화이기 때문)
6. 로고 제작
7. 결과 & 느낀 점
짧은 기간이었지만 처음 진행했던 팀 프로젝트였다.
처음에 크롤링하는 시간이 꽤 오래 걸렸다. 8시간 정도 걸렸던 것 같다. 첫 번째 날은 기획과 크롤링하느라 시간을 다 씀.
모델링 파트에서는 장르별로 유사도를 측정하다보니 액션을 입력하면 다큐멘터리가 나오고 드라마를 입력하면 호러가 나오는 등 연관성이 없었다.
유사도를 장르 이름 그대로 적용하니 나오는 문제점이었다. 추후에는 유사도 매트릭스를 만들어 점수를 통해 장르의 연관성을 뽑는 것이 좋다고 생각했다.
제대로 실습할 기회가 없었는데 수업 시간에 배웠던 내용을 활용해 볼 수 있다는 점에서는 꽤 좋은 시간들이었다.