1. 만든 "나만의 NLP 모델"의 사용 목적을 설명해주세요.
대 방구석 시대, 사람들은 그 어느때보다 영상 시청에 빠져들고 있습니다.
그리고 이렇게 보는 사람이 많아지는 만큼, 이것을 만드는 사람들도 고민이 깊어지겠죠.
어떤 내용으로 만들어야 사람들에게 인기가 많을지 예측하기는 늘 어려운 일이었습니다.
하지만 이제 걱정이 없어졌습니다.
"Make Top10 Model" 이 생겼으니까요!
이 모델은 넷플릭스 TOP10에 올라간 적이 있는 작품의 소개글을 바탕으로 주요 스토리를 만들어줍니다.
자 이제 당신만의 TOP10을 만들어보세요!
2. 데이터셋을 구성하고 준비한 방법을 들려주세요. 해당 데이터셋을 사용하기 전에 반드시 라이센스 확인을 해주세요.
-
https://flixpatrol.com/ 사이트에서 2021년 1월 1일부터, 2021년 4월 30일까지 모든 나라의 넷플릭스 Top10 타이틀을 추출한 뒤, 중복 제거하고 해당 컨텐츠 정보를 동 사이트에서 추출하여 간단한 전처리 과정을 거쳐 사용했습니다.
※ 데이터 제공 관련 : Products & Solutions • FlixPatrol (데이터 관련 주요 문구 : “We offer a wide range of movie data analytics with a focus on OTT Insights and VOD charts. A wide range of our data sets could be used for data-science, movie data analysis or to build an OTT dashboard out of film industry data.”)
3. 나만의 NLP 모델로 작성한 글을 공유해주세요!
(AI가 작성한 부분을 Bold로 표시해주세요.)
-
Korean Tae Yi is a high school student. He is also a recluse and rarely leaves his room. His roommate Yong-bae keeps a diary, and in it are some chilling predictions. While looking through the book, Yong Bae even manages to catch a glimpse of the ghost of his.
-
Student to learn about volcanoes and their role in the weather.
Based on the incredible true story. -
Making of her family’s struggle with racism, as well as her own future and the fate of Britain.
4.TabTab 페이지 링크
참여 소감
- 챌린지를 너무 늦게 알게 되어서 데이터셋 준비가 부족했는데, 양이 더 보강되고 제 실력이 부족해서 못한 고유명사(이름,지명 등)에 대한 전처리를 해서 학습시킨다면 더 예쁘고 좋은 모델이 나오지 않았을까 싶어서 아쉽기도 합니다.
그래도 코드 없이 AI를 만들어볼 수 있다는거 자체로도 너무 재밌고 좋은 경험이었어요 감사합니다!