Make Top10 Model!

1. 만든 "나만의 NLP 모델"의 사용 목적을 설명해주세요.

대 방구석 시대, 사람들은 그 어느때보다 영상 시청에 빠져들고 있습니다.
그리고 이렇게 보는 사람이 많아지는 만큼, 이것을 만드는 사람들도 고민이 깊어지겠죠.
어떤 내용으로 만들어야 사람들에게 인기가 많을지 예측하기는 늘 어려운 일이었습니다.
하지만 이제 걱정이 없어졌습니다.
"Make Top10 Model" 이 생겼으니까요!
이 모델은 넷플릭스 TOP10에 올라간 적이 있는 작품의 소개글을 바탕으로 주요 스토리를 만들어줍니다.
자 이제 당신만의 TOP10을 만들어보세요!

2. 데이터셋을 구성하고 준비한 방법을 들려주세요. 해당 데이터셋을 사용하기 전에 반드시 라이센스 확인을 해주세요.

  • https://flixpatrol.com/ 사이트에서 2021년 1월 1일부터, 2021년 4월 30일까지 모든 나라의 넷플릭스 Top10 타이틀을 추출한 뒤, 중복 제거하고 해당 컨텐츠 정보를 동 사이트에서 추출하여 간단한 전처리 과정을 거쳐 사용했습니다.
    ※ 데이터 제공 관련 : Products & Solutions • FlixPatrol (데이터 관련 주요 문구 : “We offer a wide range of movie data analytics with a focus on OTT Insights and VOD charts. A wide range of our data sets could be used for data-science, movie data analysis or to build an OTT dashboard out of film industry data.”)

3. 나만의 NLP 모델로 작성한 글을 공유해주세요!

(AI가 작성한 부분을 Bold로 표시해주세요.)

  1. Korean Tae Yi is a high school student. He is also a recluse and rarely leaves his room. His roommate Yong-bae keeps a diary, and in it are some chilling predictions. While looking through the book, Yong Bae even manages to catch a glimpse of the ghost of his.

  2. Student to learn about volcanoes and their role in the weather.
    Based on the incredible true story.

  3. Making of her family’s struggle with racism, as well as her own future and the fate of Britain.

4.TabTab 페이지 링크

참여 소감

  • 챌린지를 너무 늦게 알게 되어서 데이터셋 준비가 부족했는데, 양이 더 보강되고 제 실력이 부족해서 못한 고유명사(이름,지명 등)에 대한 전처리를 해서 학습시킨다면 더 예쁘고 좋은 모델이 나오지 않았을까 싶어서 아쉽기도 합니다.
    그래도 코드 없이 AI를 만들어볼 수 있다는거 자체로도 너무 재밌고 좋은 경험이었어요 감사합니다! :slight_smile:
9 Likes

와아! 첫 번째 결과 제출물 축하합니다. :partying_face:

저도 넷플릭스에서 시청할 영화나 드라마 선택할 때 소개글을 보고 자주 판단하고는 하는데요. Top 10에 등재되었던 작품들의 소개글을 뽑아 데이터를 구성하셨다니…!

AI가 추천해주는 문장을 내 상황에 그대로 적용하기는 어렵겠지만, 영감이 필요할 때 유용하게 참고할 수 있을 것 같아요!(인기있던 작품들은 이렇게 썼구나~) 저도 마케팅 문구 고민할 때 한 번 사용해보겠습니다. :raising_hand_woman:

수고하셨습니다!

1 Like

Killer’s housemaid to settle the matter, but his ex-wife reveals that he was framed for her.

뭔가 단어들 넣고 어떤 영화나 드라마가 Top 10에 있었는지 맞추는 퀴즈처럼 써볼 수도 있겠네요 :smiley:

2 Likes

데이터셋 추출 과정에서 나라별로 빠진 부분이 많아서 약간 아쉬운 기분이라,
다시 추출해서 데이터셋 양을 늘리고 다시 적용시켜봤습니다! :slight_smile:

아래는 새로 훈련시킨 TabTab 링크입니다!

3 Likes

영화를 좋아하는 저한테는 꼭 써보고 싶은 모델이네요. TabTab을 테스트해보니 이런 결과가 나오네요. ㅎㅎ

Magic for kids to explore the surreality of small-town life, the darkness, and weirdness bubbling beneath the river.

The hackers gather information on the Russian economy, government and social media. Affections with famous people and events are