Skip to content

Latest commit

 

History

History
22 lines (21 loc) · 1.82 KB

지금까지_활동내역.md

File metadata and controls

22 lines (21 loc) · 1.82 KB

프로젝트 기술 요소

  • 다큐멘터리 정보 추출 : 데이터 크롤링(Python - pandas/selenium/beautifulsoup 활용)

  • 시놉시스 텍스트 정제 : 데이터 전처리(엑셀, Python - pandas 활용)

  • 데이터 개요 정리 : 데이터 차트 시각화(Python - matplolib, wordcloud 활용)

    • [ ]
  • 다큐멘터리 회차 별 '태그' 추출, 추천 시스템용 데이터 생성 : 자연어 처리(Python - pandas, soynlp, konlp 활용)

    • 다현님이 하신 샘플링 태그 올리기
  • 다큐멘터리 회차 '대분류' 채우기 : RandomForest(머신러닝 기법)을 활용한 classification(Python - scikit-learn 활용)

  • 다큐멘터리 회차 별 다른 컨텐츠 추천 : Contents Filtering algorithm을 활용한 콘텐츠 추천(Python - scikit-learn 활용)

    • [ ]
  • 웹 개발 : Bootstrap 프레임워크 - html, css, javascript, jQuery 활용

    • [ ]