Archive les données des vidéos d'une chaine via l'API Youtube data V3 avec ID, titre, description, date de publication, top commentaires, sous-titres manuels & automatiques, pour Wankil Finder.
Le but est d'être utilisé dans le Wankil Finder, les données archivés serviront de données de recherche, permettant de rechercher une vidéo de Wankil Studio (le crawler est toutefois configurable pour n'importe quelle chaîne) à partir de mots-clés.
Nécéssite les modules youtube_transcript_api, requests:
pip3 install youtube-transcript-api requests
Il faut renommer config.sample.py
en config.py
, en renseignant APIKey
avec la clé API et playlistId
avec l'ID de la playlist dans laquelle prendre les vidéos.
Il faut ensuite renseigner les informations de connexion de la base de donnée MySQL, la structure de cette bdd est disponible dans le fichier structure.sql
Puis il suffit de lancer le script:
python3 crawler.py
Testé avec Python 3.10.4, mais devrait marcher avec toute versions > 3.
License MIT (voir le fichier LICENSE)