Skip to content

Archive les vidéos d'une chaine (avec metadatas + top commentaires + sous-titres), pour Wankil Finder

License

Notifications You must be signed in to change notification settings

EnzoPB/WankilFinderCrawler

Repository files navigation

WankilFinder Crawler

Archive les données des vidéos d'une chaine via l'API Youtube data V3 avec ID, titre, description, date de publication, top commentaires, sous-titres manuels & automatiques, pour Wankil Finder.

But

Le but est d'être utilisé dans le Wankil Finder, les données archivés serviront de données de recherche, permettant de rechercher une vidéo de Wankil Studio (le crawler est toutefois configurable pour n'importe quelle chaîne) à partir de mots-clés.

Utilisation

Nécéssite les modules youtube_transcript_api, requests: pip3 install youtube-transcript-api requests

Il faut renommer config.sample.py en config.py, en renseignant APIKey avec la clé API et playlistId avec l'ID de la playlist dans laquelle prendre les vidéos. Il faut ensuite renseigner les informations de connexion de la base de donnée MySQL, la structure de cette bdd est disponible dans le fichier structure.sql

Puis il suffit de lancer le script: python3 crawler.py Testé avec Python 3.10.4, mais devrait marcher avec toute versions > 3.

License

License MIT (voir le fichier LICENSE)

About

Archive les vidéos d'une chaine (avec metadatas + top commentaires + sous-titres), pour Wankil Finder

Resources

License

Stars

Watchers

Forks

Languages