
J'ai publié un nouveau dépôt sur le github de l'organisation "stream-for-good" (me contacter si vous voulez que je vous y rajoute)
Ce dépôt montre comment procéder au scrapping (ou capture des données) des programmes en direct de Netflix. Pour cela, j'utilise Selenium en Python et le driver web du navigateur Chrome.
Une fois les étapes de connexion et le selection de la page du direct passé, le contenu aspiré et envoyé dans l'API de consommation, et peut être accédé au travers de l'API dataviz.
Objectif: prime-space vs prime-time
Ces données permettront de voir si les contenus de la programmation directe de netflix, qui répondent à une problématique de "prime-time", correspondent également à celui du supposé "prime-space" de l'algorithme de recommandation.
Ce Scrapping n'est possible uniquement qu'à partir d'un compte Netflix et d'une IP "privée" (c'est à dire pas un serveur sur le cloud). Il est donc nécessaire d'exécuter ce robot sur un microsystème en cours de développement par les équipes L3 Class et L3 App B.
- Se connecter pour poster des commentaires