Scrapping du Direct de Netflix

Nicolas Herbaut 27 December 2020 scrapping, netflix, prime time,

J'ai publié un nouveau dépôt sur le github de l'organisation "stream-for-good" (me contacter si vous voulez que je vous y rajoute)

Ce dépôt montre comment procéder au scrapping (ou capture des données) des programmes en direct de Netflix. Pour cela, j'utilise Selenium en Python et le driver web du navigateur Chrome.

Une fois les étapes de connexion et le selection de la page du direct passé, le contenu aspiré et envoyé dans l'API de consommation, et peut être accédé au travers de l'API dataviz.

Objectif: prime-space vs prime-time

Ces données permettront de voir si les contenus de la programmation directe de netflix, qui répondent à une problématique de "prime-time", correspondent également à celui du supposé "prime-space" de l'algorithme de recommandation.

Ce Scrapping n'est possible uniquement qu'à partir d'un compte Netflix et d'une IP "privée" (c'est à dire pas un serveur sur le cloud). Il est donc nécessaire d'exécuter ce robot sur un microsystème en cours de développement par les équipes L3 Class et L3 App B.

Se connecter pour poster des commentaires

découvrabilité

sécurité

Equipe Scientifique

L'équipe scientifique, composée des étudiants de Master 2 IKSEM et Master 2 S2I.

Matthieu Porembski s'intéresse à la découvrabilité des oeuvres sur la plateforme Netflix
Léna Albert s'intéresse à la propagation des théories du complit sur la plateforme Youtube
Marie-Françoise Edroux s'intéresse à la diversité des contenus proposés sur la plateforme Netflix

A propos

Equipe Scientifique