22nd Jan 2025 8 minutes de lecture Netflix emballé avec SQL : Plongez dans votre année de streaming Jakub Romanowski postgresql analyse des données pratique sql Table des matières Étape 1 : Récupérez vos données Netflix Étape 2 : Charger le fichier dans PostgreSQL (de manière ludique) Étape 3 : Voir quelle série a été la plus regardée Étape 4 : Repérer les tendances au cours de l'année Étape 5 : Découvrez des tendances surprenantes Netflix emballé à l'aide de SQL Dans cet article, nous transformons votre historique de visionnage Netflix en votre propre Netflix Wrapped, en utilisant SQL. Vous êtes-vous déjà demandé quelle émission vous avez le plus regardé ou quel jour vous n'avez pas pu résister à l'envie d'appuyer sur "play" ? Je vais vous montrer comment obtenir toutes ces informations amusantes. Allons-y ! L'année est presque terminée, alors pourquoi ne pas jeter un coup d'œil amusant à vos habitudes Netflix ? Vous vous souvenez de tous ces week-ends où vous vous êtes dit que vous ne regarderiez qu'un seul épisode ? Oui, moi aussi. Avec SQL, vous pouvez transformer votre historique de visionnage de Netflix en informations intéressantes, comme trouver vos émissions les plus regardées ou découvrir vos habitudes de binge-watching. C'est plus facile que vous ne le pensez et, honnêtement, c'est très amusant de voir les données présentées ! Si cela vous intéresse, vous pouvez également consulter mon autre article sur la façon d'analyser vos données Spotify Wrapped avec SQL. Mais revenons aux films et aux séries. Étape 1 : Récupérez vos données Netflix Tout d'abord, vous avez besoin de votre historique de visionnage Netflix. C'est là que tout commence ! Vous allez télécharger les données que Netflix conserve discrètement sur tout ce que vous avez regardé. Voici ce que vous devez faire : Connectez-vous à Netflix dans votre navigateur (croyez-moi, c'est beaucoup plus facile ainsi). Cliquez sur Paramètres du compte (sous votre photo de profil). Allez dans Profil et contrôle parental, choisissez votre profil et cliquez sur Activité de visualisation. Descendez jusqu'en bas et cliquez sur Télécharger tout. Et voilà ! Vous avez un fichier CSV avec tout ce que vous avez regardé. Vous l'avez ? C'est super ! Passons à la suite. Étape 2 : Charger le fichier dans PostgreSQL (de manière ludique) PostgreSQL est un puissant système de base de données relationnelle open-source, parfait pour traiter des données structurées, comme votre historique de visionnage Netflix. Il est fiable, polyvalent et largement utilisé dans tous les domaines, des projets personnels aux applications d'entreprise. Pour faciliter les choses, nous utiliserons pgAdmin, une interface graphique conviviale pour gérer les bases de données PostgreSQL. Considérez pgAdmin comme votre centre de commande : il vous permet de créer des bases de données, d'exécuter des requêtes et de visualiser des données sans avoir à mémoriser une tonne de commandes SQL. Si vous ne connaissez pas encore ces outils, consultez ce guide du débutant : Comment installer et configurer PostgreSQL avec pgAdmin. Ce guide vous guidera tout au long du processus, ce qui vous permettra de démarrer très facilement. Maintenant, nous allons transférer vos données dans PostgreSQL afin de pouvoir commencer à jouer avec elles. Voici comment procéder : Ouvrez pgAdmin et connectez-vous à votre serveur PostgreSQL. Ajoutez une table pour vos données en écrivant cette requête dans l'outil Query : CREATE TABLE NetflixViewingHistory ( Title TEXT, Date DATE ); Importez votre fichier CSV : Cliquez avec le bouton droit de la souris sur la table et sélectionnez Import/Export. Choisissez votre fichier CSV, associez les colonnes à Title et Date, puis cliquez sur OK. Vous voulez faire preuve de plus de fantaisie ? Vous pouvez également importer des données à l'aide d'une requête SQL : COPY NetflixViewingHistory(Title, Date) FROM '/path/to/your/NetflixViewingHistory.csv' DELIMITER ',' CSV HEADER; Remplacez simplement /path/to/your/NetflixViewingHistory.csv par le véritable chemin d'accès au fichier. Et comme ça, vos données sont prêtes à être utilisées ! Pour vérifier les données et vous assurer que tout s'est chargé correctement, vous pouvez exécuter une simple requête SQL pour vérifier votre table : SELECT * FROM NetflixViewingHistory LIMIT 10; Cette requête affichera les 10 premières lignes de votre table. Si vous voyez vos spectacles, dates et détails bien rangés dans les colonnes, vous pouvez commencer ! Étape 3 : Voir quelle série a été la plus regardée Très bien, découvrons les séries qui vous ont tenu en haleine cette année. Au lieu de regarder tous les titres, cette requête se concentre sur la recherche des séries les plus regardées en regroupant les épisodes. En exécutant cette requête, vous découvrirez les séries qui ont dominé votre temps sur Netflix. Cette requête compte le nombre d'épisodes que vous avez regardés pour chaque série, ce qui vous permet d'identifier clairement la série la plus regardée. Était-ce Friends ? Peut-être Stranger Things ? Jetons un coup d'œil : SELECT SPLIT_PART(Title, ':', 1) AS Series, COUNT(*) AS WatchCount FROM NetflixViewingHistory GROUP BY Series ORDER BY WatchCount DESC LIMIT 10; Cette requête vous donne une liste de vos séries les plus regardées. Dans mes résultats, "Friends" arrive en tête, suivi de près par "The Office" et "Dr House". Parmi les autres choix populaires, on trouve "Vikings", "Breaking Bad" et "Cobra Kai". Même "Designated Survivor" et "Fauda" font partie de la liste, ce qui montre un mélange assez éclectique ! À vous de jouer. À quoi ressemble votre liste ? Votre série préférée de tous les temps a-t-elle été retenue ou y a-t-il eu un concurrent surprise en tête de liste ? Essayez et faites-moi signe ! Étape 4 : Repérer les tendances au cours de l'année Soyons un peu plus "nerd" avec des statistiques mensuelles pour découvrir vos tendances de visionnage. Avez-vous regardé davantage pendant les mois d'hiver, ou l'été a-t-il été la saison où vous avez le plus regardé Netflix ? En utilisant SQL, nous pouvons décomposer votre historique de visionnage mois par mois pour voir comment vos habitudes ont changé au cours de l'année. Voici une requête SQL très intéressante : SELECT EXTRACT(YEAR FROM Date) AS Year, EXTRACT(MONTH FROM Date) AS Month, COUNT(*) AS TotalViews FROM NetflixViewingHistory GROUP BY Year, Month ORDER BY Year DESC, Month DESC; Cette requête vous permettra de connaître, mois par mois, le nombre d'émissions ou de films que vous avez regardés. Par exemple, vous pouvez constater un pic en décembre grâce aux émissions spéciales des fêtes de fin d'année, ou en juillet pendant les soirées d'été paresseuses. Dans mon cas, le mois de décembre n'a pas été en reste : il s'agit clairement d'un mois riche en soirées cinéma douillettes. Vous voulez savoir quel mois de l'année 2024 a enregistré le plus grand nombre de visionnages ? Essayez cette requête : SELECT EXTRACT(MONTH FROM Date) AS Month, COUNT(*) AS TotalViews FROM NetflixViewingHistory WHERE EXTRACT(YEAR FROM Date) = 2024 GROUP BY Month ORDER BY TotalViews DESC LIMIT 1; Cette requête identifie le mois le plus fréquenté en 2024. Pour moi, février a été le grand gagnant : j'ai réussi à regarder un nombre impressionnant de 77 émissions et films ! Il semblerait que les douces soirées d'hiver aient été parfaites pour les marathons Netflix. Mais quel film ou quelle série a été le plus regardé en février ? Découvrons-le grâce à cette requête : SELECT SPLIT_PART(Title, ':', 1) AS Series, COUNT(*) AS TotalViews FROM NetflixViewingHistory WHERE EXTRACT(YEAR FROM Date) = 2024 AND EXTRACT(MONTH FROM Date) = 2 GROUP BY Series ORDER BY TotalViews DESC; Ces requêtes affichent vos titres préférés et les séries les plus regardées en février. Dans mon cas, la plupart des 77 visionnages ont été des épisodes de "Dr House" et de "Yellowstone". Et vous ? S'agit-il d'une série emblématique ou d'un film réconfortant auquel vous revenez sans cesse ? Vérifiez vos résultats ! Étape 5 : Découvrez des tendances surprenantes Vous voulez connaître votre jour de prédilection pour Netflix ? Découvrons le jour de la semaine où vous êtes le plus susceptible d'appuyer sur "play". SQL peut facilement le révéler en analysant votre historique de visionnage et en comptant le nombre d'émissions ou de films que vous avez regardés chaque jour de la semaine. C'est une façon amusante de repérer vos habitudes de lecture en continu ! SELECT CASE EXTRACT(DOW FROM Date) WHEN 0 THEN 'Sunday' WHEN 1 THEN 'Monday' WHEN 2 THEN 'Tuesday' WHEN 3 THEN 'Wednesday' WHEN 4 THEN 'Thursday' WHEN 5 THEN 'Friday' WHEN 6 THEN 'Saturday' END AS DayOfWeek, COUNT(*) AS Views FROM NetflixViewingHistory GROUP BY DayOfWeek ORDER BY Views DESC; Pour moi, le résultat était assez évident : les week-ends dominaient mon temps Netflix ! Les dimanches et les samedis étaient les jours où je me gavais le plus. Qu'en est-il pour vous ? Les week-ends ont-ils remporté la palme, ou vous arrive-t-il de regarder davantage de contenus en streaming pendant la semaine ? SQL permet de découvrir facilement vos habitudes uniques et de révéler des schémas intéressants dans votre historique de visionnage. Essayez-le et voyez ce que vos données révèlent ! Netflix emballé à l'aide de SQL Vous avez réussi ! Vous venez de transformer votre historique de visionnage de Netflix en votre propre Netflix Wrapped à l'aide de SQL. N'est-ce pas incroyable de voir toutes ces statistiques présentées ? De la découverte de vos séries les plus regardées à l'identification de vos jours de consommation excessive préférés, vous avez un aperçu complet de vos habitudes de lecture en continu. Vous connaissez déjà mes statistiques, il est maintenant temps de connaître les vôtres ! À quoi ressemblent vos résultats ? Une série surprise a-t-elle pris la première place, ou votre mois le plus chargé a-t-il été une surprise ? Quelle que soit votre histoire, SQL vous permet de la découvrir et de la partager facilement ! Si cela vous a amusé (et soyons réalistes, c'était le cas), vous devriez jeter un coup d'œil à la piste SQL de A à Z. Il comprend sept cours géniaux qui vous enseignent tout, des requêtes de base aux compétences plus avancées telles que les jointures, les agrégations et les sous-requêtes. Il s'agit d'un cours interactif et pratique qui vous permet de développer vos compétences étape par étape, un peu comme nous venons de le faire, mais à un tout autre niveau. Croyez-moi, ce cours est l'étape suivante idéale si vous êtes prêt à améliorer votre jeu SQL. Qui sait ? L'année prochaine, vous pourriez utiliser SQL pour tout analyser, de vos progrès en matière de fitness à vos projets de voyage. Bonne lecture en continu et bonne recherche. Tags: postgresql analyse des données pratique sql