9th Oct 2025 15 minutes de lecture Ensembles de données SQL sur la culture populaire : Pratique avec les films, la musique et les sports LearnSQL.fr Team pratique sql Table des matières 🎬 Films : Interroger vos films préférés 🎵Musique : Analyser les graphiques 🏀 Sports : Des statistiques qui racontent une histoire 🎨 Art : Les formes de l'expression 🎮 Jeux vidéo : Jouez avec les données 🗂️ Comment charger un ensemble de données CSV dans une base de données De l'amusement au professionnalisme Pourquoi se contenter de factures et de tableaux de commandes alors que vous pourriez interroger les Oscars, les hits de Spotify ou les statistiques de la NBA ? Les ensembles de données de la culture populaire rendent la pratique de SQL amusante, engageante et étonnamment efficace. Avez-vous déjà voulu utiliser le langage SQL pour savoir quel acteur a remporté le plus grand nombre d'Oscars, quel artiste a dominé les charts l'année où vous avez obtenu votre diplôme ou quel pays est en tête du classement des médailles olympiques ? Bonne nouvelle : c'est possible. La plupart des débutants apprennent le langage SQL en analysant les clients, les commandes et les factures. C'est utile, mais soyons honnêtes, ce n'est pas toujours passionnant. Si vous voulez rester motivé pendant votre apprentissage, vous avez besoin d'ensembles de données amusants et réalistes. C'est là que la culture pop entre en jeu. Les films, la musique et les sports regorgent de données, et les interroger est un moyen idéal de développer de vraies compétences SQL tout en restant intéressant. Si vous débutez ou si vous avez besoin d'une remise à niveau, commencez par le cours SQL pour les débutants à l'adresse LearnSQL.fr. Nos cours de SQL sont entièrement interactifs : vous écrivez des requêtes, vous les exécutez sur des bases de données réelles et vous obtenez un retour d'information instantané. Nous proposons des cours pour les débutants ainsi que des défis avancés, de sorte que même si vous êtes un analyste de données chevronné, vous trouverez quelque chose pour pousser vos compétences plus loin. Dans cet article, nous allons voir comment vous pouvez pratiquer le langage SQL en utilisant des ensembles de données de la culture pop. Nous examinerons des exemples tirés de films, de chansons et de sports, et nous vous montrerons comment ils sont liés aux concepts que vous maîtriserez dans nos cours. 🎬 Films : Interroger vos films préférés Les films ne sont pas seulement un divertissement, ce sont aussi des mines d'or de données. Les listes d'acteurs, les dates de sortie, les budgets, les recettes au box-office, les genres, les classements... tout cela s'intègre parfaitement dans une base de données. Idées de jeux de données Ensemble de données IMDB - Géré par IMDb, cet énorme ensemble de données comprend les titres, les acteurs, l'équipe, les années de sortie, les évaluations et bien plus encore. Il s'agit de l'une des sources les plus utilisées pour les données relatives aux films. The Movie Database (TMDb) - Base de données ouverte et communautaire contenant des métadonnées détaillées sur les films et les émissions de télévision. Populaire pour son API et son contenu actualisé. Kaggle Top 500 Popular Movies - Les ensembles de données cinématographiques curatées sur Kaggle, tels que Top 500 Popular Movies, fournissent des sous-ensembles propres et prêts à l'emploi de films populaires. Spectacles Netflix (Kaggle) - Jeux de données compilés à partir des catalogues Netflix, souvent récupérés ou partagés par des chercheurs, couvrant les titres, les genres, les années de sortie et les régions. Votre propre Netflix Wrapped- Exportez votre historique personnel de visionnage de Netflix pour analyser vos habitudes de visionnage. Idéal pour une pratique personnalisée de SQL. Oscars (Kaggle) - Données historiques sur les Oscars, y compris les gagnants, les nominés, les catégories et les années. Utile pour les requêtes sur les réalisations et les tendances du cinéma. Idées d'exercices Quel acteur a joué dans le plus grand nombre de films primés aux Oscars ? Quel a été le film qui a rapporté le plus d'argent en 2010 ? Quel réalisateur a la meilleure note moyenne sur IMDB ? Combien de films au cours des 20 dernières années ont eu un budget supérieur à 100 millions de dollars mais n'ont pas réussi à atteindre le seuil de rentabilité ? Concepts SQL que vous pratiquerez JOINs (par exemple, relier des acteurs à des films) Tri avec ORDER BY (par exemple, liste des films les mieux notés ou des plus gros succès au box-office) Agrégats comme COUNT, AVG, MAX, SUM (par exemple, compter les films par réalisateur, trouver la note moyenne par décennie ou calculer le total des recettes par studio) 👉 C'est exactement le type de pratique que vous obtiendrez dans notre coursSQL pour les débutants . Au lieu de stars de cinéma, vous interrogerez des données commerciales structurées, mais les compétences sont directement transférées. 🎵Musique : Analyser les graphiques Les données musicales sont omniprésentes : graphiques, listes de lecture, statistiques de streaming et même paroles de chansons. Si vous êtes curieux des tendances, SQL peut révéler des informations fascinantes. Idées d'ensembles de données Billboard Hot 100 et autres - Les données du palmarès capturent les classements hebdomadaires des meilleures chansons, avec les artistes, les années de sortie et les performances dans le palmarès. Parfait pour explorer les tendances de popularité au fil du temps. Jeu de données Spotify Tracks (Kaggle) - Un grand ensemble de données avec des caractéristiques audio (tempo, danse, énergie, valence), des détails sur les titres, les artistes et les scores de popularité. Compilé par les contributeurs Kaggle à partir de l'API de Spotify, il est largement utilisé pour analyser les tendances d'écoute et les attributs musicaux. Créez votre propre Spotify Wrapped avec SQL - Un guide pratique qui vous montre comment exporter votre historique personnel Spotify et l'interroger avec SQL. Idéal pour créer vos propres analyses de type "Wrapped". Grammy Awards (Kaggle) - Couvre les nominations et les gagnants de 1965 à 2024, y compris les catégories, les artistes, les chansons et les albums. Créé par la communauté Kaggle, cet ensemble de données est très apprécié pour étudier l'histoire des récompenses et le succès des artistes au fil des décennies. Principaux compositeurs classiques (Kaggle) - Un ensemble de données sur les compositeurs classiques avec des métadonnées telles que les noms, les époques et les pays. Une ressource simple mais efficace pour analyser l'histoire de la musique à l'aide de SQL. MusicNet (Kaggle) - Contient 330 enregistrements classiques avec plus d'un million d'étiquettes indiquant chaque note et chaque instrument. Publié à l'origine pour la recherche, c'est l'un des ensembles de données classiques les plus riches, qui permet d'analyser la structure musicale et de comparer les compositeurs en détail. Idées pratiques Quel a été l'artiste le plus écouté en 2020 ? Comment la durée des chansons a-t-elle évolué au fil des décennies ? Quelle décennie a produit le plus grand nombre de tubes n°1 au Billboard ? Quels artistes figurent régulièrement dans le Top 10 année après année ? Qui détient le record du plus grand nombre de nominations aux Grammy Awards sans victoire ? Quels sont les compositeurs classiques qui ont vécu le plus longtemps et combien d'œuvres leur sont attribuées ? Concepts SQL que vous pratiquerez Fonctions GROUP BY et aggregate (par exemple, compter les entrées au hit-parade par artiste ou trouver la durée moyenne d'une chanson par décennie) Filtrage avec WHERE (par exemple, limiter les résultats aux chansons des années 1990 ou aux seuls lauréats des Grammy Awards) Travailler avec des dates (par exemple, comparer les performances du palmarès par décennie ou suivre les pics de streaming par année). 👉 Si vous trouvez que GROUP BY est déroutant, notre SQL GROUP BY Pratique vous propose de nombreux exercices pratiques pour vous mettre en confiance. Avec une variété d'ensembles de données du monde réel, vous pratiquerez le regroupement et l'agrégation de données jusqu'à ce que cela devienne une seconde nature. 🏀 Sports : Des statistiques qui racontent une histoire Les amateurs de sport savent que les statistiques font partie du plaisir. Les points, les buts, les médailles, les victoires, les défaites - tout cela se trouve dans des bases de données structurées. Ils sont donc parfaits pour la pratique du langage SQL. Idées d'ensembles de données 120 ans d'histoire olympique (Kaggle) - Couvre les athlètes et les résultats olympiques de 1896 à 2016. Inclut les données démographiques des athlètes, les événements, les médailles et les statistiques par pays. Largement utilisé pour l'analyse historique et l'analyse des tendances. Coupe du monde de la FIFA (GitHub) - Ensemble de données structurées sur les matchs, les équipes, les tournois, les buts et les résultats de la Coupe du monde. Créé par le chercheur sportif Jeffrey Fjelstul, populaire pour l'analyse de l'histoire du football. Ensemble de données NBA (Kaggle) - Données complètes sur la NBA avec des matchs, des équipes, des joueurs et des résultats sur plusieurs décennies. Idéal pour comparer les carrières des joueurs, les succès des équipes et les performances saison par saison. NFL - nflfastR - Données publiques sur les matchs de la NFL à partir de 1999. Inclut des statistiques avancées comme les points attendus et la probabilité de victoire. Données disponibles en CSV/Parquet, largement utilisées dans l'analyse sportive. Baseball - pybaseball (GitHub) - Une bibliothèque Python qui récupère les données de la MLB à partir de sources officielles et semi-officielles comme Baseball Savant et FanGraphs. Fournit des statistiques au niveau du jeu, de la saison et du lancer. Idées d'exercices Quel joueur de la NBA a marqué le plus de points dans les années 1990 ? Qui détient le record du plus grand nombre de buts en Coupe du monde ? Quel est le pays qui obtient le plus grand nombre de médailles d'or aux Jeux olympiques ? Comment le nombre moyen de buts par match a-t-il évolué au fil des tournois ? Concepts SQL que vous pratiquerez Requêtes de classement (par exemple, recherche des meilleurs buteurs ou des meilleurs médaillés) Filtrage avec conditions multiples (par exemple, se concentrer sur des saisons ou des tournois spécifiques) Agrégats avec conditions (par exemple, calculer la moyenne des buts par match ou des points par match). Les données sportives sont une affaire de classements, de moyennes et de comparaisons entre les saisons. C'est exactement ce que vous apprendrez dans notre cours de Création de rapports basiques en SQL cours - transformer des statistiques brutes en rapports clairs et structurés. 🎨 Art : Les formes de l'expression L'art n'est pas qu'une affaire de galeries et d'expositions - ce sont aussi des données qui attendent d'être explorées. Les musées et les chercheurs du monde entier publient des collections structurées contenant des informations sur les artistes, les œuvres d'art, les styles et les mouvements. Avec SQL, vous pouvez révéler des modèles de créativité, comparer des époques et même suivre l'évolution de certaines tendances artistiques dans le temps. Idées de jeux de données Collection du MoMA (GitHub) - Jeu de données ouvert du Museum of Modern Art, contenant des métadonnées sur plus de 130 000 œuvres d'art : artistes, titres, supports, dates et classifications. Parfait pour explorer l'art moderne et contemporain. Images d'art (Kaggle) - Un ensemble de données d'environ 9 000 images d'œuvres d'art dans des catégories telles que les dessins, les peintures, les sculptures et les gravures. Inclut des étiquettes pour le type d'œuvre, utiles pour la classification et l'exploration. Accès libre au Whitney Museum - Métadonnées sur les artistes, les œuvres d'art et les expositions du Whitney Museum of American Art. Régulièrement mis à jour, il constitue une source fiable pour l'analyse de l'histoire de l'art américain. Meilleures œuvres d'art de tous les temps (Kaggle) - Un ensemble de données sélectionnées d'œuvres de 50 peintres célèbres, comprenant les noms des artistes, les styles et les détails des peintures. Idéal pour comparer des artistes individuels ou étudier des mouvements à travers les siècles. Idées d'exercices Quel artiste possède le plus grand nombre d'œuvres dans la collection du MoMA ? Comment les supports (huile, acrylique, sculpture, etc.) varient-ils d'une décennie à l'autre ? Quels sont les mouvements artistiques les plus représentés dans l'ensemble de données du Whitney ? Parmi les "meilleures œuvres d'art de tous les temps", quels sont les peintres qui apparaissent le plus souvent, et dans quelles catégories de style ? Comparez le chevauchement entre le MoMA et le Whitney - certains artistes sont-ils représentés dans les deux ? Concepts SQL que vous pratiquerez Filtrage et regroupement (par exemple, œuvres par artiste, support ou décennie) JOIN (par exemple, relier des œuvres d'art à des expositions ou à des artistes) Agrégats tels que COUNT et DISTINCT (par exemple, le nombre d'œuvres par style ou mouvement) Tri et classement (par exemple, les 10 peintres les plus prolifiques d'une collection). 👉 Vous voulez vous entraîner sur des données réelles ? Essayez nos La pratique du SQL Bases de données. Vous y trouverez des ensembles de données tels que MoMA et Athletics Finals conçus pour une exploration libre, afin que vous puissiez écrire vos propres requêtes et découvrir des insights sans être enfermé dans des exercices prédéfinis. 🎮 Jeux vidéo : Jouez avec les données Les jeux vidéo ne sont pas seulement amusants à jouer - ils génèrent également des quantités massives de données structurées. Des chiffres de vente aux critiques en passant par les tournois esports et les classements de jeux de société, ces ensembles de données vous permettent d'explorer les tendances en matière de divertissement, de compétition et de culture. Avec SQL, vous pouvez découvrir ce qui fait le succès d'un jeu, comment les genres évoluent ou quels sont les joueurs et les équipes qui dominent la scène esports. Idées d'ensembles de données Ventes de jeux vidéo (Kaggle) - Contient des données sur les ventes de plus de 16 000 jeux vidéo. Les colonnes comprennent le nom, la plateforme, l'année, le genre, l'éditeur et les ventes mondiales/régionales. Parfait pour pratiquer les fonctions GROUP BY, JOIN et aggregate. Ensemble de données Steam Games (Kaggle) - Couvre le vaste catalogue de jeux de Steam. Inclut le titre, la date de sortie, le développeur, le genre, les tags, le prix et les critiques. Idéal pour le filtrage, la recherche de texte et l'analyse des tendances. Gains des sports électroniques (Kaggle) - Données au niveau des tournois avec les cagnottes, les joueurs et les équipes. Utile pour les requêtes hiérarchiques, le classement et l'exploration des tendances de performance dans les jeux de compétition. Jeux de société (Kaggle) - Données de BoardGameGeek avec des critiques, des évaluations et des catégories. Excellent pour s'entraîner aux jointures entre les critiques, les catégories et les évaluations. Idées d'entraînement Quelle plateforme de jeux vidéo a enregistré les ventes mondiales les plus élevées dans les années 2000 ? Quels sont les développeurs Steam qui ont sorti le plus de jeux, et comment se comparent leurs notes moyennes ? Quels sont les 10 premiers joueurs d'esports en termes de gains totaux et quels sont les jeux qui dominent les cagnottes ? Quelles sont les catégories de jeux de société les mieux notées en moyenne, et diffèrent-elles des jeux les plus critiqués ? Comment les genres de jeux ont-ils évolué en termes de popularité au cours des trois dernières décennies ? Concepts SQL que vous pratiquerez Regroupement et agrégation (par exemple, les ventes par plate-forme ou par genre) JOIN (par exemple, relier les critiques aux catégories de jeux de société) Classement avec ORDER BY (par exemple, les jeux les plus vendus ou les joueurs esports les mieux rémunérés) Filtrage et recherche de texte (par exemple, les jeux avec "Adventure" dans leur titre ou leurs balises). 👉 Les jeux sont une affaire de classements et de palmarès - et c'est exactement là que les fonctions de fenêtre brillent. Dans notre Fonctions de fenêtrage cours, vous apprendrez à classer, comparer et analyser des données au fil du temps, tout comme vous le feriez en suivant les meilleurs joueurs ou les titres les plus vendus. 🗂️ Comment charger un ensemble de données CSV dans une base de données La plupart des ensembles de données que nous avons étudiés sont au format CSV. Pour pratiquer le langage SQL, vous voudrez généralement les charger dans un système de base de données tel que PostgreSQL, MySQL ou SQLite. Voici la procédure générale : Choisissez votre base de données SQLite - option la plus simple ; tout est stocké dans un seul fichier. PostgreSQL / MySQL - plus puissant, idéal si vous souhaitez travailler avec des ensembles de données plus importants ou des tables multiples. Créez une table Créez une table qui correspond à la structure de votre fichier CSV. Par exemple, si votre fichier CSV comporte des colonnes : Name, Platform, Year, Genre, Sales, votre table pourrait ressembler à ceci dans PostgreSQL : CREATE TABLE videogames ( name TEXT, platform TEXT, year INT, genre TEXT, sales NUMERIC ); Importer le CSV Dans PostgreSQL: COPY videogames(name, platform, year, genre, sales) FROM '/path/to/videogames.csv' DELIMITER ',' CSV HEADER; Dans MySQL: LOAD DATA INFILE '/path/to/videogames.csv' INTO TABLE videogames FIELDS TERMINATED BY ',' IGNORE 1 ROWS; Dans SQLite (en utilisant la ligne de commande) : sqlite3 mydatabase.db .mode csv .import videogames.csv videogames Commencer à interroger Une fois la table chargée, vous pouvez exécuter vos requêtes SQL comme d'habitude : SELECT genre, AVG(sales) FROM videogames GROUP BY genre ORDER BY AVG(sales) DESC; 👉 Si vous ne voulez pas vous occuper de la configuration de la base de données, vous pouvez également utiliser les bases de données de pratique SQL. LearnSQL.frLes bases de données SQL Practice Databases de. Elles sont prêtes à être interrogées dans votre navigateur, aucune installation n'est nécessaire. De l'amusement au professionnalisme Pratiquer SQL sur des films, de la musique, des sports ou des jeux est un excellent moyen de rester motivé. Mais le véritable avantage vient lorsque vous transférez ces compétences dans votre carrière. Une fois que vous aurez maîtrisé le filtrage, les JOIN et les agrégats sur des ensembles de données amusants, vous serez prêt à analyser les données clients, les rapports de vente ou les analyses marketing au travail. Si vous souhaitez disposer d'une méthode structurée pour développer ces compétences, sans perdre de temps à rechercher vous-même des ensembles de données, le package Tout à vie paquetage SQL est le meilleur choix. Il vous donne un accès à vie à tous les cours LearnSQL.fr , des bases aux sujets avancés tels que les fonctions de fenêtre, les rapports et les sous-requêtes. Vous pratiquerez SQL de manière interactive avec des données réelles, obtiendrez un retour d'information instantané et gagnerez en confiance pour interroger n'importe quel ensemble de données, qu'il s'agisse du box-office, des hit-parades Spotify ou de la base de données de votre entreprise. 👉 Prêt à passer de la culture pop à l'analyse professionnelle ? Le package Tout à vie paquet SQL contient tout ce dont vous avez besoin pour maîtriser le langage SQL une fois pour toutes. Tags: pratique sql