2nd Jul 2025 12 minutes de lecture SQL et Chill : 5 jeux de données amusants pour s'entraîner un vendredi soir Agnieszka Kozubek-Krycuń pratique sql pratique en ligne Table des matières Jeu de données IMDb Movies Ensemble de données des épisodes des Simpsons Base de données LEGO Observation d'OVNI Votre propre Netflix emballé Bonus : Notre cours La pratique du SQL Datasets Prêt pour SQL et la détente ? Vous en avez assez des jeux de données ennuyeux qui donnent l'impression que SQL est un travail ? Détendez-vous et affinez vos compétences avec cinq jeux de données amusants et originaux qui donnent à l'apprentissage de SQL l'aspect d'un jeu. C'est vendredi soir. Vous n'êtes pas d'humeur à sortir, il n'y a plus rien de bon à regarder et votre cerveau a envie de quelque chose de plus satisfaisant que de faire défiler votre téléphone. Vous allumez donc votre ordinateur portable, ouvrez votre éditeur SQL et vous vous installez pour une détente d'un autre genre. Le langage SQL (Structured Query Language) est le langage qui alimente les données. Il vous permet de tirer des informations de tableaux gigantesques, de repérer des modèles et de répondre à des questions telles que "Quel est notre produit le plus vendu ce mois-ci ?" ou "Quelle est la garniture de pizza préférée du public ?" Le langage SQL est omniprésent - dans les entreprises, la technologie, le marketing - et dans votre avenir si vous êtes un tant soit peu curieux des données. Mais voilà : apprendre le langage SQL ne consiste pas à mémoriser des commandes. C'est une question de pratique. Il s'agit d'écrire des requêtes, de les exécuter, de les corriger lorsqu'elles ne fonctionnent pas et de célébrer ces petits moments "a-ha" lorsque les résultats ont enfin un sens. Cela signifie que la pratique n'a pas besoin de ressembler à un devoir ! Pour le prouver, nous avons rassemblé cinq ensembles de données amusants, bizarres et tout simplement intéressants pour vous aider à affiner vos compétences en SQL tout en appréciant le processus. Pensez moins à la base de données des ressources humaines de l'entreprise qu'aux observations d'ovnis et aux classements de films. Et si vous voulez continuer sur votre lancée, consultez la pisteLa pratique du SQL sur LearnSQL.com. Il s'agit d'un parcours d'apprentissage interactif conçu pour tous ceux qui veulent arrêter de lire sur SQL et commencer à le faire. Allons-y pour le SQL et la détente. Jeu de données IMDb Movies Que contient la base de données ? Les jeux de données non commerciales d'IMDb vous donnent accès à un large éventail d'informations relatives aux films, parfaites pour être explorées à l'aide de SQL. Le jeu de données comprend plusieurs tables liées (au format TSV) qui couvrent : Informations de base sur les films : Titres, années de sortie, genres, durée, et s'il s'agit d'un film, d'un court métrage ou d'un épisode télévisé. Données d'évaluation : Notes moyennes des utilisateurs et nombre de votes par titre. Détails sur l'équipe : Réalisateurs et scénaristes associés à chaque film. Informations sur la distribution : Acteurs et actrices principaux et leurs rôles. Profils des personnes : Noms, années de naissance, professions et œuvres notables. Où l'obtenir : https://developer.imdb.com/non-commercial-datasets/ Quels concepts SQL pouvez-vous mettre en pratique ? IMDb offre un ensemble de données relationnelles d'une complexité réelle. Il est idéal pour pratiquer les jointures, les filtres, le regroupement, etc. tout en plongeant dans le monde du cinéma. SELECTVous pouvez effectuer des jointures, WHERE, et filtrer par texte ou par nombre. ORDER BY pour classer les films en fonction de leur note ou de leur popularité GROUP BY et les fonctions d'agrégation (comme AVG(), COUNT()) LIMIT pour trouver les meilleurs résultats Filtrage avec IN, BETWEEN, et LIKE Idées d'interrogation amusantes : Quelles sont les 10 comédies les plus populaires sorties après 2010 ? Quel est le réalisateur le plus constant, produisant succès après succès sans trop de flops ? Quelles sont les suites de comédies qui sont mieux notées que l'original ? Quels sont les acteurs qui ont joué dans les films les mieux notés (par exemple, note IMDb > 8) ? Quels sont les films les plus longs jamais réalisés (et en ont-ils valu la peine) ? Niveau de compétence recommandé : Débutant à intermédiaire. Idéal pour pratiquer les compétences SQL de base avec des données réelles. Ensemble de données des épisodes des Simpsons Que contient la base de données ? Les Simpson est la sitcom animée la plus ancienne de l'histoire de la télévision, connue pour ses personnages excentriques, son humour acerbe et ses commentaires sociaux étonnamment profonds. Cet ensemble de données capture l'essence de la série à travers plus de 600 épisodes, vous offrant ainsi une manière structurée d'explorer Springfield à travers les données. L'ensemble de données comprend plusieurs tableaux liés : Episodes - Titres, dates de diffusion, saisons, numéros d'épisodes et brèves descriptions. Personnages - Tous les personnages, de la famille Simpson à d'obscurs habitants de la ville, ont un identifiant unique. Lieux - Lieux présentés dans la série, comme la Taverne de Moe, l'école primaire de Springfield et le Kwik-E-Mart. Lignes de dialogue - Plus de 150 000 lignes de dialogue, avec des informations sur qui a dit quoi, dans quel épisode et où cela s'est passé. Où l'obtenir : https://www.kaggle.com/datasets/prashant111/the-simpsons-dataset Quels concepts SQL pouvez-vous mettre en pratique ? Joindre plusieurs tables (personnages, épisodes, lieux, lignes de dialogue) Filtrer du texte avec LIKE et LOWER() Comptage et regroupement avec GROUP BY et COUNT() Recherche de valeurs uniques avec DISTINCT Analyse de l'apparence des personnages avec ORDER BY et LIMIT Idées de requêtes amusantes : Quelle saison des Simpsons compte le plus grand nombre d'épisodes ? Qui parle le plus ? Bart ou Lisa ? Y a-t-il des personnages qui n'apparaissent que dans un seul épisode ? Quels sont les 5 lieux les plus fréquemment utilisés dans la série ? Quels sont les 10 mots les plus utilisés par Homer ? Niveau de compétence recommandé : Intermédiaire. Cet ensemble de données est idéal si vous êtes à l'aise avec les jointures et prêt à expérimenter les données textuelles et les requêtes multi-tables dans un cadre amusant. Base de données LEGO Que contient l'ensemble de données ? Ce jeu de données est conçu pour les amateurs de briques et les explorateurs de données. Il couvre des décennies d'ensembles LEGO officiels, allant de pièces minuscules à des collections thématiques massives. Les données sont organisées en tables relationnelles, ce qui vous permet d'explorer la façon dont les ensembles LEGO sont construits et catalogués. Les tables comprennent Jeux - Chaque jeu LEGO avec son nom, son année de sortie, son thème et le nombre de pièces. Pièces - Chaque pièce individuelle, avec les numéros de pièces, les noms et les catégories. Couleurs - Une liste complète des couleurs de briques LEGO disponibles, y compris les valeurs RVB. Inventaires - Quelles pièces apparaissent dans quels ensembles, et en quelle quantité. Pièces de l'inventaire - Permet de relier les ensembles, les pièces et les couleurs, ce qui est parfait pour explorer la façon dont les ensembles sont construits. Thèmes - Le thème auquel appartient chaque ensemble (par exemple, Star Wars, Technic, City). Il s'agit d'un ensemble de données ludique mais riche, idéal pour interroger les relations du monde réel et plonger dans le monde coloré de LEGO du point de vue de la base de données. Où l'obtenir ? Jeu de données Kaggle (dernière mise à jour en 2017) : https://www.kaggle.com/datasets/rtatman/lego-database Jeu de données original (mis à jour quotidiennement) : https://rebrickable.com/downloads/ Quels concepts SQL pouvez-vous mettre en pratique ? Multi-table JOINs (par exemple, connecter des ensembles, des pièces, des inventaires et des couleurs) Filtrage avec WHERE, IN, et BETWEEN Agrégation avec GROUP BY, COUNT(), et SUM() Trier avec ORDER BY et limiter les résultats avec LIMIT Explorer les hiérarchies (par exemple, les thèmes à l'intérieur des thèmes) Idées de requêtes amusantes : Quel ensemble LEGO compte le plus grand nombre de pièces ? Quelles sont les 5 couleurs de briques LEGO les plus courantes ? Quelles sont les 5 couleurs les moins courantes ? Quelle est l'année au cours de laquelle le plus grand nombre de nouveaux ensembles LEGO ont été commercialisés ? Existe-t-il des pièces qui n'apparaissent que dans un seul jeu ? Quels sont les thèmes pour lesquels le nombre moyen de pièces par set est le plus élevé ? Quels sont les thèmes LEGO les plus colorés (en fonction du nombre de couleurs de briques utilisées) ? Niveau de compétence recommandé : Intermédiaire. C'est la solution idéale si vous avez maîtrisé les bases et que vous souhaitez vous familiariser avec plusieurs tableaux connexes. Observation d'OVNI Que contient l'ensemble de données ? Ce jeu de données unique et original contient des milliers de rapports d'observation d'OVNI du 20e siècle, recueillis par le National UFO Reporting Center (NUFORC). Chaque enregistrement comprend la date et l'heure de l'observation, la ville, l'État et le pays où elle s'est produite, la forme de l'OVNI, la durée de sa visibilité et même la description de l'événement par le témoin. Avec plus de 80 000 entrées, dont les coordonnées complètes, c'est le terrain de jeu idéal pour tous ceux qui sont curieux des lumières mystérieuses dans le ciel et de ce que les données disent à leur sujet. Où se le procurer ? https://www.kaggle.com/datasets/NUFORC/ufo-sightings Quels concepts SQL pouvez-vous mettre en pratique ? Filtrage par date, heure et texte avec WHERE, LIKE, et BETWEEN Agrégations avec COUNT(), AVG(), et GROUP BY Tri avec ORDER BY Travailler avec des données géographiques (villes, états, pays) Idées de base pour le nettoyage des données (par exemple, filtrer les entrées incomplètes ou aberrantes) Idées de requêtes amusantes : Quel est l'État américain qui a enregistré le plus grand nombre d'observations d'OVNI dans les années 1990 ? Quelles sont les formes d'OVNI les plus courantes au fil du temps ? Y a-t-il des mois particuliers où les observations sont plus nombreuses que d'autres ? Quelle est la durée moyenne d'une observation par type de forme ? Quelles villes sont des "points chauds" en matière d'OVNI, si l'on en croit le nombre de rapports ? Niveau de compétence recommandé : Débutant à intermédiaire. Il s'agit d'un excellent choix si vous êtes à l'aise avec le filtrage et le regroupement et si vous souhaitez explorer des données temporelles et géographiques de manière ludique. Votre propre Netflix emballé Que contient cet ensemble de données ? Cet ensemble de données est un peu différent parce qu'il vous appartient. Contrairement à la plupart des jeux de données publics, celui-ci provient directement de votre propre compte Netflix. Dans Netflix Wrapped With SQL, nous vous montrons exactement comment télécharger votre historique de visionnage personnel et le transformer en quelque chose que vous pouvez explorer avec SQL. De nombreuses plateformes de streaming, comme Netflix et Spotify, vous permettent d'accéder à vos propres données. C'est un excellent moyen d'apprendre le langage SQL avec quelque chose auquel vous êtes déjà connecté. Le fichier d'historique de visionnage de Netflix comprend deux colonnes principales : Titre - Le nom du film ou de l'épisode que vous avez regardé. Date - La date exacte à laquelle vous l'avez regardé. Simple, mais puissant. Avec ces seules informations, vous pouvez analyser vos habitudes de visionnage, repérer des tendances au fil du temps et même répondre à des questions que vous ne soupçonniez pas sur votre propre temps d'écran. Où l'obtenir ? Suivez les instructions de notre article précédent Netflix Wrapped With SQL. Quels concepts SQL pouvez-vous mettre en pratique ? Filtrage par date et par titre à l'aide de WHERE, LIKE, et BETWEEN Agrégation avec COUNT(), MAX(), AVG(), et GROUP BY pour analyser les habitudes de visionnage Trier les résultats avec ORDER BY pour trouver les émissions les plus regardées ou les jours les plus chargés. Utilisation des fonctions de date et d'heure pour extraire des mois ou des jours de la semaine ou pour calculer des intervalles de temps Nettoyage et formatage de texte de base à l'aide de fonctions de chaîne telles que SUBSTRING() ou TRIM() pour les noms de séries et d'épisodes. Idées de requêtes amusantes : Quelle est la série télévisée dont vous avez regardé le plus d'épisodes ? Au cours de quel mois avez-vous regardé le plus de contenu sur Netflix ? Quel jour de la semaine avez-vous l'habitude d'appuyer sur "Play" ? Quels genres regardez-vous le plus souvent (si les données sur les genres sont disponibles) ? En moyenne, à quelle fréquence regardez-vous quelque chose : tous les jours, tous les quelques jours ou seulement le week-end ? Niveau de compétence recommandé : Débutant à intermédiaire. Cette méthode est idéale pour ceux qui connaissent les opérations SQL de base et qui souhaitent appliquer leurs compétences à des données personnalisées du monde réel. Bonus : Notre cours La pratique du SQL Datasets Vous voulez avoir la liberté d'explorer SQL par vous-même, mais avec des bases de données prêtes à l'emploi et bien organisées ? Le cours La pratique du SQL Jeux de données sur LearnSQL.fr vous donne accès à une variété de bases de données réalistes provenant de magasins en ligne, d'universités, de musées et de plateformes musicales. Contrairement aux cours typiques qui proposent des tâches étape par étape, celui-ci vous laisse libre de vos mouvements. Vous explorerez les structures des bases de données par vous-même, vous poserez vos propres questions et vous écrirez des requêtes pour y répondre. Les bases de données du cours comprennent un système universitaire (étudiants, cours, notes) Un magasin de commerce électronique (commandes, produits, clients) L'analyse d'un blog (pages vues, comportement de l'utilisateur) Un magasin de musique numérique (artistes, albums, achats de titres) Le musée d'art moderne (œuvres d'art et artistes) Ce cours est idéal pour s'entraîner à joindre, grouper, filtrer et écrire de vraies requêtes SQL, sans avoir besoin de configurer quoi que ce soit. Consultez le cours à l'adresse suivante : La pratique du SQL Datasets sur LearnSQL.com Prêt pour SQL et la détente ? Pratiquer le langage SQL ne doit pas être synonyme de travail et ne doit certainement pas impliquer d'ennuyeuses bases de données d'employés. Que vous soyez amateur de films, d'observations d'ovnis, d'ensembles LEGO ou de votre propre historique Netflix, il existe un ensemble de données qui vous permettra d'apprendre tout en vous amusant. La prochaine fois que vous aurez une soirée tranquille, essayez d'exécuter quelques requêtes originales au lieu de vous contenter de faire défiler les données. Qui sait, vous découvrirez peut-être une nouvelle façon de vous détendre. Et si vous voulez encore plus de pratique, consultez notre pisteLa pratique du SQL . Vos futures compétences en SQL (et votre CV) vous remercieront. Tags: pratique sql pratique en ligne