2nd Jul 2025 11 minutes de lecture Comment construire un tableau de bord de données (même si vous venez de commencer à apprendre SQL) Agnieszka Kozubek-Krycuń Projet SQL analyse des données Table des matières Outils utilisés pour créer le tableau de bord BigQuery Looker Studio L'ensemble de données sur les crimes de Chicago Questions à poser sur l'ensemble de données Explorer un jeu de données dans BigQuery Construire des requêtes pour exécuter votre tableau de bord Total des délits signalés Total des arrestations Les 5 principaux types de délits Les 5 principaux types d'arrestation Connecter Looker Studio à BigQuery Créer un tableau de bord dans Looker Studio Approfondissez vos compétences en SQL Plongez dans la création de votre propre tableau de bord avec ce guide pour débutants, même si vous commencez à apprendre SQL. En utilisant BigQuery, des ensembles de données publiques et Looker Studio, vous apprendrez à créer facilement un tableau de bord impressionnant. Si vous êtes un analyste de données ou si vous souhaitez le devenir, il est essentiel d'apprendre le langage SQL. SQL, ou Structured Query Language, est le langage utilisé pour extraire et analyser les données des bases de données, vous aidant ainsi à transformer les chiffres bruts en véritables informations. Mais si vous débutez, trouver des idées de projets peut être la partie la plus difficile. C'est là que ce guide intervient. Vous allez construire un tableau de bord de données à l'aide des outils gratuits BigQuery et Looker Studio de Google, qui vous permettra d'analyser des données réelles sur la criminalité dans la ville américaine de Chicago. Que vous soyez novice en SQL ou que vous cherchiez à affiner vos compétences, le guide SQL pour l'analyse de données sur LearnSQL.fr est l'endroit idéal pour commencer. Il s'agit d'un parcours d'apprentissage complet conçu pour les futurs analystes, qui couvre tout, des requêtes de base aux sujets plus avancés tels que la création de rapports complexes et l'utilisation des fonctions de fenêtre. Chacun des quatre cours inclus dans le parcours est interactif et pratique, vous aidant à apprendre par la pratique avec des exemples du monde réel qui vous préparent à travailler sur des données réelles. À la fin de la formation, vous serez en mesure d'écrire vos propres requêtes, d'analyser des ensembles de données réels et de créer des projets tels que le tableau de bord que nous allons créer dans ce tutoriel. Outils utilisés pour créer le tableau de bord Nous utiliserons deux outils pour créer notre tableau de bord : BigQuery et Looker Studio. BigQuery BigQuery est un entrepôt de données proposé par Google. Un entrepôt de données est un type de base de données conçu pour traiter de grandes quantités de données et répondre à des questions analytiques. BigQuery est particulièrement utile pour les débutants car vous n'avez pas besoin d'installer quoi que ce soit ; il vous suffit d'ouvrir votre navigateur et de commencer à écrire du code SQL. Vous pouvez utiliser BigQuery gratuitement pendant votre apprentissage. Google propose un niveau gratuit avec une limite mensuelle généreuse. Si vous vous contentez d'exécuter des requêtes simples et d'explorer des données, il est très peu probable que vous dépassiez cette limite. BigQuery vous donne également accès à des ensembles de données publiques gratuites, y compris des données réelles sur des sujets tels que la criminalité, la santé et les transports. Looker Studio Looker Studio est une plateforme de veille stratégique proposée par Google. Elle vous permet de transformer vos données en tableaux de bord interactifs et partageables et en rapports faciles à lire. C'est un outil idéal pour les débutants car il est visuel, intuitif et fonctionne dans votre navigateur. Vous pouvez créer des rapports de qualité professionnelle à l'aide de graphiques et de filtres par glisser-déposer. Et vous pouvez mettre à jour votre travail automatiquement au fur et à mesure que vos données changent. Exemple de tableau de bord dans Looker Studio L'utilisation de Looker Studio est gratuite (avec certaines limites). Il fonctionne avec un large éventail de sources de données, notamment Google Sheets, Google Analytics et (plus important pour nous) BigQuery. Dans cet article, nous allons connecter Looker Studio à BigQuery pour construire un tableau de bord en utilisant l'un des ensembles de données publiquement disponibles de BigQuery. L'ensemble de données sur les crimes de Chicago Pour ce tutoriel, nous utiliserons le jeu de données Chicago Crimes qui est accessible au public par le biais du programme de jeux de données publics gratuits de Google BigQuery. Il est publié par la ville de Chicago et repose sur des informations collectées par le service de police de Chicago. Il est mis à jour chaque semaine avec les données de la semaine précédente. Cet ensemble de données est idéal pour s'entraîner au langage SQL et créer son premier tableau de bord de données. Il comprend différents types de délits que vous pouvez regrouper et filtrer, ainsi que des champs de date et d'heure pour tester des requêtes basées sur le temps. Comme il est mis à jour régulièrement, vous travaillerez avec des données fraîches et réelles. Cet ensemble de données contient des milliers de lignes, chacune représentant un délit signalé dans la ville de Chicago. Il n'y a qu'une seule table dans l'ensemble de données, nommée bigquery-public-data.chicago_crime.crime. Les colonnes les plus importantes de la table sont les suivantes : date - La date et l'heure auxquelles le délit a été commis (stockées sous DATETIME). block - L'adresse approximative où l'incident s'est produit. primary_type - La catégorie de crime de haut niveau (par exemple THEFT, BATTERY, ROBBERY). description - Une description plus précise de l'infraction (par exemple SIMPLE, STRONG ARM – NO WEAPON). location_description - Le type de lieu où l'infraction a été commise (par exemple STREET, PARKING LOT, CHA HALLWAY). arrest - Une valeur booléenne (TRUE/FALSE) indiquant si une personne a été arrêtée. domestic - Une valeur booléenne (TRUE/FALSE) indiquant s'il s'agit d'un incident domestique. beatIdentificateurs numériques pour les circonscriptions de police, les districts et les quartiers de la ville : district, ward. latitude longitude Les coordonnées du lieu où l'infraction a été commise (peuvent être utilisées pour la cartographie). year - L'année où l'infraction a été commise. Questions à poser sur l'ensemble de données Pour élaborer un tableau de bord pertinent, vous devez commencer par poser les bonnes questions. Vous pouvez trouver vos propres questions pour construire votre tableau de bord. Je vais partager avec vous les questions et les requêtes que j'ai utilisées pour créer un tableau de bord simple permettant de visualiser les crimes commis au cours d'une période donnée. Les questions que j'ai utilisées pour guider mon tableau de bord sont les suivantes : Combien de délits ont été signalés au cours de la période donnée ? Combien d'arrestations ont été effectuées au cours de cette période ? Quels sont les cinq types de délits les plus fréquemment signalés ? Quels sont les 5 principaux types de délits ayant donné lieu à des arrestations ? Avant de commencer à écrire les requêtes pour répondre à ces questions, explorons l'ensemble de données. Explorer un jeu de données dans BigQuery La première étape de la création de votre tableau de bord consiste à en apprendre davantage sur votre jeu de données. Ouvrez la console BigQuery à l'adresse console.cloud.google.com/bigquery. Dans le panneau de gauche, recherchez bigquery-public-data. Développez-la pour trouver chicago_crime et cliquez sur la table crime pour afficher sa structure. Cliquez sur le bouton Requête SQL en haut de la page. Dans l'éditeur de requête, vous pouvez commencer à écrire du code SQL : SELECT * FROM `bigquery-public-data.chicago_crime.crime` LIMIT 10; Cela renverra les 10 premières lignes de l'ensemble de données. À partir de là, vous pouvez commencer à explorer vos données. Exécutez quelques requêtes pour vous familiariser avec l'ensemble de données. Vous pouvez filtrer par date, regrouper par type de délit ou analyser les arrestations. Il s'agit des mêmes techniques que vous utiliseriez dans n'importe quelle base de données SQL. N'oubliez pas de toujours mettre le nom complet de la table entre crochets : `bigquery-public-data.dataset_name.table_name`. Construire des requêtes pour exécuter votre tableau de bord Maintenant, écrivons les requêtes pour notre tableau de bord. Pour simplifier les choses, je me concentrerai sur les données de l'année 2024, mais vous pouvez facilement modifier les filtres pour couvrir la période de votre choix. Ces requêtes ne sont qu'un point de départ. N'hésitez pas à les adapter ou à utiliser vos propres idées. Les tableaux de bord sont toujours construits étape par étape : vous commencez par une version de base, puis vous l'améliorez au fur et à mesure. Total des délits signalés Notre première requête est la suivante : SELECT COUNT(*) FROM `bigquery-public-data.chicago_crime.crime` WHERE year = 2024; Cette requête compte le nombre total de crimes enregistrés dans l'ensemble de données de Chicago Crime pour l'année 2024. Nous utilisons la fonction COUNT(*) pour obtenir le nombre de lignes et la colonne year pour filtrer les crimes commis en 2024. Total des arrestations SELECT COUNT(*) FROM `bigquery-public-data.chicago_crime.crime` WHERE year = 2024 AND arrest IS TRUE; Cette requête est similaire à la précédente, sauf que nous filtrons (et ne comptons que) les lignes où la colonne arrestations est définie sur TRUE. Les 5 principaux types de délits SELECT primary_type, COUNT(*) FROM `bigquery-public-data.chicago_crime.crime` WHERE year = 2024 GROUP BY primary_type ORDER BY COUNT(*) DESC LIMIT 5; Cette requête indique les 5 types de délits les plus courants en 2024. Elle filtre les données pour cette année-là, regroupe les enregistrements par type de délit (primary_type), compte le nombre de fois où chaque type s'est produit, puis les trie du plus fréquent au moins fréquent. Enfin, il limite le résultat aux 5 premiers. Les 5 principaux types d'arrestation SELECT primary_type, COUNT(*) FROM `bigquery-public-data.chicago_crime.crime` WHERE year = 2024 AND arrest IS TRUE GROUP BY primary_type ORDER BY COUNT(*) DESC LIMIT 5; Cette requête permet de trouver les 5 principaux types de délits en 2024 qui ont le plus souvent donné lieu à une arrestation. Elle filtre les données pour n'inclure que les crimes de 2024 ayant donné lieu à une arrestation, les regroupe par primary_type, compte le nombre d'arrestations pour chaque type, trie les résultats par ordre décroissant et renvoie les 5 premiers. Connecter Looker Studio à BigQuery Nous allons utiliser Looker Studio pour construire notre tableau de bord. Il peut se connecter à de nombreuses sources de données, mais il fonctionne particulièrement bien avec celles de l'écosystème Google (comme BigQuery). Pour garder les choses propres et efficaces, nous utiliserons l'option Custom Query. Cela nous permet de filtrer, d'organiser et de façonner les données avec SQL avant qu'elles n'atteignent le tableau de bord. Commencez par ouvrir Looker Studio et créez un nouveau rapport vierge. Dans le panneau Ajouter des données au rapport, choisissez BigQuery comme source de données. Ensuite, sélectionnez Custom Query (Requête personnalisée). Choisissez votre projet de facturation. (Il s'agit du projet qui sera facturé pour l'utilisation de BigQuery ; si vous utilisez BigQuery Sandbox, vous ne serez pas facturé). Collez votre requête SQL dans le champ Entrer une requête personnalisée et cliquez sur Ajouter. Il est intéressant de noter que vous ne pouvez pas renommer la source de données à ce stade ; Looker Studio la nommera automatiquement. Après avoir ajouté la source de données à votre rapport, vous pouvez la renommer en allant dans Ressources > Gérer les sources de données ajoutées, où vous pouvez également mettre à jour la requête ou renommer des champs. Vous pouvez ajouter d'autres requêtes SQL à votre tableau de bord si nécessaire. Créer un tableau de bord dans Looker Studio Ensuite, vous devez créer vos visualisations. Tout d'abord, cliquez sur le bouton Ajouter un graphique. Vous pouvez choisir parmi une sélection de différents types de graphiques, tels que les graphiques à barres ou les graphiques linéaires. Pour configurer un graphique, vous devez sélectionner la bonne source de données et définir les colonnes à afficher. L'éditeur de graphiques de Looker Studio comporte deux onglets principaux pour vous aider dans cette tâche. L'onglet SETUP vous permet de choisir la source de données, les dimensions et les métriques ; c'est là que vous décidez de ce que le graphique affichera. L'onglet STYLE vous permet de personnaliser l'aspect du graphique, c'est-à-dire de choisir les polices, les couleurs, les bordures et les titres. Par exemple, lors de la création d'un diagramme à barres, vous utiliserez l'onglet CONFIGURATION pour afficher les types de crimes et les décomptes et l'onglet STYLE pour ajuster l'apparence du diagramme. Vous pouvez ajouter d'autres graphiques à votre tableau de bord, tels que des tableaux de bord qui affichent un seul chiffre, des graphiques linéaires qui montrent les tendances dans le temps ou des cartes géographiques qui visualisent les données par emplacement. Chaque graphique peut être stylisé séparément, ce qui vous donne un contrôle total sur la mise en page et la conception afin de correspondre à vos préférences ou de mettre en évidence des informations clés. Voici à quoi ressemble mon tableau de bord final : Approfondissez vos compétences en SQL Si vous avez apprécié la création de ce tableau de bord, ne vous arrêtez pas là ! Essayez d'explorer d'autres ensembles de données et de créer vos propres tableaux de bord. Plus vous vous entraînerez, mieux vous saurez poser les bonnes questions et trouver les réponses dans les données. Vous voulez passer au niveau supérieur ? Une fois de plus, je vous recommande notre formation SQL pour l'analyse des données. Il s'agit d'un parcours d'apprentissage pratique conçu pour vous aider à dépasser les bases et à commencer à penser comme un analyste de données. Vous apprendrez à écrire des requêtes plus avancées, à travailler avec des ensembles de données réels, à repérer des tendances, à comparer des périodes, à segmenter vos données et à préparer des données pour des tableaux de bord et des rapports. Chaque cours comprend des exercices interactifs, un retour d'information instantané et une véritable pratique du langage SQL. Avec ce cours interactif, vous apprenez en faisant plutôt qu'en lisant. À la fin de la formation, vous serez en mesure d'explorer des ensembles de données en toute confiance et de créer des tableaux de bord qui répondent réellement aux questions importantes. Découvrez-le dès aujourd'hui ! Tags: Projet SQL analyse des données