Retour à la liste des articles Articles
8 minutes de lecture

Projet SQL pour débutants : Construire un rapport avec BigQuery et Looker

Vous souhaitez mettre en pratique vos compétences SQL sur un jeu de données réel ? Dans ce projet pour débutants, vous utiliserez BigQuery et Looker pour explorer les données de criminalité de Chicago et créer votre premier rapport interactif - aucune expérience avancée n'est nécessaire !

Si vous voulez vous améliorer en SQL, rien ne vaut le travail sur des projets réels. C'est en pratiquant que vos compétences se développent vraiment - et aujourd'hui, vous ferez un grand pas en avant.

Dans ce projet pour débutants, vous allez créer un simple rapport de criminalité basé sur le jeu de données publiques Chicago Crime, en utilisant BigQuery pour écrire des requêtes SQL et Looker Studio pour construire un tableau de bord interactif. Pas de configuration avancée, pas d'outils compliqués - juste un chemin clair depuis les données brutes jusqu'à de vraies informations.

Nous utiliserons deux outils puissants (et gratuits) :

  • BigQuery pour interroger de grands ensembles de données publiques avec SQL.
  • Looker Studio pour transformer vos résultats en visualisations faciles à comprendre.

Si vous souhaitez acquérir des compétences encore plus solides après ce projet, consultez la piste SQL de A à Z sur LearnSQL.fr - il s'agit d'un parcours d'apprentissage complet conçu pour vous faire passer du statut de débutant absolu à celui d'utilisateur SQL confiant, avec des exercices pratiques.

C'est parti !

Étape 1 : Configurer votre environnement

Avant de commencer à écrire des requêtes SQL, préparons tout. Ne vous inquiétez pas, c'est rapide, gratuit et adapté aux débutants.

Accéder à BigQuery

Tout d'abord, vous avez besoin d'un compte Google. Allez dans Google Cloud Console, créez un nouveau projet et ouvrez BigQuery. Google propose une version gratuite qui suffit amplement pour ce projet. Aucune carte de crédit n'est nécessaire si vous utilisez uniquement les ensembles de données publics de BigQuery.

À l'intérieur de BigQuery, vous pourrez exécuter des requêtes SQL directement dans votre navigateur sans avoir à installer quoi que ce soit.

Trouver l'ensemble de données publiques sur la criminalité à Chicago

Une fois dans BigQuery, cliquez sur "Add Data""Explore Public Datasets". Recherchez "chicago crime" - le jeu de données dont vous avez besoin est appelé : bigquery-public-data.chicago_crime.crime

Cliquez dessus pour afficher les tables et les champs disponibles. Vous êtes prêt à lancer des requêtes !

Configuration de Looker Studio

Looker Studio (anciennement connu sous le nom de Google Data Studio) vous permet de visualiser facilement vos résultats BigQuery - aucun codage n'est nécessaire.

Visitez Looker Studio, connectez-vous avec le même compte Google, puis cliquez sur "Créer""Rapport".
Lorsqu'il vous est demandé de sélectionner une source de données, choisissez BigQuery, recherchez votre projet et connectez-vous à l'ensemble de données avec lequel vous allez travailler.

Voilà, votre environnement est prêt ! Dans l'étape suivante, nous commencerons à explorer les données avec SQL.

Étape 2 : Explorer le jeu de données

Jetons un coup d'œil rapide aux données avec lesquelles vous allez travailler. Le jeu de données Chicago Crime contient des enregistrements détaillés des délits signalés à Chicago depuis 2001.

Chaque ligne représente une seule déclaration de crime et contient des informations utiles telles que

  • date - l'heure à laquelle le délit a été commis.
  • primary_type - la catégorie générale (par exemple, THEFT, ASSAULT).
  • description - une étiquette plus spécifique.
  • location_description - l'endroit où le crime s'est produit (par exemple, STREET, RESIDENCE).
  • arrest - si une arrestation a eu lieu (TRUE/FALSE).
  • district - le numéro du district de police.
  • latitude / longitude - la localisation géographique.

Pour avoir un aperçu de l'ensemble de données, exécutez cette requête simple dans BigQuery :

SELECT *  
FROM `bigquery-public-data.chicago_crime.crime`  
LIMIT 10;
Créer un rapport avec BigQuery et Looker

Elle affiche les 10 premières lignes et vous donne une idée de la structure des données. Passez un moment à faire défiler les résultats - le fait de savoir ce qui est disponible vous aidera à écrire des requêtes plus intelligentes.

Étape 3 : Rédigez vos requêtes

Maintenant que vous avez vu ce que contient l'ensemble de données, il est temps d'écrire votre première requête SQL. Notre objectif ici est de connaître le nombre de crimes commis à Chicago en 2024, regroupés par type.

Dans un rapport réel, vous voudrez probablement aller plus loin, en explorant les taux d'arrestation, en comparant les tendances dans le temps ou en décomposant les données par quartier. Mais pour que ce didacticiel reste accessible aux débutants, nous nous en tiendrons à une seule question : quels types de délits ont été les plus fréquents en 2024 ?

Pour répondre à cette question, nous allons

  • Filtrer les données sur l'année 2024 uniquement.
  • Regrouper les données par primary_type (catégorie de délit).
  • Compter le nombre de crimes dans chaque catégorie.

Voici la requête :

SELECT 
  primary_type, 
  COUNT(*) AS num_crimes
FROM `bigquery-public-data.chicago_crime.crime`
WHERE year = 2024
GROUP BY primary_type
ORDER BY num_crimes DESC;

Vous obtenez une liste classée des types de délits, du plus fréquent au moins fréquent. Dans l'étape suivante, nous utiliserons ce résultat pour construire un simple diagramme à barres dans Looker Studio.

Créer un rapport avec BigQuery et Looker

Pour apprendre à écrire des requêtes plus complexes pour les rapports, jetez un coup d'œil à la piste SQL Reporting sur LearnSQL.fr. Il s'agit d'un guide pratique pour transformer des données brutes en informations utiles à l'aide de techniques de reporting réelles.

Vous pouvez également conserver la SQL pour les débutants Aide-mémoire ouverte comme référence rapide pendant que vous écrivez - c'est un excellent compagnon pour les débutants.

Étape 4 : Connecter BigQuery à Looker Studio

Maintenant que votre requête est prête, visualisons les résultats à l'aide de Looker Studio (anciennement Google Data Studio). Puisque nous utilisons la version gratuite de BigQuery, nous exécuterons la requête en utilisant l'option Custom Query, sans avoir besoin de créer ou d'enregistrer des tables ou des vues.

  1. Allez sur Looker Studio et connectez-vous avec le même compte Google que vous avez utilisé pour BigQuery.
  2. Cliquez sur "Rapport vierge" ou choisissez "Créer → Rapport".
  3. Lorsque vous êtes invité à sélectionner une source de données, choisissez "BigQuery".
  4. Dans la fenêtre du connecteur :
    • Sélectionnez votre propre projet (celui que vous avez créé précédemment dans Google Cloud Console).
    • Cliquez ensuite sur "Custom Query" en bas à gauche.
  5. Dans le champ Custom Query, collez la requête SQL que vous avez créée précédemment :
    SELECT 
      primary_type, 
      COUNT(*) AS num_crimes
    FROM `bigquery-public-data.chicago_crime.crime`
    WHERE year = 2024
    GROUP BY primary_type
    ORDER BY num_crimes DESC;
    
  6. Cliquez sur "Ajouter", puis confirmez en cliquant sur "Ajouter au rapport".
Créer un rapport avec BigQuery et Looker

Looker Studio utilisera désormais les résultats de votre requête directement, sans vous demander de stocker des données. Vous êtes prêt à créer votre premier graphique.

Étape 5 : Créer un rapport simple

Votre source de données étant connectée, il est temps de créer votre premier rapport. Dans Looker Studio, commencez par créer un diagramme à barres qui montre le nombre de crimes par type.

Créer le graphique

  1. Dans le menu supérieur, cliquez sur "Ajouter un graphique" et sélectionnez le graphique à barres.
  2. Faites-le glisser pour le placer sur le canevas du rapport.
Créer un rapport avec BigQuery et Looker

Configurer les données

  • Dimension (axe X): primary_type
  • Métrique (axe Y): num_crimes

Ceci affichera un diagramme à barres où chaque barre représente un type de crime, et la hauteur indique combien de fois il s'est produit en 2024.

Créer un rapport avec BigQuery et Looker

Looker Studio propose de nombreux autres types de graphiques que vous pouvez expérimenter, notamment des graphiques linéaires, des graphiques circulaires, des cartes géographiques, etc. Au fur et à mesure que vos requêtes deviennent plus avancées, vous pouvez les utiliser pour montrer des tendances dans le temps, comparer des catégories ou visualiser des données par emplacement.

Pour l'instant, nous nous contenterons d'un seul graphique, mais n'hésitez pas à explorer et à personnaliser la mise en page au fur et à mesure.

Étape 6 : Dernières retouches

Maintenant que votre graphique est prêt, prenez une minute pour peaufiner le rapport et vous l'approprier.

  • Ajoutez un titre à l'aide de l'outil de zone de texte - par exemple : "Crimes de Chicago par type - 2024".
  • Formatez les nombres pour les rendre plus lisibles - ajoutez des virgules, supprimez les décimales ou abrégez les grandes valeurs (par exemple, 12K au lieu de 12 000).
  • Ajustez les couleurs pour améliorer le contraste ou mettre en évidence des points de données clés - choisissez une palette de couleurs adaptée à votre style ou à votre marque.
  • Personnalisez le style - sélectionnez les polices, les tailles de police et les options de mise en page qui rendent le rapport facile à lire et visuellement attrayant.
Créer un rapport avec BigQuery et Looker

Looker Studio vous donne un contrôle total sur l'aspect et la convivialité de votre rapport, alors n'hésitez pas à expérimenter. Ces petites modifications vous aideront à rendre votre rapport final plus attrayant et plus professionnel.

Quelle est la prochaine étape ? Tirer parti de ce que vous avez appris

Vous venez de réaliser un véritable projet SQL, de l'écriture d'une requête à la création d'un rapport. C'est déjà une belle réussite.

Au fur et à mesure que vous vous familiarisez avec SQL et les outils de reporting, essayez d'aller plus loin dans vos projets. Voici quelques idées à explorer :

  • Analyser les crimes par district ou par quartier pour identifier les points chauds.
  • Vérifier les taux d'arrestation par type de délit ou par lieu.
  • Comparer les tendances dans le temps pour voir comment les schémas de criminalité évoluent d'un mois à l'autre ou d'une année à l'autre.

Ce type d'informations est exactement ce que les professionnels fournissent dans le cadre de leurs fonctions d'information. Si vous êtes prêt à apprendre à structurer des requêtes et des rapports plus avancés, la formation SQL Reporting sur LearnSQL.fr est une excellente étape suivante. Il est conçu pour vous aider à transformer des données brutes en informations exploitables à l'aide de techniques de reporting réelles.

Vous pouvez également explorer d'autres cours pratiques sur LearnSQL.fr afin d'affiner vos compétences, que vous soyez débutant ou que vous souhaitiez faire passer votre SQL au niveau supérieur.

Commencez simplement, continuez à explorer - chaque projet vous permet de développer vos compétences en SQL.