Sommaire
partager l'article sur
SEO
4/7/2021
Pierre-François Viaud
Pierre-François Viaud
No items found.

BigQuery : Tout savoir sur l’entrepôt de données

A l’heure du Big Data, la plateforme BigQuery est de plus en plus utilisée dans le monde du Digital. Découvrons ensemble les raisons de ce succès. 

Qu’est-ce que BigQuery ? 

BigQuery est un entrepôt de données (data warehouse en anglais) proposé par Google depuis 2010. 

Voici une définition très simple donnée par Google lui-même : « BigQuery est la plate-forme de stockage cloud sans serveur de Google conçue pour les grands ensembles de données. »

En quelques mots, il s’agit d’un service de stockage dans le cloud reprenant les concepts de bases de données : on y stocke les données dans des tables et on les récupère en exécutant des requêtes SQL (Structured Query Language : langage informatique normalisé servant à exploiter des bases de données relationnelles).

Il faut savoir que BigQuery est un outil payant dont la tarification est basée sur 3 éléments : le stockage, les insertions de données, et le volume des requêtes.

Ci-dessous vous trouverez un tableau récapitulatif des tarifs selon le type d’opération :

Type d’opérationTarifNoteStockage0,02 $par Go et par moisLes 10 premiers Go sontgratuits chaque moisInsertion de données0,01 $par tranche de 200 MoRequêtes5$ par ToLe premier To est gratuitchaque mois

Les concepts de base BigQuery

Vous serez souvent amenés à entendre parler de projet, ensemble de données et table lorsque le sujet BigQuery sera abordé.

Pour simplifier les choses, il faut voir le tout comme des poupées russes, la plus grosse étant le projet et la plus petite, la table.

Le projet : la base pour la création, l’activation et l’utilisation de services Google Cloud et donc BigQuery. Il est donc indispensable de créer un projet avant de pouvoir utiliser un service Google Cloud.

L’ensemble de données : contenu dans un projet, il est comparable à un dossier et va réunir un ensemble de données appelées tables.

Une table : contient des données de la même manière qu’une table Excel.

Quels sont les avantages de BigQuery ? 

Premièrement, la plateforme possède des intégrations qui rendent la création d’un lac de données* dans BigQuery simple, rapide et rentable.

De plus, il est possible de centraliser vos données pour permettre des intégrations automatiques avec les outils de machine learning de Google Cloud.

Grâce à une intégration en un seul clic avec Data Studio, la visualisation des tables traitées est simple et rapide.

Enfin, il existe des solutions ETL** (Extract Transform Load) comme DataFlow et DataProc qui réduisent les frais généraux de la transformation des données.

Comment profiter de BigQuery dans le SEO ? 

BigQuery peut s’avérer utile dans de nombreux domaines dont celui du référencement naturel.

D’une part, sa connexion simplifiée à Data Studio permet la création de Dashboards pertinents et ce de manière très  rapide.

D’autre part, BigQuery va permettre de croiser plusieurs types de données donnant ainsi la possibilité d’élaborer des analyses plus poussées.

Enfin, il est possible d’enregistrer une plus grande base de données SEO que de nombreux logiciels tels qu’Excel ou Google Sheet, car pas suffisamment puissants.

Vous en savez désormais un peu plus sur BigQuery, pour toute information supplémentaire rendez-vous sur Google Cloud dans la rubrique BigQuery

KLH utilise fréquemment BigQuery pour la gestion de grandes bases de données.

* Un lac de données (data lake) est un référentiel de données permettant de stocker une très large quantité de données brutes dans le format natif pour une durée indéterminée (Source : Lebigadata.fr) 

** Une solution ETL est un type de logiciel permettant de collecter des données en provenance de sources multiples pour ensuite les convertir dans un format adapté à une Data Warehouse et les y transférer.