ServicesÀ proposNotesContact Me contacter →
EN FR
Note

Patterns SQL BigQuery pour les analytics engineers

Un guide de lecture sur les patterns SQL BigQuery essentiels couvrant l'optimisation des requêtes, les données imbriquées, les fonctions de fenêtrage, les modèles dbt incrémentaux et l'analytique marketing.

Planté
bigquerydbtdata modelingdata engineeringanalytics

Ce hub couvre les patterns SQL BigQuery essentiels selon cinq catégories : optimisation des requêtes, gestion des données imbriquées, fonctions de fenêtrage, stratégies incrémentales dbt et analytique marketing. Les notes sont organisées de sorte que les premières servent de fondation aux suivantes.

Prérequis

Vous devez comprendre le fonctionnement interne de BigQuery — stockage en colonnes, slots, la séparation du calcul et du stockage. Le modèle de coût découle directement de l’architecture et motive la plupart des patterns d’optimisation ci-dessous.

Ordre de lecture

Optimisation des requêtes

Ces patterns affectent la facture BigQuery et les performances des requêtes.

  1. BigQuery Partition Pruning Patterns — Combiner partitionnement et clustering pour une réduction maximale du scan, plus les anti-patterns qui contrecarrent silencieusement le pruning.
  2. BigQuery Materialized Views — Précalculer les agrégations répétées avec un rafraîchissement incrémental automatique et une réécriture transparente des requêtes.
  3. BigQuery HyperLogLog Sketches — Comptages distincts approximatifs composables pour les métriques de fenêtres glissantes à une fraction du coût.

Données imbriquées

Essentielles pour quiconque travaille avec GA4, Firebase ou des données d’événements.

  1. GA4 Event Data Structure — Comment GA4 structure les données d’événements dans BigQuery, y compris le pattern de sous-requête UNNEST inline pour une extraction propre des paramètres sans explosion des lignes.

Fonctions de fenêtrage

  1. Window Function Patterns for Analytics SQL — ROW_NUMBER pour la déduplication, QUALIFY pour un filtrage élégant, LEAD/LAG pour la comparaison de lignes, totaux cumulés, FIRST_VALUE/LAST_VALUE pour l’attribution, et détection des lacunes et îles pour les séries.

Stratégies incrémentales dbt

  1. Incremental Strategy Decision Framework — Quand utiliser merge, delete+insert, insert_overwrite ou microbatch, avec des conseils spécifiques à l’entrepôt et des benchmarks de performance.
  2. Incremental Models in dbt — Comment fonctionnent les modèles incrémentaux, la configuration de base, la gestion des données tardives et les pièges courants.

Analytique marketing

Patterns spécifiques aux données marketing : définitions de sessions personnalisées et modélisation de l’attribution.

  1. Custom Sessionization Patterns — Construire des sessions personnalisées à partir d’événements bruts avec des timeouts configurables, des divisions basées sur les campagnes et des métriques de session.
  2. SQL Attribution Patterns — Modèles d’attribution first-touch, last-touch, linéaire, basé sur la position, time-decay et algorithmique en SQL pur.