Ce hub couvre les patterns SQL BigQuery essentiels selon cinq catégories : optimisation des requêtes, gestion des données imbriquées, fonctions de fenêtrage, stratégies incrémentales dbt et analytique marketing. Les notes sont organisées de sorte que les premières servent de fondation aux suivantes.
Prérequis
Vous devez comprendre le fonctionnement interne de BigQuery — stockage en colonnes, slots, la séparation du calcul et du stockage. Le modèle de coût découle directement de l’architecture et motive la plupart des patterns d’optimisation ci-dessous.
Ordre de lecture
Optimisation des requêtes
Ces patterns affectent la facture BigQuery et les performances des requêtes.
- BigQuery Partition Pruning Patterns — Combiner partitionnement et clustering pour une réduction maximale du scan, plus les anti-patterns qui contrecarrent silencieusement le pruning.
- BigQuery Materialized Views — Précalculer les agrégations répétées avec un rafraîchissement incrémental automatique et une réécriture transparente des requêtes.
- BigQuery HyperLogLog Sketches — Comptages distincts approximatifs composables pour les métriques de fenêtres glissantes à une fraction du coût.
Données imbriquées
Essentielles pour quiconque travaille avec GA4, Firebase ou des données d’événements.
- GA4 Event Data Structure — Comment GA4 structure les données d’événements dans BigQuery, y compris le pattern de sous-requête UNNEST inline pour une extraction propre des paramètres sans explosion des lignes.
Fonctions de fenêtrage
- Window Function Patterns for Analytics SQL — ROW_NUMBER pour la déduplication, QUALIFY pour un filtrage élégant, LEAD/LAG pour la comparaison de lignes, totaux cumulés, FIRST_VALUE/LAST_VALUE pour l’attribution, et détection des lacunes et îles pour les séries.
Stratégies incrémentales dbt
- Incremental Strategy Decision Framework — Quand utiliser merge, delete+insert, insert_overwrite ou microbatch, avec des conseils spécifiques à l’entrepôt et des benchmarks de performance.
- Incremental Models in dbt — Comment fonctionnent les modèles incrémentaux, la configuration de base, la gestion des données tardives et les pièges courants.
Analytique marketing
Patterns spécifiques aux données marketing : définitions de sessions personnalisées et modélisation de l’attribution.
- Custom Sessionization Patterns — Construire des sessions personnalisées à partir d’événements bruts avec des timeouts configurables, des divisions basées sur les campagnes et des métriques de session.
- SQL Attribution Patterns — Modèles d’attribution first-touch, last-touch, linéaire, basé sur la position, time-decay et algorithmique en SQL pur.