ServicesÀ proposNotesContact Me contacter →
EN FR
Note

Les données publicitaires dans l'entrepôt

Note hub pour le guide complet de centralisation des données publicitaires — du problème de mesure à l'extraction, aux défis de pipeline et aux patterns de transformation dbt

Planté Dernier soin
bigquerydbtgoogle adsdata engineeringanalytics

Ce hub couvre la centralisation des données publicitaires dans un entrepôt : du problème de mesure et du panorama des API à l’extraction, l’ingénierie des pipelines et les patterns de transformation dbt. Les plateformes appliquent des fenêtres d’attribution et des méthodes de comptage différentes ; l’entrepôt est le seul environnement où tous les canaux peuvent être comparés sur une méthodologie cohérente.

Prérequis

  • Familiarité avec SQL et votre entrepôt (BigQuery, Snowflake ou Databricks)
  • Compréhension de base de l’architecture trois couches de dbt
  • Au moins une plateforme publicitaire à centraliser

Ordre de lecture

  1. Biais d’attribution des plateformes publicitaires — Pourquoi les plateformes surcomptent les conversions, la structure d’incitation des jardins clos, et ce qui devient possible lorsque les données publicitaires se trouvent dans l’entrepôt.

  2. Panorama des API de plateformes publicitaires — Caractéristiques d’ingénierie de chaque grande API de plateforme publicitaire : Google Ads, Meta, LinkedIn, Microsoft, TikTok, Pinterest, Twitter/X.

  3. Outils d’extraction de données publicitaires — ELT managé (Fivetran, Airbyte Cloud), open-source (dlt, Airbyte OSS, Meltano) et intégrations natives (BigQuery Data Transfer Service). Critères de sélection : taille de l’équipe, budget, nombre de plateformes.

  4. Défis d’ingénierie des pipelines publicitaires — Rate limits des API, breaking changes de schéma, normalisation des fenêtres d’attribution, gestion des devises et des fuseaux horaires, conformité vie privée.

  5. Patterns de reporting publicitaire avec dbt — Couche de transformation : package dbt_ad_reporting, modèles UNION cross-plateformes personnalisés, normalisation spécifique à chaque plateforme, tests de réconciliation, intégration des modèles d’attribution.

  6. Divergence des métriques entre plateformes publicitaires — Standards de comptage des impressions, définitions des clics, différences de fenêtres d’attribution, pré-agrégation des fuseaux horaires et mapping des hiérarchies entre plateformes.

  7. Comparabilité des métriques publicitaires cross-plateformes — Les cinq métriques comparables entre plateformes (clics, impressions, dépenses, conversions, valeur des conversions), variables passthrough et configuration des conversions.

  8. Normalisation du nommage des campagnes et des UTM — Conventions de nommage des campagnes, parsing regex dans dbt, overrides par seed files, règles d’hygiène UTM.

  9. Cross-Platform Ad Testing Patterns — Fraîcheur des sources, réconciliation des dépenses, tests de grain, détection statistique des anomalies, réconciliation manuelle.

  10. Unified Ad Model Downstream Patterns — ROAS global, suivi du rythme budgétaire et préparation des données pour le Marketing Mix Modeling après l’unification.

Concepts connexes

  • Patterns d’attribution SQL — Une fois les données publicitaires dans l’entrepôt, les modèles d’attribution assignent le crédit de conversion entre les points de contact
  • Architecture BigQuery pour les analytics engineers — Comprendre le modèle de coût de votre entrepôt aide à optimiser les pipelines de données publicitaires qui scannent de gros volumes quotidiennement
  • Hub d’analyse d’attribution — Le parcours complet d’attribution de l’implémentation SQL à la conception des tableaux de bord et aux tests d’incrémentalité