Articles
-
Macros cross-database : écrire une fois, exécuter partout
Écrire des macros dbt compatibles avec BigQuery, Snowflake et Databricks grâce au pattern dispatch. Différences de syntaxe clés et fonctions intégrées.
dbt bigquery snowflake databricks -
Écrire des macros réutilisables : principes DRY pour dbt
Quand créer une macro dbt et quand garder le code en ligne. Patterns pratiques pour le nommage, l'organisation des dossiers, les tests et éviter l'abstraction prématurée.
dbt data modeling data engineering testing -
10 macros indispensables pour tout projet dbt
Les macros dbt incontournables, issues de packages ou personnalisées, qui couvrent 80 % du SQL répétitif. Exemples concrets pour surrogate keys et date spines.
dbt data modeling data engineering -
Macros dbt : des bases Jinja aux patterns de production
Maîtrisez les macros dbt, des bases Jinja aux patterns de production. Couvre dbt-utils, dbt-expectations et les principes pour du code macro maintenable.
dbt data modeling data engineering -
Charger les données Google Ads dans BigQuery : quatre approches comparées
Comparatif de BigQuery Data Transfer Service, Fivetran, Google Ads Scripts et dlt pour charger vos données Google Ads. Coûts, limites et aide à la décision.
bigquery google ads data engineering etl -
Build vs. Buy : quand construire vos data pipelines en 2026
Évolution tarifaire de Fivetran, développement assisté par IA et maturité de dlt : pourquoi le calcul build-vs-buy a changé pour les équipes data en 2026.
dlt bigquery python data engineering -
Fivetran vs. Airbyte vs. dlt : le comparatif 2026
Comparaison de Fivetran, Airbyte et dlt pour l'ingestion de données en 2026. Modèles tarifaires, qualité des connecteurs, compromis du self-hosting et grille de décision.
dlt bigquery data engineering etl -
Construire des pipelines API personnalisés avec dlt : de REST à BigQuery
Construisez des pipelines API production avec RESTClient et REST API Source de dlt : pagination, authentification et chargement incrémental vers BigQuery.
dlt python bigquery data engineering -
dlt : le data loader Python-natif qui change l'équation build vs buy
dlt comble le fossé entre l'ELT managé coûteux et le développement from scratch. Quand cette librairie Python de data loading est le bon choix.
dlt bigquery python data engineering -
Définir des métriques dans dbt : bonnes pratiques et patterns
Apprenez à définir des métriques dans dbt avec MetricFlow. Les cinq types de métriques, conventions de nommage, patterns d'organisation et pièges courants.
dbt data modeling analytics -
Premiers pas avec le dbt Semantic Layer et MetricFlow
Configurez le dbt Semantic Layer avec MetricFlow : installez le package, définissez semantic models et métriques en YAML, puis interrogez-les via le CLI.
dbt data modeling analytics -
La révolution du Semantic Layer : pourquoi 2026 est l'année
Les semantic layers deviennent incontournables pour l'analytics compatible IA. Ce qui accélère l'adoption, les trois architectures en compétition, et faut-il investir.
dbt snowflake databricks data modeling -
Stratégie microbatch incrémental dans dbt 1.9 : guide pratique
Comment la stratégie microbatch de dbt simplifie les modèles incrémentaux partitionnés par le temps, avec backfills intégrés, filtrage automatique et retries par batch.
dbt incremental processing data engineering -
Données en retard dans dbt : des patterns qui fonctionnent vraiment
Patterns concrets pour gérer les données en retard dans les modèles incrémentaux dbt : lookback windows, stratégies de partitionnement et déduplication.
dbt bigquery snowflake databricks -
Merge vs. Delete+Insert vs. Insert_Overwrite : choisir la bonne stratégie dbt
Comparaison des stratégies incrémentales dbt sur BigQuery, Snowflake et Databricks. Découvrez quand merge devient un goulot d'étranglement et quelles alternatives réduisent les coûts.
dbt bigquery snowflake databricks -
Modèles incrémentaux dbt : le guide complet
Référence complète sur les modèles incrémentaux dbt : stratégies, comportements spécifiques aux warehouses, patterns pour les données tardives et cadres de décision.
dbt bigquery snowflake databricks -
Écosystème MCP : serveurs, clients et SDKs
Un guide pratique des serveurs, clients et SDKs MCP pour les data engineers. Quels serveurs de bases de données utiliser et quels clients privilégier.
mcp agents bigquery snowflake -
MCP Apps : visualisations interactives dans Claude
Construisez des dashboards et graphiques interactifs qui s'affichent directement dans les conversations Claude. Un guide MCP Apps pour les équipes data.
mcp agents claude code data engineering -
Créer des serveurs MCP personnalisés pour la data engineering
Construire des serveurs MCP personnalisés avec Python ou TypeScript. Exemples pratiques pour les catalogues de données, le monitoring de pipelines et les outils de data quality avec le code complet.
mcp agents python data engineering -
Serveur MCP BigQuery : guide complet d'installation
Connectez BigQuery à vos assistants IA avec les options MCP officielles de Google. Comparatif entre le Remote Server et le Toolbox auto-hébergé, avec les étapes d'installation.
mcp agents bigquery gcp -
dbt MCP Server : guide complet d'installation
Tutoriel pas à pas pour connecter dbt à vos assistants IA via MCP. Accédez aux modèles, métriques, lineage et exécutez des commandes dbt depuis Claude Desktop ou Claude Code.
mcp agents dbt claude code -
Comprendre le terminal : guide complet pour les débutants de Claude Code
Apprenez les commandes essentielles du terminal et découvrez comment Claude Code les utilise. Un guide pratique pour les débutants qui veulent comprendre ce qui se passe en coulisses.
claude code automation -
MCP, les fondamentaux du protocole : ce que les data engineers doivent savoir
Découvrez l'architecture MCP, les primitives essentielles et le modèle de sécurité. Les bases pour connecter vos assistants IA à votre infrastructure de données.
mcp agents data engineering integration -
GA4 + dbt : un template de projet prêt pour la production
Un template complet de projet dbt pour les exports GA4 vers BigQuery avec traitement incrémental, tables d'événements sessionisées, patterns de tests et documentation.
dbt bigquery ga4 data modeling -
GA4 User Stitching : réconcilier utilisateurs anonymes et authentifiés
Construisez des pipelines d'identity resolution dans BigQuery pour relier les utilisateurs GA4 anonymes à leurs identités authentifiées, avec des patterns dbt prêts pour la production.
bigquery ga4 dbt identity resolution -
Construire des tables de sessions à partir des événements GA4
Apprenez à sessioniser les exports BigQuery GA4 en construisant des tables d'événements enrichies avec l'identité de session, l'attribution et la position dans la séquence grâce aux window functions.
bigquery dbt ga4 data modeling -
Unnester les événements GA4 : patterns pour chaque cas d'usage
Patterns SQL prêts pour la production pour extraire les données GA4 des arrays imbriqués dans BigQuery : e-commerce, événements d'engagement et modèles dbt.
bigquery dbt ga4 data modeling -
Export GA4 BigQuery : la référence complète du schéma
Un guide pratique du schéma d'export GA4 vers BigQuery couvrant les structures imbriquées, les champs de source de trafic, les pièges critiques et les patterns de requêtes efficaces.
bigquery ga4 data engineering analytics -
10 patterns SQL BigQuery que tout analytics engineer devrait connaître
Patterns BigQuery prêts pour la production : partitionnement, vues matérialisées, sketches HLL, données imbriquées, window functions, incrémentaux dbt et attribution.
bigquery dbt data modeling data engineering -
On-Demand vs. Editions : quand changer de modèle de tarification BigQuery
Un guide pratique pour choisir entre la tarification On-Demand et Editions de BigQuery, avec des requêtes SQL pour analyser vos workloads et calculer les points d'équilibre.
bigquery data engineering -
Slots et réservations BigQuery : Le guide complet
Comprendre le fonctionnement des slots BigQuery, la hiérarchie des réservations, comparer les niveaux de tarification Editions, et optimiser l'utilisation des slots pour vos workflows dbt.
bigquery dbt data modeling -
Partitioning vs. Clustering : le framework de décision
Un framework de décision pratique pour choisir entre le partitioning et le clustering BigQuery selon vos patterns de requêtes, la taille des tables et vos stratégies incrémentales dbt.
bigquery dbt data engineering data modeling -
Architecture BigQuery pour Analytics Engineers : Le Guide Complet
Apprenez la hiérarchie des ressources BigQuery, les contraintes régionales, les patterns multi-environnements et la configuration IAM pour concevoir des systèmes analytiques scalables.
bigquery dbt data engineering -
dbt-expectations : le package indispensable pour tout projet
Découvrez comment dbt-expectations ajoute plus de 50 tests de qualité de données à votre projet dbt : validation de patterns, contrôles de fraîcheur, validation statistique et plus encore.
dbt data quality testing -
Unit Testing vs. Data Testing : Quand utiliser chaque approche
Un cadre de décision pour choisir entre les tests unitaires dbt, les tests de données, dbt-expectations, Elementary et dbt-audit-helper selon ce que vous testez.
dbt bigquery testing -
Unit Testing des modèles dbt : Exemples concrets et patterns
Patterns prêts à copier-coller pour tester les modèles incrémentaux, les snapshots, les fonctions de fenêtrage, la sessionisation GA4 et les modèles d'attribution dans dbt avec BigQuery.
dbt bigquery testing -
Unit Testing dans dbt 1.8+ : Guide d'implémentation complet
Apprenez à implémenter les tests unitaires dbt de zéro. Couvre la syntaxe YAML, les solutions spécifiques à BigQuery pour les STRUCTs et ARRAYs, le mocking des dépendances et l'intégration CI/CD.
dbt bigquery testing -
Stratégie de tests dbt : un cadre pour chaque projet
Un cadre pratique pour les tests dbt qui s'adapte des premiers projets aux pipelines d'entreprise, couvrant les tests de données, les tests unitaires, les contrats et les packages.
dbt data engineering data quality -
Optimisation des coûts BigQuery : le guide 80/20
Réduisez vos coûts BigQuery en vous concentrant sur le partitionnement, le clustering et la sélection des colonnes. Inclut des configurations dbt, des requêtes INFORMATION_SCHEMA et des garde-fous de gouvernance.
bigquery dbt data engineering cost optimization -
Vos premiers modèles dbt GA4 : des événements bruts aux sessions
Construisez des modèles dbt GA4 au niveau événement qui préservent la granularité. Découvrez le piège de la session key, l'extraction des event_params imbriqués, et un pattern à trois couches pour des analyses flexibles.
dbt bigquery ga4 data engineering -
Base, Intermediate, Marts : quand utiliser chaque couche
Apprenez quand utiliser les couches base, intermediate et mart dans dbt. Des règles claires pour savoir où placer les jointures, la logique métier et les agrégations dans votre projet de transformation.
dbt data engineering data modeling -
Structure de projet dbt : le guide complet
Un guide complet sur la structure des projets dbt : architecture à trois couches, conventions de nommage des entités, matérialisation des tables et exemples concrets en marketing analytics.
dbt data modeling -
Connecter Claude Code à votre Data Warehouse (et pourquoi MCP n'est pas toujours nécessaire)
Cloudflare et Anthropic ont découvert que les LLMs écrivent mieux du code que des appels d'outils. Pour les utilisateurs BigQuery, cela signifie que la CLI pourrait battre MCP. Voici les preuves.
bigquery claude code gcp agents -
Workflows avancés avec Claude Code : tests, documentation et débogage pour les analytics engineers
Trois workflows prêts pour la production qui transforment Claude Code en partie intégrante de votre processus d'analytics engineering.
dbt bigquery claude code agents -
Automatiser les tâches répétitives : Hooks et commandes personnalisées pour les analytics engineers
Découvrez comment utiliser les hooks et les commandes slash personnalisées de Claude Code pour automatiser vos workflows dbt — du formatage automatique du SQL au blocage des commandes dangereuses en production.
claude code dbt automation -
Claude Code - Skills vs. Commandes
Les skills ne s'activent automatiquement que 20% du temps. Pour des workflows data répétables comme les audits dbt et la documentation de lineage, les commandes offrent la cohérence dont vous avez besoin.
claude code dbt data engineering -
Comment configurer CLAUDE.md pour votre projet dbt (et le rendre vraiment utile)
Apprenez à configurer CLAUDE.md pour vos projets dbt. Conseils pratiques sur les conventions de nommage, les pièges BigQuery, et l'art du minimalisme.
claude code dbt data engineering -
Comment j'utilise Claude Code pour les transformations dbt
Guide pratique d'utilisation de Claude Code avec dbt. De la génération de modèles de base au refactoring : ce qui marche vraiment au quotidien.
claude code dbt llm agents -
Claude Code pour la data : c'est quoi et pourquoi s'y intéresser
70% des analytics engineers utilisent l'IA pour coder. Découvrez Claude Code, l'outil agentique qui lit votre codebase dbt et génère du code selon vos patterns.
claude code llm agents data engineering -
Votre première heure avec Claude Code en tant qu'analytics engineer
Installez et maîtrisez Claude Code en une heure. Guide pratique pour analytics engineers : installation, authentification, premiers modèles dbt et astuces essentielles.
claude code llm agents data engineering -
n8n RSS vers Notion
Transformez vos flux RSS en base de connaissances automatisée avec n8n et ChatGPT. Fini le nettoyage manuel : récupérez et organisez vos articles dans Notion sans effort.
n8n notion llm automation -
dbt Core vs. dbt Cloud
Examinons les différences entre dbt Cloud et dbt Core.
dbt data engineering -
Déployer dbt Core sur une Google Cloud Function
Voici comment déployer dbt Core sur une Google Cloud Function.
dbt bigquery data engineering etl -
Réussir la certification dbt
Découvrez les secrets pour réussir la certification d'Analytics Engineer de dbt dans cet article détaillé qui couvre les conseils pratiques, l'examen, et les ressources essentielles de la communauté pour vous préparer efficacement.
dbt data engineering -
Guide pratique de dlt
Apprenez à construire des pipelines de données avec dlt (data load tool). De l'extraction API basique au chargement incrémental : un tutoriel pratique utilisant l'API GitHub.
dlt python data engineering etl