ServicesÀ proposNotesContact Me contacter →
EN FR
Note

Agent Skills dbt

Les fichiers de compétences Markdown officiels de dbt Labs qui enseignent aux agents de code IA comment suivre les bonnes pratiques dbt — ce qu'ils couvrent, comment ils fonctionnent, et ce que les benchmarks montrent réellement.

Planté
dbtclaude codedata engineeringai

dbt Labs a publié un ensemble d’Agent Skills officiels — des fichiers Markdown conçus pour être chargés dans des outils IA comme Claude Code, Codex, Cursor et Kilo Code avant une session de codage. Ils encodent les bonnes pratiques dbt pour que l’agent comprenne les conventions avant de commencer le travail. Le concept est le même que le CLAUDE.md, mais standardisé et maintenu par dbt Labs. Là où un CLAUDE.md capture les conventions spécifiques au projet, les Agent Skills capturent les bonnes pratiques générales de dbt.

Ce que couvrent les compétences

Les compétences publiées adressent l’intégralité du workflow d’analytics engineering :

  • Analytics engineering avec dbt — la boucle centrale : comment structurer les modèles, quelle couche utiliser, comment nommer les choses
  • Tests unitaires — quand écrire des tests unitaires, comment les structurer, à quoi ressemble la grammaire de test
  • Construction de la couche sémantique — construire des modèles sémantiques MetricFlow et des définitions de dimensions
  • Requêtes en langage naturel — utiliser la couche sémantique dbt pour répondre à des questions en langage courant
  • Dépannage des erreurs — diagnostiquer et résoudre les échecs de build dbt courants

Chaque compétence est un fichier Markdown. On le dépose dans le projet (typiquement aux côtés du CLAUDE.md ou dans un répertoire .claude/commands/) et on le référence dans le prompt ou on l’inclut dans le contexte de session Claude Code. L’agent le lit comme instruction avant d’effectuer le travail.

Les chiffres du benchmark

dbt Labs a testé ses compétences sur ADE-bench (Analytics Data Engineering benchmark) — une évaluation standardisée de la performance des agents IA sur des tâches dbt réalistes.

Sans compétences : 56 % de précision sur le benchmark. Avec compétences : 58,5 % de précision.

ADE-bench est conçu pour plafonner — la plupart des outils se regroupent autour de 55 à 60 % — et les gains au-delà de ce niveau sont difficiles à atteindre. Sur un benchmark où le plafond est résistant, une amélioration constante de 2,5 points de pourcentage est un signal significatif.

Altimate AI a publié des benchmarks séparés pour leurs compétences dbt et Snowflake open source : une amélioration de 19 % sur les tâches de données réelles, et une exécution SQL 22 % plus rapide sur les benchmarks TPC-H. Ces chiffres viennent d’une méthodologie différente (tâches réelles vs benchmark standardisé), donc ils ne sont pas directement comparables, mais ils pointent dans la même direction : des fichiers de compétences avec du contexte dbt explicite améliorent mesurably la production des agents.

Comment les compétences diffèrent du contexte au niveau du projet

La distinction entre Agent Skills et contexte spécifique au projet (CLAUDE.md, slash commands) mérite d’être comprise clairement.

Les Agent Skills encodent ce à quoi ressemble une bonne pratique dbt en général. “Lors de la construction d’un modèle intermédiaire, préférer les CTEs aux sous-requêtes.” “Toujours ajouter des tests not_null et unique sur les colonnes de clé primaire.” “Utiliser le préfixe base__ pour les modèles qui sélectionnent directement depuis les sources.” Cette connaissance s’applique à n’importe quel projet dbt.

Le contexte du projet (CLAUDE.md) encode ce que fait le projet spécifique. “Notre dimension date est dans marts/common/dim_date. Ne pas la recréer.” “Nous utilisons le nommage avec double underscore : modele__nom_colonne.” “Notre projet BigQuery est production-analytics.” Cette connaissance ne s’applique qu’au projet.

Les deux importent, et ils sont additifs. Les compétences préviennent les erreurs génériques (utiliser la mauvaise couche, ajouter des tests au mauvais endroit). Le contexte de projet prévient les erreurs spécifiques au projet (recréer un actif existant, utiliser la mauvaise convention de nommage).

Le pattern de configuration CLAUDE.md est la façon d’ajouter du contexte au niveau du projet. Les Agent Skills sont le complément au niveau de l’outil — ce que dbt Labs pense que l’agent devrait savoir sur dbt avant de toucher au projet.

Compatibilité cross-outils

Un aspect sous-estimé de l’approche Agent Skills est que les mêmes fichiers Markdown fonctionnent à travers les outils IA. Claude Code, Codex, Cursor et Kilo Code peuvent tous les consommer car ce sont du texte brut — pas des formats de configuration spécifiques aux outils.

Cela importe pour les équipes utilisant plusieurs outils. Si Claude Code est utilisé pour les sessions de développement approfondies et Cursor pour les modifications en flux, les mêmes fichiers de compétences fournissent une connaissance dbt cohérente aux deux. L’agent se comporte de manière cohérente car il lit les mêmes instructions, quel que soit l’outil en cours d’exécution.

Le pattern plus large de dbt comme base de connaissances étend cela : la même structure de projet qui alimente les compétences peut également alimenter le serveur MCP dbt, qui expose les métadonnées du projet et la couche sémantique à tout outil IA compatible MCP. Compétences et MCP se complètent — les compétences enseignent les pratiques générales, le MCP fournit les données spécifiques au projet.

Limitations

Les fichiers de compétences sont du contexte, pas des garde-fous. Un agent qui charge un fichier de compétences peut toujours produire une sortie incorrecte — il a lu les instructions, mais n’a pas de mécanisme pour vérifier que sa sortie les suit. Les modes d’échec issus du contexte métier manquant (mauvais types de jointure, hypothèses incorrectes sur la granularité) ne sont pas prévenus par des fichiers de compétences couvrant des conventions structurelles.

Les fichiers de compétences élèvent le plancher, pas le plafond. Un agent sans contexte dbt fait davantage d’erreurs structurelles évidentes. Un agent avec des fichiers de compétences en fait moins, mais effectue toujours des jugements qui nécessitent une connaissance de la logique métier spécifique et des données qu’aucun fichier de compétences générique ne peut fournir. Exécuter dbt build, vérifier les résultats des tests, et revoir la logique des modèles reste nécessaire quelle que soit la configuration des compétences.

Pour démarrer

dbt Labs maintient les compétences officielles dans la documentation dbt. Les compétences open source d’Altimate pour dbt et Snowflake sont disponibles via leur dépôt GitHub.

La configuration pratique : ajouter les fichiers de compétences pertinents au projet, les référencer dans le CLAUDE.md ou les inclure dans le prompt initial. Pour Claude Code spécifiquement, la note Activation des compétences Claude Code couvre comment fonctionne le mécanisme de chargement des compétences et comment écrire des descriptions de compétences efficaces.

Pour les projets dbt bien documentés — bonnes descriptions de modèles, colonnes documentées, YAML de schéma à jour — les fichiers de compétences se combinent avec cette documentation. L’agent lit la documentation du projet comme contexte et les fichiers de compétences comme instruction. Les deux ensemble produisent une meilleure sortie que l’un ou l’autre seul.