dbt Cloud est la plateforme commerciale managée de dbt Labs, construite sur dbt Core. Elle enveloppe le moteur de transformation open source dans une interface web et ajoute la planification, la collaboration et la gestion de l’infrastructure, vendue sous forme d’abonnement.
L’IDE web
La différence la plus visible entre Core et Cloud est l’environnement de développement. dbt Cloud fournit un IDE dans le navigateur où vous écrivez du SQL, compilez des modèles, exécutez des commandes et examinez les résultats sans rien installer en local.
L’IDE inclut :
- Éditeur SQL avec coloration syntaxique, autocomplétion et rendu Jinja
- Graphe de lignage affichant les dépendances des modèles visuellement — cliquez sur un modèle pour voir ses sources en amont et ses dépendants en aval
- Aperçu SQL compilé montrant ce à quoi votre modèle Jinja-templaté compile avant exécution
- Panneau de résultats affichant les résultats de requêtes, les résultats de tests et les erreurs de compilation
- Intégration Git avec gestion des branches, création de pull requests et visualisation des diffs intégrées
Pour les analytics engineers dont la compétence principale est SQL plutôt que Python et les commandes de terminal, l’IDE élimine entièrement la barrière de configuration. Pas d’installation Python. Pas d’environnements virtuels. Pas de configuration de profiles.yml. Pas de plugins d’éditeur à installer. Ouvrir un navigateur, écrire du SQL, cliquer sur Exécuter.
L’IDE permet également des fonctionnalités de collaboration en temps réel que le développement local ne peut pas égaler. Plusieurs membres de l’équipe peuvent travailler dans le même projet simultanément. La revue de code se fait au sein de la plateforme plutôt que d’exiger un workflow Git séparé. Pour les équipes non profondément ancrées dans les pratiques d’ingénierie logicielle, c’est un gain de productivité réel.
Le compromis : l’IDE est plus lent et moins personnalisable qu’un éditeur local comme VS Code. Les utilisateurs avancés qui s’appuient sur les raccourcis clavier, les snippets personnalisés, l’édition multi-curseur et l’accès au terminal trouvent souvent l’IDE web contraignant. De nombreux développeurs dbt expérimentés utilisent le dbt Cloud CLI (qui exécute les fonctionnalités Cloud depuis un terminal local) plutôt que l’IDE web.
Planification des jobs et orchestration
Le planificateur de dbt Cloud répond à la question « quand dbt s’exécute-t-il ? » que dbt Core laisse délibérément sans réponse.
Configuration des jobs dans dbt Cloud :- Schedule : expression cron ou intervalle- Commandes : dbt build, dbt run, dbt test (chaînées)- Target : production, staging, ou environnement personnalisé- Déclencheurs : schedule, API, PR (CI), ou manuelLes jobs planifiés s’exécutent sur des expressions cron. Un build de production quotidien à 6h, un rafraîchissement horaire des modèles critiques, un full refresh hebdomadaire — ces éléments sont configurés dans l’interface sans écrire de code d’orchestration.
Les jobs CI se déclenchent automatiquement sur les pull requests. Quand un membre de l’équipe ouvre une PR, dbt Cloud exécute les modèles modifiés dans un environnement de staging et publie les résultats dans la PR. Cette fonctionnalité Slim CI ne construit que ce qui a changé et ses dépendances en aval, réduisant les temps d’exécution CI de la durée complète du projet à quelques secondes ou minutes.
Les déclencheurs API permettent aux systèmes externes d’invoquer des jobs dbt. Un webhook de fin de synchronisation Fivetran déclenche une transformation dbt. Un DAG Airflow appelle l’API dbt Cloud pour démarrer un job. Cela permet l’intégration avec des orchestrateurs externes tout en maintenant l’exécution dbt managée.
La couche de planification est là où dbt Cloud apporte la valeur la plus évidente par rapport à Core auto-hébergé. Mettre en place une fonctionnalité équivalente avec Cloud Run Jobs ou Cloud Scheduler nécessite des builds de conteneurs, une configuration IAM et une mise en place du monitoring. dbt Cloud le fournit prêt à l’emploi.
La limitation : dbt Cloud ne peut orchestrer que dbt. Il ne peut pas exécuter des scripts Python, déclencher des synchronisations Fivetran, invoquer des APIs ou gérer toute étape non-dbt dans votre pipeline. Si votre workflow requiert « extraire, puis transformer, puis reverse ETL », dbt Cloud ne gère que l’étape du milieu. La comparaison d’orchestration avec Dagster explore cette frontière en détail.
Collaboration et contrôle d’accès
dbt Cloud ajoute des fonctionnalités multi-utilisateurs difficiles à reproduire avec Core seul :
Contrôle d’accès basé sur les rôles (RBAC). Définissez qui peut modifier les modèles, qui peut déclencher les jobs de production, et qui n’a qu’un accès en lecture seule. Pour les équipes avec un mélange d’analystes et d’ingénieurs, le RBAC empêche les modifications accidentelles en production tout en donnant à tous une visibilité.
Séparation des environnements. Les environnements de développement, staging et production sont isolés. Un développeur écrit et teste dans son environnement de développement personnel. La fusion vers main déclenche le job de production. Il n’y a pas de risque qu’un dbt run dans le terminal de quelqu’un écrive accidentellement dans les tables de production.
Hébergement de la documentation. dbt Cloud sert votre site de documentation auto-générée à une URL accessible par toute votre organisation. Pas besoin d’héberger un site statique séparément. Les parties prenantes peuvent parcourir les descriptions de modèles, les définitions de colonnes, les graphes de lignage et les résultats de tests sans assistance développeur.
Commentaires intégrés. Les membres de l’équipe peuvent commenter les modèles et les pull requests au sein de la plateforme, gardant la discussion aux côtés du code plutôt que dispersée entre Slack et email.
Pour un développeur solo ou une équipe de deux personnes, ces fonctionnalités de collaboration ont une valeur limitée. Pour une équipe de données de 10 personnes avec des niveaux techniques variés, elles réduisent significativement les frais de coordination.
Infrastructure managée
Le « managé » dans plateforme managée signifie que dbt Cloud gère :
- L’environnement de calcul. Vos modèles dbt compilent et s’exécutent dans l’infrastructure de dbt Cloud. Vous ne provisionnez pas de serveurs, ne gérez pas de conteneurs et ne configurez pas l’autoscaling.
- La gestion des versions. dbt Cloud exécute des versions spécifiques de dbt Core par environnement. La mise à niveau est un changement de configuration, pas une mise à jour de dépendances sur plusieurs dépôts.
- Le stockage des artefacts. Les logs d’exécution, le SQL compilé, les fichiers manifest et les artefacts de documentation sont stockés et accessibles. Pas de buckets S3 ou Cloud Storage à configurer.
- La disponibilité et la fiabilité. dbt Labs gère la disponibilité. Vous n’êtes pas d’astreinte pour les défaillances de l’infrastructure dbt.
C’est la proposition de valeur pour les équipes qui manquent d’ingénierie de plateforme dédiée. Une équipe analytics de cinq professionnels focalisés sur SQL ne veut pas maintenir des images Docker, configurer des identifiants de compte de service, mettre en place du monitoring et dépanner les défaillances de conteneurs. dbt Cloud échange le contrôle contre la commodité, et pour de nombreuses équipes cet échange est favorable.
Fonctionnalités Cloud uniquement
L’écart entre Core et Cloud s’est creusé avec le temps, et la fusion avec Fivetran accélère cette tendance :
- dbt Fusion engine. Le parseur basé sur Rust offre une compilation 30x plus rapide. Cloud uniquement.
- Couche sémantique. Définissez des métriques en YAML et interrogez-les depuis des outils BI via l’API de la couche sémantique. Cloud uniquement.
- dbt Mesh. Gouvernance multi-projets avec cross-project refs, groupes de modèles et contrôles d’accès. Cloud uniquement.
- Slim CI. Construire seulement les modèles modifiés et leurs dépendants en aval dans les pull requests. Cloud uniquement (bien que des solutions communautaires existent pour Core).
- Planification avancée. Chaînage de jobs, déclencheurs conditionnels et politiques de retry au-delà du cron basique. Cloud uniquement.
Chaque release déplace davantage de capacités derrière le paywall. Certains membres de la communauté voient cela comme la monétisation naturelle d’un projet open source. D’autres y voient une érosion progressive de la viabilité de Core en tant qu’outil autonome. La réalité pratique : si votre équipe a besoin de la couche sémantique, de la gouvernance Mesh ou du moteur Fusion, dbt Cloud est le seul chemin.
Modèle de tarification
dbt Cloud utilise une tarification par siège avec des plans échelonnés :
| Plan | Prix | Inclus |
|---|---|---|
| Developer | Gratuit (1 siège) | IDE, planification, 1 projet |
| Team | ~100 $/utilisateur/mois | RBAC, projets multiples, accès API |
| Enterprise | Négocié | SSO, logs d’audit, support prioritaire, Mesh |
Le modèle par utilisateur signifie que le coût évolue linéairement avec la taille de l’équipe. Une équipe de 3 personnes paie environ 300 $/mois sur le plan Team. Une équipe de 10 personnes paie 1 000 $/mois. À 20+ utilisateurs, la tarification Enterprise est négociée mais est généralement plus élevée par siège avec des remises sur volume.
Par comparaison : l’auto-hébergement de dbt Core avec Cloud Run Jobs coûte moins de 5 $/mois en calcul. La différence finance l’IDE, la planification, les outils de collaboration, l’hébergement de la documentation et l’infrastructure managée de dbt Cloud. Si ces fonctionnalités justifient la prime par siège dépend entièrement des capacités techniques de votre équipe et de ce que vous dépenseriez à construire des fonctionnalités équivalentes vous-même.
Le plan Developer gratuit est une véritable rampe d’accès. Un analytics engineer solo obtient l’IDE, la planification et l’hébergement de documentation sans frais. La conversation sur la tarification commence quand vous ajoutez un second membre à l’équipe.
Profil d’équipe
dbt Cloud convient aux équipes axées sur SQL qui privilégient la commodité et la collaboration au contrôle de l’infrastructure. L’IDE réduit la barrière de configuration pour les analystes qui n’utilisent pas de terminal. Le planificateur intégré supprime le besoin de configurer Airflow ou Dagster. Le RBAC permet d’accorder un accès en lecture aux analystes métier sans risque d’écriture en production.
dbt Cloud est adapté quand :
- L’équipe a une capacité limitée en ingénierie de plateforme
- Plusieurs parties prenantes non techniques ont besoin d’accéder à la documentation
- La CI/CD sur les pull requests est une priorité mais la construire from scratch ne l’est pas
- La couche sémantique, la gouvernance Mesh ou le moteur Fusion sont requis (fonctionnalités Cloud uniquement)
- Le coût par utilisateur est acceptable par rapport à la taille de l’équipe
Le cadre de décision fournit une comparaison structurée. La certification dbt couvre les concepts communs à Core et Cloud.