Stack IA en couches pour l'analytics engineering

Les outils IA pour l’analytics engineering bénéficient du même modèle mental en couches que le modern data stack : ingestion, transformation, orchestration, serving. Chaque couche a une responsabilité claire et une passation claire vers la suivante. La question utile est « quelle couche de ma stack IA devrait gérer ceci ? » plutôt que « quel outil IA devrais-je utiliser ? »

Les quatre couches

Couche	Rôle	Exemples d’outils	Idéal pour
1 - Assistant IDE	Completions en temps réel, aide inline	Cursor, GitHub Copilot	Modifications rapides, exploration de code inconnu, changements dans un seul fichier
2 - Agent de coding	Opérations multi-fichiers, builds itératifs	Claude Code, Devin	Construction de modèles de bout en bout, refactoring, débogage
3 - Orchestration	Planification, monitoring, automatisation non-codante	OpenClaw	Tests planifiés, alertes, tâches en arrière-plan
4 - Revue de code	Second avis avant fusion	Gemini Code Assist, reviewers PR	Détecter les erreurs que l’outil qui a écrit le code ne détectera pas

Chaque couche comble un manque que les autres ne peuvent pas combler. L’assistant IDE est rapide mais superficiel — il opère dans un seul fichier et n’exécute pas de commandes. L’agent de coding est profond mais lié à la session — il travaille en rafales lorsque vous l’invoquez. La couche d’orchestration fonctionne en continu mais n’est pas conçue pour une génération de code précise. La couche de revue apporte une perspective fraîche, non corrompue par les hypothèses que l’outil générateur a faites.

Pourquoi des couches, pas un seul outil

La tentation est de trouver un outil qui fait tout. En pratique, les outils ont des interfaces et des capacités fondamentalement différentes qui les rendent adaptés à différents types de travail.

Un assistant IDE comme Cursor excelle quand vous avez besoin de vitesse : ajouter une colonne, corriger un filtre, comprendre un CTE. Vous êtes dans le flux, le contexte est petit et la modification est chirurgicale. Passer à un agent de coding en terminal pour ce type de travail ajoute des frictions sans valeur proportionnelle.

Un agent de coding comme Claude Code excelle quand vous avez besoin de profondeur : construire un modèle de zéro, refactoriser une chaîne de lignage, générer des tests et de la documentation en une seule session. L’agent lit la structure complète du projet, suit les conventions de votre CLAUDE.md, exécute dbt compile pour vérifier, et corrige les erreurs dans une boucle de feedback. Un autocomplete IDE ne peut pas faire cela — il n’a pas l’interface pour exécuter des commandes et itérer sur les résultats.

Une couche d’orchestration comme OpenClaw gère le travail qui ne devrait pas nécessiter votre attention : exécuter dbt test à 7h du matin, alerter sur les échecs, vérifier l’état du pipeline. Ce n’est pas une tâche pour laquelle vous ouvririez un IDE. C’est de l’infrastructure de fond.

La couche de revue existe parce que l’outil qui a écrit le code est le pire juge de ses propres erreurs. Claude Code détecte de nombreuses erreurs pendant sa boucle build-test-fix, mais il ne détectera pas les jugements subtils — des types de jointure incorrects, des lignes silencieusement filtrées, des hypothèses inappropriées sur la logique métier. Une étape de revue dédiée, qu’elle soit automatisée ou humaine, fournit la perspective indépendante que l’auto-correction ne peut pas.

Comment les couches se rapportent aux niveaux d’outils IA

La note Niveaux d’outils IA pour le data engineering catégorise les outils IA par capacité : agents autonomes, copilots, assistants de chat et IA intégrée aux plateformes. Le modèle de stack en couches est différent — il s’agit de la façon dont vous composez les outils en pratique, pas de comment vous les classez en théorie.

Un outil peut appartenir à un niveau mais servir une couche différente selon la façon dont vous l’utilisez. Cursor utilise des modèles Claude sous le capot (même capacité IA de niveau 1), mais dans une stack en couches, il remplit le rôle de couche IDE car son interface est optimisée pour l’édition inline en temps réel, pas pour le travail d’agent multi-fichiers. La couche est définie par le flux de travail, pas par le modèle sous-jacent.

Le problème de passation

La principale faiblesse d’une approche en couches est la coordination entre les couches. Chaque outil commence avec son propre contexte. Claude Code ne sait pas ce que la couche d’orchestration a trouvé pendant la nuit. L’assistant IDE ne sait pas quels modèles l’agent de coding vient de refactoriser. Il n’y a pas de mémoire partagée.

Le Pattern d’agent en cascade est ce qui ressemble le plus à une solution : la couche d’orchestration déclenche la couche de coding avec un contexte spécifique sur ce qu’elle a détecté. Mais même cela est une passation point à point, pas une couche de contexte unifiée.

Ce qui maintient une stack en couches aujourd’hui, ce sont des fichiers partagés : CLAUDE.md pour les conventions de projet, dbt_project.yml pour la configuration, les branches Git pour l’état du code et les canaux Slack pour la communication. Ce n’est pas élégant, mais cela fonctionne parce que chaque outil peut lire indépendamment les mêmes fichiers de projet et suivre les mêmes conventions.

Quand les couches sont excessives

Tous les analytics engineers n’ont pas besoin de quatre couches. Un data engineer travaillant sur un seul projet avec une base de code stable n’a peut-être besoin que des couches 1 et 2. La couche d’orchestration importe surtout quand vous gérez plusieurs projets ou avez besoin d’un monitoring 24h/24. La couche de revue importe surtout quand vous déployez du code généré par IA en production sans étape de revue humaine.

Commencez par la couche qui répond à votre plus grand point de douleur. Pour la plupart des analytics engineers, c’est la couche 2 (un agent de coding pour la génération et les tests de modèles). Ajoutez des couches quand vous ressentez le manque — quand vous vous retrouvez à faire manuellement quelque chose qu’un type différent d’outil pourrait gérer.

Le cadre de décision

Le modèle en couches fournit un cadre de décision indépendant des outils spécifiques. Quand un test dbt échoue, la couche de monitoring le détecte, la couche de coding le corrige et la couche d’orchestration les relie. La couche détermine quel outil utiliser.

Le modern data stack a mûri de la même façon : la question est passée de « Fivetran ou scripts custom ? » à « quel outil remplit la couche d’ingestion ? » Les outils IA pour l’analytics engineering sont au même point. Les outils spécifiques changeront ; les couches sont plus durables.