L’écosystème MCP est passé d’un seul projet Anthropic à un standard ouvert gouverné par la Linux Foundation avec 97 millions de téléchargements du SDK et plus de 5 800 serveurs communautaires en moins de deux ans. Ce hub organise les notes qui couvrent le paysage — comment fonctionne le protocole, ce qui est disponible, et comment construire pour lui.
Commencer ici
MCP Protocol Architecture — Ce qu’est MCP, comment les clients et serveurs communiquent, et les trois primitives (outils, ressources, prompts). À lire en premier. Tout le reste dans ce hub le suppose.
L’écosystème
MCP Official Reference Servers — Les serveurs maintenus par le MCP Steering Group. Sept serveurs activement maintenus, dont Filesystem (essentiel pour le data engineering) et Git. Plus les serveurs archivés qui ont été transférés à la maintenance des fournisseurs.
MCP Client Landscape — Claude Desktop, Claude Code, Cursor, VS Code Copilot, Windsurf et autres. Comment choisir selon l’endroit où se déroule votre travail, pas selon le client qui a le plus de fonctionnalités.
MCP Ecosystem Governance — Comment MCP est devenu indépendant des fournisseurs : la donation à la Linux Foundation, l’adoption par OpenAI, Microsoft, AWS et Google, et ce que cela signifie pour les décisions d’infrastructure.
MCP Discovery Resources — Où trouver des serveurs : le registre officiel, awesome-mcp-servers, mcpservers.org, et comment évaluer ce que vous trouvez avant d’installer.
Serveurs de data engineering
MCP Data Engineering Servers — Les serveurs qui comptent pour le travail sur les données : Snowflake (officiel Snowflake Labs), BigQuery (GenAI Toolbox de Google), ClickHouse (officiel), centralmind/gateway (multi-base de données), MindsDB (fédéré avec ML), Databricks et Confluent.
Approfondissements par base de données :
- BigQuery MCP Server Setup — hub de configuration pour les options BigQuery de Google
- BigQuery MCP Toolbox Setup — étape par étape pour GenAI Toolbox
- Choosing Between BigQuery MCP Options — Toolbox distant vs CLI BigQuery
- dbt MCP Server Setup Hub — intégration dbt pour le contexte de lignage et de documentation
Construction de serveurs personnalisés
Quand les serveurs existants ne couvrent pas votre cas d’usage, le chemin du serveur personnalisé :
Custom MCP Server Decision Criteria — Construire vs parcourir : quand écrire du code personnalisé, quand forker un serveur existant, quand le CLI est une réponse plus simple.
MCP SDK Selection for Data Engineering — Python (FastMCP) ou TypeScript (McpServer). Pour la plupart des équipes de data engineering : Python.
FastMCP Server Skeleton — Serveurs minimaux fonctionnels en Python et TypeScript. Le point de départ en 30 lignes.
MCP Tool Design Patterns — Docstrings comme descriptions, modèles Pydantic pour la sortie structurée, validation des entrées avec des schémas. La différence entre les outils que l’IA utilise correctement et ceux qu’elle rate.
MCP Resources and Prompts — Exposition de données en lecture seule (ressources), templates réutilisables (prompts), reporting de progression (objet Context). Les deux autres primitives au-delà des outils.
MCP Transport Configuration — stdio pour le développement local, HTTP streamable pour la production. Quand basculer.
MCP Server Testing and Debugging — L’Inspector, le piège stdout-corrompt-le-protocole, et le workflow de test en trois étapes.
MCP Server Project Setup — Initialisation complète de projet : structure de répertoires, dépendances, installation client, configuration à portée de projet.
Schémas de serveurs pour les besoins courants en data engineering :
- MCP Data Catalog Server Pattern
- MCP Pipeline Monitoring Server Pattern
- MCP Data Quality Server Pattern
Connexe
CLI vs MCP for AI Agents — Quand le CLI BigQuery bat un serveur MCP BigQuery. Efficacité des tokens, données d’entraînement, composabilité Unix vs schémas typés et universalité des clients.
Security Posture for AI Agents — Principes de sécurité pour les outils IA accédant à l’infrastructure de données. Pertinent pour tout déploiement MCP en production.
Custom Parameterized MCP Queries — Un schéma spécifique pour un accès BigQuery contraint — requêtes paramétrées qui évitent la prolifération de schémas.
MCP Context Window Overhead — Le coût de connecter de nombreux serveurs MCP. Pertinent pour choisir combien de serveurs exécuter simultanément.