Cette note couvre le modèle de tarification d’Airbyte de février 2025 et les coûts d’infrastructure cachés de l’auto-hébergement — en particulier les frais NAT Gateway et la surcharge Kubernetes qui ne sont pas visibles sur la page de tarification.
Le Modèle de Tarification de Février 2025
Airbyte a introduit une tarification par capacité en février 2025, remplaçant son ancien modèle basé sur des crédits. La structure :
- Core open-source : Gratuit, pour toujours. Auto-hébergement sur votre propre infrastructure.
- Cloud Standard : 10 $/mois de base plus des frais au volume : 15 $ par million de lignes pour les sources API, 10 $ par Go pour les sources de bases de données et de fichiers.
- Cloud Plus et Enterprise : Niveaux supérieurs avec des fonctionnalités additionnelles (SSO, RBAC, support prioritaire, conformité HIPAA).
Le modèle au volume est favorable par rapport à la tarification MAR de Fivetran pour de nombreuses charges de travail. Comparaison approximative pour une équipe data mid-size chargeant 50 millions de lignes API plus 50 Go de données de base de données :
| Outil | Coût mensuel approximatif |
|---|---|
| Airbyte Cloud | ~1 250 $ (10 $ de base + 750 $ lignes API + 500 $ base de données) |
| Fivetran (basé MAR) | ~4 445 $ (selon le tier et le nombre de connecteurs) |
Le chiffre Airbyte ne s’emballe pas de la même manière que Fivetran quand vous ajoutez des connecteurs, car les comptages de lignes API sont partagés sur l’ensemble du compte plutôt que par connecteur. Une ligne est une ligne quelle que soit la source dont elle provient.
Cela est le plus important pour les équipes avec de nombreux connecteurs, où le palier MAR par connecteur de Fivetran a éliminé les remises sur volume que les clients Fivetran recevaient auparavant.
L’Option d’Auto-hébergement
Le Core open-source d’Airbyte est gratuit, mais l’auto-hébergement échange les frais d’abonnement contre du temps d’ingénierie et des coûts d’infrastructure.
Exigences d’Infrastructure
L’exécution d’Airbyte OSS en production nécessite :
- Un cluster Kubernetes (EKS, GKE ou AKS) avec un minimum de 2 cœurs et 8 Go de RAM par nœud
- 30 Go d’espace disque
- PostgreSQL externe pour le stockage des métadonnées
- S3 ou GCS pour le stockage des logs
Chaque connecteur s’exécute dans son propre conteneur Docker ; le cluster a besoin de suffisamment de capacité pour exécuter des synchronisations simultanées sans contention de ressources. L’expertise Kubernetes et la gestion des charts Helm sont requises.
Le Problème NAT Gateway
Le coût qui surprend presque tout le monde : les frais NAT Gateway.
Quand les pods Kubernetes se connectent à des API externes, le trafic passe par un NAT Gateway (ou équivalent) pour l’accès Internet sortant. AWS NAT Gateway coûte 0,045 $/heure (environ 32 $/mois rien que pour exister) plus 0,045 $/Go de données traitées. Sur GCP et Azure, des coûts similaires s’appliquent.
Des praticiens ont rapporté que les coûts NAT Gateway représentent 80% du total des coûts d’infrastructure à une échelle modérée. Un utilisateur a noté que « les coûts NAT Gateway et EC2 dépasseront de loin le reste. » Une équipe s’attendant à 0 $ pour un déploiement open-source se retrouve souvent avec 200 à 500 $/mois en infrastructure avant même de comptabiliser le calcul.
Surcharge Opérationnelle de Kubernetes
Au-delà des coûts d’infrastructure, Airbyte en auto-hébergement a des exigences de maintenance continues :
- Gestion des versions de connecteurs : Airbyte publie des images de connecteurs régulièrement. Les déploiements en auto-hébergement doivent les mettre à jour manuellement, ou vous prenez du retard sur les changements d’API.
- Mises à jour des charts Helm : La plateforme Airbyte elle-même publie des mises à jour. Mettre à niveau un déploiement Kubernetes est plus impliqué que de cliquer sur « mettre à jour » dans un tableau de bord SaaS.
- Réponse aux pannes : Quand un connecteur échoue à 2h du matin parce que l’API source a renvoyé une réponse malformée, quelqu’un dans votre équipe est alerté.
- Expertise Kubernetes : La plupart des équipes data n’ont pas de spécialiste Kubernetes. Gérer un cluster Kubernetes en production est du travail DevOps. Le temps d’ingénierie que cela consomme est de l’argent réel.
Quand l’Auto-hébergement Est Rentable
- Cloud Standard est généralement meilleur pour les équipes sans expertise Kubernetes ou avec des volumes de données modérés (moins de 100 millions de lignes/mois).
- L’auto-hébergement est rentable pour les charges de travail à fort volume (centaines de millions de lignes) où les frais de traitement des données au prix cloud dépassent les coûts d’infrastructure.
Le calcul pertinent inclut le coût mensuel de l’infrastructure plus le temps d’ingénierie amorti pour la gestion de l’infrastructure.
Qualité des Connecteurs
Sur 600+ connecteurs, environ 350 sont officiels (maintenus par Airbyte) ; le reste est contribué par la communauté. Les connecteurs officiels répondent aux changements d’API dans des délais raisonnables. Les connecteurs communautaires peuvent prendre du retard de quelques semaines ou mois après un changement d’API source.
Les principales sources marketing (Google Ads, Meta Ads, GA4, HubSpot, Shopify) ont des connecteurs officiels. Pour les outils SaaS de niche, confirmez si le connecteur est officiel ou maintenu par la communauté avant de l’utiliser en production.
Critères de Décision
Airbyte est bien adapté aux équipes qui :
- Ont la capacité d’ingénierie pour gérer l’infrastructure Kubernetes (ou sont prêtes à payer pour Cloud)
- Ont besoin d’une large palette de connecteurs au-delà des 60+ sources vérifiées de dlt mais ne peuvent pas justifier la tarification Fivetran
- Ont des charges de travail où la tarification par capacité est inférieure à la tarification MAR
- Peuvent tolérer une qualité de connecteurs variable
Non adapté pour : les équipes souhaitant zéro surcharge de maintenance (Fivetran), ou les équipes maîtrisant Python qui peuvent construire des pipelines personnalisés à moindre coût (dlt).
Le coût affiché d’Airbyte est exact ; le coût total est plus élevé. L’infrastructure (notamment NAT Gateway), la maintenance des connecteurs et le temps d’ingénierie pour la gestion du déploiement en production doivent être budgétés.