Ce hub couvre la couche spécifique à Salesforce d’un pipeline BigQuery. Le CRM Data Architecture Hub couvre les patterns d’architecture qui s’appliquent à n’importe quelle source CRM (modèles dbt en couches, suivi SCD Type 2, stratégies incrémentales, packages Fivetran). Les notes ici adressent le modèle de données particulier de Salesforce : les clés étrangères polymorphiques, les champs de formule qui changent sans mettre à jour les timestamps, les types d’enregistrement qui divisent les objets en différents processus métier, et les hiérarchies de comptes qui requièrent du SQL récursif.
Prérequis
Avant de commencer, vous devriez être à l’aise avec :
- CRM Data Extraction Challenges — mutabilité, suppressions logiques, angles morts des champs de formule
- CRM Modeling Patterns in dbt — architecture base/intermédiaire/mart pour les données CRM
- Modèles de données Salesforce vs HubSpot — comment Salesforce structure son modèle de données
Ordre de lecture
-
Sélection de l’outil d’ingestion Salesforce — Choisir entre Fivetran, Airbyte, dlt, Hevo et Python personnalisé pour l’extraction Salesforce. Mécaniques des connecteurs spécifiques à Salesforce, réalités des coûts, et le différend AppExchange.
-
Résolution des relations polymorphiques Salesforce — Comment résoudre les clés étrangères polymorphiques
WhoIdetWhatIden utilisant le routage par préfixe d’ID. Le pattern SQL et où il se retrouve dans les Tasks, Events et objets personnalisés. -
Partitionnement par type d’enregistrement Salesforce dans dbt — Gérer
RecordTypeIddans l’entrepôt. Quand diviser les objets en modèles séparés par type d’enregistrement versus garder un seul modèle avec une colonne de type. -
Comptes personnels et multi-devises Salesforce dans l’entrepôt — Deux fonctionnalités Salesforce qui cassent les hypothèses standards : les Comptes Personnels (Account/Contact fusionnés) et le multi-devises (conversion de taux de change dans dbt).
-
Analyse de la durée des étapes d’opportunité Salesforce — Calculer le temps passé dans chaque étape du pipeline en utilisant
OpportunityFieldHistoryet les fonctions de fenêtre LEAD. Détection des goulots d’étranglement et métriques de taux de remportés. -
Hiérarchie de comptes Salesforce avec des CTEs récursives — Résoudre le
ParentAccountIdauto-référentiel en une hiérarchie aplatie pour le rollup des revenus sur les groupes d’entreprises. -
Timeline d’activité unifiée Salesforce — Combiner Tasks et Events en une vue chronologique unique avec résolution d’entités polymorphiques.
Notes existantes qui s’appliquent
Ces notes du jardin issues de la série architecture CRM élargie s’appliquent directement au travail Salesforce :
- Fivetran dbt Packages for CRM — colonnes pass-through pour les champs personnalisés, mode historique, support multi-org
- SCD Type 2 avec les snapshots dbt — suivi de l’état historique des enregistrements CRM
- CRM Data Extraction Challenges — angles morts des champs de formule avec SystemModStamp
Associé
- HubSpot BigQuery Pipeline Hub — pipeline HubSpot-vers-BigQuery, couvrant le modèle de données basé sur les associations