Dimensions de signaux pour le lead scoring

Le lead scoring attribue une valeur numérique à chaque lead reflétant la probabilité de conversion. Le scoring natif CRM est limité à ce qui vit dans le CRM — intitulé de poste, taille de l’entreprise, soumissions de formulaires, ouvertures d’e-mails. Le scoring basé sur le warehouse peut incorporer les analytics web GA4, la télémétrie d’utilisation du produit, l’historique des tickets de support et les signaux de facturation.

Quatre catégories de signaux couvrent les entrées de la plupart des modèles de lead scoring.

Adéquation démographique

Qui est cette personne ? Les signaux démographiques capturent l’identité individuelle et le contexte professionnel.

Les signaux démographiques les plus prédictifs sont généralement la séniorité et le département. Un VP Engineering dans une entreprise SaaS qui évalue des outils pour développeurs est un lead fondamentalement différent d’un stagiaire de la même entreprise. La séniorité signale l’autorité sur la décision d’achat. Le département signale la pertinence par rapport à ce que vous vendez.

L’intitulé de poste brut est bruité — des milliers de variantes pour des rôles similaires. Si vous extrayez des intitulés depuis HubSpot ou Salesforce, envisagez de les normaliser dans votre couche intermédiaire avant de scorer :

-- Normaliser les intitulés de poste bruts en niveaux de séniorité
CASE
  WHEN LOWER(contact__job_title) LIKE ANY ('%ceo%', '%cto%', '%cfo%', '%coo%', '%chief%') THEN 'C-Level'
  WHEN LOWER(contact__job_title) LIKE ANY ('%vp%', '%vice president%') THEN 'VP'
  WHEN LOWER(contact__job_title) LIKE ANY ('%director%') THEN 'Director'
  WHEN LOWER(contact__job_title) LIKE ANY ('%manager%', '%lead%', '%head of%') THEN 'Manager'
  ELSE 'Individual Contributor'
END AS contact__seniority_band

Normalisez d’abord, scorez ensuite. Les intitulés bruts alimentés directement dans les règles de scoring créent un enfer de maintenance dès que vous rencontrez « VP-level » ou « Dir. » ou « Chief of Staff ».

Adéquation firmographique

De quel type d’entreprise viennent-ils ? Les signaux firmographiques capturent l’adéquation au niveau de l’entreprise par rapport à votre profil client idéal (ICP).

Signaux firmographiques clés : nombre d’employés, secteur d’activité, chiffre d’affaires annuel, stack technologique (si vous pouvez l’inférer). Ceux-ci déterminent si cette entreprise se trouve même dans votre marché adressable, indépendamment de l’engagement du lead.

Une entreprise SaaS de 500 personnes dans votre secteur cible score plus haut qu’une agence de 5 personnes hors de votre ICP — même si le lead de l’agence a rempli deux fois plus de formulaires. L’adéquation firmographique est un multiplicateur sur les signaux d’engagement. Un engagement élevé d’une entreprise mal adaptée reste un mauvais lead.

Les données firmographiques proviennent généralement du CRM (ce que votre équipe commerciale saisit manuellement ou que votre outil d’enrichissement complète), mais c’est dans le warehouse que vous les normalisez pour le scoring. C’est aussi là que vous appliquez votre définition d’ICP — en scorant 0 pour les secteurs non qualifiés, par exemple, plutôt que de laisser ces leads dans votre pipeline pour faire perdre du temps aux commerciaux.

Engagement comportemental

Qu’est-ce que le lead a réellement fait ? Les signaux comportementaux mesurent l’intention et l’intérêt démontrés.

Ces signaux différencient un lead qui vous a trouvé une fois d’un lead qui vous évalue activement. Les événements comportementaux à fort signal incluent les visites de la page de tarification, les demandes de démo, les vues de pages de comparaison de fonctionnalités et les soumissions de formulaires. Les événements à signal moyen incluent les ouvertures d’e-mails, les téléchargements de contenu et les visites de blog. Les événements à faible signal incluent les visites de la page d’accueil et les désabonnements (qui sont en fait des signaux négatifs).

Le pattern important ici est que le warehouse peut extraire des signaux comportementaux que le CRM ne voit jamais. Un lead qui a passé 45 minutes sur votre page de tarification lors d’une session commencée depuis un clic Google Ads — c’est un événement GA4. Un lead qui a ouvert l’application trois fois la semaine dernière sans passer à un plan supérieur — c’est de la télémétrie produit. Le CRM capture ce que le lead vous a dit. Le warehouse capture ce que le lead vous a montré.

Récence

Quand l’ont-ils fait ? La récence pondère l’activité récente par rapport à l’activité plus ancienne.

Un lead qui a demandé une démo hier représente une situation différente de celui qui en a demandé une il y a six mois puis s’est silencieux. Le score doit refléter cette différence.

L’approche standard est la décroissance temporelle : au lieu d’ajouter le compte brut d’événements au score, appliquez un facteur de décroissance basé sur la date de l’événement.

-- Décroissance exponentielle : divise par deux le score tous les ~7 jours
lead__score * EXP(-0.1 * DATE_DIFF(CURRENT_DATE(), event__occurred_at, DAY))

La constante 0.1 contrôle le taux de décroissance. À 0.1, le score est divisé par deux environ tous les 7 jours. Un événement d’hier compte à ~90% de sa valeur nominale. Le même événement d’il y a trois semaines compte à ~13%.

La récence transforme les scores comportementaux de compteurs cumulatifs (quelqu’un qui s’est inscrit il y a deux ans accumule plus de points au fil du temps indépendamment de l’intérêt actuel) en signaux d’intention (seule l’activité récente compte de manière significative dans le score).

Signaux négatifs

Les modèles de scoring axés uniquement sur les signaux positifs permettent aux leads morts de s’accumuler dans le tier de score élevé au fil du temps. Les signaux négatifs — désabonnements (-20), e-mails rebondis (-15), inactivité prolongée (-10 pour 30+ jours sans activité) — doivent soustraire du score. Sans eux, les leads à score élevé peuvent ne pas avoir été engagés depuis des mois.

La logique de signal négatif appartient au même modèle de scoring que les signaux positifs — généralement dans un bloc CASE WHEN ou une table de règles de scoring alimentée par un seed, aux côtés des pondérations de signaux positifs.

Pourquoi cela importe pour le scoring basé sur le warehouse

Les outils de scoring natifs CRM gèrent raisonnablement bien les signaux démographiques et firmographiques, puisque ces données vivent dans le CRM. Ils gèrent certains signaux comportementaux — ouvertures d’e-mails, soumissions de formulaires, activités trackées par le CRM. Ce qu’ils ne peuvent pas toucher : les analytics web (GA4), l’utilisation du produit, l’historique de support, les signaux financiers de votre système de facturation.

Construire le scoring dans le warehouse avec dbt signifie que vous pouvez incorporer les quatre catégories de signaux de chaque source de données déjà modélisée. Les tables de features intermédiaires alimentent depuis les données d’événements GA4, les enregistrements CRM, la télémétrie produit — quoi que vous ayez. Le modèle de scoring les joint ensemble.

C’est la raison fondamentale de déplacer le scoring hors du CRM et dans le warehouse : non pas parce que les outils warehouse sont plus puissants, mais parce que le warehouse est là où tous les signaux résident réellement.

Pour l’implémentation du scoring basé sur des règles utilisant ces signaux, voir Lead scoring basé sur des règles dans dbt. Pour le scoring basé sur le ML qui apprend les pondérations à partir des données de conversion historiques, voir BigQuery ML pour le lead scoring.