Le guide du sourcing des données en B2B : base de données, outils d'enrichissement et scrapping

Vous avez une base de données incomplète. Votre CRM est un Frankenstein de la donnée. Vos sales pleurent comme des madeleines et vous martyrisent à coup de Slack et d'emails afin d'avoir plus de leads avec des données plus farfelues les unes que les autres. Ajouter à ceci la RGPD -à interprétation plus que variable- qui laisse le champ libre aux DPO qui jubilent avec le nouveau pouvoir qu'ils viennent d'obtenir et qui se fichent complètement de la croissance de la boîte.

Le désespoir ? Ho que non ! Voici quelques sources de données qui peuvent vous être utiles.

Nous visons ici autant les données de société que les données de contact.

Disclaimer : toutes les APIs présentées ont été testées à l'aide de Python.

Pas de temps pour tout lire ?

preview tableau recap base de données B2B
Accès au tableau comparatif qui contient toutes les données.

N'hésitez pas à nous écrire pour y contribuer !

Table des matières

Bases de données

      Societeinfo
      Societe.com
      Mixdata
      Kompass

Outils d'enrichissements

      Clearbit
      Lusha
      Fullcontact
      Gender-API
      insideview
      dropcontact

Hybrides

      snovio
      hunter
      voilanorbert

Méthodes de scrapping

      Scrapping Google
      Scrapping Linkedin
      Scrapping domaines

Le RGPD dans tout ça ?

Le top

Les bases de données

Sociétéinfo.com

review societeinfo

L'API de Sociétéinfo est très facile à utiliser et permet d'enrichir aisément vos données.

Bien que celle-ci soit classée comme base de données, elle peut très bien être utilisée pour l'enrichissement.

Données accessibles : toutes les données sur les sociétés, incluant dirigeants, téléphones, emails génériques, données financières, siren, siret. Une nouvelle fonctionnalité "contact" est désormais disponible et permet d'extraire des informations sur les personnes. Détails ici

L'interface est d'une qualité acceptable, bien que l'export demande un peu de temps de traitement. Il est possible de limiter l'export, ce qui parait bête mais fait défaut à d'autres plateformes. L'API représente l'intérêt principal de sociétéinfo. Combiné à son coût raisonnable, l'outil s'avère redoutable pour compléter un CRM incomplet ou effectuer de la génération de leads.

Point de départ : Siren, siret, domaine, mots clés

Prix : Forfait mensuel pour des crédits. Une request par domaine pour une société coûte, par exemple, 20 crédits et donne l'ensembles des données disponibles sur la société. Pour 20 crédits, vous payez en fonction du forfait, soit approximativement 0.05€.

societe.com

Societe.com est une entreprise du groupe La Poste, à ne pas confondre avec societeinfo.com. Les données disponibles sont de bonne qualité. Certainement une référence.

Données accessibles : L'ensemble des données sur les sociétés, principalement légales et financières. Vous pouvez également obtenir de l'information sur les dirigeants, qui contient jusqu'à l'âge, ce qui est extrêmement rare et dans certain cas, essentiel. L'information est très fiable, car sourcée directement chez Infogreffe. Plusieurs outils de surveillance sont également disponibles.

Prix : entre .50€/ligne et 0.06€/ligne, en fonction de l'abonnement.

Mixdata.com

Mixdata est une base de données classique. Elle permet d'exporter les données sur les sociétés, mais aussi sur les contacts. Les informations sont d'assez bonne qualité et demande peu de retraitement manuel. Cependant, l'interface a besoin d'être complètement retravaillée. La manipulation de celle-ci est désagréable et peu intuitive.

Mixdata a cependant un super support, très efficace et serviable. Ils offrent de réaliser des listes sur mesure.

Données accessibles : données générales sur les sociétés et les contacts. Permet de filtrer par code NAF, département, titre. Il existe quelques filtres uniques très utiles tel que les filtres B2B, startup, accepte American Express, fait de l'Export si la société dépense en R&D, etc.

Vous pouvez obtenir les emails vérifiés ou non vérifiés des personnes.

Prix : approximativement entre 0.8€/ligne et 1.20€/ligne pour un contact, un peu moins pour une société.

Kompass

review insideview

Un outil très similaire à Mixdata. Cependant, le coût de l'outil est relativement plus bas que pour Mixdata et l'interface est beaucoup plus agréable à utiliser.

Données accessibles : approximativement la même chose que pour Mixdata.

Prix :

Les bases à tester : Cartégie, Manageo, Docmarketing.fr et plusieurs autres que je n'ai malheureusement pas eu encore l'occasion de tester.

Les outils d'enrichissements

Clearbit

review clearbit

Clearbit est un outil d'enrichissement et de prospection. À moins d'être richissime et d'avoir un CPL possible conséquent, il est fort probable que vous soyez dans la même situation et que vous utilisiez principalement l'outil d'enrichissement.

Celui-ci permet d'obtenir une information très, très complète à partir du domaine et du email. C'est probablement l'outil sur le marché qui permet d'obtenir l'information la plus complète sur une société, si l'on exclut les informations financières et légales. Cependant, il s'agit d'un outil américain et le taux de réussite est plutôt faible en France.

L'outil est principalement axé sur son API en plus des connections natives aux outils de l'écosystème Salesforce. L'outil d'import/export CSV est minimaliste, bug souvent et l'extension Google Sheet a été délaissée. Celui-ci reste tout de même fonctionnel.

C'est donc un excellent outil à brancher à votre CRM afin de compléter sans effort les fiches contacts de vos prospects.

Point de départ : email, domaine

Données accessibles : à partir du domaine, pour une société, pratiquement tout.

À partir du email, vous trouverez également la plupart des informations intéressantes. Les données sont d'ailleurs d'une très bonne qualité.

Prix : à partir de 99€/mois pour 2500 demandes. Donc, 0.04€/ligne.

Lusha

LogoDark-1
Lusha est un outil extrêmement puissant. Il permet, à l'aide d'une simple requête à l'API ou à l'aide de l'extension chrome, d'obtenir à la fois les emails personnels et professionnels mais aussi le numéro de téléphone, incluant le mobile.

Le plus étonnant avec Lusha est l'efficacité de l'outil. Dans plus de 75% des cas (selon mes propres tests), vous pouvez obtenir le bon numéro de portable de la personne. Peu importe sa position hiérarchique.

Le sourcing des données de Lusha fait l'objet de nombreuses discussions, mais officiellement, Lusha obtient ses données à partir de ses partenaires. Je ne sais pas qui ils sont, mais ceux-ci ont certainement des données de très haute qualité.

Problème : dans un contexte B2B, pas très RGPD-esque comme données. Une campagne de cold-calling sur ces mobiles n'est probablement pas une bonne idée.

Point de départ : prénom+nom+nom de la société ou domaine pour une personne. nom de la société ou domaine pour une société. détails ici

Données accessibles : principalement les numéros de téléphones mobiles mais aussi la ligne directe, le email personnel (gmails et cie) et à l'occasion le email pro. À utiliser à vos risques et périls.

Prix : approximativement 1€/crédit, ce qui équivaut à une fiche contact, dépendamment du forfait choisi.

Fullcontact

review dropcontact

Fullcontact est un outil d'enrichissement similaire à Clearbit. Il a cependant la particularité d'être très axé sur les réseaux sociaux. Il offre la possibilité d'enrichir un numéro de téléphone et un Twitter. À ma connaissance, il s'agit de l'un des seuls outils à pouvoir effectuer ces tâches.

Point de départ : email, Twitter, téléphone

Données accessibles : le meilleur outil pour les données sociales. Ensemble de l'info disponible ici.

Prix : à partir de 10€/mois pour l'enrichissement de 500 contacts. Option "small business" pour 499€/mois pour 50 000 contacts + l'API.

Gender API : l'incontournable-qui-manque-tout-le-temps-mais-que-vous-devez-utilisez-parce-que-cela-augmente-la-conversion-test-à-l'appui

Gender API ermet de récupérer le genre de la personne en fonction du prénom ou du email. Cela vous permet donc de bien démarrer vos e-mails par Monsieur/Madame. Cela semble anodin, mais c'est ce qui fait la différence entre une bonne et une mauvaise personnalisation, sauf si vous optez pour Bonjour+{{first_name}}, ce qui n'est pas toujours approprié. Avec le prénom, cet outil réussi dans plus de 99% des cas à trouver le bon résultat.

Point de départ : email ou prénom + pays. Marche beaucoup mieux avec le prénom.

Données accessibles : sexe de la personne, qui peut-être converti en monsieur/madame.

Prix : dérisoire! 8€ pour 5000 crédits, qui donne un enrichissement chaque.

Insideview

review insideview

Insideview est à ma connaissance très axé sur l'enrichissement des données CRM. De mon côté, j'ai eu la chance de tester cette base connectée à Dynamics CRM. Ceci c'est avéré être un outil redoutable pour la prospection, à un coût normal. L'interface d'insideview a été remaniée et est beaucoup plus agréable à utiliser.

Données accessibles : L'ensemble des informations des contacts et des sociétés. Détails ici.

Prix : démarre à 99€/utilisateur/mois pour 100 exports. Donc, +- 1€/ligne.

Dropcontact.io

review dropcontact

Un outil qui, à partir du prénom/nom/société en CSV, trouve l'ensembles des informations manquantes incluant civilité et reformate les données. Hyper rapide et low cost.

Données accessible : prénom/nom/société/email/civilité/titre/naf/nombre d'employés/etc et bien reformaté svp.

Prix : 0,01€/contact. Donc, vraiment, vraiment pas très cher.

les hybrides

snov.io : celui qui fait tout et qui le fait bien, comme dans les films

review dropcontact

Il s'agit maintenant d'un de mes outils préférés. Snov intègre très bien plusieurs outils : trouver un email à partir d'un domaine, reconstruction d'email à partir du prénom/nom/compagnie, création d'une liste de société qui utilise une technologie (avec filtres), extension Chrome qui permet d'obtenir l'information directement à partir de Linkedin, validation des emails et j'en passe.

Vraiment, un super outil, très complet, qui permet d'éviter des heures à créer des scripts tellement l'interface est bien.

Données accessibles : pour le contact : email, prénom, nom, titre, société, coordonnés géographiques, etc. Pour les sociétés : taille, coordonnées géographiques, industrie, technologies, url, etc. Bref, tout ce qui est nécessaire. Tout ça est disponible via l'API. Je n'ai pas encore beaucoup exploré celle-ci, mais elle semble très complète.

Deux détails agaçants : le filtre géographique et par nombre d'employé ne laisse pas suffisament de flexibilité et l'approche par industrie plutôt que NAF.

Prix : très, très, abordable à approximativement 0,02€/crédit. Un email vérifié coûte approximativement 20 crédits.

hunter.io : l'incontournable vétéran

review societeinfo

Le légendaire. Hunter est un outil très mature qui permet à partir du domaine ou du prénom/nom/société d'obtenir des adresses emails, génériques ou personelles. Hunter possède une API très bien documentée et très pratique pour effectuer des scripts.

C'est un outil que j'utilise depuis longtemps et qui a fait ses preuves.

L'extension Google Sheet est très pratique et permet d'effectuer le travail sans avoir de connaissance de développeurs.

Plusieurs fonctionnalités ont récemment été ajoutées : comme par exemple la possibilité de trouver des domaines à partir d'une techno.

Données accessibles : emails personnels et génériques.
Prix : entre 49€/mois pour 1000 requests et 400€/mois pour 50 000 requests.

Voilà Norbert

review voilanorbert

Une application équivalente à Hunter mais un peu moins connue en France. Le match rate est similaire. Quelques intégrations absentes chez les compétiteurs peuvent faire la différence.

Données accessibles : emails à partir de prénom/nom/société mais aussi l'enrichissement de emails avec job title/société/coordonnées géographiques et réseaux sociaux
Prix : 49€/mois pour 1000 requests et 499€/mois pour 50 000 requests.

Le dark side of the force : méthodes de scrapping

dark_side_of_scrapping
Il s'agissait principalement d'une excuse pour utiliser des gifs de Star Wars. Le scrapping vise généralement des données publiques, bien que ces pratiques peuvent vous créer des soucis, tels que comptes bloqués et cie. Faites également attention de respecter la loi en vigueur dans votre pays et les conditions d'utilisation.

Scrapping Google Search

L'objectif du scrapping Google Search est de récupérer une liste de domaine en fonction de recherches que vous pourrez par la suite utiliser avec des outils tiers.

Par exemple, supposons que vous ciblez les agences immobilières. Plutôt que de chercher manuellement les agences dans chaque ville, vous créez un script qui le fera pour vous.

Pour pouvez réaliser ce script à l'aide de Python, Beautifulsoup et le module Python Requests. Scrapy / Selenium peut également être utile si vous préférez ces modules. Pyautogui peut-être utile, si vous êtes vraiment motivé à imiter le comportement d'un humain. Il sera difficile de le faire sans le talent de développeurs. Le cas échéant, il y a toujours scrapebox.

Une fois votre script réalisé, vous transmettez cette liste de domaine à un outil tel que hunter.io ou snov.io.

Prix : votre temps, le mien, un développeur ou scrapebox

Scrapping Linkedin

cette méthode consiste à récupérer le prénom/nom/société de contacts en fonction de recherches Linkedin et à enrichir ces données via un service tier. Nous avons réaliser un guide pour débutant plus détaillé concernant cette méthode.

Pour réaliser ceci, le plus simple consiste à utiliser des outils tels que Linkedhelper. Un script vous permettra d'obtenir une meilleure performance mais, dans la majorité des cas, il s'agit d'outils suffisants.

Un compte Sales Navigator ou Recruiter est préférable. Il permet de mieux cibler vos recherches et d'éviter les limitations les plus contraignantes.

Le bot récupèrera les données de base (prénom/nom/société) si vous utilisez une liste ou l'ensemble des données du profil si vous utilisez le mode autovisit.

Une fois ceci fait, il suffit d'utiliser l'outil d'enrichissement de votre préférence.

Données accessibles : tout ce qui est sur un profil Linkedin + emails et autres via enrichissement
Prix : 8€/mois pour Linkedhelper et 75€/mois pour un abonnement Linkedin

Scrapping direct des URLS / répertoires

Il existe plusieurs manières d'effectuer le scrapping d'un site, qu'il s'agisse d'un répertoire ou d'un autre. Vous pouvez utiliser des outils tels que webscraper.io, parsehub, ou Phamtom buster, des outils testés et efficaces.

Cependant, si vous avez quelques talents de développeurs, il est difficile de faire mieux qu'un script. À l'aide de Python, vous pouvez utiliser Beautifulsoup, Scrappy, requests, pyautgui, Selenium. Il existe également des choses très bien en JavaScript et de très nombreux guides tels que celui-ci.

Le top

Ce qu'on retient et qui devrait vous permettre d'effectuer tout ce qu'il vous faut :
*societeinfo
*Lusha
*Scrapping Linkedin / Google
*Snov
*Hunter
*Dropcontact
*Gender-API
*Clearbit

Le RGPD dans tout ça ?

Voici les recommandations de la CNIL concernant la sollicitation en B2B : recommandations
Voici les recommandations de la SNCD : recommandations

Bien entendu, mon opinion ne remplace pas celle d'un avocat, ce que je ne prétend être en aucun cas. Pour résumer les textes ci-dessus, vous devez solliciter des personnes en lien avec votre offre, il doit y avoir une méthode de désinscription claire et l'opt-in est recommandé, donc non-obligatoire. Ceci ne s'applique pas aux adresses génériques, puisqu'il s'agit d'adresses de personnes morales. (contact@lesmagiciensdelouest.com).

Show Comments

Get the latest posts delivered right to your inbox.