La double dimension d'une adresse

Ou l'explication de l'échec de tant de campagnes d'emailing

A quoi peut bien servir le plus beau ou plus efficace des mailings s'il ne touche pas la personne à qui il est destiné ?

« Toucher » peut prendre ici deux significations : la première, c'est arriver à bon port, être remis à la bonne adresse. La deuxième, c'est toucher sur le plan émotif, de l'envie, du besoin, et provoquer une réaction (un achat la plupart du temps). Pour que notre mailing touche son destinataire dans tous les sens du terme, aucun de ces deux aspects, de ces deux dimensions ne doit être négligé. Ainsi, il est intéressant d'aborder la question de l'adresse, qu'elle soit postale ou électronique, par cet aspect de double dimension : statique et dynamique.

Il y a les données que l'on pourrait qualifier de visibles à l'œil nu et qui sont obligatoirement différentes d'une adresse à l'autre. Et d'autre part les données dynamiques qui fédèrent des adresses entre elles, stockées dans une base de donnée détachée du fichier qui sera utilisé pour le mailing et donc invisible à la simple lecture des lignes de l'adresse sur l'enveloppe, la lettre ou le bon de commande.

Les données statiques, carburant du géomarketing et des scores primaires

Les données qui composent une adresse peuvent paraître anodines de prime abord. Mais à y regarder de plus près, les trois, quatre ou cinq lignes de caractères qui composent une adresse B to C sont riches d'information. A commencer par la donnée géographique.

Comparons ces deux adresses (imaginaires bien sûr !)

Mme Eléonore de Saint Amand

25 avenue Foch

75016 PARIS

Et

Mme Ginette Duclou

Appartement 13

59 boulevard Salvador Allende

93100 MONTREUIL

Il ressort qu'à priori la première adresse présente un profil social ou de pouvoir d'achat plus élevé que la deuxième, car nous savons, toujours qu'à priori, que le niveau social et de pouvoir d'achat est globalement plus élevé avenue Foch dans le 16ème que dans le « neuf trois ». Pour vérifier notre « à priori », nous pouvons nous baser sur des données statistiques fournies par l'INSEE et issues des derniers recensements. Si, bien évidemment, (et heureusement !) l'INSEE ne fournit aucune information individuelle, il est toutefois possible d'acquérir des données chiffrées très précises concernant le niveau de vie en terme de revenu, de confort, d'habitat d'un pâté de maison, d'une rue ou d'un village en zone rurale, appelé îlots et que l'INSEE regroupe en IRIS homogènes (Ilots regroupés pour l'information statistique). Fin des années 80, Jean Marie Bouroche et sa société Line Data Coref a été ainsi l'un des premiers à segmenter la France en petits quartiers selon des caractéristiques obtenues à partir des recensements. Pour la seule statistique relative à l'habitat nous pouvons ainsi disposer de dizaines de chiffres, comme le nombre de pièces, mais aussi le nombre de salles de bain équipées en baignoire plutôt qu'en douche, le type de chauffage, la présence d'ascenseur, de piscine... pour un IRIS donné. Et si nous le voulons, nous pouvons croiser ces données avec la tranche de revenus moyen de l'IRIS ou son nombre de retraités. L'utilisation de ces données est la base du géomarketing que l'on pourrait qualifier de « marketing de données statiques ».

Dans cette première approche nous nous sommes concentrés sur les dernières lignes de l'adresse : rue, code postal et ville. Voyons maintenant la première, celle du nom et du prénom. L'exploration des informations pouvant découler d'une liste de patronymes est formellement proscrite par la première mouture de la loi informatique et liberté de janvier 1978 que la CNIL (commission nationale informatique et libertés) est chargée de faire appliquer. En effet la CNIL interdit tout traitement automatisé se basant sur des origines ethniques ou raciales voire sur des appartenances à des groupes religieux. Or quelles autres informations pourrions-nous tirer d'un patronyme ? Par contre le prénom, s'il est étudié dans le seul et stricte aspect de la pyramide des âges (et non sous l'aspect ethnique ou racial) peut apporter une information intéressante sur l'âge de son propriétaire. Avec des approximations toutefois.

L'INSEE nous apporte cette fois-ci des tables statistiques (RNIPP) sur la récurrence d'un prénom par année de naissance. En 1987, par exemple, sont nés bien plus de Jérémy en France (9186 exactement) que de Hector (13 !) alors que 103 Hector s'apprêtent à devenir centenaire en 2011. Ainsi chaque prénom d'une liste d'adresses se verra attribuer une note ou un « score » correspondant à une probabilité de le rencontrer dans la tranche d'âge que nous souhaitons cibler. Dans quelques rares cas, ce type de score, seul, peut suffire pour « toucher » notre correspondant.

Prenons un exemple.

Nous souhaitons toucher des personnes de 50 à 70 ans dans une zone géographique délimitée et avec un type d'habitat donné ( les PUP, périurbains pavillonnaires, par exemple ...). Pour ce faire nous pouvons partir du fichier qui présente actuellement en France la plus grande exhaustivité, à savoir le fichier des abonnés au téléphone fixe commercialisé par plusieurs opérateurs, dont le producteur, France Télécom. Imaginons que la sélection géographique qui nous intéresse concerne 50 000 individus ou adresses (une adresse = un foyer).

Il s'agit maintenant de l'affiner en termes d'âge. Pour ce faire nous allons tout d'abord affecter une note à chaque adresse correspondant à la probabilité de la retrouver dans la tranche d'âge recherchée d'après les tables de l'INSEE. Puis les 50 000 adresses seront scorées, c'est-à-dire classées par note, de la meilleure à la plus faible et regroupées par « segments », en général d'une taille équivalente à 10% du volume total scoré. Dans notre cas nous allons donc pouvoir limiter le risque en testant le premier segment de 5000 adresses. Celles à priori « les plus proches, statistiquement parlant, de la tranche d'âge recherchée. Et si le test fonctionne, nous pourrons passer aux 5000 suivantes et ainsi de suite.

Cet exemple résume un cas simple d'approche géomarketing couplée à un score prénom et effectué sur les seules données apparentes et statiques d'un fichier, sachant que la seule chose qui fédère ces adresses entre elles est qu'elles ont un abonnement chez France Telecom .

Si je refaisais mon test ci-dessus, en suivant strictement la même procédure, mais en prenant comme base un annuaire de possesseurs de téléphones mobiles, et non plus fixe il est fort probable que le résultat de mon test serait différent. Car le fait même de posséder un mobile d'un certain opérateur plutôt qu'un autre induit une notion comportementale ou dynamique.

La « pauvreté » d'une adresse email

Notons au passage qu'une adresse électronique « sèche » sous la forme Cette adresse email est protégée contre les robots des spammeurs, vous devez activer Javascript pour la voir. ne nous apporte aucune information statique qu'elle soit géographique, touchant à la civilité (homme, femme ?) ou d'âge. Tout au plus, peut-elle nous apporter une indication ou une piste. Sur une typologie commune par exemple à tel ou tel fournisseur d'accès. On pourrait, sans prendre trop de risque, dire que les adresses de type Cette adresse email est protégée contre les robots des spammeurs, vous devez activer Javascript pour la voir. appartiennent à des personnes plus âgées, voire plus établies ou sédentarisées que celles du type Cette adresse email est protégée contre les robots des spammeurs, vous devez activer Javascript pour la voir. ; ou encore qu'une adresse de type Cette adresse email est protégée contre les robots des spammeurs, vous devez activer Javascript pour la voir. a plus de chance qu'une autre d'aboutir sur une machine dans le bureau d'une entreprise.

Envisager de prospecter par email sur des fichiers ne comportant que l'adresse électronique sans que celle-ci soit liée à des données dynamiques décrites ci-après et donc en écartant toute approche comportementale, c'est à coup sûr se tromper de cible à 99%. Bref c'est faire du spam. Mais heureusement, une nouvelle génération d'adresses email arrive aujourd'hui sur le marché, bien plus riches et donc plus ciblées, grâce à cette deuxième dimension qui leur manquait tant à ce jour.

Les données dynamiques ou comportementales.

Les données dynamiques ou comportementales liées à une adresse destinée à la prospection proviennent de toutes les informations autres que ses propres données nominatives et géographiques. Cela peut être un acte d'achat, la date, le montant et le mode par lequel s'est effectué cet achat, l'évènement ou les circonstances qui l'ont déclenché, le coût de l'évènement générateur si cet évènement est une campagne publicitaire, le détail de l'achat en terme de produits ou de services. Mais ces données dynamiques peuvent aussi désormais revêtir la forme d'images, de sons, de caractéristiques physiques liées à une personne. Une multitude d'informations avec des degrés d'intimité variables peuvent être ainsi stockées dans le « réservoir dynamique » d'une adresse en vue d'une éventuelle utilisation ultérieure. Ce que la CNIL appelle « la finalité du traitement ». Et c'est justement cette « finalité du traitement automatisé des données » qui est soumise à déclaration avant toute mise en œuvre et qui doit préciser les limites ou le périmètre des informations stockées sur une personne, voire un groupe de personnes, quand il s'agit de l'adresse d'une communauté, d'une association ou d'une entreprise.

A l'heure de la reconnaissance vocale, de la biométrie, de l'avancement en matière de traçabilité génétique on comprendra aisément que le stockage d'informations sensibles ne sera pas considéré sous le même angle selon qu'il s'agisse de les utiliser pour contrôler l'accès d'enfants à leur cantine scolaire, l'accès du personnel dans les zones sensibles d'un aéroport international, ou le routage d'un catalogue de voyages.

Pour le domaine qui nous intéresse, à savoir l'activité purement économique, à part la date de naissance, fréquemment utilisée par les opérateurs en assurance et (par la force des choses) les astrologues, aucune information liée directement aux origines de la personne, à sa morphologie ou ses caractéristiques physiques, ethnique ou à fortiori médicales n'est utilisée, et d'ailleurs ne doit et ne peut être utilisée au regard de la loi pour une finalité purement commerciale. La CNIL a d'ailleurs prévu un certain nombre de normes restrictives caractérisant ces fichiers à la finalité bien cernée. Ainsi les fichiers de prospection ou de clients de sociétés pratiquant la VAD étaient tenus à une déclaration simplifiée et enregistrable directement sur leur site Internet. Les nouvelles directives permettent aujourd'hui aux entreprises d'alléger leurs démarches liées individuellement à chaque fichier exploité en nommant un « CIL », Correspondant Informatique et Liberté, au sein de l'entreprise qui sera le garant du respect de la loi en matière de protection des données. La CNIL recommande d'ailleurs que ce correspondant ne soit pas le chef d'entreprise lui-même.

Il reste que certains opérateurs pourraient être tentés d'utiliser des informations sensibles pour affiner leur champ de prospection et donc leur rentabilité. A défaut d'en disposer directement, ils pourront y accéder en toute légalité en les déduisant à partir d'un historique d'achat par exemple, en croisant des données statiques avec des données dynamiques.

Aucun loueur de fichiers ne vous fournira des adresses de personnes enregistrées expressément comme obèses ou en surpoids, mais nombreux sont ceux qui pourront vous proposer des adresses de personnes ayant acheté des tailles supérieures au 48 dans un catalogue de confection, qui viennent de commander une cure minceur hyper protéinée ou qui ont acheté un livre sur la dernière méthode Weight Watcher. Pour peu que ces personnes ne se soient pas opposé à l'utilisation de leur adresse (opt out, la règle en mailing postal) ou aient donné expressément leur accord (opt in, en emaling).

J'ai encore en souvenir l'une des toutes premières expériences en la matière, quand, annonceur, j'étais à la recherche d'adresses d'acheteurs potentiels de vin blanc d'Alsace. Mon interlocutrice de l'époque, courtier basé à Bordeaux, me demanda si d'après moi l'acheteur de vin rouge pourrait avoir ce profil. Et de m'expliquer qu'elle avait trouvé un « filon » d'acheteurs de vin rouge en VPC, en sélectionnant dans le fichier d'un grand cataloguiste de sous-vêtements protégeant du froid et appréciés des seniors, les maris des clientes ayant commandé des slips et des finettes « homme » de (très) grande taille. La donné statique avait ensuite simplement été un peu « arrangée » en supprimant le prénom de Madame et en substituant la civilité par « M. » dont la présence dans le foyer ne faisait précisément aucun doute.

Nous voyons donc clairement que pour une adresse bien renseignée en termes de comportement, la seule partie visible qui va apparaître derrière la fenêtre de l'enveloppe et qui se résume à 5 ou 6 lignes de caractères au maximum cache la partie immergée et la plus intéressante de l'iceberg qui peut prendre la taille de plusieurs millions d‘octets dans la mémoire de l'ordinateur chargé de la gérer.

La gestion des données dynamiques : CRM, scores et RFM

La pertinence d'une donnée dynamique est fortement liée à la qualité de son procédé de stockage dans la base de données et les moyens de sa restitution.

Comme nous l'avons vu plus haut, ces données sont essentiellement liées à un historique qui compile et ordonne tous les faits liant le consommateur à la société :

  • date de sa première commande ou demande de catalogue
  • support publicitaire dont il est issu
  • détails et contexte de la campagne marketing à l'origine de son recrutement
  • coût d'acquisition
  • historique de commandes tant quantitatif que qualitatif (pour combien et quel produit et par quel canal (papier, téléphone, web... ?)
  • consignation de tous les contacts entre le client et la société et ce dans les deux sens : date et nature de l'appel téléphonique, du courrier, du courriel émanant d'un client, mais aussi
  • date, nature et coût de chaque relance émise par la société vers ce client.

Cette liste de données dynamiques liées à une adresse n'est pas exhaustive. J'ai cité là les données de base indispensables pour gérer une activité de vente à distance.

Pour mener à bien le stockage et le « brassage » de toutes ces données dynamiques il est indispensable pour la société de VAD de développer une stratégie appuyée sur un logiciel spécialisé capable de gérer ou « manager » la relation client. C'est tant la donnée dynamique elle même que la stratégie mise en œuvre pour la manager ou encore le software qui va piloter le tout que l'on nomme communément le CRM ou Customer Relationship Management d'une entreprise.

Les donnée dynamiques sont également à la base de la segmentation RFM : Récence - Fréquence - Montant de commande, socle basique de toute exploitation de fichier de vente à distance. La récence est habituellement exprimée en nombre de mois pleins séparant la date de l'extraction de la date de dernière commande. La fréquence peut être exprimée en nombre de commandes totales du client ou en en mois séparant ces commandes. Le montant de commande habituellement pris en compte est le panier moyen constaté pour chaque client.

Il existe plusieurs méthodes plus ou moins complexes d'organisation de ces données pour en tirer soit un score permettant de hiérarchiser les clients à l'intérieur d'un même fichier ou encore de les classer par groupes homogènes de qualité.

Un score facile à réaliser bien que très approximatif consiste à diviser le chiffre d'affaire cumulé du client par le nombre de jours écoulés depuis la dernière commande. Ainsi un client ayant 600€ « au compteur » et ayant passé une commande il y a 4 mois se verra attribuer la note de 5, un client de même « montant » mais n'ayant plus commandé depuis un an aura la note de 1,6 et sera donc considéré comme moins bon. Chaque facteur pouvant ensuite être pondéré selon l'activité.

Les sociétés éditant des catalogues saisonniers (printemps - été - hiver) utilisent des scores logiques combinant leurs données dynamiques : achat ou non achat durant la période observée. Nous pouvons ainsi observer le comportement d'achat sur deux années découpées en 8 trimestres sous la forme d'une note binaire de type 00010010. Dans cet exemple le client aura acheté dans l'avant dernier trimestre de l'année écoulée et dans le dernier trimestre de l'année précédente. La donnée logique « 1 » ou « 0 » peut être remplacée par le nombre et le montant des achats réalisés sur la période observée, donnant ainsi naissance à un tableau dont les colonnes correspondent à un cycle observé : mois, trimestre, semestre... et les lignes les nombres et montants des achats constatés sur la période.

L'exploitation de ces données, phase élémentaire du « datamining » est à la base de toute stratégie marketing visant à optimiser le nombre de relances clients en fonction d'une probabilité d'achat. La meilleure stratégie étant celle qui consiste à envoyer la sollicitation au moment exact où le client est susceptible de renouveler un achat et d'éviter de l'envoyer quand la probabilité est la moins forte. Mais simplement être en mesure de savoir à quel moment cesser de relancer un client permet déjà de réaliser de substantielles économies, ne serait-ce que pour décider de consacrer ce budget à acquérir un nouveau client plutôt qu'à s'entêter à récupérer un ancien, définitivement perdu.

Les mégabases ou bases de données comportementales et les bases mutalisées

Dans les « mégabases » aussi appelées « bases de données comportementales » les données dynamiques qui se trouvent attribuées à chaque adresse ne résultent pas ici d'un achat effectif ou d'une réaction à une offre proposée par un acteur de la VAD ou un commerçant. Dans ces fichiers la donnée a été récoltée sous forme de questionnaires présentés comme une enquête liée à la consommation du ménage. A l'aide de questionnaires très étendus (250 à 300 cases à cocher) et distribués par voie de presse, de mailing ou en ISA (imprimé sans adresse, communément appelé « toutes boîtes ») ces sociétés récoltent des données permettant de dresser un profil très précis de l'individu qui « se cache » derrière une adresse. Il s'agit dans le jargon professionnel de données « déclaratives » qui bien évidemment n'engagent que leurs auteurs. Mais en règle générale ces données sont assez fiables. En effet ces questionnaires qui émanent de sociétés dont la récolte et la commercialisation est entre autre le métier, sont obtenus en échange de bon de réduction ou autre avantages liés directement aux produits cités dans le questionnaire. Il n'y a aucun intérêt pour le répondant de cocher la case « Kronenbourg » pour sa bière préférée s'il préfère la Heineken. Car les coupons de réduction qui lui seront envoyés concerneront exclusivement la « Kro ».

Certaines questions portant sur les habitudes d'achat peuvent permettre aux sociétés débutantes d'accéder à des adresses relativement bien qualifiées sans pour autant procéder à des échanges qu'ils seraient par la force des choses incapables d'honorer puisque ne possédant pas encore de fichiers eux-mêmes.

Ainsi un viticulteur pourra accéder aux adresses qui auront répondu positivement à la question « Avez vous acheté du vin par correspondance dans les 12 derniers mois ? ». Il n'est pas certain qu'un vendeur de vin en VPC voudra lui mettre son fichier à disposition s'il n'y a pas de contrepartie sous forme d'échange.

Ces fichiers, ou mégabases présentent un intérêt certain à être testés, mais toujours en complément de fichiers de comportement constitués de vrais acheteurs. En effet on ne voit que rarement ces fichiers « battre » les fichiers de comportement issus d'activités commerciales et dont les données dynamiques se mettent à jour automatiquement à chaque achat. Ce qui n'est pas le cas des ces mégabases qui doivent renvoyer leurs questionnaires régulièrement pour maintenir leurs données à jour et dont le principe de profilage se base non sur un acte d'achat effectif mais sur une déclaration. Mais quand le profil recherché ne se trouve pas en quantité suffisante dans les fichiers de comportement classiques ces mégabases s'avèrent incontournables.

Un dernier type de fichier exploitant tant les données dynamiques que statiques est la base mutualisée. Il s'agit là de plusieurs opérateurs qui confient tout ou partie de leur fichier, assorti des données dynamiques, à une société spécialisée. Ceci dans le but de trouver chez les partenaires de nouvelles adresses de prospection ayant le même profil que les leurs. Le recours à ce procédé est intéressant, comme pour les mégabases, dès lors que les gisements de fichiers de comportement classiques et homogènes s'épuisent, ou encore pour toucher des profils non disponibles sur le marché de la location d'adresses traditionnel (cartes de fidélité, abonnés presse....).

Quel que soit le type de fichier utilisé, il doit donc impérativement présenter cette double dimension, statique et dynamique, indispensable pour y trouver le comportement qui fera de son utilisation une réussite. Jusqu'à ce jour, seuls les fichiers postaux de comportement présentaient ce profil. Ce qui explique que les campagnes de mailing « papier » ont toujours le vent en poupe et que l'emailing a résolument du mal à s'imposer dans la plupart des secteurs marchands. Mais une prise de conscience des opérateurs du web de mettre sur le marché des adresses plus qualifiées, c'est-à-dire leurs « vrais clients » soit des adresses liées à un achat récent, avec les mêmes possibilités de tri que les fichiers postaux ( géo, civilité, RFM...) aurait pour effet de diminuer les volumes tout en augmentant la pertinence. C'est à ce prix que l'emailing pourra gagner ses lettres de noblesse.

 

Retrouvez la rubrique de Paul Adam dans VAD magazine