mercredi 21 mai 2008

Quand les machines vous reconnaissent

Au doigt, à l'oeil et à la voix...
Juillet 1991 (Les Echos)


C'est inévitable, dans tout film d'anticipation qui se respecte il faut montrer patte blanche. Et quand on dit patte, ce n'est ni d'une banale carte d'identité ni d'un badge quelconque dont il s'agit. Non, de "2001 l'Odyssée de l'espace" à bien d'autres polars orbitaux, en passant par les derniers exploits nucléaires de James Bond, le héros aboutit toujours devant une porte, ou un terminal informatique pour lequel toute formule d'accueil se résume à l'essentiel : "Identification".
Selon le degré d'imagination de l'auteur ou la fortune des producteurs, il ne reste alors au héros qu'à laisser son oeil se faire fouiller par un rayon infra-rouge (relevé des vaisseaux rétiniens), poser sa main contre une plaque de verre (analyse des contours de la main et des doigts), ou à prendre son meilleur timbre pour s'écrier "Astronaute Cooper. Nasa. Mot de passe Nashville-Tennesse". Et généralement la porte interdite s'ouvre, ou l'écran du terminal de communication s'orne du minois d'une charmante hôtesse de synthèse qui prend la direction des opérations.

Sans le savoir, vous avez donc déjà vu des terminaux de reconnaissance biométrique au travail. Dans la vie quotidienne il faudra attendre encore un peu avant de se faire identifier par une machine à tous les coins de rue. Pour l'instant, les prix des systèmes (plus de 100.000 francs pour ceux qui sont estimés vraiment sûrs) empêchent leur arrivée en masse. Mais plusieurs milliers de ces installations ont déjà été réalisées à travers le monde, chez les consommateurs de haute sécurité : militaires, services de renseignement, laboratoires à zones d'accès limité. Les technologies les plus répandues étant celles de la mémorisation de la géométrie de l'arbre rétinien, le vaisseau sanguin qui irrigue le fond de l'oeil. L'image est obtenue par un scanner optique à infra-rouge, qui lit en quelques fractions de seconde l'image de votre rétine, pendant que vous contemplez paisiblement une cible optique. Un ordinateur (type PC) la compare ensuite à celle stockée en mémoire. Près d'un millier de ces dispositifs ont déjà été installés aux Etats-Unis, notamment par la société Eyedentify. La fiabilité est presque totale, mais l'opération est lourde, trop pour se voir appliquée à des centaines de personnes au passage d'une enceinte. Autre méthode, aux allures plus classiques, les empreintes digitales. Lues par un terminal électronique et comparées à celles enregistrées dans une carte que le candidat à la reconnaissance doit introduire dans la machine. C'est ce que propose la firme américaine Identitix. C'est plus souple, plus rapide, moins cher mais moins fiable : le système est "ouvert" (on est porteur d'une information mémorisée dans une carte), ce qui prête le flanc à la fraude.

La technique présente l'avantage de pouvoir gérer des flux importants de personnes. On peut donc installer de tels dispositifs à l'entrée de grandes administrations, d'immeubles, comme ceux de centres militaires, de recherches, de banques.
Variante au genre digital, la reconnaissance des formes de la main, éprouvée par Mitsubishi, qui diminue les coûts, augmente encore le débit des personnes, et baisse un peu la garde de la sécurité.

"Tout dépend du niveau de sécurité que l'on recherche, et du nombre de personnes à vérifier", explique Michel Tantet, responsable recherche sur la sécurité électronique chez Fichet-Bauche.

Finalement l'idéal ne serait-il pas d'être reconnu par une machine se passant de contact physique, à la simple écoute de sa voix, éventuellement assortie d'un mot de passe ? L'empreinte d'identité vocale suscite aujourd'hui bien des recherches. L'enjeu est énorme. Il s'agit à terme, de pouvoir authentifier à coup sûr l'auteur d'une phrase, d'un mot. Comme on sait aujourd'hui reconnaître une empreinte digitale ou génétique. Mais le système présenterait l'avantage de la souplesse totale. Pour accéder à distance à des banques de données informatiques, s'identifier au téléphone pour des services de télé-achat, accéder à des services divers sans avoir à transporter en permanence avec soi une douzaine de cartes et de badges accréditifs. Mais c'est particulièrement ardu, car la voix est une information fluctuante et éphémère. "C'est plus difficile qu'avec le fond de l'oeil ou une empreinte, car presque tout est variable", explique Jean-Sylvain Lienard, chercheur au Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur d'Orsay (LIMSI). Certes, personne ne parle comme vous. Mais quelle mode d'analyse utiliser pour le savoir ? La simple comparaison des profils des fréquences vocales, pratiquée dès la fin des années 70, est largement insuffisante. Un mot est rarement prononcé deux fois de suite de la même manière, ce qui empêche de trop "serrer" les critères d'identification. Par contre, si l'on est trop tolérant, un bon imitateur (ou une bande magnétique) parviendra à induire la machine en erreur. Bien entendu, un dispositif de reconnaissance simple sera suffisant si l'on veut mettre une sécurité de bas niveau sur une entrée à faible protection, ou ordonner à une porte de s'ouvrir lorsque l'on arrive les bras encombrés d'objets. L'inventive Martine Kempf s'est rendue célèbre en 1985 pour ses prouesses en la matière, avec son Katalvox, qui permettait de commander des fonctions à la voix. de nombreuses applications ont été depuis réalisées, que ce soit dans l'automobile, l'aide logistique aux handicapés, ou les chambres d'hôpital dont les portes, fenêtres et volets s'ouvrent ou se déroulent à la voix . Mais quelqu'un qui souhaite pénétrer dans le local saura vite contourner un tel appareil, a priori incapable d'effectuer un contrôle d'identité vocale.

Pourtant les chercheurs ne désespèrent pas de mettre au point des algorithmes, des méthodes de sélection d'échantillons vocaux pour offrir à leur électronique la possibilité de savoir qui parle. Un domaine qui intéresse bien naturellement les autorités de police, qui aimeraient déjà disposer d'une machine à mettre des noms sur des enregistrements magnétiques. Un appel d'offre a déjà été lancé en ce sens.

Dans l'état actuel des techniques, il est exclu de reconnaître formellement la voix de quelqu'un, enregistrée sur bande magnétique. Souvent l'enregistrement a été réalisé au moment de l'action, de façon à peine préméditée, "sur le vif", au moyen d'un magnétophone de mauvaise qualité, parfois au téléphone (répondeur-enregistreur), avec des bruits de fond, et dans des conditions de stress du locuteur. Sans parler du truc bien connu du "mouchoir devant la bouche" que pratiquent volontiers maîtres chanteurs. "Quand on demande à des suspects de lire pour comparaison vocale un texte, on peut rarement compter sur leur bonne volonté à utiliser le même ton qu'au moment de l'action. Et de toute manière, la situation ne présentant pas le même niveau de stress, le résultat sera souvent très différent", souligne Bernard Prouts, responsable de l'activité traitement de la parole chez Vecsys. Ce qui n'empêche pas les autorités de police de consulter régulièrement les experts sur le sujet. Les scientifiques sont très partagés sur l'intérêt de la démarche, certains, dans le cadre d'une sorte de moratoire, ont pour le moment carrément refusé de travailler dans cette voie.

Aux Etats-Unis, la société Sensimetrics de Cambridge (Massachusetts) vient pour sa part d'annoncer une curieuse prouesse, qui pourrait constituer une percée. Les chercheurs assurent avoir identifié parmi les discours de guerre de Winston Churchill des textes qui avaient été enregistré en studio par un acteur-imitateur, Norman Shelley. Une innocente mascarade destinée à enregistrer a posteriori des discours qui avaient été prononcés en l'absence de micros. Churchill avait autre chose à faire. Une astuce dont personne ne s'était aperçu, et que l'acteur avait confessé juste avant de décéder. Pour parvenir à ce résultat, les ingénieurs ont mis au point une technique qui reconnait la manière dont le Premier ministre britannique associait les formants, les résonances de fréquences de sa voix, pour obtenir des sons. Il suffit de disposer d'un bon enregistrement de la voix de quelqu'un pour façonner cette empreinte vocale. Son intérêt est à première vue de rester constante chez un individu, ce qui permet de reconnaître quelqu'un même si le texte prononcé ou l'intonation changent.

Aucun commentaire: