Imprimer cette page
J’ai eu le plaisir totalement imprévu d’assister hier à la rencontre en comité restreint du ministre, Mounir Mahjoubi, avec différents interlocuteurs du monde numérique lors du Grand Barouf du Numérique à la CCI de Lille. D’où cet échange qui m’interpelle quelque peu sur les questions d’IA et d’analyse du langage.

Cela pourrait faire sourire de prime abord : un nom propre que Facebook ne reconnaît pas et propose de traduire.

La proposition « voir la traduction » est en effet incongrue. Mais en fait c’est révélateur des biais et risques que comportent les systèmes apprenants non pas en général mais lorsqu’ils sont mal programmés.
Premier point, si vous en doutiez encore, cela prouve bien que tout ce que vous tapez dans Facebook est analysé. Sans cela, je n’aurais pas reçu cette proposition de traduction.
Second point, cela démontre un système apprenant d’analyse de texte manquant sérieusement de culture politique et d’un soupçon de vocabulaire.
 
Si Mounir Mahjoubi avait été un petit nouveau dans le monde politique, j’aurais encore pu comprendre un peu l’erreur de la pseudo-IA. Certes le nom tapé comporte une erreur d’orthographe mais les moteurs de recherche (Google, Qwant, Duck Duck Go et consorts…) savent depuis longtemps corriger nos approximations. Il n’y a donc pas lieu de ne pas comprendre. Mounir Mahjoubi a été président du Conseil national du numérique sous François Hollande et est actuellement ministre. C’est loin d‘être un inconnu et on peut s’étonner que l’IA de Facebook ne reconnaisse pas son nom. Quand j’ai tapé quelques semaines plus tôt le nom de Keith Flint, chanteur et danseur du groupe The Prodigy, récemment décédé, Facebook ne m’a pas proposé de traduction. C’est donc possible.
Troisième point, s’il avait été un parfait inconnu, l’erreur aurait pu être évitée en se basant sur les dictionnaires, sur les bases de données de vocabulaire.
Si les termes « Mounir » ou « Mahjoubi » n’apparaissent pas dans le dictionnaire français, langue détectée dans l’échange, l’IA passe à une autre langue, ce qui se fait lors des détections de langue dans Google Translate ou Deepl. Il existe aussi des dictionnaires de prénoms, de noms de famille qui permettent facilement de repérer l’origine et la typologie du terme. « Mounir » n’est pas non plus un prénom rare. L’IA ne pouvait donc passer à côté.
 
Si celle-ci n’est pas capable de distinguer un prénom et un nom, que peut-elle comprendre du reste de nos échanges ? Si celle-ci n’est pas capable de distinguer un prénom et un nom, que peut-elle comprendre du reste de nos échanges ? D’un côté, cela rassure ; d’un autre, cela effraie car, si l’incompréhension est de mise, c’est la porte ouverte à tout et n’importe quoi.
 
Enfin, et c’est ce qui me gêne le plus, quand on se remémore les problèmes de certaines IA devenues racistes ou privilégiant un peu trop certaines populations (blanches, masculines, de plus de 40 ans et issues d’une certaine « élite » sociale), on retrouve ici le même biais face à la singularité.
Une des « plaisanteries » préférées dans le racisme étant de se moquer des particularités d’accent, de nom. On raccourcit les noms, on les simplifie car on les trouve imprononçables. On ne fait pas d’efforts car « c’est trop compliqué ». Ce sont des discours que j’ai malheureusement souvent entendus et, dans l’Histoire, il existe de nombreux exemples d’asservissement de populations auxquelles on a imposé des noms, des prénoms « bien plus de chez nous ».
 
On peut trouver la comparaison extrême mais, si malgré tous les moyens techniques dont on dispose, une IA n’est pas capable de reconnaître un nom et un prénom, qui plus est, d’une personnalité, cela m’inquiète.
Dernière modification le vendredi, 22 mars 2019
Cauche Jean-François

Docteur en Histoire Médiévale et Sciences de l’Information. Consultant-formateur-animateur en usages innovants. Membre du Conseil d'Administration de l'An@é.