fil-educavox-color1

Chatbot, Chatbox, assistant intelligent à commande vocale… C’est avec leur voix et  leur langage que  les hommes et les femmes se mettent à communiquer avec les machines machine. Ce sont les progrès récents de l’intelligence artificielle et le développement du deep learning qui ont permis ce changement de paradigme.

La reconnaissance vocale devient un enjeu économique et social fondamental.

Les grands opérateurs du GAFA ne s’y trompent pas : Google, Apple et Amazon développent et commencent à commercialiser leurs propres assistants intelligents.

 

Ils se présentent comme des enceintes de forme cylindrique ou ovoïde et promettent de répondre à toutes les commandes vocales de leurs propriétaires grâce aux intelligences artificielles qu'ils renferment.

Ce sont Google Home, commercialisé en France depuis cet été, Alexa qu’Amazon diffusera en France en 2018, Hompod qu’Apple prévoit de lancer en 2018 également… Ils visent tout particulièrement les commandes vocales de la domotique, des objets connectés, de la voiture ainsi que tout ce qui concerne l’aide à la personne, mais pas uniquement.

Il est possible de demander à son assistant une recherche de renseignement, d’artisan, de médecin, de morceau de musique, ou le temps qu’il va faire…Qui plus est l’assistant de Google se connecte naturellement dans tout l’univers de la galaxie Google via les données traitées par Google search ; il pourra très vite analyser des images de réalité augmentée en utilisant la caméra d’un smartphone…Quant à Alexa, elle dispose aujourd'hui de plus de 7.000 applications compatibles avec des commandes vocales. Nous ne sommes qu’au tout début d’une vraie…et l’on va encore employer le mot révolution en l’appliquant, en tous cas, à nos usages.

Les avantages sont multiples :

 

- unicité de la réponse fournie contrairement aux résultats obtenus à l’aide d’un moteur de recherche classique ;

- rapidité du passage de l’ordre : nous pouvons parler au moins deux fois plus vite que nous n’écrivons sur machine ;

- disponibilité : on peut passer une commande en conduisant, en bricolant, en cuisinant, en regardant la télévision…

Mais il n’y a pas que des avantages :

 

Malgré tous les progrès évoqués ci-dessus concernant la reconnaissance vocale, la précision de la réponse est fortement conditionnée par la qualité de l’ordre :

                - qualité de la forme (il faut éviter les bruits parasites et soigner l’élocution)

                - qualité du contenu (précision des termes utilisés).

Le mode de réponse et sa quasi unicité prive l’utilisateur d’une part de sa  liberté et de l’usage de son esprit critique.

De plus, il ne sera jamais possible d’utiliser les commandes vocales toujours, partout et pour tout. Il ne faut tout de même pas imaginer que de telles avancées techniques signent la fin de l’écrit à plus ou moins brève échéance. Du reste, les ingénieurs de Google ne s’y trompent pas, eux qui envisagent pour la future génération d’assistants, la possibilité d’interagir aussi avec un clavier.

Pour être pertinentes, les intelligences artificielles, derrière les assistants virtuels, doivent se nourrir d'un maximum de données personnelles pour apprendre des habitudes de leurs utilisateurs et leur formuler des suggestions adaptées.

Il conviendra aux opérateurs de rassurer les futurs acquéreurs éventuels quant à l’utilisation des données ainsi recueillies et d’atténuer les craintes liées à cette nouvelle intrusion de la technologie dans l’espace privé.

Il y a eu le clavier, la souris et l’écran tactile ; le temps est venu où la reconnaissance vocale va s’imposer comme interface majeure entre l’homme et la machine.

Ce retour fondamental à l’oral a deux conséquences immédiates :

 

-   une réduction potentielle des inégalités au regard des outils de communication. Il y a beaucoup moins besoin de compétences  spécifiques pour utiliser un assistant vocal que pour naviguer à l’aide d’un Smartphone, d’une tablette ou d’un ordinateur qu’il s’agisse de maitrise technique ou de maitrise de l’écriture et de la lecture ;

-  la nécessité d’introduire dans la langue parlée une rigueur et une précision qui n’est pas, actuellement, universellement partagée.

Ce dernier aspect est loin d’être anecdotique et l’école va avoir, là aussi, un rôle tout nouveau à jouer.

 

Pour autant que sera vendu comme naturel le fait de parler à une machine, cela nécessitera un vrai apprentissage, au risque de créer de nouvelles inégalités. La culture numérique nécessitait l’agilité des pouces elle va nécessiter la qualité de l’élocution et du langage. 

Dernière modification le mercredi, 20 décembre 2017
Puyou Jacques

Professeur agrégé de mathématiques - Secrétaire national de l’An@é