fil-educavox-color1

EIDOS 2021- Le 20 janvier 2021, Claudio Cimelli, Directeur de projets à la Direction du Numérique pour l’Education, Ministère de l’éducation nationale de la jeunesse et des sports, livrait une perspective à la fois éclairante et ambitieuse pour l’utilisation des données d’éducation par l’Intelligence Artificielle au service de la formation des élèves et du métier d’enseignant. Sécuriser les données pour les valoriser avec l’IA : voilà la stratégie.

Les recherches et expérimentations menées dans le secteur du numérique éducatif depuis plusieurs années mettent en évidence les potentialités majeures offertes par le recueil, l’analyse et le traitement des données scolaires et des traces d’apprentissage, pour accompagner les élèves, aider les enseignants, adapter les stratégies d’apprentissage et d’orientation et assurer une meilleure gouvernance de l’ensemble. L’arrivée de l’intelligence artificielle dans les méthodes de traitement des données a accru ces potentialités en ouvrant la voie à une profonde transformation du système éducatif.

Que sont les données d’éducation?

Toutes les activités réalisées par les élèves laissent des traces et elles sont collectées de manière numérique.

Qu’il s’agisse de l’organisation et de la vie scolaire, des traces d’apprentissage qui rendent compte de l’activité de l’élève, des traces d’usage (voir quels sont les gestes qui révèlent l’activité en termes d’utilisation des outils numériques disponibles), des publications, des données d’identification personnelle, statistiques etc. Certaines sont des données à caractère personnel, telles que l’adresse IP ou l’identité.

Quelles finalités pour des traitements à base d’IA, quelles limites ?

L’objectif est de capter l’activité des élèves et le niveau de réalisation de l’activité. Ces données sont présentes dans les plateformes de type Moodle. On obtient alors de tableaux de bord de l’engagement et de l’activité de l’élève (par exemple la tendance à la procrastination, l’autonomie, le retour sur des activités) qui pourra être analysé par l’enseignant. Ces tableaux de bord rendent compte de l’engagement des élèves dans l’activité.

Comment valoriser les données d’éducation et pour quoi faire?

Il s’agit d’accompagner élèves et parents, tout en aidant les enseignants en ciblant les besoins de l’élève (en langues vivantes par exemple, ou en aidant les élèves dans leurs recherches, en analysant le rythme des apprentissages, l’ancrage mémoriel etc.). Il y a là une opportunité pour le secteur éducatif français et européen, mais plusieurs défis sont à relever.

En effet, les données sont atomisées : il faut alors les réunir, les exploiter, et cela suppose une interopérabilité entre les différents outils de référence. On valorisera les données en utilisant l’Intelligence artificielle (IA) qui permet de s’appuyer sur les données pour décrire, analyser, faire des prédictions et des prescriptions. A partir des renseignements obtenus ont peut souvent aussi prédire les capacités de réussite des étudiants, notamment au concours de médecine comme l’ont montré des études réalisées aux USA. L’analyse des données peut encore donner des idées d’architecture pour créer des modèles, des matrices de risque, pour réaliser des prédictions et des prescriptions. Le rôle de médiation de l’enseignant est ici essentiel.

Comment les protéger (confiance, éthique, sécurité) ?

Il faut prendre en compte des éléments éthiques, ce dont le ministère s’est emparé avec l’installation d’un Comité d’éthique pour les données d’éducation depuis 2019[1]. Il s’agit aussi d’asseoir la souveraineté numérique en matière d’éducation, c’est à dire de disposer de données sous le contrôle de la Nation afin que les données ne puissent pas s’évaporer : nous devons exercer maîtrise et contrôle, en préserver la portée, l’interopérabilité et la sécurité.

L’IA est partout présente actuellement : smartphones, tablettes, saisie intuitive, services, transcription oral écrit, entrées automatisées de calendrier etc. L’IA est donc entrée dans l’école où elle facilite notamment les recherches réalisées par les élèves.

Il convient d’adapter l’IA à nos besoins. Pour cela nous nous appuyons sur un partenariat d’innovation avec le P2IA (Partenariat d’innovation et d’intelligence artificielle). Des équipes mènent dans ce cadre des travaux sur l’apprentissage du français et des maths en cycle 3. Nous mettons en contact la recherche et les entreprises pour adapter des outils aux apprentissages.

1 tableau ia

Plusieurs travaux ont été récemment initiés : Class’code[2], ainsi que des applications pour le contrôle des faux diplômes ou la détection du plagiat. Il s’agit de soutenir les expérimentations et de faciliter l’accès aux données tout en les protégeant. Ces groupes font l’état de l’art de la recherche. Ce fut le cas de l’appel à projets e-FRAN.[3] La grosse difficulté est celle de sécuriser l’accès, mais le problème demeure l’interopérabilité des sources. On cherche à apporter un soutien à la recherche appliquée à travers un conventionnement, pour un travail de recherche entre laboratoires publics et privés.

Comment responsabiliser et éduquer ? Quelle stratégie ?

Le but est de travailler en confiance selon un code de conformité sectorielle avec les EdTech France et l’AFINEF en respect du RGPD.

Il faut veiller aux conditions de sécurité en utilisant certaines techniques : l’anonymisation (le nom n’est pas prélevé), pseudonymisation (on a le nom mais on a gardé la clé), l’obfuscation (masquage, brouillage pour supprimer des éléments qui permettraient de retrouver un nom ou des identifiants).

Les nouveaux programmes d’enseignement en « Numérique et sciences informatiques » visent à développer les connaissances et les compétences liées à l’IA chez les élèves. Les États Généraux du Numérique pour l’Education ont également apporté des acquis importants pour ces évolutions.

1 tableau 2 eidos

Pourquoi un « Data Hub pour l’éducation »[4]?  Ce centre de données permet de collecter des données qui iront vers la recherche des entreprises en proposant des données contrôlées. On peut ainsi élaborer des cas d’usage avec des stratégies pour améliorer la compréhension des besoins des élèves, les accompagner, aider à l’orientation etc.

La réflexion stratégique est une dimension souveraine primordiale qui nous conduit à adopter plusieurs partenariats pour assurer la disponibilité et la souveraineté des données européennes qui sont stockées dans le cloud et prochainement dans GAIA-X, le meta cloud européen)[5].

Pour conclure, Claudio Cimelli « espère que l’IA et la valorisation des données ne feront plus peur à l’issue de ces échanges. C’est en effet quelque chose qu’il est possible de maîtriser et qui a vocation à soutenir les efforts des enseignants en devenant plus humain. »

Pour finir, une réflexion inspirante de Yann LeCun :

« Il faut éviter que les biais de la société ne se reflètent dans les décisions prises par les machines ; sur les biais de la société dans le numérique. »

Michel Pérez


[1] Lire à ce propos l’interview de Nathalie Sonnac, présidente du Comité, sur Educavox.

 https://educavox.fr/accueil/interviews/questions-a-nathalie-sonnac-presidente-de-la-commission-d-ethique-des-donnees-d-education

[2] Le Mooc Class’Code IAI est une formation en ligne pour appréhender l’intelligence artificielle

[3] e-FRAN a pour ambition de créer une communauté scientifique de niveau international en matière de « numérique éducatif » au service d’une nouvelle dynamique de transferts des résultats de la recherche pour l’Ecole à l’heure du numérique.

[4] Un hub de données est une collection de données provenant de plusieurs sources organisées pour la distribution, le partage et souvent le sous-ensemble et le partage. Généralement, cette distribution de données se présente sous la forme d'une architecture en étoile. Widipedia.

[5] la France et l’Allemagne se lancent dans la course au cloud. Le projet Gaia-X qui vient d’être officialisé a pour ambition d’offrir une alternative aux solutions de Google, Amazon et Microsoft.

Dernière modification le jeudi, 01 septembre 2022
Pérez Michel

Président national de l'An@é de 2017 à 2022. Inspecteur général honoraire de l’éducation nationale (spécialiste en langues vivantes). Ancien conseiller Tice du recteur de Bordeaux, auteur de nombreux articles et rapports sur les usages pédagogiques du numérique et sur la place des outils numériques dans la politique éducative.