fil-educavox-color1

L'Éducation nationale produit un très grand nombre de données liées à la vie scolaire, aux évaluations et aux résultats des élèves, aux travaux et aux devoirs qu'ils réalisent. Une grande variété de données numériques personnelles sont ainsi collectées, stockées et font l'objet de traitements par une multitude d'acteurs : écoles et établissements scolaires, services académiques, collectivités territoriales, partenaires privés fournissant des ressources pédagogiques et services numériques.

Le secteur du numérique éducatif ouvre un nouveau champ des possibles pédagogiques par le recueil, l'analyse et l'exploitation des données d'éducation. Ces potentialités nouvelles doivent d'abord être au bénéfice des élèves et de leurs familles, des professeurs, des chercheurs en éducation mais doivent aussi éclairer le pilotage du système éducatif.

En complémentarité avec le délégué à la protection des données (DPD) et l'administrateur ministériel des données (AMD), les inspections générales du ministère, la direction des affaires juridiques (DAJ), la direction de l'évaluation, de la prospective et de la performance (Depp), la direction du numérique pour l'éducation (DNE), le Comité d'éthique pour les données d'éducation a pour missions de conduire et développer la réflexion sur les aspects éthiques associés à l'utilisation des données d'éducation, afin de garantir un juste équilibre entre valorisation et protection de la donnée.

Il émet dans ce rapport des alertes et des recommandations à destination de toute la communauté éducative.

Cette analyse a été initiée de façon réactive dans l’urgence de la situation et devra se poursuivre dans les phases ultérieures de gestion de la crise.

Elle se concentre sur trois enjeux majeurs d'éthique de l'usage du numérique dans le domaine éducatif : protéger les données personnelles, garantir la souveraineté numérique et assurer l'égalité de l'accès aux ressources et des compétences numériques.

1. Données d’éducation et leur traitement

Selon le code de l'éducation, « dans chaque école, collège ou lycée, la communauté éducative rassemble les élèves et tous ceux qui, dans l'établissement scolaire ou en relation avec lui, participent à l'accomplissement de ses missions. Elle réunit les personnels des écoles et établissements, les parents d'élèves, les collectivités territoriales ainsi que les acteurs institutionnels, économiques et sociaux, associés au service public de l'éducation »[1].

De nombreuses données liées à la vie scolaire et concernant différents acteurs de la communauté éducative, dites « données d'éducation », sont produites, stockées et analysées pour différents objectifs. Ces données sont exploitées à des fins de suivi pédagogique des élèves, d’organisation du service éducatif, d'élaboration de ressources pédagogiques ainsi qu'à des fins de statistiques et de recherches.

1.1. Types de données d’éducation

Dans ce rapport nous nous intéressons aux données personnelles numériques d'éducation. Nous présentons les données qui sont propres à certains acteurs puis celles qui résultent d'interactions entre eux ou avec des objets numériques.

1.1.1. Données des élèves et de leur famille

Parmi les données concernant les élèves qui sont produites et/ou traitées dans le contexte scolaire on trouve des données administratives sur leur identité (nom, prénom, date de naissance, adresse postale ou numérique etc.), sur leur état de santé et sur leur suivi scolaire (présences/absences, redoublement, changement de classe/école, activités périscolaires etc.). Sont aussi produites des données relatives à leur suivi pédagogique et à leurs apprentissages telles que les évaluations, relevés de notes, productions, exercices, et notes prises en cours. Par ailleurs, sont aussi traitées des données concernant les parents des élèves comme la profession et le statut marital.

Dans le contexte du confinement ont été produites et traitées de façon massive un grand nombre de données sur les élèves, par exemple toutes les informations sur leur identité insérées dans des plateformes numériques (institutionnelles ou non), ainsi que les travaux échangés entre eux par le biais de ces plateformes (que ce soit des exercices ou des activités en ligne, ou des photos/scans de travaux nécessaires au suivi pédagogique à distance).

1.1.2. Données des enseignants

De la même façon, les données personnelles des enseignants, et de façon plus générale de tout personnel de l’éducation, incluent les données administratives sur leur identité (nom, prénom, date de naissance, adresse postale ou numérique etc.), les données concernant leur pratique pédagogique (contenus et support de cours, correction de copies etc.), ainsi que leur activité professionnelle telles que les présences/absences, congés maladies, et leur ancienneté, données utiles pour la gestion RH. 

Dans le contexte du confinement, et pour assurer la « continuité pédagogique », les choix pédagogiques des enseignants, comme les ressources pédagogiques produites ou utilisées ou encore les séquences suivies, se sont accompagnés de choix de plateformes pour l'enseignement à distance. Les données personnelles qu'ils ont produites ou traitées ont été ainsi massivement stockées par les services numériques choisis par les enseignants pour faire cours ou communiquer avec leurs élèves, et ont été aussi potentiellement stockées par toute personne y ayant accès (élèves, parents, collègues).

1.1.3. Données d’interaction

En plus des données propres à un élève, à sa famille ou à un enseignant, les données relatives aux interactions ont un rôle fondamental. Il s’agit de  tout ce qui relève des interactions entre élèves et enseignants (copies corrigées, questions/réponses, interpellations), entre élèves (échanges lors d’un travail collaboratif), entre enseignants (coordination entre disciplines, coordination entre classes ou entre collègues de même discipline, partage d’information sur des élèves, etc.), et aussi entre enseignants et parents (cahier de liaison, rendez-vous parents). Ces données sont donc liées directement aux élèves et/ou aux enseignants et/ou aux parents.

Lors du confinement, on a assisté à une augmentation considérable du recours au mail, aux systèmes de messagerie instantanée, aux réseaux sociaux ainsi qu'aux outils de visioconférence pour communiquer, échanger des informations, faire un cours ou travailler de façon collaborative.

Ces interactions ont ainsi produit massivement des données stockées par les fournisseurs de ces services, et potentiellement stockées par toute personne ayant accès à ces espaces d’interaction.

Au-delà du domaine scolaire, il est important de signaler que le nombre de données d’interaction qui ont été produites et stockées a explosé, notamment par l’utilisation massive des réseaux sociaux par les élèves, leurs parents et les enseignants.

Le numérique permet par ailleurs un accès particulièrement précis et mémorisable aux données comportementales des élèves et des enseignants sur les plateformes et les outils mis à leur disposition.

Ces données incluent par exemple les temps de connexion, les zones de la plateforme les plus visitées, et toutes formes de comportements interactifs avec l’outil tels que le nombre de clics, la distance de déroulage (scroll down), ou encore le nombre et la fréquence des messages instantanés. Là encore, pendant le confinement, la production de ces données comportementales a augmenté considérablement. 

1.2. Données personnelles

Une donnée personnelle est toute information se rapportant à une personne physique identifiée ou identifiable, une personne pouvant être identifiée directement ou indirectement[2]. Le traitement des données personnelles doit se faire, hors cadre domestique, dans le respect du Règlement Général sur la Protection des Données (RGPD). Ceci inclut non seulement les données avec le nom et prénom des personnes, mais aussi les données qui permettent d’identifier indirectement les personnes.

Par exemple, si l’on dispose du numéro de téléphone, ou du numéro de sécurité sociale d'une personne, ou de l’Identifiant National Élève (INE)[3] d’un élève, il est a priori facile d’identifier la personne concernée.

Aujourd’hui, il est même possible d’identifier automatiquement une personne à partir d’un enregistrement de sa voix ou d'une photo de son visage. Il est aussi possible d’identifier une personne par le croisement de plusieurs données, comme un élève si on connaît l'école qu'il fréquente, le jour de son anniversaire, et le métier de ses parents. De même, la géo-localisation d'une personne à plusieurs moments de la journée peut permettre de trouver son identité (les localisations fréquentes en journée et en soirée correspondent généralement au lieu de travail et au domicile, respectivement). Une copie d’examen ainsi que les corrections des évaluateurs, même si celles-ci n’incluent pas l’identifiant de l’élève, doivent être considérées comme des données personnelles si on peut identifier indirectement l'élève[4].

Une donnée d'éducation peut ne plus se rapporter à une personne identifiable si elle a été soumise à un processus d’anonymisation (mais souvent on procède à une simple pseudonymisation, par exemple en retirant des éléments directement identifiants tels que le nom et le prénom sur un texte écrit, ce qui n'assure pas l'anonymisation[5]) ou bien si elle a été agrégée aux données d'autres personnes, comme par exemple la proportion de redoublements dans une région, de sorte que le groupe soit suffisamment grand.

De telles données ne sont alors plus des données personnelles et ne relèvent pas du RGPD, à l'inverse des données pseudonymisées[6]. Il est à noter toutefois que dans le cas de données agrégées, même si on ne sait pas si un élève a redoublé, savoir qu’il appartient à un groupe caractérisé par une propriété (fort taux de redoublement) donne des indications sur lui et peut être stigmatisant.

1.3. Traitement des données

Selon la CNIL, un traitement de données personnelles est toute opération portant sur des données personnelles (comme stocker, modifier, analyser ou croiser avec d'autres données), quel que soit le procédé utilisé[7].

1.3.1. Avec quels outils et à quelles fins ?

Les données d’éducation sont traitées par de nombreux acteurs à de nombreuses fins et avec des outils très divers.

Lors du confinement on a assisté à une augmentation spectaculaire de l’usage des outils numériques pour communiquer et partager des données d’éducation. La proportion de recours à des outils non-institutionnels pendant le confinement est difficile à évaluer, mais dans les premiers jours de la mise en place de la continuité pédagogique, faute d’autres solutions rapides à mettre en œuvre, cette proportion n’a pas été négligeable.

Ensuite, très rapidement le Ministère a mis à disposition des enseignants et des élèves un certain nombre de ressources numériques éducatives utiles pour la continuité pédagogique,  indiquées sur le site Eduscol[8] et donné des directives aux enseignants pour l’utilisation des outils institutionnels qui ont été de pair avec le développement d’outils comme Ma Classe à la Maison du CNED. La CNIL a diffusé le 8 avril des conseils pour aider au choix d'outils numériques qui se conforment aux règles de protection des données[9].

Les données scolaires des élèves sont utiles à de nombreux égards : elles permettent la gestion administrative, pédagogique et financière des élèves ou encore le suivi des résultats scolaires. Elles sont précieuses pour l’équipe enseignante, dans la mesure où elles permettent d’améliorer la pédagogie au service des élèves et des enseignants, mais peuvent l'être aussi pour l'élève lui-même (il peut consulter son parcours d'apprentissage) ainsi que pour ses responsables légaux.

Dans le contexte de l’enseignement à distance, les données des élèves (connexions, réponses à des questionnaires) permettent à l’équipe enseignante de suivre les apprentissages de chaque élève dans son individualité, mais aussi de l’ensemble des élèves d'un groupe pour ajuster son enseignement aux besoins de ce groupe. Dans ce cas, toutes les traces d’apprentissage sont reliées à des élèves identifiés.

Les données d'éducation sont aussi précieuses pour les chercheurs en sciences de l’éducation pour comprendre les phénomènes sociologiques et cognitifs des processus d’enseignement et d’apprentissage, ainsi que pour identifier des pratiques pédagogiques prometteuses.

D’autres champs de la recherche tels que les learning analytics ou l’educational data-mining pourraient utiliser les traces numériques d’apprentissage pour créer des modèles d’apprenants afin de développer des plateformes d’enseignement s’adaptant automatiquement aux individualités des élèves. Notons toutefois que les chercheurs n'ont pas forcément besoin de données personnelles, mais que des données anonymisées ou agrégées peuvent suffire.

Ces données permettent également d’extraire des statistiques sur le système d’éducation par classe d’âge, classe sociale, ville, région ou à l’échelle du pays. Ces statistiques sont fondamentales pour évaluer la situation du pays en matière d'éducation nationale (et les possibles disparités géographiques et sociales), son évolution dans le temps, ainsi que pour évaluer l’efficacité de différentes réformes. Là encore, des données personnelles anonymisées peuvent être utilisées à de telles fins.

1.3.2. Responsables de traitement

Selon le RGPD, le responsable d’un traitement est « la personne physique ou morale, l'autorité publique, le service ou un autre organisme qui, seul ou conjointement avec d'autres, détermine les finalités et les moyens du traitement et est soumis au droit des données »[10]. Concernant les données traitées dans le cadre scolaire, le guide élaboré par la DAJ et le DPD, avec le soutien de la CNIL, et présenté par le réseau Canopé décrit précisément qui est le responsable du traitement dans différentes situations et quelles sont ses obligations[11].

A côté du responsable de traitement, on trouve les sous-traitants qui sont des personnes physiques ou morales (entreprise ou organisme public) qui traitent des données pour le compte d’un autre organisme (« le responsable de traitement »), dans le cadre d’un service ou d’une prestation[12].

Les responsables de traitement et les sous-traitants sont tenus de désigner un DPD (Délégué à la Protection des Données) lorsque le traitement est effectué par une autorité publique ou un organisme public, ce qui est le plus souvent le cas des données d'éducation[13].

Ces différents traitements doivent être effectués en respectant les cinq grands principes relatifs à la protection des données personnelles : finalité, proportionnalité et pertinence, durée de conservation, sécurité et confidentialité[14].

A suivre avec les recommandations du Comité :

2. Des données spécifiques au cœur de la souveraineté numérique

3. Assurer l'égalité d'accès au numérique


[1] Article L. 111-3 du code de l'éducation.

[2] https://www.cnil.fr/fr/definition/donnee-personnelle

[3]Arrêté du 16 février 2012 portant création d'un traitement dénommé « répertoire national des identifiants élèves, étudiants et apprentis », https://www.legifrance.gouv.fr/affichTexte.do?cidTexte=JORFTEXT000025554438

[4] https://gdpr-info.eu/issues/personal-data/

[5] Il n'est pas toujours possible d'anonymiser les données et il n'existe pas de méthode universelle. Voir la note (mai 2020) de la CNIL : https://www.cnil.fr/fr/lanonymisation-de-donnees-personnelles

[6] https://gdpr-text.com/fr/read/recital-26/

[7] https://www.cnil.fr/cnil-direct/question/un-traitement-de-donnees-caractere-personnel-cest-quoi?visiteur=part

[8] https://eduscol.education.fr/cid150648/ressources-numeriques-educatives.html

[9] https://www.educnum.fr/fr/outils-de-la-continuite-pedagogique-les-conseils-de-la-cnil

[10] Article 4 du RGPD, §7 : https://www.privacy-regulation.eu/fr/4.htm

[11] https://www.reseau-canope.fr/les-donnees-a-caractere-personnel/le-responsable-de-traitement-et-ses-obligations.html

[12] https://www.cnil.fr/fr/definition/sous-traitant

[13] Article 37 du RGPD, 1.

[14] https://www.cnil.fr/fr/cnil-direct/question/quels-sont-les-grands-principes-des-regles-de-protection-des-donnees

Dernière modification le lundi, 08 novembre 2021
Laurissergues Michelle

Présidente et fondatrice de l’An@é, co-fondatrice d'Educavox et responsable éditoriale.