Les données de l'éducation

Les données de l'éducation

Entretien avec Serge Abiteboul, informaticien, membre de l'Académie des Sciences et du Conseil National du Numérique de 2013 à 2016.

Serge Abiteboul

La question des données, de leur protection, est présente partout. On a toutefois l’impression que dans le domaine de l’éducation, elle est particulièrement sensible. Le ressentez-vous également et cela vous parait-il justifié ?

Le numérique produit de plus en plus de données, c’est une évidence. On est face à un phénomène d’accumulation et, simultanément, d’explosion des échanges de données. L’éducation n’échappe évidemment pas à un phénomène aussi massif.

La prolifération des données a fait émerger une notion importante qui est celle de données personnelles ou de données privées, c’est-à-dire de données qui concernent une personne en particulier. Personne n’est propriétaire des données qui le concernent mais chacun a des droits sur elles et en particulier sur leur utilisation. Ce qui compte c’est donc moins la donnée elle-même que ce qui en est fait, en particulier lorsqu’il s’agit de données personnelles.

En éducation, on peut faire toutes sortes de choses avec les données personnelles, des choses bonnes ou moins bonnes…

Tout à fait. On peut par exemple utiliser des données personnelles dans des logiciels pédagogiques performants qui sauront s’adapter à l’utilisateur parce qu’ils tiendront compte à la fois de ce qu’il ou elle a fait précédemment mais aussi de ce que d’autres ont fait avec le même logiciel. C’est une utilisation des données personnelles positive, même si elle est encore embryonnaire et que l’on n’en connait pas tous les effets. Ce qui serait négatif par contre, ce serait par exemple qu’une entreprise vende des données sur des lycéens ou des étudiants à des cabinets d’embauche qui les revendraient eux-mêmes à leurs entreprises clientes.

Il me semble que l’on pourrait retenir un principe très simple : que les données produites à l’intérieur du système éducatif national restent à l’intérieur de l’éducation nationale. Mais là encore il faut être prudent car même à l’intérieur du système, le risque existe de mauvaises utilisations. Par exemple, si on classe, si on étiquette les enfants et que l’on se sert de ces données pour les orienter, il y a un risque. Car dès lors qu’il existe des mesures, on va avoir tendance à leurs donner trop d’importance, à se cacher derrière elles. Or il faut toujours préférer le contact humain, une évaluation individuelle. Je dirais donc que l’extérieur de l’éducation nationale, c’est une zone interdite, une zone noire pour les données personnelles, mais à l’intérieur, c’est une zone grise, il faut rester vigilant.

Serge Abiteboul

Qu’avez-vous pensé de ce qui s’est passé avec APB qui est justement un système d’orientation exploitant des données scolaires personnelles ?

C’est un cas intéressant en effet. APB a été un progrès par rapport à ce qui se pratiquait avant. Il faut le rappeler. De plus, le recours au tirage aléatoire qui a été tant critiqué n’est pas la responsabilité du code mais de contraintes sur le système, de choix faits par des cadres de l’éducation nationale. Sur le plan informatique, je dirais que le code d’APB n’est pas terrible mais l’algorithme est bon. Ce qui est important, dans le cas d’APB comme en général, c’est que l’algorithme soit public, de façon à ce qu’il puisse être compris, discuté. Pour cette raison, il faut préférer les logiciels en Open Source quand on parle de décisions aussi importantes pour la vie de la cité.

L’autre problème auquel les responsables de l’éducation doivent faire face est celui de l’hébergement des données. Quelle est votre position sur cette question ?

Je dirais d’abord que l’hébergement dans le cloud est une avancée naturelle de l’informatique qui simplifie grandement la gestion des données. Mais quel cloud ?

Ce qui compte surtout ce n’est pas tant le lieu que les conditions d’utilisation. Le principe essentiel reste celui-ci : l’éducation nationale doit contrôler pleinement l’accès aux données et les mettre au service exclusif de l’éducation. Cette responsabilité est aussi bien-sûr celle des collectivités.

Ceci étant rappelé, en pratique, l’hébergement des données doit être négocié avec des industriels. C’est une question délicate. Pour cela, nous avons besoin de garanties. C’est une affaire de confiance et de rapport de force. Je préfèrerais que l’éducation nationale choisisse des industriels nationaux et européens avec lesquels il lui est plus facile de discuter d’égal à égal, plutôt que des entreprises nord-américaines comme les fameux GAFAM (Google Amazon Facebook Apple Microsoft) en lesquelles nous avons le droit d’avoir une confiance limitée et avec lesquelles le rapport de force n’est clairement pas en notre faveur.

La localisation des données est aussi importante : en Europe, elles dépendent de règlements européens beaucoup plus protecteurs. Et puis, nous avons d’excellentes entreprises françaises et européennes…

Serge Abiteboul

Je profite de l’occasion pour répéter l’importance considérable dans un monde numérique de l’enseignement de l’informatique depuis le primaire. La situation a évolué. Mais les cours sont donnés le plus souvent par des professeurs de mathématiques ou de technologie que l’on n’a pas pris le temps de former correctement – un enseignant d’informatique doit avoir en gros un niveau Bac+5, comme en mathématiques ou en histoire-géographie. La formation de ces enseignants en informatique est devenue le cœur du problème. Quand les élèves montent en compétence, ce qui est en train de se passer, ils doivent avoir en face d’eux de vrais professeurs d’informatique.

Et pour revenir sur notre sujet, nous devons aussi préparer tous nos élèves au monde numérique et par exemple, leur apprendre à protéger leurs données. L’éducation nationale doit être irréprochable dans ce domaine et leur donner un bon exemple.



A lire ailleurs

Serge Abiteboul est informaticien, directeur de recherche à l’Inria, membre de l’Académie des Sciences et du Conseil National du Numérique (CNNum) de 2013 à 2016. Il a participé aux travaux du CNNum qui ont abouti en 2016 à la publication du rapport Jules Ferry 3.0. Il est l’auteur, avec Valérie Peugeot de « Terra Data – Qu’allons-nous faire des données numériques? » (Le Pommier, mars 2017).

Couverture de Terra Data

Voir aussi sur le Web :

Rechercher un article