Éduquer aux données pour développer des communs

Si les données font aujourd’hui partie intégrante de nos vies, il est indispensable de comprendre comment celles-ci sont produites et comment les mettre au service de l’intérêt général. Alors, quels sont les enjeux de l’éducation aux données ? Et comment les données ouvertes peuvent-elles contribuer à l’intérêt général ?

Transcription

Dans la vie de tous les jours, lorsque nous échangeons sur les réseaux sociaux, lorsque nous recherchons des informations en ligne, ou lorsque nous nous déplaçons… nous consommons et générons un grand nombre de données.

Si les données font aujourd’hui partie intégrante de nos vies, il est indispensable de comprendre comment celles-ci sont produites et comment les mettre au service de l’intérêt général.

Alors,

• Qu’est-ce qu’une donnée ?

• Comment sont-elles produites et utilisées ?

• Quels sont les enjeux de l’éducation aux données ?

• Et comment les données ouvertes peuvent-elles contribuer à l’intérêt général ?

Les données sont le plus petit élément du savoir.

On les croise et les assemble pour leur donner du sens, pour produire de l’information et de la connaissance.

Par exemple :

Lorsque Alice valide son titre de transport dans le tram… … cela génère des données : le numéro du titre de transport, l’heure de validation, la station, la ligne, la direction… Ici, la donnée est visualisée comme une valeur ou une chaine de caractère dans la cellule d’un tableau !

En validant son titre de transport, Alice et les milliers d’autres usagers, produisent des données qui vont permettre au transporteur d’analyser la fréquentation de la ligne et d’adapter la fréquence des trams.

Ces données peuvent être publiées en open data, ou données ouvertes. C’est à dire qu’elles peuvent devenir libre d’accès et réutilisables par d’autres services pour bénéficier aux usagers. Par exemple pour une application qui indique l’horaire du prochain tram, ou calcule le meilleur trajet pour se rendre au musée…

Avant toute chose, ces données doivent être anonymisées : on peut diffuser les données de déplacements, mais pas les numéros de voyageurs.

Dans cet exemple, le bénéfice va à l’usager.

Mais dans d’autres cas, le profilage des données contribue plutôt à des intérêts privés. Par exemple quand il sert à proposer de la publicité ciblée à Alice…ou à modifier son contrat d’assurance en fonction des données connues par l’organisme.

C’est pourquoi, en France, pour éviter toute collecte ou toute utilisation abusive, nos données personnelles sont protégées par la CNIL. Lorsqu’on génère et que l’on collecte des données personnelles d’élèves, il est essentiel de s’assurer que les plateformes utilisées respectent le Règlement Général sur la Protection des Données.

Pour cela, il est possible de s’appuyer sur les outils recommandés par l’Education nationale et les conseils des référents pour les usages pédagogiques du numérique.

La littératie des données ou culture des données est la capacité à comprendre comment sont collectées, traitées, analysées et interprétées les données. C’est un enjeu éducatif important :

  • pour utiliser les services numériques avec discernement,
  • pour comprendre certaines décisions publiques
  • ou encore cerner des phénomènes scientifiques.

Par ailleurs, cette culture des données permet aussi de comprendre que les celles-ci peuvent être produites de manière biaisée ou abusivement interprétées. De nombreuses fausses informations s’appuient ainsi sur des données erronées, ou non-contextualisées, voire manipulées.

Par exemple, pour les élections américaines de 2016, voici la représentation des votes par comtés… Et voici la même représentation par nombre de votes. En faisant le choix de représenter par comté, on peut laisser croire que le vote républicain a été massif - 84% des comtés - alors qu’il représentait 47% des votes.

En ayant recours à des sources et des méthodes fiables de collecte et de représentation, il est possible en revanche d’utiliser les données pour faire émerger des informations pertinentes, comme dans la série Data Science versus Fake. Le datajournalisme , ou journalisme de données, consiste à exploiter des bases de données, pour en extraire de l’information de façon claire, accessible à tous, et visuellement attractive.

Ainsi, comprendre comment les données sont produites et utilisées est essentiel afin de développer son esprit critique.

Des ressources comme le site Datalireladata, soutenu par le Ministère de la Culture, proposent des d’activités telles que :

  • déconstruire les corrélations fallacieuses ;
  • créer des datavisualisations
  • ou comprendre comment les algorithmes utilisent nos données pour nous suggérer des contenus.

D’autres dispositifs, comme les "datasprints pédagogiques" proposent aux élèves et au grand public d’explorer un jeu de données, d’en tirer des problématiques et de proposer des visualisations. C’est le cas du défi "Trace2roues", lancé par Réseau Canopé, qui explore les données liées aux accidents de transport.

Mais revenons à l’open data qui désigne donc des données anonymes, libres d’accès.

L’ open data permet de développer des communs de connaissances, c’est à dire des sources de données publiques, partagées et gérées collectivement par des communautés dans le but de créer des services d’intérêt général.

La collecte des données en open data a des applications dans tous les secteurs :

  • En cartographie, Open Street Map est une carte du monde, ouverte et collaborative, améliorée chaque jour par plus d’un million de contributeurs.
  • Un autre domaine est celui des sciences participatives. Ce sont des dispositifs de recherche dans lesquels des bénévoles participent à la production de connaissances avec les chercheurs. Les données collectées sont souvent rendues publiques et ouvertes, comme l’Inventaire national du patrimoine naturel qui lance des quêtes pour répertorier les espèces animales.

Enfin, les données ouvertes peuvent nourrir des algorithmes de prédiction ou de recommandation. Par exemple :

  • les données d’accidents de la route peuvent permettre de prédire la gravité des accidents selon l’endroit ;
  • les données en lien avec les activités des élèves vont permettre de repérer les notions à retravailler.

Avec le site data.gouv, de nombreuses données sur la vie publique et politique sont désormais accessibles à tous. Aujourd’hui, on peut par exemple

  • observer l’activité des parlementaires,
  • voir l’évolution du covid
  • et bientôt, avoir accès à l’ensemble des décisions administratives ou judiciaires.

Plus que jamais, il est donc nécessaire de développer et de transmettre aux élèves une culture de la donnée. Afin qu’ils soient capables

  • de comprendre comment les données produisent de l’information,
  • d’avoir un regard critique face à celles-ci,
  • mais aussi de produire eux-mêmes de l’information, et de partager de la connaissance.

Crédits

  • Scénario : Kimi Do, Théodore Laugée, Virginie Esparel-Rousseau, Joanna Marques, Julia Dumont
  • Direction de publication : Marie-Caroline Missir
  • Production : Réseau Canopé
  • Partenariat : Pix
  • Licence : CC BY-NC-ND 4.0

Ressource produite avec le soutien du ministère de l’Éducation nationale et de la Jeunesse

Financé par le Gouvernement de la République française, liberté égalité fraternité, le plan France Relance et l'Union européenne (NextGenerationEU)