Une donnée est la description élémentaire d’une réalité ou d’un fait, comme par exemple un relevé de température, la note d’un élève à un examen, l’état d’un compte, un message, une photo, une transaction, etc. Une donnée peut donc être très simple et, prise isolément, peu utile. Mais le recoupement avec d’autres données devient très intéressant.
Par exemple, une liste de températures pour une région donnée sur une longue période peut nous renseigner sur le réchauffement climatique. Ou bien la note moyenne d’un élève dans une matière sur une année nous informe du niveau d’acquisition des connaissances de l’élève dans cette matière. Il y a donc une relation subtile entre donnée et information, termes qui sont d’ailleurs souvent confondus dans le langage courant. Mais obtenir de l’information demande un travail d’analyse et d’interprétation des données (ex. une liste de notes) pour leur donner un sens dans un certain contexte (ex. une matière sur une année). Ainsi, les données sont la matière brute qui permet de produire des informations, qui elles sont exploitables pour diverses activités quotidiennes : évaluation, recommandation, prise de décision, prévision, recherche, etc. Inversement, pour comprendre d’où vient une information, il faut pouvoir retrouver les données initiales, d’où la nécessité d’enregistrer ces données dans une mémoire.
Pendant longtemps, le papier a fourni une mémoire pratique pour stocker et organiser les données. En effet, les documents sont faciles à transporter, partager, ranger et archiver. Et on peut les organiser, par exemple sous forme de répertoires, registres, annuaires ou tableaux pour faciliter la recherche de données. Afin d’enregistrer correctement les données, il faut aussi pouvoir les identifier précisément, de manière unique, ce qui demande un travail d’uniformisation des identifiants, comme le numéro de sécurité sociale en France, afin d’éviter les problèmes d’homonymie. Enfin, pour pouvoir retrouver des données dans de grandes collections, des métadonnées (données décrivant des données), comme des mots-clés, permettent de faire des index, en associant par exemple chaque mot-clé aux identifiants des données correspondantes.
Lire la suite de l'article sur le site : https://interstices.info/jcms/p_84069/les-donnees-en-question
Auteurs : Stéphane Grumbach et Patrick Valduriez
Dernière modification le lundi, 04 avril 2016