Les données

Définition

  • Une donnée est une valeur décrivant un objet, une personne, un événement digne d'intérêt pour celui qui choisit de la conserver.

    Par exemple, le numéro de téléphone d'un contact est une donnée. Il y a les données quantitatives (âge, poids, etc.) et les données qualitatives (nom, immatricule, etc.).

  • Un descripteur est un identifiant qui décrit le type de la donnée, plusieurs descripteurs peuvent être utiles pour décrire un même objet.

    Par exemple des descripteurs permettant de caractériser un contact : nom, prénom, adresse et numéro de téléphone.

  • Une collection regroupe des objets partageant les mêmes descripteurs.

    Par exemple, la collection des contacts d'un carnet d'adresses.

FondamentalNotion de donnée et d'information

Une donnée est un élément brut, qui n'a pas encore été interprétée, mis en contexte, elle peut être considérée comme étant un élément fondamental sur lequel se bâtit un raisonnement, une recherche, une étude ou une œuvre.

Ainsi, une donnée est rarement utilisée d'une manière isolée, regroupée avec d'autres, ces données rattachées à un contexte et éventuellement transformées donnent naissance à une information.

Et c'est là toute la différence entre une information et une donnée. En effet, une information est par définition une donnée interprétée.

information = donnée + un modèle d'interprétation

Exemple

Sur l'exemple en image ci-contre de la Dead-line, en appliquant le modèle interprétatif français de la date, le 11/10/2017 aurait signifié le 11 Octobre 2017. Cela aurait donc changé l'information. En d'autres termes, la mise en contexte d'une donnée crée de la valeur ajoutée pour constituer une information.

Remarque : on peut considérer la connaissance comme une information comprise,c'est-à-dire assimilée et utilisée.

RappelLa persistance

Une donnée est rarement utilisée une seule fois. Généralement on a besoin de la mémoriser sur un support quelconque pour pouvoir la retrouver ultérieurement.

Par exemple, lorsque quelqu'un vous communique son numéro de téléphone, vous le notez sur un bout de papier, sur votre carnet d'adresses, dans votre téléphone portable ou bien, si vous avez une bonne mémoire, dans votre cerveau. La façon de le mémoriser a une influence sur la rapidité de le retrouver lorsqu'on en a besoin.

Cette capacité de mémoriser et de pouvoir retrouver une donnée est appelée persistance. Son opposé est la volatilité.

Lorsqu'une donnée n'est pas persistante, elle est volatile, c'est-à-dire qu'elle disparaît au bout d'un certain temps.

Persistance ≅ mémorisation + disponibilité

Dans le domaine de la programmation, la gestion de persistance des données se réfère au mécanisme responsable de la sauvegarde et la restauration de données, afin qu'un programme puisse se terminer sans que ses données ni son état d'exécution soient perdus. Ces données peuvent être sauvegardées sur disque ou transmises à un serveur.

Lors de la mémorisation d'une donnée, deux aspects doivent être pris en considération :

  • Le type du support de mémorisation : Ce type doit être adapté à la durée de la mémorisation.

    Exemples : si je vais utiliser le numéro de téléphone immédiatement, je peux me contenter de ma mémoire. Si je veux l'utiliser dans une heure, je peux le noter sur un bout de papier. Si je vais l'utiliser souvent dans les jours et mois à venir, il vaut mieux le mémoriser dans mon carnet d'adresses ou dans la puce de mon téléphone portable.

  • Le format de mémorisation : La forme selon laquelle une donnée est mémorisée.

    Exemple : Pour mémoriser le numéro de téléphone, si je note uniquement le numéro, je ne serais pas capable de savoir à qui il se réfère si je le retrouve dans un mois. Il me faut donc le décrire par exemple sous la forme suivante : « Monsieur X : 34217788».

Qu'est-ce qu'un format de fichier ?

On distingue :

  • Les formats utilisés pour représenter les documents de type texte (qui ne contiennent que des caractères alphanumériques) lisibles par des logiciels de traitement de texte ;

    RTF, TXT, HTML, CSV, XML, JSON, vCard (extension .vcf) , etc.

  • Les formats utilisés pour les fichiers binaires (non interprétables sous forme de texte : une image, un son, un fichier compressé).

    PDF, PPT, PPS, GIF, JPEG, MP3, WAV, EXE, RAR, ZIP, etc.

MéthodeIdentifier la nature d'un fichier

  • Par l'extension[1] du nom de fichier qui est constituée des (souvent \(3\)) dernières lettres après le point (.) dans un nom de fichier. Ex : doc, xls, xml, jpg, htm, html

    l'extension peut être considérée comme une méta-donnée

  • Par des méta-données (informations sur le fichier comme nom, taille, codage,type de fichier, le logiciel ayant créé le fichier, le propriétaire, les droits, date de création, ...)

    Une norme venue d'Internet (le mail) permet de décrire le contenu d'un fichier, la partie content-type décrit le type et le sous-type. (text/plain, text/html, audio/mp3, image/jpeg)

    Cette description MIME[2] est contenue dans l'entête d'un fichier ou d'un message, ou dans une méta-donnée externe (le système de fichier du système d'exploitation stocke des méta-données pour chaque fichier).

    Méthode fiable et transparente pour l'utilisateur (voir propriétés d'un fichier au niveau système).

    Il faut savoir repérer les méta-données collectées par un dispositif et celles renseignées par l'utilisateur.