Quelques bases sur le codage des données

L'informatique s'appuie sur un code binaire pour représenter les données et les instructions qu'il manipule ; ce code représente deux états physiques :

  • charge électrique pour la mémoire centrale,
  • polarisation pour un support magnétique,
  • irrégularités (appelées pits) pour la surface réfléchissante d'un support optique,
  • fréquences pour un signal de transmission.

Un élément binaire, également désigné bitBInary digiT – peut donc prendre 2 valeurs. Les bits sont généralement regroupés par 8 pour constituer un octet. Dans un octet, chaque bit est pondéré en fonction de sa position ; le poids d’un bit varie de 0 à 7. Le bit pondéré par la valeur 0 est désigné le bit de poids faible tandis que le bit pondéré par la valeur 7 est désigné le bit de poids fort

Structure d'un octet :

Poids 7 6 5 4 3 2 1 0
Valeur 0 1 1 1 1 0 0 1
  poids fort   poids faible

Cette notion est également appliquée lorsque plusieurs octets sont regroupés. Par exemple, dans un mot qui est un regroupement de 2 octets, le poids des bits varie de 0 à 15.

Structure d'un mot :

Poids 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0
Valeur 0 1 1 0 1 0 0 0 1 0 1 1 1 0 0 1
  poids fort   poids faible

La manipulation des valeurs biniaires peut être fastidieuse et source d'erreur, c'est pourquoi la valeur binaire d'un octet est souvent transformée en valeur hexadécimale en s'appuyant sur les quartets.

  quartet quartet
Poids 7 6 5 4 3 2 1 0
Valeur binaire 0 1 1 1 1 1 0 1
Valeur hexidécimale 7 E

La codage des données permet de transformer le code spécifique représentant une donnée externe en code binaire. Les données manipulées par un ordinateur peuvent être :

  • des caractères : pages web, documents, rapports, etc.,
  • des nombres : calculs scientifiques (flottant), comptables (décimal) ou autres (binaire, entier, réel),
  • des images statiques (photographies) ou animées (vidéos), des hologrammes,
  • des sons, enregistrés ou fabriqués : bruitages, musique ou parole.

La représentation des caractéristiques d'un phénomène physique (images, sons, etc.) peut s'effectuer par 2 types de signaux :

  • le signal analogique pour représenter un nombre infini d'états d'une caractéristique,
  • le signal numérique pour représenter un nombre fini d'états d'une caractéristique.

Si un phénomène est représenté par un signal analogique, il est nécessaire, dans un premier temps, de numériser sa représentation. Il faut ensuite transformer la représentation obtenue sous forme binaire pour représenter un état physique. Ces transformations s'appuient sur des formats spécifiques à chaque type de donnée

  • format caractère : représentations des caractères pour les textes (ASCII, Unicode, etc.),
  • format numérique : représentations des nombres entiers ou réels,
  • format image fixe : bitmap, TIFF, JPEG, PNG,
  • format vidéo : QuickTime, MPEG.