Bien que les compacteurs arrivent déjà à réduire
significativement les tailles des fichiers qu'ils
compressent, il est encore possible d'améliorer les taux de
compression. Cela a d'autant plus d'enjeu qu'une image en
haute résolution ou un son dont la définition est de
qualité CD prend énormément de place.
L'idée qui préside à cette amélioration vient des limites
mêmes de l'homme : un oeil humain n'est pas capable de
différencier 2 couleurs très proches parmi les 16 millions
affichables par son PC. Pourquoi dans ce cas, ne pas
réduire le nombre de couleurs employées par l'image? C'est
ce que font les formats de compression JPEG, PING et GIF,
et, de ce fait, ils réduisent de manière radicale la taille
des images.
Idem pour le son, aucun homme normalement constitué ne peut
entendre un son à la fréquence de 20 KHz. Si un morceau
contient des fréquences hors de cette gamme, on peut donc
purement et simplement les supprimer sans perte de qualité
audio puisque l'oreille ne les entend pas. En fait, on
entend surtout correctement les fréquences situées dans la
gamme 2 kHz 5 kHz. En effet, il faut moins de 5dB pour
entendre les fréquences de cette bande alors qu'il faut
plus de 20dB pour entendre les fréquences situées en
dessous de 100Hz ou au dessus de 10kHZ.
Ces constatations peuvent être exploitées pour réduire la
taille des fichiers. On peut par exemple décider que toutes
les fréquences au dessus de 15kHz seront supprimées. En
supprimant ces informations inaudibles par le commun des
mortels, on diminue significativement le nombre de données
à prendre en compte et on obtient donc un fichier plus
léger.
Poursuivant cette chasse aux informations inutiles, les
psycho acousticiens ont établi qu'aucun être humain n'était
capable de percevoir la stéréo dans les extrêmes graves.
Autant donc passer toutes les fréquences trop basses en
mono quitte à rétablir une pseudo stéréo au moment de la
lecture du fichier. Et encore quelques octets de gagnés!
Mais le plus futé reste à venir : les mêmes psycho
acousticiens ont observé que certaines fréquences en
écrasaient d'autres qui, du coup, devenaient superflues.
Pour une nouvelle fois faire simple, imaginez votre groupe
de rock : le guitariste avec son Marshal 100 W dont il
pousse le volume à 10, le batteur qui enclume comme un
forcené et entre les deux, votre petite soeur qui joue du
triangle, sans micro pour l'amplifier. Il y a fort à parier
que le public n'entende rien de son solo débridé de
triangle si les autres ne se décident pas à lui faire un
silence royal. Autant, donc, qu'elle ne joue pas du tout.
Fort de ce constat, l'algorithme de compression repère donc
les sons "dominants" et retire toutes les données relatives
aux sons "dominés". Puisque de toutes façons, on ne les
aurait pas entendus, cela ne fait guère de différence au
niveau sonore tout en réduisant notablement la taille du
fichier.
C'est sur ces principes que reposent de nombreux
algorithmes de compression du son tels que le mp3 et ses
affiliés, (le WMA, le Real Audio, l'Ogg Vorbis, etc.) : ils
allègent le fichier de toutes les informations qu'ils
estiment superflues avant de le passer par un algorithme de
compression classique.
Parce qu'ils retirent de la matière sonore au fichier
traité et dégradent ses qualités d'origine, on dit qu'ils
opèrent une compression "destructive". Evidemment, plus on
veut un petit fichier, plus la dégradation du son sera
grande.