Le plus connu des formats de compression est évidemment ce
bon vieux Mp3, mais il est loin d’être le seul au monde.
Sentant que la musique numérique compressée avait de
grandes chances de bouleverser le marché du disque, de
nombreux développeurs se sont lancés dans la conception de
formats destinés à offrir le meilleur compromis entre la
quantité de données utilisée et la qualité sonore.
Souvent en informatique, le Mp3 doit son statut de standard
moins à l'excellence de ses prestations qu'au fait qu'il
fut le premier sur le marché. On trouve donc aujourd'hui
des codecs (nom donné aux algorithmes de
COmpression/DECompression) plus performants et plus riches
en termes de fonctionnalités tels le VQF, le MP3 Pro, l'Ogg
Vorbis, le Windows Audio Media , le Quick time ou le Real
Audio. Par ailleurs, au sein même de la famille MP3,
plusieurs algorithmes s'affrontent, émanant chacun de
développeurs différents. Ainsi, aux côtés du premier codec
mis au point par Fraunhoffer, on trouve désormais des
concurrents du nom de Lame, Blaze, Gogo ou Radium qui sont
tous compatibles entre eux mais qui offrent des différences
quant à leur qualité audio ou leur rapidité de
traitement... Autant de raisons de se livrer à un petit
comparatif. Revue de détail des différents formats.
Le
MP3
Star incontestée des codecs, cet algorithme de compression
prend naissance dans les laboratoires de Fraunhofer IIS et
de l'Université d'Erlangen en 1987. L'ISO en fera un
standard dans les années 92-93 (ISO/IEC 11172). Le MP3 est
un dérivé de la compression sonore utilisé pour les vidéos
au format MPEG-1 (MP3 signifie d’ailleurs MPEG-1 Audio
Layer 3).
Il s’agit du format qui offre le panel de paramétrage le
plus important. On peut en effet définir un débit
("bitrate" dans le jargon) allant de 32 à 320 kbps. À
partir de 128 Kbps, la qualité audio devient suffisante
pour encoder des chansons. À 192 Kbps, la qualité est
similaire à celle d’un CD audio. À ce taux de compression,
une minute de musique équivaut à 1,4 Mo de données. Mais il
est également possible d'opter pour un débit variable dit
VBR (Variable Bit Rate). Dans ce cas, l’encodeur augmentera
le taux de compression sur les passages musicaux moins
complexes, ce qui diminuera légèrement la taille du fichier
final. Le gain dépend grandement du type de morceau : de 5
à 10% avec un extrait de musique classique ou du jazz, pas
grand-chose avec du rock ou du rap.
Le gros avantage du MP3 demeure sa compatibilité avec
l'ensemble des baladeurs audionumériques, certaines chaînes
hi-fi, autoradios et lecteurs de DVD de salon mais aussi à
des applications nécessitant des débits faibles d'où une
adhésion très rapide du monde Internet à ce format de
compression.
Quasiment universel, il figure sur tous les sites de
téléchargement gratuit de type Kazaa ou eDonkey. En
revanche, ce format pèche un peu au niveau de la
restitution des fréquences aiguës et se montre donc moins
adapté à la musique classique, par exemple.
On notera enfin qu’il existe plusieurs algorithmes
d’encodage MP3, le "Fraunhofer" étant le plus répandu et le
"Lame" le plus efficace. Ses ancêtre peu connu son le mp1
et le mp2.
Le suffixe des fichiers créés est .mp3
Le MP3
Pro
Avec l’arrivée de formats concurrents et plus efficaces
tels le WMA ou l’AAC, les dépositaires du MP3 ont décidé de
faire évoluer ce format. D’où l’arrivée du MP3 Pro, sorti à
la fin de 2001. Fruit de la collaboration entre Thomson
Multimédia et l'Institut Fraunhofer, dans son principe, le
MP3 Pro a pour but d’améliorer la principale lacune du MP3
au niveau des fréquences élevées. Ainsi, si le premier
supprime purement et simplement les fréquences situées
au-delà d’un spectre défini par le taux de compression, le
second essaie, autant que faire se peux, de conserver
certaines de ces hautes fréquences qui amélioreront la
qualité d’écoute. Ce format combine l'algorithme MP3 et un
système améliorant la qualité des fichiers compressés
appelé SBR pour Spectral Band Replication. Ainsi à un débit
de 96 kbps, le MP3 Pro est légèrement plus efficace que le
MP3 à 128 kbps, d’où un gain de poids de 25%. Plus le débit
sera faible, et plus le gain sera élevé. Et en corollaire,
avec un débit supérieur ou égal à 192 kbps, la différence
apparaît quasi imperceptible. La qualité CD en MP3 Pro est
obtenue à 96 kbps, soit 720 ko pour une minute. Toutefois,
et c’est là que le bât blesse et nuit au développement de
ce format, il n’existe pas d’encodeur gratuit supportant le
MP3 Pro. Signalons que les fichiers MP3 Pro peuvent en
théorie être lus par des baladeurs ne supportant que le MP3
mais dans la pratique la qualité sonore obtenue est souvent
sujette à caution.
Le suffixe des fichiers créés est .mp3
Le
WMA
Lancé en 1999 par Microsoft, le WMA (Windows Media Audio)
n’a eu pour but que de contrer l’essor du MP3. Avec des
arguments convaincants. Exploitant plus efficacement les
caractéristiques de l’oreille humaine au niveau du spectre
audible, le WMA parvient à supprimer les fréquences
réellement inutiles tout en conservant certaines hautes
fréquences qui ont une influence sur la qualité sonore.
L’algorithme de compression, relativement efficace, permet
de conserver une qualité équivalente à un CD audio avec un
débit de 128 kbps, soit 1 Mo pour une minute de chanson.
Totalement gratuit, le WMA a en plus l’avantage de disposer
d’un encodeur intégré au lecteur Windows Media Player. Une
façon efficace d’assurer la diffusion de ce support.
D’autant que ce format est lié à une gestion pointue des
droits d’auteur (DRM ou Digital Right Management) qui
permet de définir par exemple une durée de vie limitée pour
les fichiers ou d’interdire les possibilités de gravure.
C’est pourquoi il est utilisé par certains sites de musique
en téléchargement. De nombreux baladeurs audionumériques
supportent également le WMA et des sharewares réputés tels
WinAmp permettent d’encoder dans ce format.
Le suffixe des
fichiers créés est .wma
L’AAC
Contrairement aux idées reçus, l’AAC (Advanced Audio
Coding) n’est pas un format développé par Apple mais par un
consortium au sein duquel se retrouvent l’institut
Fraunhofer (le père du MP3),, AT&T, Nokia, Sony, ou
encore Dolby. Connu également sous le nom de MPEG-2 NBC
pour Non Backward Compatible, il est l'un des descendants
du MPEG-2 successeur lui-même du MPEG-1. Effectivement,
l’AAC est sans aucun doute l’algorithme de compression le
plus efficace. Contrairement au MP3 et au WMA, il ne
s'appuie pas sur le MPEG-1 mais sur le MPEG-4 (format à
l’origine du DivX). Ce choix semble avoir porté ses fruits
puisque cela lui permet de disposer d’un meilleur compromis
entre le taux de compression et la qualité sonore. Ainsi en
AAC, on obtient l’équivalent d’une qualité CD audio avec un
débit de seulement 96 kbps. À cela s’ajoute, comme pour le
WMA, des propriétés de gestion des droits d’auteur (DRM) et
la possibilité de gérer des sons sur 48 canaux différents,
ce qui le rend apte à encoder des DVD audio ou vidéo en
conservant la spatialisation sonore d’origine (les six
canaux du Dolby Digital par exemple), bien que cette
possibilité ne soit pour l’heure pas vraiment exploitée,
par rapport aux autres formats et compte tenu de sa grande
qualité à taux de compression équivalent, nous avons
peut-être là le successeur du MP3 mais la durée d'encodage
est importante.
Le suffixe des fichiers créés est .aac
L’OGG
Vorbis
L’OGG Vorbis est au format de compression audio ce que
Linux est aux systèmes d’exploitation. Il s’agit en effet
d’un format "ouvert" dont les codes source sont publics et
peuvent être adaptés et modifiés par tout un chacun. Il a
été mis au point par des programmeurs indépendants sous
l'égide de la fondation Xiph.org. Il n’en reste pas moins
un format assez efficace. À 128 kbps, on atteint le niveau
de qualité d’un CD Audio (1 Mo pour 1 minute). La structure
de compression du format OGG est par ailleurs sensiblement
différente des MP3, WMA et autres AAC. Il segmente les
sources audio en paquets successifs, l’algorithme de
compression agissant dans un premier temps sur chaque
paquet indépendamment des autres. Cela lui permet de ne pas
avoir vraiment de faiblesse sur certaines fréquences et de
conserver la même qualité quel que soit le type de musique.
À cela s’ajoutent des fonctions de polyphonie permettant de
restituer jusqu’à 255 canaux son. La structure en paquet le
rend en plus bien adapté à une utilisation en diffusion
continue (streaming) sur l'Internet, notamment pour les
radios en ligne, autre avantage, ce codec peut être intégré
dans les applications sans que le programmateur reverse des
royalties aux concepteurs. Ouvert, le OGG Vorbis devrait
rapidement évoluer et peut-être se rapprocher de l’AAC en
termes de débit. Signalons par ailleurs que la
compatibilité descendante est assurée, un fichier OGG
Vorbis quelle que soit la version de son encodeur peut être
lu par un lecteur plus ancien. De nombreux encodeurs et
lecteurs sont compatibles avec l’OGG. Inconvénient, la
durée d'encodage est importante.
Le suffixe des fichiers
créés est .ogg
Le
VQF
La norme vqf ou TwinVQ (Transform-domain Weighted
Interleave Vector Quantization) est assez récente, elle a
été développée par NTT Cyber Space Laboratories et soutenu
par Yamaha. On regrettera une durée d'encodage un peu trop
longue. Le vqf est réputé pour être meilleur que le mp3, Il
fournit une meilleure qualité sonore que le format MP3. En
vqf la "qualité CD" est atteinte à 96 Kbits/s ce qui fait
que pour une qualité égale à celle du mp3, un fichier vqf
prend moins de place, environ 30 % de moins.
Le suffixe des
fichiers créés est .vqf,vql ou .vqe.
Le
MPC
Le MPC est un format destructeur de compression audio basé
sur le format vidéo Mpeg2. Il est aussi appelé Mp+, c'est
pour cela qu'il est également appelé Mpeg Plus ou MP+.
C'est un format destructeur qui permet de créer des
fichiers audio d'excellente qualité (qualité bien
supérieure au MP3 ou Ogg Vorbis). Ses caractéristiques sont
une excellente qualité d'écoute, il est très rapide à
l’encodage et est gratuit (mais l’encodeur n’est pas Open
Source). Ce format n'est intéressant que pour de hauts et
très hauts débits (à partir de 180 kbits/s). En raison de
l'excellente qualité sonore qu'il permet, la taille des
fichiers MPC est supérieure à celle de fichiers encodés en
MP3 ou Ogg.
En bitrate de 170kbps environ : très grande transparence
(99% des utilisateurs en sont satisfait).
En bitrate de 200kbps environ : Difficile de voir la
différence avec l’originale.
EN bitrate de 240kbps environ : Transparence absolue.
Ce format est de plus en plus répandu. Sa qualité d’écoute
a su engendrer son succès, et il a su trouver sa place dans
les p2p.
Le suffixe des fichiers créés est .mpc
L’AIF (Audio
Interchange File)
Format de fichier audio et ou vidéo contenant du son
échantillonné dans un format cousin d'IFF. D'abord sur
l'Amiga, puis chez Apple. Il est l’équivalent du format Wav
dans le monde Macintosh. Ce format offre une bonne qualité
sonore, il est pris en charge par plusieurs navigateur
Internet, et ne requiert pas de plu gin. Toute fois la
taille importante des fichiers limite sérieusement son
utilisation.
Le suffixe des fichiers créés est .aif
Le
Real
Le format Real permet la diffusion de fichiers multimédia
sur le net en streaming, c'est à dire sans le chargement
préalable du fichier et avec une diffusion en continu. Ce
format s'adapte aussi bien à la compression de musiques que
d'extraits vidéo. Une méthode bien plus rapide que le
téléchargement même si la qualité des musiques subit
parfois quelques dégradations. Le lecteur Real player est
gratuit et existe sur les plates-formes Windows, MacOS et
Unix. .
Le suffixe des fichiers créés est .rmvb (Real Media
Variable Bitrate)
Conclusion.
Tous ces algorithmes de compression fonctionnent sur le
même principe : éliminer les fréquences que l’oreille
humaine ne perçoit pas du tout, ou très peu, et niveler les
fréquences proches les unes des autres à des valeurs
identiques de façon à accroître la compression. Ce sont des
algorithmes dits "destructifs". Autrement dit, la
conversion d'un fichier audio compressé à partir d’un CD
audio à nouveau en format CD audio, les données résultantes
ne seront pas les mêmes que celles du fichier original.
Selon les formats et les besoins, la compression pourra
être plus ou moins importante. Elle est définie par ce que
l’on appelle le débit, c’est-à-dire le flux d’informations
par seconde de musique. Il peut osciller de 32 kbps
(kilobits par seconde) à 320 kbps.