Principaux formats

Le plus connu des formats de compression est évidemment ce bon vieux Mp3, mais il est loin d’être le seul au monde. Sentant que la musique numérique compressée avait de grandes chances de bouleverser le marché du disque, de nombreux développeurs se sont lancés dans la conception de formats destinés à offrir le meilleur compromis entre la quantité de données utilisée et la qualité sonore.

Souvent en informatique, le Mp3 doit son statut de standard moins à l'excellence de ses prestations qu'au fait qu'il fut le premier sur le marché. On trouve donc aujourd'hui des codecs (nom donné aux algorithmes de COmpression/DECompression) plus performants et plus riches en termes de fonctionnalités tels le VQF, le MP3 Pro, l'Ogg Vorbis, le Windows Audio Media , le Quick time ou le Real Audio. Par ailleurs, au sein même de la famille MP3, plusieurs algorithmes s'affrontent, émanant chacun de développeurs différents. Ainsi, aux côtés du premier codec mis au point par Fraunhoffer, on trouve désormais des concurrents du nom de Lame, Blaze, Gogo ou Radium qui sont tous compatibles entre eux mais qui offrent des différences quant à leur qualité audio ou leur rapidité de traitement... Autant de raisons de se livrer à un petit comparatif. Revue de détail des différents formats.

Le MP3

Star incontestée des codecs, cet algorithme de compression prend naissance dans les laboratoires de Fraunhofer IIS et de l'Université d'Erlangen en 1987. L'ISO en fera un standard dans les années 92-93 (ISO/IEC 11172). Le MP3 est un dérivé de la compression sonore utilisé pour les vidéos au format MPEG-1 (MP3 signifie d’ailleurs MPEG-1 Audio Layer 3).

Il s’agit du format qui offre le panel de paramétrage le plus important. On peut en effet définir un débit ("bitrate" dans le jargon) allant de 32 à 320 kbps. À partir de 128 Kbps, la qualité audio devient suffisante pour encoder des chansons. À 192 Kbps, la qualité est similaire à celle d’un CD audio. À ce taux de compression, une minute de musique équivaut à 1,4 Mo de données. Mais il est également possible d'opter pour un débit variable dit VBR (Variable Bit Rate). Dans ce cas, l’encodeur augmentera le taux de compression sur les passages musicaux moins complexes, ce qui diminuera légèrement la taille du fichier final. Le gain dépend grandement du type de morceau : de 5 à 10% avec un extrait de musique classique ou du jazz, pas grand-chose avec du rock ou du rap.

Le gros avantage du MP3 demeure sa compatibilité avec l'ensemble des baladeurs audionumériques, certaines chaînes hi-fi, autoradios et lecteurs de DVD de salon mais aussi à des applications nécessitant des débits faibles d'où une adhésion très rapide du monde Internet à ce format de compression.
Quasiment universel, il figure sur tous les sites de téléchargement gratuit de type Kazaa ou eDonkey. En revanche, ce format pèche un peu au niveau de la restitution des fréquences aiguës et se montre donc moins adapté à la musique classique, par exemple.

On notera enfin qu’il existe plusieurs algorithmes d’encodage MP3, le "Fraunhofer" étant le plus répandu et le "Lame" le plus efficace. Ses ancêtre peu connu son le mp1 et le mp2.

Le suffixe des fichiers créés est .mp3

Le MP3 Pro

Avec l’arrivée de formats concurrents et plus efficaces tels le WMA ou l’AAC, les dépositaires du MP3 ont décidé de faire évoluer ce format. D’où l’arrivée du MP3 Pro, sorti à la fin de 2001. Fruit de la collaboration entre Thomson Multimédia et l'Institut Fraunhofer, dans son principe, le MP3 Pro a pour but d’améliorer la principale lacune du MP3 au niveau des fréquences élevées. Ainsi, si le premier supprime purement et simplement les fréquences situées au-delà d’un spectre défini par le taux de compression, le second essaie, autant que faire se peux, de conserver certaines de ces hautes fréquences qui amélioreront la qualité d’écoute. Ce format combine l'algorithme MP3 et un système améliorant la qualité des fichiers compressés appelé SBR pour Spectral Band Replication. Ainsi à un débit de 96 kbps, le MP3 Pro est légèrement plus efficace que le MP3 à 128 kbps, d’où un gain de poids de 25%. Plus le débit sera faible, et plus le gain sera élevé. Et en corollaire, avec un débit supérieur ou égal à 192 kbps, la différence apparaît quasi imperceptible. La qualité CD en MP3 Pro est obtenue à 96 kbps, soit 720 ko pour une minute. Toutefois, et c’est là que le bât blesse et nuit au développement de ce format, il n’existe pas d’encodeur gratuit supportant le MP3 Pro. Signalons que les fichiers MP3 Pro peuvent en théorie être lus par des baladeurs ne supportant que le MP3 mais dans la pratique la qualité sonore obtenue est souvent sujette à caution.

Le suffixe des fichiers créés est .mp3

Le WMA

Lancé en 1999 par Microsoft, le WMA (Windows Media Audio) n’a eu pour but que de contrer l’essor du MP3. Avec des arguments convaincants. Exploitant plus efficacement les caractéristiques de l’oreille humaine au niveau du spectre audible, le WMA parvient à supprimer les fréquences réellement inutiles tout en conservant certaines hautes fréquences qui ont une influence sur la qualité sonore. L’algorithme de compression, relativement efficace, permet de conserver une qualité équivalente à un CD audio avec un débit de 128 kbps, soit 1 Mo pour une minute de chanson.

Totalement gratuit, le WMA a en plus l’avantage de disposer d’un encodeur intégré au lecteur Windows Media Player. Une façon efficace d’assurer la diffusion de ce support. D’autant que ce format est lié à une gestion pointue des droits d’auteur (DRM ou Digital Right Management) qui permet de définir par exemple une durée de vie limitée pour les fichiers ou d’interdire les possibilités de gravure. C’est pourquoi il est utilisé par certains sites de musique en téléchargement. De nombreux baladeurs audionumériques supportent également le WMA et des sharewares réputés tels WinAmp permettent d’encoder dans ce format.

Le suffixe des fichiers créés est .wma

L’AAC

Contrairement aux idées reçus, l’AAC (Advanced Audio Coding) n’est pas un format développé par Apple mais par un consortium au sein duquel se retrouvent l’institut Fraunhofer (le père du MP3),, AT&T, Nokia, Sony, ou encore Dolby. Connu également sous le nom de MPEG-2 NBC pour Non Backward Compatible, il est l'un des descendants du MPEG-2 successeur lui-même du MPEG-1. Effectivement, l’AAC est sans aucun doute l’algorithme de compression le plus efficace. Contrairement au MP3 et au WMA, il ne s'appuie pas sur le MPEG-1 mais sur le MPEG-4 (format à l’origine du DivX). Ce choix semble avoir porté ses fruits puisque cela lui permet de disposer d’un meilleur compromis entre le taux de compression et la qualité sonore. Ainsi en AAC, on obtient l’équivalent d’une qualité CD audio avec un débit de seulement 96 kbps. À cela s’ajoute, comme pour le WMA, des propriétés de gestion des droits d’auteur (DRM) et la possibilité de gérer des sons sur 48 canaux différents, ce qui le rend apte à encoder des DVD audio ou vidéo en conservant la spatialisation sonore d’origine (les six canaux du Dolby Digital par exemple), bien que cette possibilité ne soit pour l’heure pas vraiment exploitée, par rapport aux autres formats et compte tenu de sa grande qualité à taux de compression équivalent, nous avons peut-être là le successeur du MP3 mais la durée d'encodage est importante.

Le suffixe des fichiers créés est .aac

L’OGG Vorbis

L’OGG Vorbis est au format de compression audio ce que Linux est aux systèmes d’exploitation. Il s’agit en effet d’un format "ouvert" dont les codes source sont publics et peuvent être adaptés et modifiés par tout un chacun. Il a été mis au point par des programmeurs indépendants sous l'égide de la fondation Xiph.org. Il n’en reste pas moins un format assez efficace. À 128 kbps, on atteint le niveau de qualité d’un CD Audio (1 Mo pour 1 minute). La structure de compression du format OGG est par ailleurs sensiblement différente des MP3, WMA et autres AAC. Il segmente les sources audio en paquets successifs, l’algorithme de compression agissant dans un premier temps sur chaque paquet indépendamment des autres. Cela lui permet de ne pas avoir vraiment de faiblesse sur certaines fréquences et de conserver la même qualité quel que soit le type de musique.
À cela s’ajoutent des fonctions de polyphonie permettant de restituer jusqu’à 255 canaux son. La structure en paquet le rend en plus bien adapté à une utilisation en diffusion continue (streaming) sur l'Internet, notamment pour les radios en ligne, autre avantage, ce codec peut être intégré dans les applications sans que le programmateur reverse des royalties aux concepteurs. Ouvert, le OGG Vorbis devrait rapidement évoluer et peut-être se rapprocher de l’AAC en termes de débit. Signalons par ailleurs que la compatibilité descendante est assurée, un fichier OGG Vorbis quelle que soit la version de son encodeur peut être lu par un lecteur plus ancien. De nombreux encodeurs et lecteurs sont compatibles avec l’OGG. Inconvénient, la durée d'encodage est importante.

Le suffixe des fichiers créés est .ogg

Le VQF

La norme vqf ou TwinVQ (Transform-domain Weighted Interleave Vector Quantization) est assez récente, elle a été développée par NTT Cyber Space Laboratories et soutenu par Yamaha. On regrettera une durée d'encodage un peu trop longue. Le vqf est réputé pour être meilleur que le mp3, Il fournit une meilleure qualité sonore que le format MP3. En vqf la "qualité CD" est atteinte à 96 Kbits/s ce qui fait que pour une qualité égale à celle du mp3, un fichier vqf prend moins de place, environ 30 % de moins.

Le suffixe des fichiers créés est .vqf,vql ou .vqe.

Le MPC

Le MPC est un format destructeur de compression audio basé sur le format vidéo Mpeg2. Il est aussi appelé Mp+, c'est pour cela qu'il est également appelé Mpeg Plus ou MP+. C'est un format destructeur qui permet de créer des fichiers audio d'excellente qualité (qualité bien supérieure au MP3 ou Ogg Vorbis). Ses caractéristiques sont une excellente qualité d'écoute, il est très rapide à l’encodage et est gratuit (mais l’encodeur n’est pas Open Source). Ce format n'est intéressant que pour de hauts et très hauts débits (à partir de 180 kbits/s). En raison de l'excellente qualité sonore qu'il permet, la taille des fichiers MPC est supérieure à celle de fichiers encodés en MP3 ou Ogg.

En bitrate de 170kbps environ : très grande transparence (99% des utilisateurs en sont satisfait).

En bitrate de 200kbps environ : Difficile de voir la différence avec l’originale.

EN bitrate de 240kbps environ : Transparence absolue.

Ce format est de plus en plus répandu. Sa qualité d’écoute a su engendrer son succès, et il a su trouver sa place dans les p2p.

Le suffixe des fichiers créés est .mpc

L’AIF (Audio Interchange File)

Format de fichier audio et ou vidéo contenant du son échantillonné dans un format cousin d'IFF. D'abord sur l'Amiga, puis chez Apple. Il est l’équivalent du format Wav dans le monde Macintosh. Ce format offre une bonne qualité sonore, il est pris en charge par plusieurs navigateur Internet, et ne requiert pas de plu gin. Toute fois la taille importante des fichiers limite sérieusement son utilisation.

Le suffixe des fichiers créés est .aif

Le Real

Le format Real permet la diffusion de fichiers multimédia sur le net en streaming, c'est à dire sans le chargement préalable du fichier et avec une diffusion en continu. Ce format s'adapte aussi bien à la compression de musiques que d'extraits vidéo. Une méthode bien plus rapide que le téléchargement même si la qualité des musiques subit parfois quelques dégradations. Le lecteur Real player est gratuit et existe sur les plates-formes Windows, MacOS et Unix. .

Le suffixe des fichiers créés est .rmvb (Real Media Variable Bitrate)

Conclusion.

Tous ces algorithmes de compression fonctionnent sur le même principe : éliminer les fréquences que l’oreille humaine ne perçoit pas du tout, ou très peu, et niveler les fréquences proches les unes des autres à des valeurs identiques de façon à accroître la compression. Ce sont des algorithmes dits "destructifs". Autrement dit, la conversion d'un fichier audio compressé à partir d’un CD audio à nouveau en format CD audio, les données résultantes ne seront pas les mêmes que celles du fichier original. Selon les formats et les besoins, la compression pourra être plus ou moins importante. Elle est définie par ce que l’on appelle le débit, c’est-à-dire le flux d’informations par seconde de musique. Il peut osciller de 32 kbps (kilobits par seconde) à 320 kbps.

Le codage du son

Vous avez un avocat juridique. Et pour votre informatique ?