À propos des formats de sons

 

AIFF et AIFF-C: (.aif, .aiff, .aifc) AIFF est le sigle du Audio Interchange File Format qui a été développé par Apple pour la mémorisation des sons dans la partie données. Il a été adopté par SGI et quelques autres applications spécialisées. Le logiciel système du Macintosh inclue des fonctions de lecture et de créations de fichiers AIFF. Plus d’information à propos de ce format peut être trouvé dans Inside Macintosh VI ou Inside Macintosh: Sound. De plus, la description technique du format peut être trouvée à différents endroits sur la Toile. AIFF est un format de fichier très souple permettant de préciser des taux d’échantillonnage arbitraires, la taille des échantillons, le nombre de canaux et des parties de format spécifiques à une application qui peuvent être ignorés par les autres. AIFF-C est le même format que AIFF mais avec des échantillons compressés. Apple fournit deux types propriétaires de compression sur le Macintosh, MACE 3-à-1 et MACE 6-à-1. Les deux sont des algorithmes avec perte de données, mais offrent une qualité raisonnable avec une grande économie d’espace. Récemment, Apple a ajouté les sous-formats log-µ et IMA 4:1, qui sont décrits ci-dessous. De plus, le GS Apple II utilise les compressions ACE 2-à-1 et ACE 8-à-3, mais  SoundApp ne traite pas les fichiers ACE. Au contraire de SoundCap/Edit, les échantillons de 8 bits sont stockés comme deux valeurs complémentaires. La compression avec perte de données signifie que le son compressé ne sonnera pas exactement comme l’original, un peu comme des images JPEG ne ressemblent pas tout à fait à leurs originaux.

 

Amiga IFF (8SVX): (.iff) C’est le format dominant sur la plateforme Amiga de Commodore. Il permet de fixer un taux d’échantillonnage arbitraire mais n’autorise que les sons 8 bits en mono ou stéréo. Il possède aussi un format de compression 2 à 1 avec perte de données qui utilise un algorithme Fibonacci-delta unique.

 

Pistes CD Audio : En utilisant QuickTime, SoundApp peut extraire les données numériques des CD audio par l’option Importer vers QuickTime. Cela amène une fenêtre de dialogue qui permet d’établir différents paramètres pour la conversion. Méfiez-vous: les pistes audio prennent une grande quantité d’espace disque.

 

AVR: (.avr) Créé par Audio Visual Research, c’est un format de fichiers son populaire sur les ordinateurs Atari ST basés sur les processeurs 680x0. Il peut contenir des données à n’importe quel taux d’échantillonnage en mono ou stéréo en 8 ou 16 bits.

 

DVI ADPCM: (.adpcm) C’est le format DVI ADPCM (Adaptive Differential Pulse Code Modulation) de Intel. C’est un format de fichier 16 bits avec compression 4-à-1. Il a d’unique parmi les divers formats ADPCM d’être très rapide, et comme tous les formats ADPCM, il est avec perte de données. La version du format que prend en compte SoundApp joue en mono à un taux d’échantillonnage de 8000 Hz.

 

EPOC 32 (Psion série 5): Ce format est natif du système d’exploitation EPOC 32 qui est en usage sur les ordinateurs de poche Psion série 5. C’est un format plus complexe que celui de la série 3 et il est basé sur leur architecture “Direct File Store”. Ces fichiers peuvent contenir des données log-a comme les fichiers de la série 3 et des données compressées par ADPCM. SoundApp ne prend pas en compte la variante ADPCM.

 

GSM: (.gsm, .au.gsm) Cet algorithme de compression est le standard européen GSM 06.10 pour la transcription de la parole à pleine vitesse, prI-ETS 300 036, qui utilise un codage RPE/LTP (residual pulse excitation/long term prediction) à 13 kbit/s. Il a été développé pour le système de téléphone cellulaire numérique européen pour utiliser la bande passante la plus étroite possible.  À la base, cela signifie qu’il analyse de courtes sections de parole pour en obtenir une formulation mathématique en utilisant un modélisation de la voix humaine. Ainsi, il est optimisé pour la reproduction de la voix, et est de fait utilisé dans de nombreuses applications de téléphonie sur internet, bien qu’il semble relativement bien compresser des sons quelconques. Le format “.au.gsm” consiste en une série de paquets de 33 octets de données échantillonnés en mono à 8000 Hz. Bien que le suffixe contienne “.au” les fichiers n’ont pas de rapport avec les fichiers audio (AU) de Sun. L’implantation WAVE utilise une petite variante de l’algorithme (ils sont bons avec ces standards!) et peut traiter des fichiers mono à un taux d’échantillonnage arbitraire.

 

IMA ADPCM: C’est un standard multi-plateformes de la Interactive Multimedia Association pour jouer des sons. L’algorithme de base est le même que dans le DVI ADPCM. Actuellement, SoundApp traite les données IMA en WAVE, AIFF-C et ressources 'snd '. Malheureusement, Apple et Microsoft stockent leurs données d’une manière différente. (Autant pour les standards!) Les sons mono et stéréo sont tous deux possibles à un taux d’échantillonnage arbitraire.  Cependant, l’algorithme de compression n’accepte que des échantillons 16 bits.

 

IRCAM: (.sf) Ces fichiers sont utilisés par des logiciels universitaires comme la suite logicielle CSound et l’échantillonneur de sons MixView. Ces fichiers fixent un taux d’échantillonnage arbitraire et peuvent contenir du mono ou de la stéréo. SoundApp ne traite que les échantillons 8 et 16 bits linéaires et 32 bits virgule flottante, bien que le format puisse contenir d’autres codages.

 

MIDI: (.mid, .midi, .kar) Le Musical Instrument Digitial Interface est avant tout un standard pour la communication entre instruments de musique. General MIDI (GM) est un standard pour enregistrer les compositions en se basant sur les événements survenus durant l’exécution. Il ne contient pas de données audio numérisées; à la place, il ne stocke comme information que quelles notes ont été jouées dans un format notant le déroulement dans le temps. C’est similaire au format MOD mais sans les échantillons d’instruments numérisés. QuickTime 2.0 et ultérieur traite les données MIDI dans les films QuickTime. SoundApp peut directement jouer les fichiers MIDI de  type 0, 1 et 2 en utilisant QuickTime ou OMS 2.1 ou ultérieur et peut aussi jouer les données MIDI encapsulées dans des films QuickTime. Notez que l’information de paroles des fichiers karaoké n’est pas affichée. Il y a plusieurs extensions du standard GM, en particulier GS (Roland) et XG (Yahama). SoundApp prend en compte ces deux extensions. Il enverra aussi toutes les données non générales à l’équipement MIDI de sortie sélectionné si vous utilisez le pilote OMS MIDI. À l’aide de QuickTime 3.0 ou ultérieur, SoundApp peut jouer un fichier en utilisant les instruments GS.

 

MOD: (.mod, .s3m, .mtm) Ce n’est pas vraiment un format de son mais un format de musique. Il stocke des instruments numérisés et contient une partition musicale qui produit de longues composition avec une très petite quantité de données. Il y a eu diverses extensions de ce format, mais SoundApp n’en reconnaît qu’un sous-ensemble utilisant deux pilotes différents. Cela comprend SoundTracker d’Amiga, NoiseTracker, Protracker, StarTracker d’Amiga (4 et 8 pistes), Oktalyzer (4-8 pistes), MED/OctaMED d’Amiga(4-16 pistes, formats MMD0/1/2), FastTracker d’IBM(4, 6 et 8 pistes), TakeTracker d’IBM(1-32 pistes). En utilisant le pilote ZSS, SoundApp reconnaît aussi S3M (ScreamTracker 3), MTM (Multitracker) et les formats 'MADF' et 'MADG' utilisés par Player Pro pour le Macintosh. Aucun des deux pilotes ne peut actuellement jouer les fichiers IT, XM ou 669.

 

MPEG Audio: (.mp, .mp2, .mp3, .m1a, .m2a, .mpg, .mpeg, .swa) MPEG est le sigle du “Moving Picture Experts Group” qui travaille sous la direction conjointe de l’International Organization for Standardization (ISO) et de l’International Electro-Technical Commission (IEC). Ce groupe travaille sur des standards pour le codage des images animées et des sons qui leurs sont associés. Les fichiers audio MPEG peuvent être de niveau I, II or III. L’augmentation du niveau complique le format et nécessite plus d’effort pour le codage et le décodage. Cependant, cela fournit aussi une meilleure qualité sonore pour le taux d’échantillonnage. SoundApp prend en compte les niveaux I, II et III. Pour compliquer encore un peu plus la situation, les fichiers MPEG existent en deux déclinaisons, MPEG-1 et MPEG-2. Le codage des trois niveaux est presque le même; cependant, les flots de données MPEG-2 ont des taux d’échantillonnage inférieurs pour une meilleure fidélité à une profondeur de bit inférieure. Les fichiers peuvent avoir des taux d’échantillonnage de 32000, 44100 et 48000 Hz pour MPEG-1 et 16000, 22050 et 24000 Hz pour MPEG-2. En fait, il existe une autre déclinaison qui ne peut être utilisée que pour des données niveau III et qui est fréquemment appelée MPEG 2.5. Ce n’est pas un standard officiel, mais un format créé par le Fraunhofer Institut für Integrierte Schaltungen en Allemagne pour des applications à faible taux de donnéees à 8000, 11025 et 12000 Hz. Microsoft a adopté le “standard” MPEG 2.5 dans leur produit NetShow et également dans des fichiers WAVE utilisant le codec NetShow. Les données MPEG peuvent être en stéréo ou en mono et se décompressent à une résolution de 16 bits. La compression MPEG est un algorithme avec perte basé sur un codage fin, qui peut donner des taux de compression élevés sans diminution notable de la qualité. Les taux de compression typiques se situent autour de 10 à 1. SoundApp ne peut traiter les fichiers MPEG audio que sur des Macs avec processeur PowerPC. Enfin, le système audio de Shockwave de Macromedia utilise un codage MPEG-1 niveau III avec un en–tête non standard, que SoundApp ignorera. Ces fichiers portent fréquemment un suffixe “.swa”.

 

PARIS: (.paf) Ce format est le format natif du système d’édition audio numérique PARIS d’Ensoniq. PARIS signifie “Professional Audio Recording Integrated System” (->“Système Professionnel Intégré d’Enregistrement Audio”). Il peut contenir des données 8, 16 et 24 bits en mono ou stéréo; cependant, la plupart des fichiers sont en 16 ou 24 bits mono.

 

son du PSION: (.wve) Ce format consiste en en court en-tête suivi d’échantillons à 8000 Hz codés en log-a. Il est utilisé par le “personal information manager” du PSION série 3 et utilise un suffixe “.WVE”.

 

Films QuickTime: (.mov) C’est le standard d’Apple pour les fichiers multimédia basés sur le temps. Les versions 1.x autorisent les images animées et le son et les versions ultérieures acceptent le texte. QuickTime 2.0 a ajouté des pistes MIDI par l’intermédiaire d’un synthétiseur logiciel ou d’un synthétiseur externe dans les versions 2.5 et ultérieures. QuickTime 2.0 ou plus et l’extension QuickTime Musical Instruments doivent être installés pour pouvoir jouer des fichiers MIDI QuickTime. SoundApp devrait pouvoir jouer et convertir la plupart des formats de compression audio bien que, QuickTime 3.0 ne pouvant pas convertir les MPEG, SoundApp ne le puisse pas non plus.

 

Données brutes de CD Audio: Il s’agit d’échantillons bruts 16 bits, 44.1-kHz, stéréo en notation petit-boutienne utilisée par quelques programmes de création de CD-Rom.

 

VOC Sound Blaster: (.voc) C’est le format utilisé par les cartes Creative Voice SoundBlaster utilisées dans les compatibles IBM et il est optimisé pour ce matériel. Il impose un taux d’échantillonnage multiple d’une horloge interne et n’est pas aussi souple que les autres formats, généraux. Les données peuvent être segmentées et des portions de silence être ajoutées. SoundApp prend en compte ces deux fonctions, mais pas la fonction de bouclage.

 

Sound Designer: Le format du prédécesseur de Sound Designer II chez Digidesign. Contrairement au format de la seconde génération, il n’utilise pas les ressources pour stocker l’information d’en-tête. Il a un large en-tête, bien que la plus grande partie en soit utilisée intérieurement par leur logiciel. Il ne peut contenir que des données mono. La plupart des fichiers sont généralement en 16 bits, 44.1-kHz.

 

Sound Designer II: C’est un format populaire pour l’édition sonore professionnelle sur le Macintosh. Il permet des taux d’échantillonnage quelconques et accepte de multiples canaux et tailles de données. L’information sur les spécificités du son est stockée dans trois ressources 'STR '. Comme pour VOC, 8SVX et WAVE, les échantillons sont codés comme des valeurs signées. Plus d’information concernant ce format peut être obtenue auprès de Digidesign.

 

SoundCap: C’est un format de son Macintosh créé pour être utilisé avec un échantillonneur audio des débuts. La dernière version que j’ai vue du programme est la 4.3, vers 1986. Il était écrit par Mark Zimmer et Tom Hedges de Fractal Software. Il possédait deux versions de base de sons, compressé et non compressé. Les deux types avaient 'FSSD' comme type de fichier et 'FSSC' comme code créateur. Les fichiers non compressés sont juste une série d’octets (8 bits) non signés dans le partie données de la mémoire. Les fichiers compressés stockent l’information de taux d’échantillonnage et une somme de contrôle. Les taux d’échantillonnage sont limités à 5,6, 7,4, 11,1 et 22,2 kHz, et la compression est effectuée avec un algorithme Huffman. Les fichiers SoundCap compressés sont parfois appelés des fichiers HCOM parce que ce sont les quatre premiers caractères du fichier.

 

SoundEdit: C’est le même format que les fichiers SoundCap non compressés pour les sons mono. De plus, il ajoute aux ressources de l’information à propos des couleurs, des étiquettes, des segments de bouclage et du format. Le plus utile pour le jeu est la ressource 'INFO', qui stocke le taux d’échantillonnage, limité aux même quatre valeurs que SoundCap. Les fichiers stéréo sont constitués des canaux droit et gauche stockés dos à dos dans la partie données. La compression MACE-3 et MACE-6 est possible pour les fichiers mono 22 kHz seulement, ce qui est une limitation de SoundEdit. SoundEdit possède aussi des compressions 4:1 et 8:1, mais SoundApp ne reconnaît pas ces algorithmes de compression propriétaires. La ressource 'INFO' précise la longueur de chaque canal, qui peuvent être différentes. SoundEdit est apparu avec l’échantillonneur de sons MacRecorder de Farallon et plus tard Macromedia. SoundEdit Pro et SoundEdit 16 en sont des incarnations plus récentes, et ils possèdent une suite de formats nettement plus large, incluant des échantillonnages jusqu’à 48 kHz et une résolution de 16 bits. Ils se sont affranchis des limitations dues au format d’origine. Actuellement SoundApp ne traite pas les fichiers SoundEdit Pro ou SoundEdit 16.

 

Sun Audio et NeXT: (.au, .snd) Intérieurement, ces deux formats sont identiques. SoundApp ne les différencie par leur type de fichier ou leur suffixe que pour le bénéfice de l’utilisateur. Le format autorise des taux d’échantillonnages quelconques et des sons multi-canaux. Il permet de nombreux codages de son, incluant log-µ, log-a, divers formats linéaires de tailles variables d’échantillons, des échantillons en virgule flottante, des échantillons natifs DSP et la compression G.72x ADPCM. SoundApp traite les log-µ, log-a, 8, 16, 24 et 32 bits signés, 32 et 64 bits virgule flottante, G.721 ADPCM et les deux versions de G.723 ADPCM. Chaque échantillon log-µ est mémorisé sur 8 bits, mais la signification de l’échantillon est différente. Les formats de son normaux utilisent un codage linéaire, tandis que les log-µ et log-a sont logarithmiques. Cela signifie que l’espacement entre les différents niveaux de son devient progressivement plus grand quand les valeurs augmentent. Ce format fournit une amplitude dynamique plus large que des échantillons 8 bits normaux, approximativement équivalent à des échantillons 12 bits. Cependant, il souffre d’un niveau de bruit supérieur à ceux des codages linéaires. Les formats ADPCM G.721, G.723-24  et G.723-40 sont les standards CCITT pour la compression d’échantillons 14 bits à 8000 Hz dans un flot de données à 32, 24 ou 40 kbps. Ces formats compressés ne sont pas très populaires à cause de leur vitesse de décompression extrêmement lente. La plupart des fichiers ont la signature de quatre caractères '.snd', mais il y a quelques fichiers .au, plus anciens, sans en-tête. Ceux-là sont supposés être mono à 8000 Hz codés en log-µ. Un suffixe “.al” forcera le son à être log-a, s’il n’a pas d’en-tête. Le système de téléphone U.S. utilise un codage log-µ pour la numérisation, tandis que les systèmes européens utilisent un codage log-a.

 

Studio Session Instrument: Ce format est principalement utilisé avec Super Studio Session et stocke des instruments numérisés. Il y en a deux types: compressé et non compressé. Les instruments compressés ont le même format que les fichiers SoundCap compressés, et les instruments non compressés sont de même similaires aux fichiers SoundCap non compressés, avec l’addition d’un en-tête de huit octets.

 

System 7 et 'snd ': Les fichiers sons du système 7 sont simplement des ressources 'snd ' de type 1 enregistrées avec un type de fichier 'sfil' et un code créateur 'movr'. Le système 7 fournit l’icône familière pour eux et permet de les jouer depuis le Finder en les double-cliquant. Un 'snd ' est un type de ressource qui consiste en une série de commandes à destination du Sound Manager. En plus de sons numérisés, les ressources 'snd ' peuvent contenir des des sons direct en modulation de fréquence ou basés sur des tables d’ondes. Un nombre quelconque des trois types peuvent être combinés avec des effets variés pour produire des fichiers sons complexes. Le simple Beep est un exemple de 'snd ' non numérisé. Il y a deux types de ressources 'snd ', étonnamment appelés type 1 et type 2. Le Type 1 est le format décrit ci-dessus et il y est fait référence comme le format de son du système. Le Type 2 est pour utiliser avec HyperCard et ne peut contenir qu’un son échantillonné (numérisé). SoundApp peut jouer les deux types mais ne peut convertir que les sons numérisés. Pour plus d’information sur les fichiers 'snd ', consulter Inside Macintosh VI ou Inside Macintosh: Sound. Il serait aussi utile d’être familiarisé avec le Resource Manager. Les échantillons 8 bits sont stockés comme des octets non signés, comme SoundCap/Edit, mais les échantillons 16 bits sont signés, comme AIFF. Des ressources 'snd ' stéréo sont aussi possibles, mais le Sound Manager 3.0 ou ultérieur est nécessaire pour jouer des échantillons 16 bits directement. Les types possibles de compression pour les ressources 'snd ' sont les mêmes types MACE, IMA et log-µ utilisés dans les fichiers AIFF-C.

 

Windows WAVE: (.wav) Ce format a été créé par Microsoft et IBM, et est malheureusement devenu un standard populaire. Comme AU, il permet de fixer un taux d’échantillonnage arbitraire, le nombre de canaux et la taille des échantillons. Il réserve aussi un certain nombre de blocs spécifiques aux applications dans le fichier. Il a pléthore de formats de compression différents. SoundApp ne traite que les sons 8, 16 ou 32 bits compressés log-µ, log-a, GSM, IMA ADPCM, MS ADPCM et MPEG 2.5. IMA et MS ADPCM fournissent un taux de compression de 4 à 1 et GSM approximativement 9,7 à 1. Tous les champs de données et les échantillons 16 bits sont stockés en notation petit-boutienne, comme le nécessitent les processeurs Intel. Tous les autres formats pris en compte par SoundApp utilisent la notation gros-boutienne, ce qui signifie que les octets dominants viennent en premier dans le flot de données.

 

On peut trouver plus d’information sur les divers formats de sons dans la foire aux questions (FAQ) Audio File Formats de Guido van Rossum à <ftp://ftp.cwi.nl/pub/audio/>. Un programme UNIX appelé SOX peut convertir différents formats entre eux. Le code source est fourni et il a été porté sur de nombreuses autres plate-formes. On peut obtenir plus d’information à son propos de la part de son auteur, Lance Norskog, à <mailto:thinman@netcom.com>.

 

Copyright © 1996-1998, Norman Franke.