Le son et sa notation

La conscience du musicien entre musique et technologie a toujours été très étroites. Au XIX siècle, les orgues de Winchester rugissaient comme des lions sous la baguette de Rossini, Berlioz et Wagner accusés de les avoir tonné comme des canons de la grande armée. Curieusement, au XX° siècle, les titres de tout repos ne sont désormais mesuré qu'en fonction de leur conception libérale et mercantile. A en croire certains manuels d'histoire, le développement des instruments de musiques se termine par le saxophone. Or les progrès de la technologie ont développé la musique du XX° siècle, dans trois secteurs : technique de stockage de l'information, télécommunications, développement des ordinateurs.

La notion d'écoute est très vaste; il s'y mélange plusieurs registres. Elle est alimenté par la mémoire, qui permet d'accumuler de reconnaître et de comparer. Elle est inspirée par le désir, la sensibilité, le talent, la motivation, l'envie, qui viennent lui donner du sens. L'imprégnation passive est la première étape de l'enfance. L'environnement sonore, de la berceuse maternelle et des chants du villages à la ville moderne, des récepteurs radios, TV, informatique, imprègne les oreilles et la sensibilité de l'enfant. L'écoute plus tard peut devenir plus dirigée. L'auditeur va vers la musique. C'est un choix actif, le désir de se former une culture musicale. L'écoute devient plus précise, il détaille, reconnaît les formes musicales, leur donne un nom et s'intéresse aux enjeux qu'elle contient.

Cependant, les sons musicaux ont un aspect concret et matériel :

  • La durée : qui correspond à l'étalement du son dans le temps (long / bref).
  • La hauteur : qui est en relation directe avec les fréquences des vibrations (aigu / grave).
  • L'intensité : qui est en rapport avec les nuances et la dynamique de la musique ( doux / fort).
  • Le timbre : qui est un paramètre mixte lié à la personnalité de chaque musicien et la manufacture de chaque instrument.

On considère volontiers, en occident que toute musique passe par l'écriture. Le vocabulaire technique dont on se sert pour décrire la musique est imprégné de l'idée d'écriture. Des notions comme "vertical", "hauteur", "horizontal" sont à la base des notions graphiques et non sonores. Les musiques non-écrites appartiennent au monde de l'oral : écouter / imiter / mémoriser / jouer. Elles sont basées sur une culture de l'oreille. Appartenant au tradition, elles sont des oeuvres collectives; il n'y a pas d'auteur à proprement parler. Tributaire d'une stabilité sociale, cette musique est volatile face au système sociaux en voie de disparition.

La notation s'est constitué en plusieurs étapes. La chironomie est un premier système de communication d'une musique fixée : il s'agit d'une direction gestuelle qui indiquent non seulement le tempo, mais aussi le mouvement mélodique. Son existence est probable chez les numériens, les égyptiens et se développe en grèce antique, dans l'église byzantine et latine. C'est à la fin du VIII° siècle qu'apparaissent en occident les neumes, sorte de sténographie musicale, qui expriment le mouvement et la continuité de figures mélodiques. Enrichi par une notation alphabétique des hauteurs encore en usage dans les pays anglo-germaniques.

A - B - C - D - E - F - G - (H)

la / si / do / ré / mi / fa / sol / (Si b)

Dès le VI° siècle, en Chine, la tablature indique la position des doigts sur l'instrument, abrégés sous forme de lettres, chiffres et symbole divers. En occident, du XIV° au XVII° siècle, une grande partie de la musique est notée en tablature. Les principes de notation musicale subissent un important changement quand au XI° siècle, Guy d'Arezzo introduit la portée. Avant de se stabiliser dans la forme que nous connaissons, la notation musicale subit encore une longue évolution au cours des siècles. Certains compositeurs de musique contemporaine ont introduit de nouvelles notations, sans qu'aucune d'elles s'impose de manière généralisé. Dans la partition de Aus den Sieben Tagen de Stockhausen, on trouve comme unique indication : " joue une vibration au rythme de tes plus petites particules", cité par Siron, Aspects de la musique contemporaine.

La mutation de la notation

Lors de représentation musicale acoustique, concert symphonique, de jazz, traditionnel... l'auditeur demeure passif. Par opposition, une audition d'œuvre electro-acoustique, musique électrifiée, électronique, peut être transformée. En effet dans ce cas, l'auditeur peut à chaque moment intervenir sur certaine particularité du son. Le volume varie la puissance sonore, le panoramique (balance) la répartition du son dans l'espace, l'égalisation (la tonalité) sur la mise en avant d'un registre sonore. En ce sens, l'auditeur participe à l'interprétation de l'oeuvre. Dans un sens plus large, un studio d'enregistrement par ses outils de traitements sonores sophistiqués est un instrument de musique qui participe à l'élaboration de la composition.

Le support écrit de la notation traditionnelle a rencontré au cours du XX° siècle cet autre support : l'enregistrement. Ce dernier conserve, rejoue des sons sans l'aide de musiciens. L'enregistrement est un retour vers une certaine oralité. L'écoute est ouvertes à de nombreux styles de musique. L'imitation est introduite par des fragments d'archives sonores (samples, échantillons). La mémoire est le support de stockage informatique. Jouer est enfin la possibilité de couper, coller, modifier l'imitation. La transition générationnelle musicale par la démocratisation des outils informatiques et la culture du Mass Media tend vers cette oralité.

Cette venue de la technologie musicale et multimédia interactive bouleverse les habitudes du compositeur. Il devient tour à tour technicien du son, architecte acoustique et programmeur interactif d'identité sonore et visuelle. Le compositeur est par définition l'architecte d'une structure sonore. Il élabore la structure du terrain (les musiciens), choisit les matériaux (les instruments), dresse les plans (la composition), et intègre son oeuvre dans des choix esthétiques de l'urbanisme musicale (la diffusion).

Le choix des musiciens est, dans la forme la plus classique du terme, un exécutant dont les talents sont de maîtriser un instrument, une bonne lecture du solfège, un sens de l'interprétation et de l'improvisation. Mais le musicien peut être aussi un Dj dont le choix des oeuvres diffusés, le montage des transitions sonores, la ré-interprétation d'un titre ou de plusieurs simultanément et un solide sens de l'animation dance floor sont autant de savoir faire. Enfin, la réalité des capteurs de mouvements, des webcams, des joysticks et autres pads permettent à toute personne de produire des sons et de les organiser. Dans un mouvement de création collective, ces musiciens jouent avec l'identité sonore modulable définie par le compositeur.

Les matériaux sonores sont les instruments. Du son des pas foulant le sol des premiers musiciens-danseurs de nos ancêtres, au dernier instruments complexes par leur modularité interactive électronique et informatique, synthétiseurs, sampleurs et programmes virtuels, l'œuvre musicale est définie souvent par une couleur associée à l'addition du timbre de chaque instruments.

Interaction Homme - Machine (IHM)

De nombreux cas de figures d'apprenants confondent le sample ou échantillon et le protocole de communication MIDI.

D'une façon générale, un signal audio est un échantillon d'un enregistrement sonore naturel. Il est la réplique exacte de la source sonore. Celà peut être toute forme de son, vocale, instrumentale classique, animale, éléments naturels, feu, eau, terre, air, matériaux, pont, sous-marin, travail mécanique... Mais ce signal peut être créer d'une façon artificielle grâce à des instruments électroniques de type oscillateurs. Cela ne reste qu'un son qu'il est possible de lire et d'arrêter grâce à un magnétophone ou lecteur CD, MP3, OGG, etc.

A ce titre, le protocole MIDI, Musical Instrument Digital Interface, est une interface aux fonctions multiples. Les plus simples commandes sont la lecture et l'arrêt d'un lecteur de son. Ce protocole numérique peut, de ce fait, tout aussi bien piloter une cafetière à commande numérique. Ce protocole de communication est lié cependant au domaine des outils numériques du spectacle. Au fur et à mesure de son développement, basiquement destiné à piloter des synthétiseurs, échantillonneurs, il communiquera avec les consoles de mixages numériques et les jeux d'orgues (consoles de jeux de lumières). Depuis quelques années, le MIDI pilote les évènements vidéos, la diffusion , les commandes de transitions et d'effets.

Une représentation du sens classique de l'écriture musicale, portée à notre ère numérique, peut par image présenter le MIDI comme une partition, un chef d'orchestre et l'échantillonneur comme l'orchestre et ses composantes, sections de cuivres, cordes, bois, sections de rossignols, de canidés, etc.

La suite de cette catégorie d'article "Concept Audio et MIDI" utilise le logiciel PureData comme application pratique afin de mettre en exergue l'inter-opérabilité, l'interactivité entre ces deux principes de fonctionnements. Il est disponible sur les plateformes Linux, Windows et Mac OS et est distribué gratuitement via le web sous licence libre.

Pure Data (pd) est un langage de programmation graphique pour la création musicale et multimédia en temps réel. Il est conçu de façon modulaire. Chaque module est développé par des programmeurs tiers et est de ce fait déjà compilé. Ces modules sont assemblés par et suivant les besoins de l'utilisateur de PureData. Les modifications des modules se font en temps réels. Cependant, il est à regretter une confusion dans l'assemblage et dans la gestion de l'ordre des opérations des modules pour les projets ambitieux. Ces modules se regroupent alors par patch. Le patch est un sous ensemble de modules. Un patch devient alors à son tour un module.

PureData est l'application principale, le coeur d'un langage de programmation graphique auquel se sont ajoutées d'autres applications en greffons (plug-ins) de même présentation et de fonctionnement. Pour les plus connus, on cite GEM pour tout ce qui est l'environnement 3D et PiDiP pour la vidéo.

La simulation sonore électronique

Le plus simple signal audio généré électroniquement est le son entrecoupé d'attente de la tonalité du téléphone.

La tonalité dans le sens classique de l'harmonie musicale est une base de hauteur de note. Sur cette assise, par exemple DO, s'en suit une série harmonique, par exemple, la fameuse suite de la gamme majeure (do, re, mi, fa, sol, la , si, do). Dans le cadre, du signal audio du téléphone en attente du correspondant, la tonalité est un LA. Ce "LA", dit LA3, se situe au troisième octave du piano. Il est la hauteur de son référente à l'accordage d'un orchestre. Sa correspondance physique en frequence est exprimée en Hertz. Le LA3 de l'écriture classique a pour équivalence hertzienne 440 Hz.

Si le hautbois indique la tonalité de référence pour l'accordage d'un orchestre, le son diffusé par cet instrument peut se différencier du son d'un piano, d'une harpe, d'un violon, etc. Cette référence auditive s'appelle le timbre. Le timbre d'un son est une suite complexe de vibration d'air dans notre environnement avant d'être interprété par notre cerveau, via notre microphone naturel, le tympan. Le timbre de la tonalité du téléphone est la plus simple des vibrations. Son timbre est donc de structure simplissime.

Généré électriquement par un oscillateur, la forme d'onde du signal du timbre du téléphone est une courbe sinusoïdale. Sa frequence est un battement de 440 oscillations par seconde, les 440 Hz. Sa hauteur tonale est donc un LA3. L'application PureData nous permet de recréer ce son.

Par le menu File, vous accédez à un nouveau fichier que vous pouvez enregistrer et nommer RingPhone. Sur la page blanche, vous insérez un objet par le menu put. Cet objet, nous allons le définir comme oscillateur, c'est à dire un générateur de son dont l'oscillation est de type sinusoïdale. Cet objet est nommé osc, nous ajoutons un espace et sa référence en Hertz, 440. Notre premier objet est défini grâce à osc~ 440.

L'objet osc 0.05 ).

Notre oscillation sinusoïdale de 440 Hz est amplifiée par 0.05, mais nous ne l'entendons toujours pas. Relions ces deux objets par une liaison, tel un câble virtuel. Sur chaque case objet, vous apercevez trois empatements, en glissant la souris sur l'empatement du premier objet situé en sa partie inférieure, le curseur de votre souris se transforme en rond. Cliquez et déposez votre câble dans l'embranchement gauche du second objet. Les deux objets sont ainsi reliés, branchés ensemble. mais le son n'est toujours pas présent. Nous allons devoir pour cela simuler les enceintes par l'objet dac~, digital audio converter, convertisseur audio numérique. Enfin câblons le tout.

Nous terminons notre montage par des boutons de marche et arrêt. Par le menu put, nous insérons une boîte message. Un point-virgule, ; , indique que le message va être assigné, routé vers un ensemble. Or nous voulons que la boîte message agisse sur l'ensemble de notre construction, en l'occurrence PureData. Nous assignons donc la boîte message ; pd. Afin que le signal numérique du processeur de PureData, Digital Signal Processor, DSP, se mette en marche ou en arrêt, nous utilisons la fonction binaire, où 0 signifie l'arrêt, le courant ne passe pas et 1 la lecture ou le courant passe. Notre boîte message est donc définie par ; pd dsp 1 pour lecture et la seconde boîte message ; pd dsp 0 pour la position arrêt.

Le point-virgule adresse le message vers le signal numérique du processeur (Digital Signal Processor) de PureData ( ; pd dsp ) en lui indiquant si celui-ci est en marche ou en arrêt, position 1 ou 0.

En résumé :

osc.gif

Une représentation graphique du son

Un synthétiseur se compose de différents modules. Le module clavier transmet la hauteur de note, la fréquence désirée, au module générateur de son, l'oscillateur. Ce dernier est amplifié par le module amplificateur. Ce signal ensuite route vers un limiteur de fréquence, le module filtre etc. Mais avant d'aller plus loin, nous allons représenter le son de notre synthétiseur simplissime par une représentation graphique via un oscilloscope. Celle-ci possède deux axes, un horizontal pour les unités de temps et un axe vertical pour les unités de puissance d'amplification. Dans PureData, continuons l'exercice précédent appelé RingPhone en y incorporant un oscilloscope.

Dans les boîtes messages de lecture et de stop, nous allons incorporer un déclenchement et un arrêt d'une impulsion métrée. La syntaxe de cette impulsion est metro pour métronome. Dans le précédent objet message | ; pd dsp 1 | du bouton marche, nous ajoutons le déclenchement de l'impulsion. Notre message devient | ; pd dsp 1 ; metro 1 |. De ce fait l'objet message | ; pd dsp 0 | du bouton arrêt devient | ; pd dsp 0 ; metro 0 |.

Pour représenter l'écran de notre oscilloscope, nous incorporons dans notre projet l'objet array et nous le nommons ecran. Dans ce rectangle apparaitra visuellement notre signal audio. Pour cela nous devons faire la liaison entre l'oscillateur, notre générateur de son, et l'écran de l'oscilloscope. Mais fabriquons d'abord la cadence d'affichage de notre oscilloscope.

On sait que lors de l'activation de notre bouton lecture, nous envoyons désormais un message vers metro dont la valeur est 1 afin qu'il s'active. Nous allons donc créer l'objet message metro. Pour cela comme à l'accoutumé, via le menu put, insérez l'objet message et nommez le metro. Afin que ce nouvel élément reçoive la commande metro des boutons de lecture et d'arrêt, nous lui ajoutons la lettre r pour receive. Le contenu de notre boite message s'illustre donc de | r metro |. Nous savons désormais que les boutons vont déclencher l'arrêt ou la lecture de l'objet metro. Hors celui ci est une série d'impulsions dans un temps dont les cadences peuvent arriver toutes les x millisecondes.

Sous le message précédent | r metro | , nous insérons un autre objet message que nous nommons metro. On associe à cet objet une valeur en d'impulsions en millisecondes, dans notre cas 100 millisecondes, soit 0, 1 seconde. Cette boîte message s'enrichit donc de | metro 100 | . Il apparaitra dans notre écran de l'oscilloscope, toutes les 0.1 seconde, les oscillations du signal audio. Un cable relie la boite de reception metro celle de l'impulsion.

Pour envoyer la cadence, et le signal de l'oscillateur ou de l'amplificateur vers l'écran de l'oscillateur, nous créons notre dernière boîte message celle de l'envoi des données perçues vers notre écran nommé ecran. Cette boîte s'enrichit de la syntaxe | tabwrite~ ecran |.

oscgraph.gif

Les bases du synthétiseur

Nous allons élaborer notre construction nommé RingPhone. Ce synthétiseur sera toujours "monophonique", mais la possibilité de jouer sur la hauteur ou la fréquence va y être ajouté. De même, un nouvel oscillateur couplé à celui existant, dont sa forme d'onde est différente, apportera du grain à notre son. Agir sur les niveaux de volume de chaque oscillateur, en les mixant, apportera des variations de timbre. L'oscillographe est toujours présent pour nous montrer nos évolutions de façon graphique.

Tout d'abord, l'insertion d'une boite, nommée number par le menu put, permet d'émettre des valeurs entières relatives. Ces nombres entiers ont pour valeur 0, 1, 2, x...y, et les nombres entiers relatifs, -y...-x, -2, -1, 0, 1, 2, x...y... C'est dans ce message number que nous allons assigner la hauteur de note exprimée en fréquence hertzienne.

Dans nos exemples précédents, nous obtenions une onde pure, sinusoïdale. Or, nous savons qu'un instrument de musique produit un son de base, une tonalité. Mais la qualité de la manufacture cré la particularité sonore de chaque instrument. Cette base tonale, la note émise, est accompagnée d'une multitude de fréquences. Sans aller plus loin sur les fréquences harmoniques générées, nous nous arrêtons à la fréquence la plus présente dans cette grappe des hauteurs diffusées, celle de l'octave. Effectivement, l'octave n'est que la valeur de la note émise multipliée par deux. Le La de l'accordage, 440 Hz, à donc pour valeur relative à son octave celle de 880 Hz.

Pour multiplier la fréquence de la tonalité par deux, nous insérons une boîte objet dans laquelle nous mettons notre formule arithmétique * pour multiplier, l'ajout d'un espace, et la valeur deux. Au niveau du routage, la première fréquence est liée à la forme sinusoïdale et également à la boîte de multiplication. Cette dernière fonction envoie le résultat du calcul sur une boîte message qui elle-même dirige la hauteur de son calculée vers le second oscilllateur en forme de dent de scie, phasor ~. Nous obtenons ainsi deux oscillateurs branchés en parallèle, dont le premier sort la frequence tonale et le second son rapport de frequence à l'octave.

Vous pouvez prolonger l'exercice en incorporant d'autres oscillateurs, autant que vous le souhaitez, branchés en parallèle ou/et en série.

Afin de faire varier notre timbre, nous allons assigner à chaque oscillateur un amplificateur. Le but de l'opération est de prendre une valeur minimale modulable par un mouvement de glisser-déposer de la souris pour changer ses valeurs. Les valeurs ainsi éditées sont envoyées vers un coefficient multiplicateur qui envoie le résultat à l'objet amplificateur.

La sortie de l'amplificateur va directement attaquer les enceintes. Ces mêmes valeurs vont alimenter notre oscillographe afin de visualiser le son émis.

2oscgraph.gif

Un pas vers l'échantillonneur

Dans les précédents chapitres de cette catégorie, Concept Audio et Midi, l'échantillon d'un son a été décrit comme un enregistrement d'une source sonore stockée sous forme d'un fichier numérisé. Mais la conversion de cette source sonore en fichier peut apparaître sous différentes formes de qualités et de formats.

Ce fichier digital, cet échantillon de son est archivé sur un support de stockage de type informatique, disque dur, clef usb, disque FireWire, voire CD-Rom ou DVD-Rom... Tous ces supports sont décrit comme ROM, pour mémoire morte. Ainsi, gît notre fichier. Celui-ci doit être activé pour le mettre en mouvement. Pour cela, il est appelé afin qu'il se stocke dans la RAM, dîte mémoire vive. Dans cette espace, notre fichier n'attend que l'ordre d'agir dans un ou des comportements définis par l'utilisateur.

Mais qu'est ce qu'un échantillon de son numérisé ?

Une acquisition de son se pratique via une carte son. C'est en effet, elle qui va convertir la source d'entrée en fichier numérique. Sur les sites marchands, nous nous trouvons face à une multitude de cartes de différentes performances. Leurs caractéristiques se révèlent importantes tout comme leurs résolutions de l'échantillonnage.

Reprenons notre cas du LA 3, la hauteur tonale qui permet l'accordage d'un orchestre. Nous savons désormais que cette référence a une oscillation, un battement de 440 oscillations par seconde, les fameux 440 Hz. Un échantillon est une découpe, une division de cette oscillation sur une période de une seconde, elle aussi.

La référence commerciale, c'est à dire celle du CD-Audio que l'on trouve dans le commerce, est une résolution de la découpe en 44 110 points dans la seconde, exprimé également en Hertz, ici 44.1 KHz. Il a été jugé que cette résolution de découpage est suffisante pour une écoute d'un équipement domestique. Si l'on divise par deux la résolution de l'échantillonnage, 22 050 Hz, la définition du son est de qualité inférieure. Cette qualité répond bien à l'enregistrement de la voix lors de conférences. Mais qui dit une résolution moindre, veut, bien sûr, dire moins de points à calculer pour l'ordinateur et par conséquence un fichier audio allégé en terme de poid, exprimé en Octet.

Cette découpe à la seconde, donc sur une ligne de temps basé sur l'abscisse, se couple d'une autre découpe celle de l'ordonnée dont la correspondance est l'amplitude (le tempérament doux à fort). Cette division de la hauteur est exprimée en bit. Un bit est l'unité de base de l'informatique. Le bit ne peut être représenté que par 0, le courant ne passe pas, valeur nulle, ou soit 1, le courant passe, valeur active, d'ou l'appellation de calcul binaire. Les bits sont regroupés en un ensemble de 8 unités qui correspondent à l'Octet, en langue latine, et au Byte en langue anglo-saxonne.

Le calcul binaire fera l'objet d'un autre article. Mais sachez qu'un octet a pour valeurs décimales un espace de 0 à 256 valeurs, et que deux octets, soit 16 bits, des valeurs décimales d'un espaces de 0 à 65 535. La référence de codage du CD-Audio est de 44 100 Hz en abscisse et de 16 bits en ordonnées. L'amplitude de cette qualité audio est donc divisé en 65 536 points.

En références, la qualité audio d'un montage vidéo est de 48 000 Hz / 16 bits et celle d'un studio d'enregistrement standard de 96 000 Hz / 24 bits. Les qualités extrêmes d'acquisition numériques de son dans certains studios d'enregistrement montent à la hauteur de 192 KHz / 24 Bits.

Mais notre équipement domestique est maintenant doté de fichiers audionumériques compressés. Grâce à l'accès Internet, il a fallu résoudre le poids des fichiers audio trop gourmands en bande passante sur le réseau. Il s'en est passé de même pour les fichiers vidéo dont les besoins sont gargantuesques. Nous pouvons désormais via notre lecteur MP3, écouter, télécharger une musique de qualité confortable. Dans le cadre d'une écoute et d'un travail sur le son, l'emploi du fichier non-compressé est indiscutable. Enfin, les boîtes de nuits n'étant pas conçues comme des auditoriums, une diffusion audio en format compressé n'altère en rien l'écoute.

Notre synthétiseur va à présent se doter d'un lecteur de son. Nous allons l'enrichir d'une fonction d'échantillonneur.

sampleoscgraph.gif