Construisons ensemble un synthétiseur : La composition des sons

Après un moment d’absence qui m’a permis de réfléchir à l’avenir de ce blog, je reviens vers vous avec un but plus éducatif qu’avant, où je ne faisais que présenter des projets pas faciles à partager.

Je vais décrire petit à petit comment réaliser un synthétiseur musical.

Cette semaine, on commence par quelques généralités sur les sons et les synthétiseurs, c’est indispensable pour savoir de quoi on parle!

C’est quoi un synthé? Vous devez déja le savoir… C’est un appareil qui produit des sons électroniques plus ou moins complexes, ce qui peut servir d’instrument de musique électronique. En général, on utilise des appareils qui fonctionnent selon la norme MIDI. Le MIDI permet de transporter des “évènements” musicaux: Ces évènements sont principalement l’allumage ou extinction d’une note, mais ils peuvent aussi concerner les changements de force des notes (vélocité) ou encore d’autres effets.

On a donc deux classes d’appareils:

  • des “émetteurs” ou “sources” d’évènements MIDI, tels que les claviers maîtres, les surfaces de contrôle ou les séquenceurs
  • des “récepteurs” ou “destinations” d’évènements MIDI, tels que les synthétiseurs ou les expandeurs.


Voyons d’abord quelques définitions:

Clavier maître: c’est le nom qu’on donne à un clavier (ex: piano électronique) dont l’appui sur les touches déclenche la création d’évènements midi. On trouve des claviers qui ne font que ça, donc qui ne savent pas générer de sons par eux mêmes. On trouve aussi des claviers couplés à des expandeurs, qui font… un bruit de piano (ou autre) quand on appuie sur les touches! Mais dans les deux cas, les machines sur lesquelles on pose les doigts sont les mêmes: des claviers maîtres.

Un clavier maître Creative EMU Xboard 25
Un clavier maître Creative EMU Xboard 25
Les claviers maîtres de Davidmusik
Les claviers maîtres de Davidmusik

Surface de contrôle: Ce sont des appareils qui peuvent générer des évènements MIDI à la demande, généralement en pressant des boutons ou en bougeant des curseurs. Ils ne ressemblent pas à des instruments de musique, et servent souvent à modifier les caractéristiques d’un son, ou à commander des évènements particuliers. Les batteries électroniques sont également des surfaces de contrôle. On voit que dans ce domaine, la créativité des concepteurs est sans limite. Ergonomie, Praticité, Compacité, Diversité sont les mots clefs.

Surface de contrôle Korg PadKontrol
Surface de contrôle Korg PadKontrol
Surface de contrôle Numark 4Trak
Surface de contrôle Numark 4Trak

Expandeurs et échantillonneurs: Ces appareils contiennent des banques de sons enregistrés, qui sont joués à la demande selon les évènements MIDI reçus. Le premier échantilloneur a été inventé dans les années 1960 , il était directement couplé à un clavier et utilisait des bandes magnétiques. On appellait ça un Mellotron (youtube) .

Synthétiseurs: Ces appareils jouent des sons non pas enregistrés, mais créés et combinés directement par les composants électroniques de l’appareil. En effet, il est possible de reproduire des sons complexes en combinant différents sons simples de fréquence différentes. C’est de là que vient le mot “synthèse”.

La composition des sons

Voici un exemple. Nous allons prendre la note “la” standard, qui a une fréquence de 440 hertz. Le son le plus simple possible contient cette unique fréquence, avec une forme sinusoïdale. Grâce à Audacity, nous pouvons facilement générer un son sinusoïdal de 440 Hz:

Génération d'un son sinusoïdal avec le menu "Générer" -> "Son"
Génération d’un son sinusoïdal avec le menu “Générer” -> “Son”

Voici à quoi cela ressemble:

Un son sinusoïdal
Un son sinusoïdal

Si on l’écoute, le son est assez désagréable, mais très clair. Il est évident qu’aucun instrument ne sonne comme cela. Ce sont ressemble en fait à la sonnerie d’attente d’un téléphone (et c’est normal, c’est exactement celui là!):

      Sinus à 440 Hz

Si on trace le spectre de ce signal, on obtient le graphique suivant, qui nous dit que toute l’énergie de ce son est concentrée dans la fréquence 440 Hz, ce qui est attendu. La “largeur” de ce signal est dûe à l’enregistrement digital du signal, et à des effets qui sont trop complexes à expliquer pour le moment.

Spectre du signal sinusoïdal
Spectre du signal sinusoïdal

Ce simple exemple a servi à présenter le plus simple des sons: le son sinusoïdal, qui contient une fréquence unique.

Que se passe t il quand on combine des sons?

Essayons, nous allons générer un signal non plus sinusoïdal mais rectangulaire. Appelons encore Audacity:

Génération d'un signal carré avec Audacity
Génération d’un signal carré avec Audacity

Le signal sonore ressemble à ça:

Un signal rectangulaire
Un signal rectangulaire

Ecoutez le attentivement…

      Signal rectangulaire à 440 Hz

C’est moche. On reconnait la fréquence originale, mais elle n’est pas “propre”, des tas de sons plus aigus semblent superposés. Nous allons le confirmer en observant le spectre de ce signal:

Spectre du signal rectangulaire
Spectre du signal rectangulaire

Eh bien c’est confirmé… Le signal contient une grande quantité de fréquences régulièrement espacées. Si la fréquence principale du son est de 440 Hertz, on retrouvera dans ce son tout les multiples impairs: 3×440 = 1320 Hz, 5×440 = 2200 Hz, etc. L’amplitude de chaque fréquence est proportionnelle à 1/multiple, ce qui produit la courbe verte de y=1/x. Ce sont les mathématiques qui nous le disent, on peut calculer ces fréquences et ces amplitudes. Pour les curieux, cela s’appelle la décomposition en série de Fourier. On peut montrer ainsi qu’en fait, chaque son est la superposition d’un grand nombre de fréquences multiples d’une fréquence de base qu’on appelle la fréquence fondamentale. Les signaux superposés de fréquence supérieure s’appellent des harmoniques. L’ensemble des harmoniques est  le spectre d’un son, il caractérise un son au delà de sa fréquence et de sa puissance. Il décrit sa richesse, son timbre, c’est à dire la façon dont il sonne.

Comme “exercice” je vous laisse jouer avec Audacity et les signaux triangulaires. Audacity appelle ça “dent de scie”. Observez la différence avec le son rectangulaire, et le spectre (dans le menu analyse). Vous trouverez un spectre qui ressemble beaucoup au signal rectangulaire, pouvez vous me laisser un commentaire pour me dire ce qui change? (ceux qui savent déja, chut, laissez chercher les autres!)

Il est évident qu’un son “joli” a un spectre bien plus complexe qu’un signal rectangulaire, mais qu’en est il exactement? Observons le son généré par notre piano Clavinova, qui utilise comme son des enregistrements de vrais pianos de concert. Pour commencer, écoutons le “bruit”:

      440 Hz au piano

Bon, un son assez standard de piano. Voyons à quoi cela ressemble “visuellement”:

440 Hz joué au piano, zoom
440 Hz joué au piano, zoom

Première remarque, ça ressemble beaucoup au son sinusoïdal, avec des petites variations “en haut et en bas” qui sont caractéristiques d’harmoniques supplémentaires, et le signal semble varier lentement, en décroissant. Dézoomons complètement pour tout voir:

440 Hz au piano, faible zoom
440 Hz au piano, faible zoom

Surprise! Il y a une grande différence par rapport à tout à l’heure! (je ne parle pas des petites oscillations, qui viennent du mauvais enregistrement que j’ai fait…)

Alors que les sons que nous avions généré avaient bien sûr un volume constant, ici, le son augmente rapidement jusqu’à son maximum, puis décroit lentement. C’est une autre caractéristique très importante des sons de la nature: leur enveloppe. On arrive à modéliser les sons en 4 phases:

  • Attaque (en anglais attack) : c’est la partie où le volume du son augmente.
  • Décroissance (decay) : Une fois que le son a atteint son maximum, il décroit immédiatement
  • Maintien (sustain) : Après sa décroissance, le son se maintient à un niveau constant pendant un certain temps
  • Relâchement (release) : C’est la décroissance finale du son, jusqu’à ce qu’il disparaisse.

Ces quatres étapes forment un modèle “ADSR” (d’après les noms anglais) et permet de décrire l’évolution sonore de tous les sons d’instruments. A noter que pour le son d’un orgue d’église, la période ‘sustain’ se maintient tant que l’organiste garde la touche appuyée. On comprend aussi pourquoi le piano est doté d’une pédale appellée “sustain”: elle permet de faire durer le son en retardant son relâchement.

A quoi ressemble le spectre de ce signal? Eh bien je suis un peu ennuyé, car à cause de la complexité de la Nature et des instruments physiques, ce spectre varie selon la phase du son. Il est  plus riche au début, et se “calme” pendant la phase de relâchement.

Voici tout de même le spectre de la partie la plus forte du son:

Spectre du piano dans sa partie "Maintien"
Spectre du piano dans sa partie “Maintien”

Que remarquez vous? Allez, je donne la solution. Oui, le spectre est complexe. Mais on peut le caractériser:

Il comprend une grande bosse avec des pics, suivie d’un zone creuse, et d’une autre bosse moins haute composée de fréquences aigues (supérieures à 10000 Hz, donc pratiquement inaudibles).

Tous les sons audibles sont ceux de la première bosse: on y remarque une série de “pics”.Faisons un “zoom” sur cette bosse, en choisissant une échelle de fréquence logarithmique:

Spectre du son de piano, vu en échelle horizontale logarithmique
Spectre du son de piano, vu en échelle horizontale logarithmique

le son contient effectivement un “gros pic” à 440 hz, ce qui est normal, c’est sa fréquence principale. Il contient aussi un pic plus réduit à la fréquence triple de 1320 Hz (harmonique 3). Mais, et c’est important, il contient aussi des harmoniques pairs (harmonique 2 à 880 Hz, H4 à 1760 Hz, etc.

Voici la liste des pics présents dans ce signal, je les ai relevés avec Audacity:

  • 440 Hz, fondamental
  • 885 Hz = Harmonique 2
  • 1327 Hz =  ” 3
  • 1767 Hz  =  ” 4
  • 2212 Hz = ” 5
  • 2688 Hz = ” 6
  • 3141 Hz = ” 7
  • 3602 Hz = ” 8,1
  • 4084 Hz = ” 9,2
  • 4570 Hz = ” 10,3
  • 5053 Hz = ” 11,5
  • 5552 Hz = ” 12,6
  • 6605 Hz = ” 15

Il y a donc beaucoup d’harmoniques, autant de pairs que d’impairs, jusqu’à un ordre avancé. Il y a aussi des fréquences qui ne correspondent pas à des harmoniques… Tout cela contribue à faire d’un piano un piano. C’est une signature du son…

Et maintenant, que se passerait il si je générais un son qui contienne toutes ces fréquences avec les bonnes amplitudes (pour ceux qui suivent: et phases!) ? Pour faire simple, je ne prends QUE les fréquences dont l’amplitude est forte, et je néglige totalement toutes les autres… Comme ça, je peux faire cette génération… Dans une machine!

Eh bien oui vous le devinez : on retrouve un son qui ressemble à celui d’un piano! Et c’est comme ça que sont conçus les synthétiseurs!

Un synthétiseur est donc une machine qui reproduit de manière simplifiée les sons d’un véritable instrument en assemblant uniquement les fréquences “caractéristiques” qui composent cet instrument, et en reproduisant aussi une enveloppe.

Selon la qualité du synthétiseur, on peut atteindre une qualité proche des sons naturels. Mais on peut aussi combiner des sons autrement, et faire preuve de créativité. C’est ce que nous verrons dans le prochain article!

A bientôt!

En complément: quelques détails sur le timbre, issus d’un TPE, qui confirme que les sons d’un piano ne contiennent pas que des harmoniques.