La parole : physiologie
-Notions élémentaires
de physiologie de la parole
L’énergie nécessaire
à la production de la parole est fournie par le courant d’air expulsé par
les poumons. L’air ainsi projeté met en mouvement les cordes vocales -
contenues dans le larynx - qui s’ouvrent et se ferment rapidement. Le
courant d’air interrompu par le rapprochement des cordes, puis libéré par
leur éloignement se transforme en une succession de bouffées chargées d’énergie
acoustique, grâce à l’effet de valve provoqué par le larynx, et qui donnent
naissance à la voix. C’est donc au niveau du larynx que se produit la phonation
qui n’est pas une capacité réservée aux êtres humains. Le bêlement du
mouton, par exemple, est une manifestation de phonation. La parole, en revanche,
est une caractéristique humaine grâce aux organes situés au-dessus du larynx,
le pharynx, les fosses nasales, et la cavité buccale qui comporte tous
les éléments nécessaires à l’articulation, voile du palais, palais dur, mâchoire,
dents, langue. lèvres. Sans ce dernier étage, nous ne pourrions produire que
des sons voyelles, les consonnes naissant de l’obstruction plus ou moins
importante de l’air par les obstacles constitués, selon la consonne produite,
par les lèvres (labiales, /p/, /b/), le dos (palatales, /k/,
/g/) ou la pointe (dentales, /t/, /d/) de la langue. Pour
mieux comprendre le processus de production de la parole il est nécessaire de
suivre :
- le parcours de
l’air généré par les poumons au niveau subglottal (par référence à la
glotte qui est l’ouverture entre les cordes vocales),
- puis sa
transformation en énergie acoustique au niveau du larynx,
- l’évolution de la
qualité du son produit consécutive à la modification de la forme du pharynx,
- enfin la production
ultime, les sons de parole, dus à l’action finale du voile du palais, de la
langue et des lèvres qui participent au changement de forme du circuit.
La
fonction respiratoire dans l’acte de parole
Le cycle respiratoire
-inspiration-expiration- d’un individu silencieux et au repos, se compose de
deux phases de durée sensiblement égale, d’environ 2,5 secondes, soit 12
cycles par minute.
L’acte de parole
bouleverse considérablement ce schéma puisque le temps d’inspiration peut être
réduit à 1/4 de seconde et l’expiration atteindre 40 secondes en fonction de
la longueur de la phrase et aussi en fonction de l’état émotionnel du
locuteur.
Le premier acte du
processus de parole est donc l’inspiration.
Un signal du centre
nerveux qui contrôle la respiration (dans le tronc cérébral) fait se
contracter le muscle intercostal externe qui soulève et écarte la cage
thoracique en même temps que le diaphragme se déplace vers le bas pour accroître
l’espace pleural (entre les poumons et les côtes). L’extension des poumons
entraîne une réduction de la pression de l’air pulmonaire et l’air pénètre
à l’intérieur des poumons afin de rétablir l’équilibre avec la pression
atmosphérique. L’élasticité des poumons fournit une partie importante de
l’énergie qui va permettre la phonation, en expulsant l’air, par la trachée,
en direction du larynx, mais l’intervention de plusieurs muscles est aussi nécessaire
pour canaliser le débit de l’air. En effet, en fonction de la longueur - donc
de la durée - de la phrase à produire, le muscle intercostal externe, actif
durant l’inspiration, est également impliqué en phase expiratoire en
ralentissant l’expiration due à l’élasticité du tissu pulmonaire.
Son action de frein s’exerce, pour maintenir constante la pression d’air
pulmonaire, jusqu’à ce que le relais soit pris par un muscle intercostal
expirateur. Ce relais est rendu nécessaire par la fin de l’action expiratoire
engendrée par la force élastique du poumon, et permet le maintien de la
pression utile à la poursuite du discours.
Les muscles abdominaux
interviennent également en fin du processus expiratoire. On peut, en
simplifiant à l’extrême, résumer ainsi un cycle respiratoire couvrant la
production d’une phrase.
-
Inspiration,
- Expiration (la très forte pression
exercée par la force élastique du tissu pulmonaire en début d’expiration
est contrecarrée par l’action de frein de certains muscles intercostaux ;
cette action décroît graduellement au fur et à mesure que décroît la force
élastique du poumon. Lorsque cette force va devenir nulle, certains muscles
expirateurs entrent en jeu et, en rabaissant la cage thoracique, vont comprimer
les poumons et poursuivre l’expiration, avec le concours des muscles
abdominaux. Le processus de régulation de la respiration pendant la parole,
bien que totalement inconscient, met en jeu une interaction extrêmement
complexe de plusieurs muscles qui permettent le maintien d’une pression
constante de l’air nécessaire à la production de la parole. La durée de
l’expiration contrôlée musculairement est donc conditionnée
linguistiquement, en fonction des segments de discours programmés. Il est
clair que la syntaxe de la langue utilisée est l’un des paramètres
importants - mais non le seul - du fonctionnement respiratoire pendant la
parole. La mesure de la pression de l’air pulmonaire montre une certaine
stabilité pendant la durée d’une expiration parlée, mais l’accentuation
de syllabes peut entraîner des variations. Aux paramètres purement
linguistiques impliqués dans la gestion respiratoire d’un individu pendant le
discours parlé s’ajoutent, bien entendu, les paramètres révélateurs de son
état émotionnel du moment dont la traduction par son interlocuteur est
essentielle pour une communication satisfaisante. L’accélération du débit
ou, au contraire, la quasi-mutité, sous le coup d’une émotion forte, sont étroitement
corrélés à la gestion respiratoire.
En
résumé :
-
La respiration est la fonction de base de la production de parole.
-
La respiration parlée est conditionnée par les caractéristiques de la
langue utilisée (syntaxiques, accentuelles, prosodiques) ce qui implique une
gestion de la respiration particulière à chaque langue, et par l'état émotionnel
du locuteur.
La
fonction du larynx dans la parole
Si l’air pulmonaire
constitue la matière première de la production de parole, c’est le larynx
qui en assure le premier niveau de transformation en vibrations audibles
(phonation) génératrices de l’énergie sonore qui évoluera au cours de sa
traversée du tractus vocal. Le larynx est un ensemble complexe de onze pièces
cartilagineuses reliées par des ligaments et des membranes, à l’intérieur
duquel se trouvent les cordes vocales. Sa situation, dans la partie supérieure
de la trachée, est aisément repérable puisque sa partie antérieure, le
cartilage thyroïde correspond à la proéminence connue sous le nom de pomme
d’Adam. Le mouvement de ce cartilage, combiné à celui de deux autres, le
cricoïde et l’aryténoïde, participe à la modulation de la phonation sous
l’action des muscles laryngés. Les cordes vocales sont deux bandes de tissu
musculaire d’une grande flexibilité, dont la longueur, la tension, l’épaisseur,
varient en permanence sous l’interaction de plusieurs muscles laryngés.
Plusieurs théories visant à expliquer la vibration des cordes vocales ont été
avancées. Il semble admis que les cordes s’écartent sous la pression de
l’air pulmonaire et se referment sous l’influence de deux forces différentes,
l’une exercée par leur propre élasticité, l’autre par l’effet de
succion causé par la baisse de pression au niveau de la glotte lorsque l’air
pulmonaire est expulsé par un orifice laryngé rétréci.
L’effet
principal exercé par le larynx est donc la production de vibrations sonores.
Ces vibrations - qui produisent le voisement - caractérisent les sons voyelles
et certains sons consonnes dits voisés, comme /b/, /d/, /z/. Pour
ressentir physiquement le voisement il suffit de prononcer une voyelle ou
l’une des consonnes mentionnées en se bouchant les oreilles. La prononciation
alternée de /z/ et de /s/ fait clairement ressentir
l’opposition voisé - non voisé. La propriété acoustique correspondant au
trait voisé se caractérise par la présence d’énergie dans la partie basse
du spectre. Pendant la phonation les cordes vocales s’ouvrent et se ferment
rapidement d’une manière quasi périodique. On appelle fréquence
d’un son le nombre de cycles (ouverture-fermeture) produits en une seconde. La
fréquence fondamentale (notée F0) est la fréquence de
base (la plus lente) d’un son complexe. En moyenne la fréquence fondamentale
d’une voix d’homme adulte est de 100 à 120 cycles par seconde - ou hertz -
celle d’une femme de 200 à 220 hertz. Une voix d’homme très grave peut
avoir une F0 de 60 hertz, une voix aiguë de femme ou d’enfant peut
avoir une F0 de 330 à 350 hertz. Ce sont les variations
de la fréquence fondamentale, produites au niveau du larynx par l’action des
cordes vocales qui déterminent notre perception de la hauteur ou pitch,
et sont l’élément principal de transmission de l’intonation, de
l’accentuation, du rythme de la parole et des tons pour les langues à tons
comme le chinois (les mêmes sons, voyelles, consonnes + voyelles, prennent des
sens différents quand la fréquence fondamentale varie).
En résumé :
- Le larynx par
l’intermédiaire des cordes vocales génère l’énergie qui constitue la
base sonore de la parole (Fréquence fondamentale F0).
- Le larynx module la
fréquence fondamentale et participe à l’expression linguistique
(accentuation, intonations indiquant la question ou l’affirmation, tons
portant des différences sémantiques, délimitation des unités
significatives...) et affective (intonation émotionnelle, altération du
débit provoqué par l’émotion...).
La
fonction supra-laryngienne dans la parole
Après son passage
entre les cordes vocales l’air chargé d’énergie sonore pénètre dans le pharynx,
long tube constitué de cartilages et de muscles, qui relie la cavité
laryngienne à la partie postérieure des cavités orale et nasale. C’est cet
ensemble qui constitue la voie supra-laryngienne et qui, grâce
aux modifications de sa configuration, agit comme un filtre acoustique et une
chambre de résonance : la configuration du parcours est modifiée grâce
à l’allongement, au raccourcissement, au rétrécissement ou à la dilatation
du pharynx, à l’abaissement ou au relèvement du voile du palais, à
l’obstruction plus ou moins importante ou à l’absence d’obstruction
offerte au passage de l’air dans la cavité buccale par la position de la
langue ou des lèvres. Au cours du trajet, la composition acoustique des bouffées
d’air sonore est altérée par filtrage de certaines fréquences (c’est la
fonction filtre acoustique de la voie supra-laryngienne), et par renforcement de
certaines autres (c’est la fonction chambre de résonance de la voie
supra-laryngienne). Le voile du palais est une bande de tissu musculaire
située au fond de la cavité buccale dans sa partie supérieure et dont une
partie, la luette, est visible à l’aide d’un miroir. Au cours de la
respiration normale le voile du palais est abaissé pour permettre la
circulation de l’air par le nez. Au cours de la parole il peut adopter trois
positions qui conditionnent la qualité des sons produits :
- En position relevée
contre le mur naso-pharyngien, il obture l’accès aux fosses nasales et
l’air ne peut passer par la bouche ; les sons produits, dits sons oraux, sont
les voyelles et la plupart des consonnes.
- En position abaissée,
si la bouche est ouverte, il permet une répartition du passage de l’air par
le nez et par la bouche, les sons produits sont alors les voyelles nasales de bon
, bain , temps ) et la consonne nasale /n/.
- En position abaissée,
si la bouche est fermée, il contraint l’air à emprunter la voie des fosses
nasales, et le son produit est la consonne nasale /m/.
Sur le plan acoustique
la caractéristique nasale se situerait dans la partie inférieure des spectres
vocalique et consonantique et serait produite par un formant nasal localisé à
une fréquence fixe d’environ 250 hertz pour le français Delattre (1968).
La langue,
composée de 17 muscles, le plus mobile de tous les organes vocaux, petit
prendre des positions variées à l’intérieur du résonateur que constitue la
cavité buccale et en modifier la résonance. Les sons voyelles lui sont tous
redevables de leur spécificité puisque la composition de leurs formants aigus
dépend de son occupation de la bouche. En réalité, l’extrême mobilité de
la langue lui permet d’agir en même temps sur le résonateur pharyngé et le
résonateur buccal, et d’influencer la composition des deux premiers formants
qui sont les plus caractéristiques des voyelles. F1, qui varie de
250 à 750 hertz prend naissance dans le pharynx, F2, attribué à la
cavité buccale, varie entre 750 et 2500 hertz.
Lorsque la langue est
à plat dans la bouche - c’est le cas pour la prononciation du son /a/-
les deux résonateurs ont un volume sensiblement égal et les deux formants
sont relativement proches l’un de l’autre, F1= 720 Hz, F2
= 1300 Hz. La voyelle /a/ est dite compacte. Lorsque la langue
se rapproche du palais dur, en s’élevant et en s’avançant - c’est ce qui
se passe pour la prononciation de /e/ puis de /i /- le volume de
la cavité buccale (antérieur) se trouve réduit tandis que celui du pharynx
(postérieur) augmente.
La conséquence est un
abaissement de F1 et une élévation de F2. Pour /i/,
F1 descend à 250 hertz, F2 monte à 2500 hertz. Cet éloignement
des deux premiers formants fait de /i/ une voyelle diffuse.
Le rapport du volume
de la cavité antérieure à celui de la cavité postérieure détermine le
caractère compact ou diffus des voyelles mais aussi des consonnes (Fant, 1970).
Dans la prononciation
des consonnes, qui sont produites par une fermeture totale ou un rétrécissement
du passage de l’air, la langue intervient tant pour les consonnes dites
abruptes (occlusion puis explosion) que pour les continues (obstruction
partielle du passage de l’air). Si l’on prend pour référence les consonnes
françaises, /t/, /d/, sont apico-dentales, /k/, /g/ dorso-vélaires pour qui
et gui, mais vélaires pour cou et goût, /n/ apico-dentale nasale, /gn/ de
groGNE, dorso-palatale nasale, /l/ apico-dentale, /r/ apicale vibrante ou uvulaire,
/ch/ de CHat et /J/ de Jean prédorso-prépatatales, /s/ et /z/ apico-prépatatales. Les lèvres
peuvent être closes et produire les consonnes dites bilabiales - /p/,
/b/, /m/ - réalisant dans ce cas l’occlusion du passage de l’air. En
contact avec les dents, la lèvre inférieure produit les labio-dentales
- /f/ et /v/. Lorsque les lèvres sont ouvertes, elles peuvent
s’arrondir ou s’allonger plus ou moins et constituer un nouveau résonateur
pour participer à la réalisation de voyelles /u/, /y/, /oe/, de feu par
exemple. Ces mouvements de lèvres, en allongeant la cavité buccale et en
diminuant l’ouverture, ont pour effet de baisser le ton produit par la cavité
buccale. Ainsi, le passage de /i/ à /u/ consécutif à une élévation
de la langue vers le voile du palais et à un allongement des lèvres accroît
le volume du résonateur buccal, ce qui entraîne une baisse de F2 de
2500 à 760 hertz.
Le blocage de
l’air, qu’il se passe au niveau des lèvres ou de la langue pour les
consonnes abruptes (/p/, /t/, /k/, /b/, /d/, /g/, /m/, /n/, /gn/) et la constriction
pour les consonnes continuées, a des conséquences acoustiques différentes. /b/
par exemple, est produit par la fermeture totale des lèvres suivie d’un relâchement,
tandis que les organes articulateurs se mettent en place pour la voyelle
suivante (co-articulation). La pression est forte au point de contact et
le relâchement s’accompagne d’une brusque élévation de l’énergie
acoustique. Pour /w/ ou /s/, qui sont des consonnes continuées,
la constriction ralentit le passage de l’air sans le bloquer. La pression est
donc moins élevée au point de constriction et la mise en place des
articulateurs de la voyelle suivante se produit plus graduellement. L’élévation
de l’énergie acoustique est plus graduelle.
En résumé :
La voie
supra-laryngienne, ultime circuit du souffle produit par l’action des poumons
sous le contrôle des muscles intercostaux et abdominaux, transforme les bouffées
d’énergie acoustique induites par le larynx en langage articulé grâce,
essentiellement, à l’extrême mobilité de la langue et des lèvres.
En fait, c’est par
une interaction à tous les niveaux du circuit que la parole est réalisable et
aucun des instruments qui le composent ne fonctionne en autonomie. L’intensité
du son laryngé qui dépend de l’amplitude du mouvement des cordes vocales est
réglée par la pression de l’air pulmonaire qui dépend elle-même de la
force expiratoire exercée par les muscles inspirateurs. Le rythme auquel les
cordes vocales s’ouvrent et se ferment (produisant la F0) est déterminé
par la pression de l’air pulmonaire à condition que la voie supra-laryngeale
ne soit pas obstruée. Dans ce cas, F0 chute, à la fin du groupe de
souffle car la pression de l’air pulmonaire, qui était positive devient
brusquement négative pour permettre l’inspiration.
Dans le cas où la
langue exige une intonation montante en fin de groupe de souffle, le maintien ou
la montée de F0 est assuré(e) par des manœuvres compensatoires des
muscles laryngés qui induisent une tension des cordes vocales.
La fréquence
fondamentale de la phonation - qui porte les variations de l’intonation du
discours, le contour intonatif de la parole - est donc fonction de la pression
de l’air pulmonaire et de l’action de tension exercée sur les cordes
vocales par les muscles laryngés. Les vibrations laryngées, en fonction des
modifications permanentes du trajet suivi dans la voie supra- laryngienne, vont
donner naissance au discours qui sera immédiatement décodé par un
interlocuteur, à condition, bien entendu, qu’il partage le même code.
Ce bref aperçu ne
concernait qu’une sensibilisation à la physiologie de la parole et ne donne,
par conséquent, qu’une bien faible idée de la complexité de l’ensemble du
processus de production et de décodage de la parole. La conception de la pensée,
qui génère la parole, de même que les opérations cérébrales permettant la
compréhension instantanée de la parole sont des processus encore obscurs que
les innombrables recherches menées dans le monde par des neurologues, des
acousticiens, des phonéticiens, des linguistes, des orthophonistes, des
psychologues, tentent d’éclairer par des approches multiples. Depuis
l’audacieuse formule de Bouillaud, en 1825, selon lequel "le principal législateur
de la parole" est localisé dans les lobes antérieurs du cerveau, et les
corrélations effectuées par Broca, en 1861, entre la perte de la parole et une
lésion de la troisième circonvolution frontale gauche, la recherche a permis
de mettre en évidence certaines spécificités de chaque hémisphère cérébral
dans la "gestion" globale de l’activité langagière par le cerveau
humain.
BIBLIOGRAPHIE
DELATTRE. P.,1968.-"Divergences entre nasalités vocaliques et
consonantiques en français", Word, 24, pp.
64-72.
FANT
G., 1960.-Acoustic theory of speech production, Marton and Co,
Gravenhague, The Hague