La parole : physiologie

 

-Notions élémentaires de physiologie de la parole

 

L’énergie nécessaire à la production de la parole est fournie par le courant d’air expulsé par les poumons. L’air ainsi projeté met en mouvement les cordes vocales - contenues dans le larynx - qui s’ouvrent et se ferment rapidement. Le courant d’air interrompu par le rapprochement des cordes, puis libéré par leur éloignement se transforme en une succession de bouffées chargées d’énergie acoustique, grâce à l’effet de valve provoqué par le larynx, et qui donnent naissance à la voix. C’est donc au niveau du larynx que se produit la phonation qui n’est pas une capacité réservée aux êtres humains. Le bêlement du mouton, par exemple, est une manifestation de phonation. La parole, en revanche, est une caractéristique humaine grâce aux organes situés au-dessus du larynx, le pharynx, les fosses nasales, et la cavité buccale qui comporte tous les éléments nécessaires à l’articulation, voile du palais, palais dur, mâchoire, dents, langue. lèvres. Sans ce dernier étage, nous ne pourrions produire que des sons voyelles, les consonnes naissant de l’obstruction plus ou moins importante de l’air par les obstacles constitués, selon la consonne produite, par les lèvres (labiales, /p/, /b/), le dos (palatales, /k/, /g/) ou la pointe (dentales, /t/, /d/) de la langue. Pour mieux comprendre le processus de production de la parole il est nécessaire de suivre :

- le parcours de l’air généré par les poumons au niveau subglottal (par référence à la glotte qui est l’ouverture entre les cordes vocales),

- puis sa transformation en énergie acoustique au niveau du larynx,

- l’évolution de la qualité du son produit consécutive à la modification de la forme du pharynx,

- enfin la production ultime, les sons de parole, dus à l’action finale du voile du palais, de la langue et des lèvres qui participent au changement de forme du circuit.

 

La fonction respiratoire dans l’acte de parole

Le cycle respiratoire -inspiration-expiration- d’un individu silencieux et au repos, se compose de deux phases de durée sensiblement égale, d’environ 2,5 secondes, soit 12 cycles par minute.

L’acte de parole bouleverse considérablement ce schéma puisque le temps d’inspiration peut être réduit à 1/4 de seconde et l’expiration atteindre 40 secondes en fonction de la longueur de la phrase et aussi en fonction de l’état émotionnel du locuteur.

Le premier acte du processus de parole est donc l’inspiration.

Un signal du centre nerveux qui contrôle la respiration (dans le tronc cérébral) fait se contracter le muscle intercostal externe qui soulève et écarte la cage thoracique en même temps que le diaphragme se déplace vers le bas pour accroître l’espace pleural (entre les poumons et les côtes). L’extension des poumons entraîne une réduction de la pression de l’air pulmonaire et l’air pénètre à l’intérieur des poumons afin de rétablir l’équilibre avec la pression atmosphérique. L’élasticité des poumons fournit une partie importante de l’énergie qui va permettre la phonation, en expulsant l’air, par la trachée, en direction du larynx, mais l’intervention de plusieurs muscles est aussi nécessaire pour canaliser le débit de l’air. En effet, en fonction de la longueur - donc de la durée - de la phrase à produire, le muscle intercostal externe, actif durant l’inspiration, est également impliqué en phase expiratoire en ralentissant l’expiration due à l’élasticité du tissu pulmonaire. Son action de frein s’exerce, pour maintenir constante la pression d’air pulmonaire, jusqu’à ce que le relais soit pris par un muscle intercostal expirateur. Ce relais est rendu nécessaire par la fin de l’action expiratoire engendrée par la force élastique du poumon, et permet le maintien de la pression utile à la poursuite du discours. 

Les muscles abdominaux interviennent également en fin du processus expiratoire. On peut, en simplifiant à l’extrême, résumer ainsi un cycle respiratoire couvrant la production d’une phrase.

- Inspiration,

- Expiration (la très forte pression exercée par la force élastique du tissu pulmonaire en début d’expiration est contrecarrée par l’action de frein de certains muscles intercostaux ; cette action décroît graduellement au fur et à mesure que décroît la force élastique du poumon. Lorsque cette force va devenir nulle, certains muscles expirateurs entrent en jeu et, en rabaissant la cage thoracique, vont comprimer les poumons et poursuivre l’expiration, avec le concours des muscles abdominaux. Le processus de régulation de la respiration pendant la parole, bien que totalement inconscient, met en jeu une interaction extrêmement complexe de plusieurs muscles qui permettent le maintien d’une pression constante de l’air nécessaire à la production de la parole. La durée de l’expiration contrôlée musculairement est donc conditionnée linguistiquement, en fonction des segments de discours programmés. Il est clair que la syntaxe de la langue utilisée est l’un des paramètres importants - mais non le seul - du fonctionnement respiratoire pendant la parole. La mesure de la pression de l’air pulmonaire montre une certaine stabilité pendant la durée d’une expiration parlée, mais l’accentuation de syllabes peut entraîner des variations. Aux paramètres purement linguistiques impliqués dans la gestion respiratoire d’un individu pendant le discours parlé s’ajoutent, bien entendu, les paramètres révélateurs de son état émotionnel du moment dont la traduction par son interlocuteur est essentielle pour une communication satisfaisante. L’accélération du débit ou, au contraire, la quasi-mutité, sous le coup d’une émotion forte, sont étroitement corrélés à la gestion respiratoire.

 En résumé :

 

-        La respiration est la fonction de base de la production de parole.

-        La respiration parlée est conditionnée par les caractéristiques de la langue utilisée (syntaxiques, accentuelles, prosodiques) ce qui implique une gestion de la respiration particulière à chaque langue, et par l'état émotionnel du locuteur.

 

La fonction du larynx dans la  parole  

Si l’air pulmonaire constitue la matière première de la production de parole, c’est le larynx qui en assure le premier niveau de transformation en vibrations audibles (phonation) génératrices de l’énergie sonore qui évoluera au cours de sa traversée du tractus vocal. Le larynx est un ensemble complexe de onze pièces cartilagineuses reliées par des ligaments et des membranes, à l’intérieur duquel se trouvent les cordes vocales. Sa situation, dans la partie supérieure de la trachée, est aisément repérable puisque sa partie antérieure, le cartilage thyroïde correspond à la proéminence connue sous le nom de pomme d’Adam. Le mouvement de ce cartilage, combiné à celui de deux autres, le cricoïde et l’aryténoïde, participe à la modulation de la phonation sous l’action des muscles laryngés. Les cordes vocales sont deux bandes de tissu musculaire d’une grande flexibilité, dont la longueur, la tension, l’épaisseur, varient en permanence sous l’interaction de plusieurs muscles laryngés. Plusieurs théories visant à expliquer la vibration des cordes vocales ont été avancées. Il semble admis que les cordes s’écartent sous la pression de l’air pulmonaire et se referment sous l’influence de deux forces différentes, l’une exercée par leur propre élasticité, l’autre par l’effet de succion causé par la baisse de pression au niveau de la glotte lorsque l’air pulmonaire est expulsé par un orifice laryngé rétréci.

 L’effet principal exercé par le larynx est donc la production de vibrations sonores. Ces vibrations - qui produisent le voisement - caractérisent les sons voyelles et certains sons consonnes dits voisés, comme /b/, /d/, /z/. Pour ressentir physiquement le voisement il suffit de prononcer une voyelle ou l’une des consonnes mentionnées en se bouchant les oreilles. La prononciation alternée de /z/ et de /s/ fait clairement ressentir l’opposition voisé - non voisé. La propriété acoustique correspondant au trait voisé se caractérise par la présence d’énergie dans la partie basse du spectre. Pendant la phonation les cordes vocales s’ouvrent et se ferment rapidement d’une manière quasi périodique. On appelle fréquence d’un son le nombre de cycles (ouverture-fermeture) produits en une seconde. La fréquence fondamentale (notée F0) est la fréquence de base (la plus lente) d’un son complexe. En moyenne la fréquence fondamentale d’une voix d’homme adulte est de 100 à 120 cycles par seconde - ou hertz - celle d’une femme de 200 à 220 hertz. Une voix d’homme très grave peut avoir une F0 de 60 hertz, une voix aiguë de femme ou d’enfant peut avoir une F0 de 330 à 350 hertz. Ce sont les  variations de la fréquence fondamentale, produites au niveau du larynx par l’action des cordes vocales qui déterminent notre perception de la hauteur ou pitch, et sont l’élément principal de transmission de l’intonation, de l’accentuation, du rythme de la parole et des tons pour les langues à tons comme le chinois (les mêmes sons, voyelles, consonnes + voyelles, prennent des sens différents quand la fréquence fondamentale varie).

En résumé :

- Le larynx par l’intermédiaire des cordes vocales génère l’énergie qui constitue la base sonore de la parole (Fréquence fondamentale F0).

- Le larynx module la fréquence fondamentale et participe à l’expression linguistique (accentuation, intonations indiquant la question ou l’affirmation, tons portant des différences sémantiques, délimitation des unités significatives...) et affective (intonation émotionnelle, altération du débit provoqué par l’émotion...).

 

La fonction supra-laryngienne dans la parole

Après son passage entre les cordes vocales l’air chargé d’énergie sonore pénètre dans le pharynx, long tube constitué de cartilages et de muscles, qui relie la cavité laryngienne à la partie postérieure des cavités orale et nasale. C’est cet ensemble qui constitue la voie supra-laryngienne et qui, grâce aux modifications de sa configuration, agit comme un filtre acoustique et une chambre de résonance : la configuration du parcours est modifiée grâce à l’allongement, au raccourcissement, au rétrécissement ou à la dilatation du pharynx, à l’abaissement ou au relèvement du voile du palais, à l’obstruction plus ou moins importante ou à l’absence d’obstruction offerte au passage de l’air dans la cavité buccale par la position de la langue ou des lèvres. Au cours du trajet, la composition acoustique des bouffées d’air sonore est altérée par filtrage de certaines fréquences (c’est la fonction filtre acoustique de la voie supra-laryngienne), et par renforcement de certaines autres (c’est la fonction chambre de résonance de la voie supra-laryngienne). Le voile du palais est une bande de tissu musculaire située au fond de la cavité buccale dans sa partie supérieure et dont une partie, la luette, est visible à l’aide d’un miroir. Au cours de la respiration normale le voile du palais est abaissé pour permettre la circulation de l’air par le nez. Au cours de la parole il peut adopter trois positions qui conditionnent la qualité des sons produits :

- En position relevée contre le mur naso-pharyngien, il obture l’accès aux fosses nasales et l’air ne peut passer par la bouche ; les sons produits, dits sons oraux, sont les voyelles et la plupart des consonnes.

- En position abaissée, si la bouche est ouverte, il permet une répartition du passage de l’air par le nez et par la bouche, les sons produits sont alors les voyelles nasales de bon , bain , temps ) et la consonne nasale /n/.

- En position abaissée, si la bouche est fermée, il contraint l’air à emprunter la voie des fosses nasales, et le son produit est la consonne nasale /m/.

Sur le plan acoustique la caractéristique nasale se situerait dans la partie inférieure des spectres vocalique et consonantique et serait produite par un formant nasal localisé à une fréquence fixe d’environ 250 hertz pour le français Delattre (1968).

 

La langue, composée de 17 muscles, le plus mobile de tous les organes vocaux, petit prendre des positions variées à l’intérieur du résonateur que constitue la cavité buccale et en modifier la résonance. Les sons voyelles lui sont tous redevables de leur spécificité puisque la composition de leurs formants aigus dépend de son occupation de la bouche. En réalité, l’extrême mobilité de la langue lui permet d’agir en même temps sur le résonateur pharyngé et le résonateur buccal, et d’influencer la composition des deux premiers formants qui sont les plus caractéristiques des voyelles. F1, qui varie de 250 à 750 hertz prend naissance dans le pharynx, F2, attribué à la cavité buccale, varie entre 750 et 2500 hertz.

Lorsque la langue est à plat dans la bouche - c’est le cas pour la prononciation du son /a/- les deux résonateurs ont un volume sensiblement égal et les deux formants sont relativement proches l’un de l’autre, F1= 720 Hz, F2 = 1300 Hz. La voyelle /a/ est dite compacte. Lorsque la langue se rapproche du palais dur, en s’élevant et en s’avançant - c’est ce qui se passe pour la prononciation de /e/ puis de /i /- le volume de la cavité buccale (antérieur) se trouve réduit tandis que celui du pharynx (postérieur) augmente.

La conséquence est un abaissement de F1 et une élévation de F2. Pour /i/, F1 descend à 250 hertz, F2 monte à 2500 hertz. Cet éloignement des deux premiers formants fait de /i/ une voyelle diffuse.

Le rapport du volume de la cavité antérieure à celui de la cavité postérieure détermine le caractère compact ou diffus des voyelles mais aussi des consonnes (Fant, 1970).

Dans la prononciation des consonnes, qui sont produites par une fermeture totale ou un rétrécissement du passage de l’air, la langue intervient tant pour les consonnes dites abruptes (occlusion puis explosion) que pour les continues (obstruction partielle du passage de l’air). Si l’on prend pour référence les consonnes françaises, /t/, /d/, sont apico-dentales, /k/, /g/ dorso-vélaires pour qui et gui, mais vélaires pour cou et goût, /n/ apico-dentale nasale, /gn/ de groGNE, dorso-palatale nasale, /l/ apico-dentale, /r/ apicale vibrante ou uvulaire, /ch/ de CHat et /J/ de Jean prédorso-prépatatales, /s/ et /z/ apico-prépatatales. Les lèvres peuvent être closes et produire les consonnes dites bilabiales - /p/, /b/, /m/ - réalisant dans ce cas l’occlusion du passage de l’air. En contact avec les dents, la lèvre inférieure produit les labio-dentales - /f/ et /v/. Lorsque les lèvres sont ouvertes, elles peuvent s’arrondir ou s’allonger plus ou moins et constituer un nouveau résonateur pour participer à la réalisation de voyelles /u/, /y/, /oe/, de feu par exemple. Ces mouvements de lèvres, en allongeant la cavité buccale et en diminuant l’ouverture, ont pour effet de baisser le ton produit par la cavité buccale. Ainsi, le passage de /i/ à /u/ consécutif à une élévation de la langue vers le voile du palais et à un allongement des lèvres accroît le volume du résonateur buccal, ce qui entraîne une baisse de F2 de 2500 à 760 hertz.

Le blocage de l’air, qu’il se passe au niveau des lèvres ou de la langue pour les consonnes abruptes (/p/, /t/, /k/, /b/, /d/, /g/, /m/, /n/, /gn/) et la constriction pour les consonnes continuées, a des conséquences acoustiques différentes. /b/ par exemple, est produit par la fermeture totale des lèvres suivie d’un relâchement, tandis que les organes articulateurs se mettent en place pour la voyelle suivante (co-articulation). La pression est forte au point de contact et le relâchement s’accompagne d’une brusque élévation de l’énergie acoustique. Pour /w/ ou /s/, qui sont des consonnes continuées, la constriction ralentit le passage de l’air sans le bloquer. La pression est donc moins élevée au point de constriction et la mise en place des articulateurs de la voyelle suivante se produit plus graduellement. L’élévation de l’énergie acoustique est plus graduelle.

En résumé :

La voie supra-laryngienne, ultime circuit du souffle produit par l’action des poumons sous le contrôle des muscles intercostaux et abdominaux, transforme les bouffées d’énergie acoustique induites par le larynx en langage articulé grâce, essentiellement, à l’extrême mobilité de la langue et des lèvres.

En fait, c’est par une interaction à tous les niveaux du circuit que la parole est réalisable et aucun des instruments qui le composent ne fonctionne en autonomie. L’intensité du son laryngé qui dépend de l’amplitude du mouvement des cordes vocales est réglée par la pression de l’air pulmonaire qui dépend elle-même de la force expiratoire exercée par les muscles inspirateurs. Le rythme auquel les cordes vocales s’ouvrent et se ferment (produisant la F0) est déterminé par la pression de l’air pulmonaire à condition que la voie supra-laryngeale ne soit pas obstruée. Dans ce cas, F0 chute, à la fin du groupe de souffle car la pression de l’air pulmonaire, qui était positive devient brusquement négative pour permettre l’inspiration.

Dans le cas où la langue exige une intonation montante en fin de groupe de souffle, le maintien ou la montée de F0 est assuré(e) par des manœuvres compensatoires des muscles laryngés qui induisent une tension des cordes vocales.

La fréquence fondamentale de la phonation - qui porte les variations de l’intonation du discours, le contour intonatif de la parole - est donc fonction de la pression de l’air pulmonaire et de l’action de tension exercée sur les cordes vocales par les muscles laryngés. Les vibrations laryngées, en fonction des modifications permanentes du trajet suivi dans la voie supra- laryngienne, vont donner naissance au discours qui sera immédiatement décodé par un interlocuteur, à condition, bien entendu, qu’il partage le même code.

Ce bref aperçu ne concernait qu’une sensibilisation à la physiologie de la parole et ne donne, par conséquent, qu’une bien faible idée de la complexité de l’ensemble du processus de production et de décodage de la parole. La conception de la pensée, qui génère la parole, de même que les opérations cérébrales permettant la compréhension instantanée de la parole sont des processus encore obscurs que les innombrables recherches menées dans le monde par des neurologues, des acousticiens, des phonéticiens, des linguistes, des orthophonistes, des psychologues, tentent d’éclairer par des approches multiples. Depuis l’audacieuse formule de Bouillaud, en 1825, selon lequel "le principal législateur de la parole" est localisé dans les lobes antérieurs du cerveau, et les corrélations effectuées par Broca, en 1861, entre la perte de la parole et une lésion de la troisième circonvolution frontale gauche, la recherche a permis de mettre en évidence certaines spécificités de chaque hémisphère cérébral dans la "gestion" globale de l’activité langagière par le cerveau humain.

 

 

 

BIBLIOGRAPHIE

DELATTRE. P.,1968.-"Divergences entre nasalités vocaliques et consonantiques en français", Word, 24, pp. 64-72.

FANT G., 1960.-Acoustic theory of speech production, Marton and Co, Gravenhague, The Hague