Das funktionale Artikulationsmodell FARM: Modellierung von zeitlicher und räumlicher Koartikulation

 

 

Prof. Dr. Bernd J. Kröger

bkroeger@speechtrainer.de

 

 

 

Inhalt 1

Abstrakt 1

1  Einleitung  2

2  Die Parameter des funktionalen Artikulationsmodells FARM  2

2.1 Vokalische Gesamtformung: tief - hoch / hinten - vorne  2

2.2 Lippen: ungerundet - gerundet 3

2.3 Lippen: vokalisch - verschlossen  3

2.4 Zungenrücken: vokalisch - gehoben  4

2.5 Zungenspitze: vokalisch - gehoben / hinten - vorne  6

2.6 Der Parameter: Art der konsonantischen Engebildung  7

2.7 Gaumensegel: gesenkt - gehoben  8

2.8 Stimmlippen: verschlossen - geöffnet 8

2.9 Weitere Parameter 9

3  Funktionale Sprechbewegungseinheiten und Artikulatorbewegungen  9

4  Zeitliche Koartikulation: Das Bewegungsmodell 9

5  Räumliche Koartikulation: Das Artikulatormodell 11

5.1 Primäre Artikulation  11

5.2 Koartikulation  11

5.3 Berechnungsablauf zur primären Artikulation und räumlichen Koartikulation  12

6   Schlussbemerkung und Ausblick  14

7   Literatur 14

 

 

 

Abstrakt

     

Bis heute sind physiologisch basierte Artikulationsmodelle im Bereich anwendungs­orien­tierter Sprachsynthese noch nicht einsetzbar. Die Modelle sind entweder zu komplex oder zu realitätsfern bzw. zu wenig datenbasiert. Das funktionale Artikulations­modell FARM wurde entwickelt, um diese Lücke zu schließen. In diesem Modell sind die artikulatorischen Basiseinheiten nicht isolierte Muskelkontraktionen, sondern sprachlich orientierte übergeordnete Bewegungseinheiten.

 

 

1  Einleitung

 

Das funktionale Artikulationsmodell FARM definiert einen Satz von artikulatorischen Parametern (Kap. 2). Charakteristisch für dieses Modell ist die Unterscheidung zwischen übergeordneten funktionalen Sprechbewegungseinheiten und konkreten Artikulatorbewe­gungen (Kap. 3). Das Modell besteht aus zwei Modulen: Bewegungsmodell und Artikulatormodell. Das Bewegungsmodell (Kap. 4) realisiert auf der Ebene der funktionalen Sprechbewegungseinheiten alle temporalen Aspekte der Artikulation. Innerhalb dieses Modells wird auch die zeitliche Überlappung von Bewegungseinheiten realisiert (zeitliche Koartikulation). Das anschließend auszuführende Artikulatormodell (Kap. 5) ist zeitunabhängig. Es berechnet die Positionierungen aller Artikulatoren für jeden Zeitpunkt einer Äußerung. Dabei wird in diesem Modul auch der gegenseitigen Beeinflussung der Lage und Formung eines Artiku­lators durch die Lage und Formung eines anderen (benachbarten) Artikulators Rechnung getragen (räumliche Koartikulation). Das Artikulatormodell basiert nicht mehr auf Kröger (1998), sondern wurde ab Oktober 2000 vollständig neu entwickelt.

 

 

2  Die Parameter des funktionalen Artikulationsmodells FARM

 

Das funktionale Artikulationsmodell definiert einen Satz von einfach interpretierbaren Parametern. Dabei werden vokalische und konsonantische Parameter unterschieden. Vokalische Parameter sind global und absolut. Sie determinieren die Position und Form aller Artikulatoren in eindeutiger Weise. Konsonantische Parameter sind lokal und relativ. Sie determinieren Lage und Form einzelner Artikulatoren relativ zur momentan zugrundeliegenden vokalischen Positionierung.

 

 

2.1 Vokalische Gesamtformung: tief - hoch / hinten - vorne        

 

Der Parameter „vokalische Gesamtformung: tief - hoch“  (VG:th, lese: „vokalische Gesamtformung: tief bis hoch“) stellt im Sinne des artikulatorischen Vokalraumes die Dimension tiefe Vokale (VG:th = -1000, z.B. [a]) - hohe Vokale (VG:th = +1000, z.B. [i], [y] oder [u]) dar. Der Parameter „vokalische Gesamtformung: hinten - vorne“ (VG:hv) stellt im Sinne des artikulatorischen Vokal­raumes die Dimension hintere Vokale (VG:hv = -1000, z.B. [u]) - vordere Vokale (VG:hv = +1000, z.B. [i], [y]) dar. Die beiden Parameter der „vokalischen Gesamtformung“ wirken sich in erster Linie auf die Positionierung des Kiefers und auf die Lage und Formung des Zungenrücken und der Lippen aus (Abb. 1; geometrische Basisdaten siehe Kap. 5). Darüber hinaus beschreiben Sie auch die vokalische Einstellung des Gaumensegels (leichte Senkung bei offenen Vokalen, siehe Abb. 1) und die Lage des Kehlkopfs (Senkung bei hinteren Vokalen, siehe Abb. 1).

 

 

 

 

 

Abbildung 1.  Die Eckvokale [i], [y], [a] und [u] realisiert im funktionalen Artikulationsmodell FARM. Die vokalischen Parameter beeinflussen vor allem Kieferposition, Zungenlage, Zungenform und Lippenform. Erkennbar auch: die Absenkung des Kehlkopfes von [i] oder [a] nach [u]; die Absenkung des Velums von [i] oder [u] nach [a].

 

 

2.2 Lippen: ungerundet - gerundet

 

Der Parameter „Lippen: ungerundet - gerundet“ (LI:ug) stellt im Sinne des artikulatorischen Vokalraumes die Dimension ungerundete (LI:ug = 0, z.B. [i]) - gerundete Vokale  (LI:ug = +1000, z.B. [y], Abb. 1) dar. Der Parameter wirkt sich in erster Linie auf die Formung der Lippen aus, beeinflusst aber auch die Kieferposition (geringere Öffnungsweite bei gerundeten Vokalen). Ein Problem der mediosagittalen Darstellung ist, dass die Lippen der gerundeten Vokale voluminöser als die der ungerundeten Vokale wirken. Dies entspricht aber der Realität, da die Lippen im Fall der Nichtrundung bzw. Spreizung durch das Zurückziehen der Mundwinkel längsgedehnt werden und damit mediosagittal dünner sind.

 

 

2.3 Lippen: vokalisch - verschlossen

 

Alle weiteren Parameter des Zungenrücken und der Zungenspitze sind konsonantische Parameter. Der Basiswert Null repräsentiert für die im Folgenden beschriebenen Parameter das Fehlen von konsonantischer Artikulationsaktivität. Haben die konsonantischen Parameter den Wert Null, dann richtet sich die Positionierung und Formung aller Artikulationsorgane ausschließlich nach den oben beschriebenen drei vokalischen Parametern. Werte größer als Null hingegen repräsentieren bei den nun folgenden Parametern konsonantische Konstriktionsbildungen.

Der artikulatorische Parameter „Lippen: vokalisch - verschlossen“ (LI:vv) beschreibt den Übergang von der momentanen vokalischen Formung der Lippen (LI:vv = 0) zur vollständigen labialen Verschlussbildung (LI:vv = +1000, z.B. [b] oder [p], Abb. 2). Die Formung der labialen Verschlussbildung ist aber auch vom Parameter „Lippen: ungerundet - gerundet“ (Kap. 2.2) abhängig. Zusätzlich differenziert der Formparameter volle Enge - kritische Enge (Kap. 2.6) hier zwischen bilabialen und labiodentalen Lauten.

 

 

 

 

Abbildung 2. Bilabiale Konstriktion in [bu:], [be:]und [fe:].

 

 

2.4 Zungenrücken: vokalisch - gehoben

 

Der Parameter „Zungenrücken: vokalisch - gehoben“ (ZR:vg) beschreibt den Übergang von der momentanen vokalischen Formung des Zungenrücken (ZR:vg = 0) zur vollständigen dorsalen Konstriktion (ZR:vg = +1000). Die Lage und Formung der Konstriktion ist aber auch vom Parameter „vokalische Gesamtformung: hinten - vorne“ abhängig. Bei der Parameterkombination (ZR:vg = -1000, VG:hv = +1000) wird eine palatale Verschlussbildung (z.B. in [?Ic]), bei der Parameterkombination (ZR:vg = +1000, VG:hv = 0) eine velare Verschlussbildung (z.B. in [?ax]) und bei der Parameterkombination (ZR:vg = +1000, VG:hv = -1000) wird eine velar-uvulare Konstriktion (z.B. in [Ru:]) realisiert. (Abb. 3; Anmerkung: Die zugehörigen Mediosagittalschnitte sind extrapoliert und müssen noch durch Daten dieser Konstriktionen ersetzt werden.)

 

 

 

 

Abbildung 3. Dorsale Konstriktion in [?Ic], [?ax] und [Ru:]. In allen Beispielen liegt kritische Enge vor (siehe Kap. 2.6).

 

 

2.5 Zungenspitze: vokalisch - gehoben / hinten - vorne

 

Der Parameter „Zungenspitze: vokalisch - gehoben“ (ZS:vg) beschreibt den Übergang von der momentanen vokalischen Formung der Zunge (ZS:vg = 0) zur vollständigen apikalen Konstriktion (ZG:vg = +1000). Die Lage der Konstriktion wird durch einen zweiten konsonantischen Zungenspitzenparameter „Zungenspitze: hinten - vorne“ (ZS:hv) determiniert (ZS:hv = -1000: postalveolar, z.B. [sch], ZS:hv = 0: alveolar, z.B. [s] oder [t], ZS:hv = +1000: dental, z.B. [th], Abb. 4).

 

 

 

 

Abbildung 4. Apikale Konstriktion in [thE:], [sE:] und [schE:] (Frikative).

 

 

2.6 Der Parameter: Art der konsonantischen Engebildung

 

Bei allen Parametern zur konsonantischen Konstriktionsbildung („Lippen: vokalisch - verschlo­­s­­­sen“, „Zungenrücken: vokalisch – gehoben“, „Zungenspitze: vokalisch – gehoben“) muss noch zusätzlich die Art der konsonantischen Engebildung festgelegt werden. So muss für alle Artikulatoren zur konsonantischen Konstriktionsbildung zwischen „voller Enge“ und „kritischer Enge“ differenziert werden. Bei „voller Enge“ werden Plosive oder Nasale (Abb. 5), bei „kritischer Enge“ werden Frikative gebildet (Abb. 3 und 4) . Im Fall der Zungenspitze und des Zungenrücken kann des weiteren der Formparameter als „vibrierende Enge“ zur Realisierung von Vibranten ([r] oder [R]) und im Fall der Zungenspitze kann der  Formparameter darüber hinaus noch als „laterale Enge“ zur Realisierung von Laterallauten (z.B. [l]) spezifiziert werden.

 

 

 

Abbildung 5. Volle Verschlussbildung bei [tE:] und [kE:]. Im Unterschied zu Abb. 3 und Abb. 4 wird hier mediosagittal keine kritische Enge sondern ein vollständiger Verschluss gebildet (Realisierung von Plosiven oder Nasalen).

 

 

2.7 Gaumensegel: gesenkt - gehoben

 

Der Parameter „Gaumensegel: gesenkt - gehoben“ (GS:gg) beschreibt den Übergang von gesenktem Gaumensegel (GS:gg = -1000: Nasallaut-Stellung, z.B. bei [m], [n]) zur vokalischen Positionierung (Gs:gg = 0: mittlere Hebung je nach Vokal; lockerer Verschluss) bis hin zur starken Anhebung des Gaumensegels (GS:gg = +1000) beschrieben. Die starke Anhebung des Gaumensegels führt zum festen Verschluss und damit zur luftdichten Abtrennung des Nasenraumes vom Mund- und Rachenraum. (Abb. 6; Anmerkung: Bei den hohen Vokalen ist das Gaumensegel bereits bei der vokalischen Positionierung stark angehoben.)

 

 

 

 

Abbildung 6. Gaumensegel gesenkt in [?En], Gaumensegel gehoben und stark gehoben bei gleicher vokalischer Umgebung ([E]). 

 

 

2.8 Stimmlippen: verschlossen - geöffnet

 

Der Parameter „Stimmlippen: verschlossen - geöffnet“ (SL:vg) beschreibt den Übergang vom festen Verschluss der Stimmlippen (SL:vg = -1000, z.B. [?]) über locker verschlossene Stimmlippen (SL:vg = 0, Phonation z.B. bei allen Vokalen) bis hin zur weiten Öffnung der Stimmlippen SL:vg = +1000: Atemstellung). Die Öffnung der Stimmritze zur Realisierung von stimmlosen Lauten liegt zwischen Phonationsstellung und Atemstellung.  

 

 

2.9 Weitere Parameter

 

Negative Werte des Parameters „Lungendruck: tief - hoch“ (LD:th) er­mög­lichen das Einatmen. Die Stärke des (positiven) Lungendrucks determiniert dann die Sprech­stärke (leise - normal - laut). Der Parameter „Stimmlippen: ungespannt - gespannt“ (SS: ug) ändert die Grund­­tonhöhe im Fall der Phonation. Mit zunehmender (Längs-)Spannung der Stimmlippen steigt die Tonhöhe.

 

 

3  Funktionale Sprechbewegungseinheiten und Artikulatorbewegungen

 

Zur näheren Erläuterung des Bewegungsmodells und des Artikulatormodells ist die Unterscheidung zwischen funktionalen (übergeordneten) Sprechbewegungseinheiten und (konkreten) Artikulatorbewegungen wichtig. Funktionale Sprechbewegungseinheiten (Sprech­gesten) sind konkret lautbildend: beispielsweise eine konsonantisch apikale Konstriktionsbildung zur Realisierung eines [t] oder eine vokalisch labiale Sprechbewegung zur Realisierung eines gerundeten Vokals. Funktionale Sprechbewegungseinheiten sind eng mit den Parametern dieses (funktionalen) Modells verknüpft, wobei jede Sprechbewegungseinheit durch maximal 2 Parameter beschrieben wird (Zu Sprechbewegungseinheiten siehe auch Kap. 5). Die Bewegung einzelner Artikulatoren (z.B. Zungenrücken, Kiefer) sind Artikulatorbewegungen. Sprechbewegungseinheiten lösen Artikulatorbewegungen aus. Zum einen kann jede Sprech­bewegungseinheit auf mehrere Artikulatoren wirken: z.B. labiale Konstriktionsbildung wirkt auf Unterkiefer und Lippen. Zum anderen kann jede Artikulatorbewegung von mehreren gleichzeitig aktiven Sprechbewegungseinheiten gesteuert werden. So wird beispielsweise die Senkung des Unterkiefers bei der vokalischen Sprechbewegung des Übergangs von [i] nach [a] in [ipa] von einer zwischenzeitlichen leichten Hebung des Kiefers zur Realisierung des konsonantischen Lippenverschlusses bei [p] überlagert.

Des weiteren muss zwischen primären und sekundären Artikulatoren unterschieden werden. Primäre Artikulatoren einer Sprechbewegungseinheit definieren direkt das funktionale Ziel: Dies sind z.B. die Lippen bei labialer, die Zungenspitze die apikaler und der Zungenrücken bei dorsaler Konstriktionsbildung. Die primären Artikulatoren sind somit die direkten „Konstriktionsbildner“ im Ansatzrohr. Die sekundären Artikulatoren sind alle weiteren Artikulatoren, die von einer funktionalen Sprechbewegungseinheit mit­bewegt werden. Sekundäre Artikulatorbewegungen sind aber nicht minder wichtig, da die Ausführung der Sprechbewegungseinheit ansonsten nicht oder nur unökonomisch geschehen würde. Beispielsweise kann eine labiale Verschlussbildung ohne Hebung des Kiefers entweder nicht vollständig oder nur unökonomisch (aufwendig große Hebung der Unterlippe) ausgeführt werden.

 

                                                           

4  Zeitliche Koartikulation: Das Bewegungsmodell

 

Das Bewegungsmodell entspricht weitgehend dem segmentalen Modell von Kröger (1998). Wegen der Merkmale des hier realisierten neuen Artikulatormodells können übergeordnete funktionale Sprechbewegungseinheiten aber nun auch im segmentalen Ansatz realisiert werden. Es ist nicht die Einführung eines explizit gestischen Modells nötig. Beispielsweise wird die zeitliche Koproduktion von konsonantischer Verschlussbewegung mit vokalisch-artikulatorischen Hintergrundbewegungen nun auch bereits im segmentalen Bewegungs­modell realisiert. Das Beispiel [pu:ma:] (Abb. 7) zeigt die zeitliche Überlappung von [p] und [u:] zum Zeitpunkt der Verschlusslösung des [p], die zeitliche Überlappung von [m] und [u:] zum Zeitpunkt der Verschlussbildung des [m] und die zeitliche Überlappung von [m] und [a:] zum Zeitpunkt der Verschlusslösung des [m] (vokalische Parameter sind dem [u:]-Target (Label 6) bzw. dem [a:]-Target (Label 10) sehr nah). Die vokalisch-artiku­la­to­ri­sche Hintergrundbewegung des Überganges von [u:] nach [a:] wird also zu großen Teilen während der Ver­schlussphase des [m] realisiert. Gut erkennbar ist hier auch die zeitliche Koordinierung von laryngaler und supralaryngaler Aktivität im Fall des [p] (max. glottale Öffnung zum Zeitpunkt der labialen Verschlusslösung) und von lingualer und velischer Aktivität im Fall des [m] (Senkung des Gaumensegels während der gesamten Dauer des labialen Verschlusses).

 

 


 

 

Abbildung 7. (Nächste Seite) Zeitliche Koartikulation im Beispielwort [pu:ma:]. Links: Zeitlicher Ablauf der Parameter (Erläuterung der Parameter VG:th ... LD:th siehe Kap. 2; Zeitachse: von links nach rechts); Rechts: Mediosagittalschnitte zu drei Zeitpunkten: von oben nach unten: Verschlusslösung des [p] (Label 4), Verschlussbildung und -lösung des [m] (Label 7, Label 9).

 

 

5  Räumliche Koartikulation: Das Artikulatormodell

 

5.1 Primäre Artikulation

 

Die Berechnung (der Position und Formung) der Artikulatoren mittels des Artikulatormodells geschieht zunächst für nur den jeweils primären Artikulator einer funktionaler Sprechbewegungseinheit (primäre Artikulation). Dabei wird Position bzw. Formung des Artikulators auf der Basis von MRT-Daten (Kröger 2000 und Kröger et al. 2000) berechnet.

 

 

5.2 Koartikulation

 

Nach jedem Schritt der Berechnung von primärer Artikulation wird in diesem Modell die räumliche Koartikulation berechnet, damit die - zum Teil räum­lich konträr wirkenden - Primäranteile der Sprechbewegungseinheiten zu jedem Zeitpunkt räumlich miteinander vereinbar werden. Dabei sind zwei Arten der räumlichen Koartikulation zu unterscheiden.

„Koartikulation 1: Sprechbewegungseinheit - sekundärer Artikulator“ bedeutet, dass der sekundäre Artikulator auf die gleiche Weise wie der primäre Artikulator berechnet wird (Kröger 2000). Der sekundäre Artikulator ist somit im Fall „Koartikulation 1“ in seinem Bewegungsverhalten eng an den primären Artikulator gekoppelt. Bei „Koartikulation 2: Sprech­be­we­gungs­einheit - sekundärer Artikulator“ wird eine Parallelverschiebung des sekundären Artikulators um die durch die Verschiebung eines ausgezeichneten Punktes des primären Artikulators (oder eines Punktes eines per „Koartikulation 1“ mitbewegten sekundären Artikulators) definierte Strecke durchgeführt. Dabei kann die Stärke der Verschiebung des sekundären Artikulators bei großflächigen Artikulatoren (z.B. Zungenrücken) mit der Entfernung vom ausgezeichneten Punkt abnehmen und damit auch zu einer Formänderung des sekundären Artikulators führen.

 

 

5.3 Berechnungsablauf zur primären Artikulation und räumlichen Koartikulation

 

Die Berechnung der primären Artikulation geschieht nach dem folgenden sieben Hauptschritten: Berechnung der (i) dorsal-vokalischen und der (ii) labial vokalischen Artikulation. Damit ist die vokalische Position und Formung aller Artikulatoren definiert. Anschließend wird hierauf aufbauend die konsonantische Artikulation berechnet: (iii) labial-, (iv) dorsal- und (v) apikal-konsonantische Artikulation. Danach werden (vi) velische und (vii) glottale Artikulation berechnet. Nach jedem Hauptschritt der Berechnung von primärer Artikulation wird dann die räumliche Koartikulation berechnet. Es treten dabei beide Arten der räumlichen Koartikulation (Kap. 5.2) auf. Der gesamte Berechnungsablauf des Artikulatormodells mit allen Teilschritten zur Berechnung von primärer Artikulation und räumlicher Koartikulation ist in Tabelle 1 zusammengestellt und wird im folgenden kurz kommentiert.

 


Artik.    Koartik.

Erläuterung

Lingual-vokalisch

Parameter: VG:th, VG:hv

Labial-vokalisch

Parameter: LI:ug

          1: labial vok. – Kiefer und Kinn

Mitbewegung von Unterkiefer und Kinn aufgrund labial-vokalischer Gesamtformung

          2: labial vok. – lingual vok.

Mitbewegung von Zungengrund aufgrund Unterkieferpunkt

Vermerk: lingual-labial-vokalisch 

 

vokalische Formung ist für Zungenrücken und Lippen hier vollständig berechnet

Labial-konsonantisch

Parameter: LI:vv

          1: labial kons. – Kiefer und Kinn

Mitbewegung von Unterkiefer und Kinn aufgrund konsonantischer (Unter-)Lippenbewegung

          2: labial kons. – Zungenrücken

Mitbewegung von Zungengrund und Vorderzunge aufgrund Unterkieferpunkt

Dorsal-konsonantisch

Parameter: ZR:vg

          1: dorsal kons. – Kiefer

Mitbewegung des Unterkiefer aufgrund konsonantischer Zungenrückenbewegung

          1: dorsal kons. – Larynx 

Mitbewegung des Kehlkopfes aufgrund konsonantischer Zungenrückenbewegung

Apikal-konsonantisch

Parameter: ZS:vg

          2: apikal kons. – dorsal vok.

Mitbewegung des hinteren Teils des Zungenrücken aufgrund Zungenspitzenpunkt (stark)

          2: apikal kons. – dorsal kons.

Mitbewegung des hinteren Teils des Zungenrücken aufgrund Zungenspitzenpunkt (schwach)

          1: apikal kons. – Larynx

Mitbewegung des Kehlkopfes aufgrund konsonantischer Zungenspitzenbewegung

          1: apikal kons. – Kiefer

Mitbewegung des Unterkiefers aufgrund konsonantischer Zungenspitzenbewegung

Vermerk: lingual-konsonantisch

linguale Artikulation (und Koartikulation) – Zunge und Unterkiefer – ist hier vollständig berechnet

          2: lingual kons. – Kinn und Lip-

                          pen

Mitbewegung von Kinn und Unterlippe aufgrund von Unterkieferpunkt

          2: lingual kons. – Korrektur

Korrektur von Kieferposition (mit Kinn und Unterlippe) zur Verhinderung von „Über-Koartikulation“

Velisch (Gaumensegel)

Parameter: GS:gg

Glottal (Stimmlippen)

Parameter: SL:vg

 

Tabelle 1. Berechnungsablauf zur primären Artikulation („Artik.“) und räumlichen Koartikulation („Koartik.“) im Artikulatormodell. Jede Zeile repräsentiert einen Berechnungsschritt.  Spalte 1: Nicht eingerückt: primäre Artikulation; Eingerückt: räumliche Koartikulation. „1:“ steht für „Koartikulation 1:“ „2:“ steht für „Koartikulation 2:“. Spalte 2: Erläuterung von Artikulation und Koartikulation.

 

 

Nach der Berechnung der primären vokalischen Artikulation für Zungenrücken und Lippen („Artikulation: lingual vokalisch“ und „Artikulation: labial vokalisch“) muss koartikulatorisch die Mitbewegung von Unterkiefer und Kinn berechnet werden („Koartikulation 1: labial vokalisch – Kiefer und Kinn“). Danach findet eine koartikulatorische Abgleichung von lingualer und labialer Artikulation statt („Koartikulation 2: labial vokalisch – lingual vokalisch“). Damit ist nach diesen Schritten die Positionierung und Formung aller Artikulatoren aufgrund vokalischer Sprechbewegungen definiert. Nachfolgend wird die konsonantische Artikulation und Koartikulation überlagert. Mit der labial-konsonantischen Artikulation wird die ko­artikulatorische Mitbewegung von Unterkiefer, Kinn und des vorderen Zungenrücken berechnet. Mit der dorsal-konsonantischen Artikulation wird die koartikulatorische Mitbewegung von Unterkiefer und Kehlkopf berechnet. Recht komplex gestaltet sich die Lage für die apikal-konsonantische Artikulation. Bei der koartikulatorischen Mitbewegung des hintern Zungenrücken muss zwischen den Anteilen aufgrund  vokalischer und konsonantischer Artikulation unterschieden werden. Falls konsonantische Artikulation vorliegt, wird eine schwächere räumliche Koartikulation mit der Zungenspitze als im Fall der rein vokalischen Artikulation angenommen, da ansonsten ein in der Umgebung eines apikalen Konsonanten auftretender dorsaler Konsonant aufgrund zu starker räumlicher Koartikulation gar keine Konstriktion ausbilden würde. Mit der apikalen konsonantischen Artikulation wird danach auch die koartikulatorische Mitbewegung von Kehlkopf und Unterkiefer berechnet. Damit ist dann die Positionierung und Formung des gesamten Zungenrücken und des Unterkiefers aufgrund vokalischer und konsonantischer Artikulation und Koartikulation vollständig definiert (linguale Artikulation). Nachfolgend wird nun die aufgrund der lingualen Artikulation (insbesondere aufgrund der hieraus resultierenden Unterkieferposition) entstehende räumliche Koartikulation mit Kinn und Unterlippe berechnet. Es ist abschließend noch eine Korrektur (d.h. eine Limitierung der maximalen Höhe) für Unterkiefer und damit auch Kinn und Unterlippe durchzuführen. Ansonsten kann es bei lingual-konsonantischen Sprechbewegungen im Kontext von hohen (insbesondere gerundeten) Vokalen zu einer „Über-Koartikulation“ d.h. zu einer rein koartikulatorisch erzeugten labialen Enge- oder sogar Verschlussbildung kommen. Anschließend werden noch velische und glottale Artikulation (Sprechbewegungen des Gaumensegels und der Stimmlippen) berechnet. Hier muss keine räumliche Koartikulation modelliert werden. Insbesondere ist beim Gaumensegel die vokalisch-konsonantische Koartikulation schon durch die sich ändernde vokalische Neutralstellung des Gaumensegels gegeben.

 

 

6   Schlussbemerkung und Ausblick

 

Das funktionale Artikulationsmodell FARM ist computerimplementiert. Anschauliche Filmdarstellungen mediosagittaler Artikulationsbewegungen können beim Autor dieses Beitrages angefordert werden. Eine Erweiterung dieses Modells in das Dreidimensionale ist geplant.

 

 

7   Literatur

 

Kröger, B.J. (1998): Ein phonetisches Modell der Sprachproduktion (Niemeyer-Verlag, Tübingen).

 

Kröger, B.J. (2000): „Analyse von MRT-Daten zur Entwicklung eines vokalischen Artikulations­modells auf der Ebene der Areafunktion“, in: K. Fellbaum (Hrsg.), Elektronische Sprach­­­­signal­verarbeitung. Studientexte zur Sprachkommunikation 20, S. 201-208.

 

Kröger, B.J., Winkler, R., Mooshammer, C., Pompino-Marschall, B. (2000): “Estimation of vocal tract area function from magnetic resonance imaging: Preliminary results“ Proceedings of 5th Seminar on Speech Production: Models and Data, Kloster Seeon, Bavaria, S. 333-336.