Generierung prosodischer Marker für ein multilinguales Sprachsynthesesystem
Authors
Parameters
More about the book
Die vorliegende Arbeit gibt zunächst einen Überblick über verschiedene prosodische Modelle, die in Sprachsynthesesystemen zur Prosodiegenerierung verwendet werden. Anschließend wird das prosodische Modell beschrieben, das im multilingualen Sprachsynthesesystem PAPAGENO eingesetzt wird. In diesem Modell werden perzeptive prosodische Marker eingesetzt, die anschließend zur Grundfrequenz-, Lautdauer- und Lautenergiegenerierung verwendet werden. Der Schwerpunkt der Arbeit liegt auf der datenbasierten Generierung der perzeptiven prosodischen Marker. Dabei werden speziell an die Erfordernisse angepaßte neuronale Netzwerkarchitekturen eingesetzt, mit denen eine hohe Vorhersagegenauigkeit für die Marker erreicht wird. Neben der hohen Vorhersagegenauigkeit wird auch eine hohe Qualität bei der Vorhersage erreicht, was anhand einer umfangreichen qualitativen Auswertung gezeigt wird. Die beschriebenen Verfahren werden zur datenbasierten Generierung prosodischer Marker für drei Sprachen angewendet. Die guten Ergebnisse für alle drei untersuchten Sprachen sprechen dafür, daß die Verfahren für weitere Sprachen (multilingual) erfolgreich eingesetzt werden können.
Book purchase
Generierung prosodischer Marker für ein multilinguales Sprachsynthesesystem, Achim F. Müller
- Language
- Released
- 2003
Payment methods
- Title
- Generierung prosodischer Marker für ein multilinguales Sprachsynthesesystem
- Language
- German
- Authors
- Achim F. Müller
- Publisher
- w.e.b.-Univ.-Verl.
- Released
- 2003
- Format
- Paperback
- ISBN10
- 3935712804
- ISBN13
- 9783935712804
- Series
- Studientexte zur Sprachkommunikation
- Category
- University and college textbooks
- Description
- Die vorliegende Arbeit gibt zunächst einen Überblick über verschiedene prosodische Modelle, die in Sprachsynthesesystemen zur Prosodiegenerierung verwendet werden. Anschließend wird das prosodische Modell beschrieben, das im multilingualen Sprachsynthesesystem PAPAGENO eingesetzt wird. In diesem Modell werden perzeptive prosodische Marker eingesetzt, die anschließend zur Grundfrequenz-, Lautdauer- und Lautenergiegenerierung verwendet werden. Der Schwerpunkt der Arbeit liegt auf der datenbasierten Generierung der perzeptiven prosodischen Marker. Dabei werden speziell an die Erfordernisse angepaßte neuronale Netzwerkarchitekturen eingesetzt, mit denen eine hohe Vorhersagegenauigkeit für die Marker erreicht wird. Neben der hohen Vorhersagegenauigkeit wird auch eine hohe Qualität bei der Vorhersage erreicht, was anhand einer umfangreichen qualitativen Auswertung gezeigt wird. Die beschriebenen Verfahren werden zur datenbasierten Generierung prosodischer Marker für drei Sprachen angewendet. Die guten Ergebnisse für alle drei untersuchten Sprachen sprechen dafür, daß die Verfahren für weitere Sprachen (multilingual) erfolgreich eingesetzt werden können.