Konkatenative Sprachsynthese mit großen Datenbanken
Authors
More about the book
Diese Dissertation beschreibt den akustischen Teil des Sprachsynthese-Systems PAPAGENO, die Generierung eines Sprachsignals aus einer mit Betonungsmarken versehenen Folge von Lautsymbolen. Vorgeschlagen wird ein integrierter Ansatz zur konkatenativen Sprachsynthese, der die Vorteile der Bausteinselektion aus großen Datenbasen mit leistungsfähigen Algorithmen zur Signalmanipulation verbindet. Bausteinerzeugung, -auswahl und -verkettung werden im Zusammenspiel mit der Ansteuerung prosodischer Parameter als eng verzahnte Aufgaben verstanden und in algorithmisch weitreichend aufeinander abgestimmten Verfahren verknüpft. Das vorgeschlagene Sprachsynthese-System ist in allen Modulen durchgehend datengetrieben und kann so (wie in mehreren Beispielen der beiliegenden Audio-CD gezeigt) durch Training einfach und automatisch an neue Sprecher oder Sprachen angepaßt werden. In informellen Hörtests wurde die Natürlichkeit der mit dem vorgeschlagenen System synthetisierten Sprache als der anderer State-of-the-art-Systeme überlegen beschrieben.