Text-to-Speech: Echte Kinderstimmen statt Computersound

Text-to-Speech-Kinderstimmen
Sprachlos? Kommunikationsbarrieren ade

Was tun, wenn die eigene Stimme zur Kommunikation nicht ausreicht? Genau so ging es der kleinen Lisa, deren Behinderung sich auch auf ihre Sprachfähigkeit auswirkt. Dank des Stands der Technik bedeutet dies heutzutage jedoch nicht mehr, dass sprachlich eingeschränkte Personen auf verbale Kommunikation verzichten müssen. Die Lösung heißt Text-to-Speech (TTS) und funktioniert, indem Text mittels Sprachsynthesesystemen in Sprache überführt wird (Lesen Sie dazu auch „Mit Stimme zum Erfolg dank Text-to-Speech„). Entsprechende Technologien existieren schon seit geraumer Zeit und konnten bereits maßgeblich dazu beitragen, auch sprachbeeinträchtigten Personen eine Stimme zu verleihen und ihnen die Kommunikation zu erleichtern. Allerdings wirkten viele Stimmen, insbesondere solche für jüngere Altersklassen, in der Vergangenheit nicht wirklich authentisch. Und das, obwohl die Liste der Sprachstörungen im Kindesalter lang ist.

So wurden Kinderstimmen bisher von Schauspielern nachgeahmt oder mittels der künstlichen Veränderung von Tonhöhen versucht zu imitieren. Zu einer realistischen Kommunikation gehört jedoch mehr als die reine Vertonung von Schrift. Das führte bei Lisa dazu, dass sie ihr Sprachsynthesegerät nur sehr ungern nutzte und aufgrund von Reaktionen auf ihre Computerstimme in der Öffentlichkeit immer verschlossener wurde. So fasst auch Uli Ehlert, Produktmanager bei Tobii Technology, zusammen: „Bisher konnten wir junge Anwender nicht optimal mit Sprachhilfsmitteln versorgen, denn die computergenerierten Stimmen klangen stets erwachsen und etwas zu blechern“.

Text-to-Speech schafft Vertrauen zur neuen Stimme

Nun ist es erstmals gelungen, authentische Kinderstimmen im Bereich der Sprachsynthese zu produzieren. Diese klingen, so Ehlert, „so natürlich, dass sich Kinder mit ihren Aussagen voll identifizieren können – man hört kaum noch, dass sie von einem Computer stammen“. Gelungen ist diese Neuerung mit Hilfe von Text-to-Speech und in 4 Schritten:

  • Kreieren eines neuen Aufnahmeskipts: Aussortieren von Zungenbrechern, Anpassen des Skripts an den Kinderwortschatz
  • Identifizieren von Sprachtalenten in der entsprechenden Altersgruppe: Aufspüren von besonders begabten Lesern und Sprechern
  • Aufnahmesitzungen: Orientierung an Schulferien, um die Schule nicht zu vernachlässigen
  • Iterative Verbesserungen: Vornehmen von Verbesserungen in sich wiederholenden Schritten

Text-to-Speech-SprachtalenteNachdem zwei talentierte junge Sprecher gefunden waren, mussten in mehrwöchiger Arbeit im Aufnahmestudio unzählige Wörter, Sätze und die merkwürdigsten Kombinationen aufgezeichnet werden, um geeignetes Audiomaterial zu produzieren. Als Resultat klingen die neuen Kinderstimmen nicht nur ganz natürlich, sondern sind auch optimal auf die Bedürfnisse von Kindern und Jugendlichen mit Kommunikationseinschränkungen abgestimmt. Darüber hinaus sind Applikationen im Bereich von Audiobüchern, interaktiven Kinderbüchern und vielen anderen zu erwarten. So fasst auch Lars-Erik Larsson, CEO bei der acapela group, zusammen: „Nach über 2.500 investierten Stunden für Forschung und Entwicklung, Aufnahme und Verarbeitung der Daten ist uns mit den neuen Kinderstimmen ein echter Durchbruch in der Stimmgestaltung gelungen.

Eine neue Lebensqualität

Das Ergebnis sind authentische und wirklich ausdrucksstarke Stimmen. Die Anwenderreaktionen zeigen, dass wir mit unserem umfassenden Repertoire auf dem richtigen Weg zur Umsetzung von individuellen Bedürfnissen sind“. Die veränderte Lebensqualität der kleinen Lisa ist dabei nur ein Beispiel von vielen.
Neugierig? Eine Hörprobe der neuen Kinderstimmen gibt es hier:

 

 


acapela groupDie acapela group entwickelt Sprachlösungen, die Inhalte in über 30 Sprachen lebendig werden lassen. Mehr als 100 synthetische, aber dennoch natürlich klingende Stimmen überführen Texte in ein angenehmes Klangerlebnis – inklusive Übermittlung von Bedeutung und Absicht. Das Repertoire der acapela group umfasst auch Stimmen von Prominenten, Stimmen mit Akzent oder Dialekt; Stimmen, die singen oder erzählen; Stimmen, die verschiedene Stimmungen annehmen können sowie Stimmen für alle Altersgruppen und Sprachen.


Detlev Artelt

Detlev Artelt - CEO, Senior-Consultant, Blogger und Unified Communications & Collaborations Experte. Als Kommunikationsarchitekt und Technologie-Berater seit über 25 Jahren für einen besseren Kundenservice aktiv.

Weitere Beiträge - Website - Twitter - Facebook - LinkedIn - Google Plus

2 Kommentare
  1. Sehr geehrte Damen und Herren,

    Auf Ihrere Webseite heißt es:
    „Eine Hörprobe für die neuen Kinderstimmen gibt es hier:“ Leider funktioniert die Audiodatei nicht! Können Sie mir eine Probe und Informationen Preise usw. per mail senden!

    Vielen Dank

    Hans-Martin Gruber

    Hans-Martin Gruber

Schreibe einen Kommentar


X