Stimm-Synthetisierung
Synthetische Stimmen in Sprachassistenten und Apps sind nicht – wie viele glauben – komplett künstlich erzeugte Stimmen. Dahinter stecken meist Menschen sowie ein komplexer Aufnahme-Prozess.
Genau darauf haben wir uns spezialisiert. Wir bei comevis sind Expert*innen auf dem Gebiet der Stimmsynthetisierung und bieten Ihnen ein umfangreiches Know How, ein breites Sprecher*innen-Netzwerk sowie speziell auf das Anwendungsgebiet zugeschnittene Technik.
Mit comevis-Expert*innen schneller ans Ziel
Was früher bis zu 10.000 Sätze und ca. 4 Wochen Arbeit brauchte, können wir dank KI Sprachmodellen beispielsweise in nur 300 Sätzen und 3 bis 7 Tagen leisten.
Das spart nicht nur Zeit und Geld, sondern bietet Ihnen zudem die Möglichkeit, Ihre Corporate Voice maximal individuell und auf die Marke abgestimmt zu gestalten. Spezielle Tonalitäten, flüstern, schreien, verständnisvoll oder ermutigend sprechen – all das ist möglich. Heben Sie sich mit gebrandetem Voice-Marketing von der Konkurrenz ab und personalisieren Sie Ihre Corporate Voice so umfassend, dass diese nicht mehr nach synthetischer Stimme, sondern nach echten Gesprächspartnern klingt.
Wir bringen Sie mit Top-Sprecher*innen zusammen
Dank unseres breiten Netzwerks in der Sprecher*innen-Szene haben wir genau die richtigen professionellen Sprecher*innen für Ihre Corporate Voice an der Hand. Gemeinsam erarbeiten wir faire und transparente Verträge und stellen sicher, dass Ethik-Informationen zu dieser doch weitgreifenden Verwendung der Stimme zu jeder Zeit klar und verständlich sind.
Die richtige Technik für große Stimmen
Da ein Tonstudio und normale Mikrofone bei weitem nicht reichen, um eine gute synthetische Stimme zu erzeugen, arbeiten wir bei comevis mit spezieller Technik, welche höchste Qualität garantiert. Wir nehmen Ihre Sprecher*innen in unserem speziell dafür gestalteten TTS-Cube auf und stellen mit diesem sicher, dass sich eine an mehreren Tagen aufgenommene Stimme wie aus einem Guss anhört. Der Cube sorgt für immer gleiche akustische Bedingungen mit reduzierter Nachhallzeit und kann den SSR (Signalrauschabstand) auf –80 dB bringen. Das bedeutet für Sie: eine klare Stimme ohne jegliche Störgeräusche. Zum Vergleich: Ein normales Studio schafft es gerade mal auf einen SSR von 40 bis 60 dB.
Tonwelten statt Warten
Genauso unangenehm wie seltsame Pausen im Gespräch sind Gespräche, die sich unnötig in die Länge ziehen. So kann ein Audio Bot-Dialog à la “Bitte nennen Sie Ihren Namen” - Stille - “Okay, ich habe Ihren Namen verstanden” und so weiter, langwierig und nervig für Ihre Nutzer*innen sein. Viel schöner wäre es doch, in einem flotten Flow ohne viel Wiederholung zum Ziel zu kommen. Wir lösen das mit Signaltönen, die Ihre Nutzer*innen verständlich und trotzdem schnell durch die Bot-Abfrage führen.
comevis Qualität für Ihre Stimmen
Standard-Qualitätsprüfungen wie ein MOS-Test, bei welchem mit Nutzer*innen ein subjektives Qualitätsempfinden überprüft wird oder eine WER-Prüfung (Word Error Rate) reichen uns nicht. Wir bei comevis haben ein spezielles Prüfverfahren entwickelt, welches unter anderem die Natürlichkeit, die Tonalität und die Höranstrengung für Nutzer*innen testet. So stellen wir für Sie sicher, dass Ihre synthetische Corporate Voice sich auf einem exzellenten Sprach-Niveau bewegt.
Custom TTS Einsatzbereiche
IVR
VoiceBot
App
Website
Video
Podcast
Branded Voice Messages
Personalisierter Content
Brand Custom Voice - Swisscom
Seit dem Jahr 2017 betreuen wir die Swisscom mit unseren Leistungsbereichen corporate Voice/Brand Voice. Wir recorden laufend für diverse Anwendungsgebiete die besetzten Swisscom Voices in den Sprachen Deutsch, Englisch, Italienisch & Französisch. Bezogen auf das Swisscom Produkt TV Box wurden Custom Voices durch comevis synthetisiert. Hierbei wird insbesondere unser spezial Know-how zum Recording & Generierung synthetischer Custom Voices genutzt. So werden neue digitale Anwendungen möglich.
Swisscom Voice Assistant
Stimme Deutsch, Human
Stimme Deutsch, TTS
Stimme Französisch, Human
Stimme Französisch, TTS
The Voice of TOBi - Vodafone Voice/XR-Bot
Gemeinsam mit Vodafone haben wir für den Chat-/Voice/XR-Bot TOBi eine menschliche Stimme erschaffen.
TOBi ist der digitale Assistent von Vodafone. Seit April 2019 unterstützt er den Vodafone-Kundenservice. Sein Ziel: Die verschiedenen Anliegen der Kunden im Erstkontakt thematisch einordnen und, wenn möglich, viele davon direkt selbst lösen. Bisher konnten Kunden mit TOBi nur chatten. Das wird sich ändern, denn jetzt hat TOBi sprechen gelernt und entwickelt sich so zu einem digitalen Service-Mitarbeiter, der seine Kolleg*innen an den Hotlines unterstützt, um Kund*innen künftig schneller zu helfen.
TOBi Voice Assistant
Human
N-TTS Sprachsythese
Neurale Synthetisierung
Dieser Vorgang beschreibt die künstliche Erzeugung einer menschlichen Stimme – eingesprochene Texte werden also in Sprache umgewandelt. Hochkomplexe neuronale Verfahren und TTS-Technologien (Text-to-Speech) stehen im Zentrum: Diese analysiert und lernt nicht nur das gesprochene Wort, sondern auch ihre Phonetik, also die Besonderheiten der Stimme in Bezug auf Klangfarbe und Aussprache.
Der Vodafone Sprecher musste beim gesamten Verfahren im Aufnahmestudio gerade einmal 2.000 Sätze einsprechen. Mit Hilfe seiner künstlichen Intelligenz kann Voicebot TOBi daraus völlig neue Sätze bilden – ohne dass Thomas diese im Aufnahmestudio erneut einsprechen muss.
Von Stille zur Stimme:
Wie wir den O2 Bot "Aura" zum sprechen gebracht haben
Durch das Entwickeln einer Stimme für Aura haben wir es geschafft, den Bot menschlicher und zugänglicher zu machen. Wir haben dafür gesorgt, dass Aura sich auf natürliche und freundliche Weise mit unseren Kunden unterhalten kann, um ihre Anfragen zu beantworten und sie bei Bedarf an die richtige Stelle zu leiten.
A.I.
Trainingsdaten in Perfektion
Quality In - Quality Out.
Nur wenn die Trainingsdaten zum erstellen einer synthetischen Stimme in allen Nuancen perfekt sind, ist es möglich ein hochqualitatives Sprachmodell zu kreieren.
Hierzu haben wir bei comevis in unserem Sonic Lab einen spezielles Produktionsumfeld entwickelt, welches im Gegensatz zu konventionellen Aufnahmetechniken deutlich mehr Details und Qualität herausarbeiten kann.
Zielgruppen spezifische Custom Voice für Blau
Für die Zielgruppe der Mobilfunkmarke Blau haben wir eine besonders charismatische synthetische Stimme in Zusammenarbeit mit Nuance kreiert. Auch hier hat uns unser Spezial Know-How sowie die Möglichkeiten in unserem Sonic Lab zu einem erstklassigen Ergebnis geführt.