Voice Synthese [TTS]:

Synthetisierung Ihrer Corporate Voice
Cloning & Design

Kostenfreie Erstberatung (1/2h)

Anker 1

Stimm-Synthetisierung

Synthetische Stimmen in Sprachassistenten und Apps sind nicht – wie viele glauben – komplett künstlich erzeugte Stimmen. Dahinter stecken meist Menschen sowie ein komplexer Aufnahme-Prozess.

Genau darauf haben wir uns spezialisiert. Wir bei comevis sind Expert*innen auf dem Gebiet der Stimmsynthetisierung und bieten Ihnen ein umfangreiches Know How, ein breites Sprecher*innen-Netzwerk sowie speziell auf das Anwendungsgebiet zugeschnittene Technik.

Mit comevis-Expert*innen schneller ans Ziel

Was früher bis zu 10.000 Sätze und ca. 4 Wochen Arbeit brauchte, können wir dank KI Sprachmodellen beispielsweise in nur 300 Sätzen und 3 bis 7 Tagen leisten.

Das spart nicht nur Zeit und Geld, sondern bietet Ihnen zudem die Möglichkeit, Ihre Corporate Voice maximal individuell und auf die Marke abgestimmt zu gestalten. Spezielle Tonalitäten, flüstern, schreien, verständnisvoll oder ermutigend sprechen – all das ist möglich. Heben Sie sich mit gebrandetem Voice-Marketing von der Konkurrenz ab und personalisieren Sie Ihre Corporate Voice so umfassend, dass diese nicht mehr nach synthetischer Stimme, sondern nach echten Gesprächspartnern klingt.

Wir bringen Sie mit Top-Sprecher*innen zusammen

Dank unseres breiten Netzwerks in der Sprecher*innen-Szene haben wir genau die richtigen professionellen Sprecher*innen für Ihre Corporate Voice an der Hand. Gemeinsam erarbeiten wir faire und transparente Verträge und stellen sicher, dass Ethik-Informationen zu dieser doch weitgreifenden Verwendung der Stimme zu jeder Zeit klar und verständlich sind.

Die richtige Technik für große Stimmen

Da ein Tonstudio und normale Mikrofone bei weitem nicht reichen, um eine gute synthetische Stimme zu erzeugen, arbeiten wir bei comevis mit spezieller Technik, welche höchste Qualität garantiert. Wir nehmen Ihre Sprecher*innen in unserem speziell dafür gestalteten TTS-Cube auf und stellen mit diesem sicher, dass sich eine an mehreren Tagen aufgenommene Stimme wie aus einem Guss anhört. Der Cube sorgt für immer gleiche akustische Bedingungen mit reduzierter Nachhallzeit und kann den SSR (Signalrauschabstand) auf –80 dB bringen. Das bedeutet für Sie: eine klare Stimme ohne jegliche Störgeräusche. Zum Vergleich: Ein normales Studio schafft es gerade mal auf einen SSR von 40 bis 60 dB.

Tonwelten statt Warten

Genauso unangenehm wie seltsame Pausen im Gespräch sind Gespräche, die sich unnötig in die Länge ziehen. So kann ein Audio Bot-Dialog à la “Bitte nennen Sie Ihren Namen” - Stille - “Okay, ich habe Ihren Namen verstanden” und so weiter, langwierig und nervig für Ihre Nutzer*innen sein. Viel schöner wäre es doch, in einem flotten Flow ohne viel Wiederholung zum Ziel zu kommen. Wir lösen das mit Signaltönen, die Ihre Nutzer*innen verständlich und trotzdem schnell durch die Bot-Abfrage führen.

comevis Qualität für Ihre Stimmen

Standard-Qualitätsprüfungen wie ein MOS-Test, bei welchem mit Nutzer*innen ein subjektives Qualitätsempfinden überprüft wird oder eine WER-Prüfung (Word Error Rate) reichen uns nicht. Wir bei comevis haben ein spezielles Prüfverfahren entwickelt, welches unter anderem die Natürlichkeit, die Tonalität und die Höranstrengung für Nutzer*innen testet. So stellen wir für Sie sicher, dass Ihre synthetische Corporate Voice sich auf einem exzellenten Sprach-Niveau bewegt.

Custom TTS Einsatzbereiche

IVR

VoiceBot

App

Website

Video

Podcast

Branded Voice Messages

Personalisierter Content

Slide 2 - Top

Brand Custom Voice - Swisscom

Seit dem Jahr 2017 betreuen wir die Swisscom mit unseren Leistungsbereichen corporate Voice/Brand Voice. Wir recorden laufend für diverse Anwendungsgebiete die besetzten Swisscom Voices in den Sprachen Deutsch, Englisch, Italienisch & Französisch. Bezogen auf das Swisscom Produkt TV Box wurden Custom Voices durch comevis synthetisiert. Hierbei wird insbesondere unser spezial Know-how zum Recording & Generierung synthetischer Custom Voices genutzt. So werden neue digitale Anwendungen möglich.

Zum Best Practice

Talk to Us

Auch Microsoft präsentiert stolz die Sprachmodelle zu denen wir die Trainingsdaten entwickelt haben.

zum Microsoft Speech Studio

Swisscom Voice Assistant

Stimme Deutsch, Human

Stimme Deutsch, TTS

Stimme Französisch, Human

Stimme Französisch, TTS

The Voice of TOBi - Vodafone Voice/XR-Bot

Gemeinsam mit Vodafone haben wir für den Chat-/Voice/XR-Bot TOBi eine menschliche Stimme erschaffen.

TOBi ist der digitale Assistent von Vodafone. Seit April 2019 unterstützt er den Vodafone-Kundenservice. Sein Ziel: Die verschiedenen Anliegen der Kunden im Erstkontakt thematisch einordnen und, wenn möglich, viele davon direkt selbst lösen. Bisher konnten Kunden mit TOBi nur chatten. Das wird sich ändern, denn jetzt hat TOBi sprechen gelernt und entwickelt sich so zu einem digitalen Service-Mitarbeiter, der seine Kolleg*innen an den Hotlines unterstützt, um Kund*innen künftig schneller zu helfen.

Zum Best Practice

Blog-Post

TOBi Voice Assistant

Human

N-TTS Sprachsythese

Medienecho

Zum Artikel

Neurale Synthetisierung

Dieser Vorgang beschreibt die künstliche Erzeugung einer menschlichen Stimme – eingesprochene Texte werden also in Sprache umgewandelt. Hochkomplexe neuronale Verfahren und TTS-Technologien (Text-to-Speech) stehen im Zentrum: Diese analysiert und lernt nicht nur das gesprochene Wort, sondern auch ihre Phonetik, also die Besonderheiten der Stimme in Bezug auf Klangfarbe und Aussprache.

Der Vodafone Sprecher musste beim gesamten Verfahren im Aufnahmestudio gerade einmal 2.000 Sätze einsprechen. Mit Hilfe seiner künstlichen Intelligenz kann Voicebot TOBi daraus völlig neue Sätze bilden – ohne dass Thomas diese im Aufnahmestudio erneut einsprechen muss.

Aufnahmestudio-mit-Alex-Patrick-Stella-Vodafone

Von Stille zur Stimme:
Wie wir den O2 Bot "Aura" zum sprechen gebracht haben

Durch das Entwickeln einer Stimme für Aura haben wir es geschafft, den Bot menschlicher und zugänglicher zu machen. Wir haben dafür gesorgt, dass Aura sich auf natürliche und freundliche Weise mit unseren Kunden unterhalten kann, um ihre Anfragen zu beantworten und sie bei Bedarf an die richtige Stelle zu leiten.

Zum O2 Sound Branding

A.I.
Trainingsdaten in Perfektion

Quality In - Quality Out.

Nur wenn die Trainingsdaten zum erstellen einer synthetischen Stimme in allen Nuancen perfekt sind, ist es möglich ein hochqualitatives Sprachmodell zu kreieren.

Hierzu haben wir bei comevis in unserem Sonic Lab einen spezielles Produktionsumfeld entwickelt, welches im Gegensatz zu konventionellen Aufnahmetechniken deutlich mehr Details und Qualität herausarbeiten kann.

Zielgruppen spezifische Custom Voice für Blau

Für die Zielgruppe der Mobilfunkmarke Blau haben wir eine besonders charismatische synthetische Stimme in Zusammenarbeit mit Nuance kreiert. Auch hier hat uns unser Spezial Know-How sowie die Möglichkeiten in unserem Sonic Lab zu einem erstklassigen Ergebnis geführt.

Talk to Us