Pressemitteilung -

Appsfactory, RTL und Microsoft realisieren Text-to-Speech-Services für automatisierte Audioinhalte

[English version here]

Köln, 20. April 2022 – RTL Deutschland legt gemeinsam mit Appsfactory den nächsten Meilenstein der digitalen, automatisierten Content-Generation im Medienbereich. Vorangetrieben werden u. a. In-App-Services, die mit dem Synthetisieren von Stimmen einhergehen und sogenannte „Text-to-Speech-Angebote“ beinhalten. Hierbei wird aus menschlichen Stimmen durch Künstliche Intelligenz lebensechte Sprache generiert. Dank dieser Technologie können zahlreiche Audioinhalte erstellt werden, ohne dass bekannte RTL-Sprecher:innen extra im Tonstudio aufgenommen werden müssen. Damit wird der Produktionsprozess erheblich beschleunigt, sodass u. a. Eilmeldungen um ein Vielfaches schneller publiziert werden können.

Das Projekt ist Teil einer umfassenden Partnerschaft von Bertelsmann mit Microsoft für technologische Innovationen in den Bereichen Medien und Bildung. Es entstand in Zusammenarbeit mit Appsfactory und wird vom Journalismus Lab der Landesanstalt für Medien NRW gefördert.

Herausforderung, ein Programm wie ein Mensch klingen zu lassen

Für das Projektteam galt es in einem ersten Showcase, die Stimmen des RTL-Moderators Maik Meuser und der Podcast-Sprecherin Inken Wriedt zu synthetisieren. Dafür wurden jeweils vier Stunden gesprochener Text der beiden Voice Talents benötigt. Daraus entstanden natürlich klingende Versionen, die von der Originalstimme, auch was Betonung, Ausdruck und Geschwindigkeit anbetrifft, kaum zu unterscheiden sind. Alle Stimmen, die den Nutzerinnen und Nutzern vertraut sind, können so in vielen Bereichen zum Einsatz kommen.

Schlüsseltechnologie, die die Arbeitsweise in Redaktionen ändert

„Audio in allen Formen ist der aktuelle Innovationstreiber der Medienbranche. Dank der Möglichkeit, Stimmen zu synthetisieren, kann der Bereich Content-Kreation nachhaltig verbessert und effizienter gestaltet werden“, erklärt Jan Nowak, VP Media & AI bei der Appsfactory.

Bekannte Stimmen sind ein enormer Erfolgsfaktor bei der Vermarktung von Audioinhalten. Das klassische Einsprechen ist aber gerade bei einer großen Menge an Inhalten gar nicht mehr möglich bzw. rentabel. Hier setzt die Technologie an und schafft damit einen signifikanten wirtschaftlichen Hebel.

„Neben der Qualität des Endresultates, war es uns als Experten der Appsfactory vor allem wichtig, die Applikation und die damit verbundenen Text-to-Speech-Anwendungen stark entlang des Nutzerbedarfs zu gestalten. Wir sind davon überzeugt, dass die heutigen Entwicklungen den Medienbereich und die Arbeitsweise in den Redaktionen der Welt nachhaltig verbessern wird“, erklärt Nowak weiter.

Isabella Thissen, Senior Vice President Editorial Products & Innovation bei RTL Deutschland: „Die nutzerfreundliche Anwendung von Appsfactory ermöglicht uns, Texte ohne großen zeitlichen Aufwand in Audiofiles umzuwandeln. Die Features wie Stimmauswahl, Textbearbeitung oder Sprechgeschwindigkeits-Einstellung sind in ihrer Bedienbarkeit intuitiv und eine wesentliche Unterstützung in der Arbeit an unseren Produkten wie der Vorlesefunktion bei den textbasierten Online-Nachrichtenangeboten von RTL und ntv.“

Hinweis:

Das Pilotprojekt folgt strengen ethischen Vorgaben, die in den Richtlinien von Microsoft für den verantwortungsvollen Umgang mit künstlicher Intelligenz festgeschrieben sind. So werden synthetische Stimmen bei künftigen Einsätzen für die Nutzerinnen und Nutzer klar erkennbar gekennzeichnet. Auch inhaltlich gibt es klare Richtlinien. Ausgeschlossen von der Synthetisierung mittels KI sind beispielsweise alle Inhalte, welche die Meinungsbildung manipulativ beeinflussen könnten. Zu diesen Fragen befindet sich das Projektteam im Austausch mit der Medienanstalt NRW.

Links

Themen

  • Daten, Telekom, IT

Kategorien

  • news
  • künstliche intelligenz
  • synthetische stimme
  • content-generation
  • audioinhalte
  • appsfactory
  • text-to-speech

Appsfactory ist mit über 700 realisierten Projekten Deutschlands führende Agentur für digitale Produkte und Applikationen. Als Kunden profitieren verschiedenste Unternehmen, unter anderem AOK, Axel Springer, Beurer, BMW, Daimler, FAZ und die Tagesschau von unserer Full Service Expertise über den gesamten Lebenszyklus technologischer Angebote. Besonderes Augenmerk liegt dabei auf die Integration Künstlicher Intelligenz (KI) und Machine Learning. Mit Akquise der Peak Performance Apps GmbH wurde das Portfolio zusätzlich um hoch skalierbare digitale Echtzeit-Interaktionen erweitert. Als eine der am schnellsten wachsenden Multimediaagenturen Europas sind wir an fünf zentralen Standorten Deutschlands mit inzwischen über 270 Mitarbeitern beschäftigt. Das QMS ist nach ISO 9001 und für die Entwicklung medizinischer Produkte nach ISO 13485 zertifiziert. Awards wie der Red Dot, der Deutsche Digital Preis und der Grand Stevie Award belegen die erfolgreiche und innovationsgetriebene Arbeit. Dazu kommen Partnerschaften mit Microsoft (Certified Gold Partner), Livingdocs und Zertifikationen im Google Agency Program und als Alexa Featured Agency.

Kontakt

Christian German

Pressekontakt Junior Marketing Manager PR & Communication LinkedIn Profil Appsfactory

Maximilian Graef

Pressekontakt Head of Marketing Marketing & PR

Zugehörige Meldungen