Verändern Text-zu-Video-Tools unseren Alltag? #KI #TEXTTOVIDEO

Nicht nur Digital Natives freuen sich über den Launch von KI-basierter Tools, mit denen Texte zu Videos transferiert werden können. Auch für Unternehmen bietet diese Technologie einige Vorteile.

So verspricht sie beispielsweise Onboardings für Mitarbeiter:innen und Online-Schulungen durch KI-basierte Tutoren viel kostengünstiger zu gestalten. Auch Erklärvideos für Kunden können damit produziert werden. Avatare einzelner Mitarbeiter:innen können diese in Video Calls vertreten. Außerdem sollen Text-zu-Video-Tools auch für Content Marketing verwendet werden können. Mögliche Anwendungsgebiete sind zahlreich vorhanden.

Die amerikanischen Tech-Riesen haben ihre Tools bislang nur angekündigt. Die veröffentlichten Forschungsberichte sprechen sowohl bei Google als auch bei Meta von hohem Missbrauchspotenzial. Die Technologien neigten dazu, Inhalte „mit sozialen Vorurteilen und Stereotypen“ zu erzeugen. Dies sei sehr schwer zu erkennen und zu filtern. Beide Unternehmen versichern jedoch, dass ihre Tools nicht auf den Markt kommen werden, solange es noch Bedenken in Bezug auf Sicherheit sowie ethische Herausforderungen gibt.

Bereits für alle Interessenten veröffentlicht ist der Text-zu-Bild-Generator Dall-E von OpenAI. Das Tool löste zuletzt besonders auf Social Media Neugier aus. Mit nur einer Textbeschreibung ermöglicht Dall-E Usern die Erstellung völlig neuer Inhalte, die verschiedene Stile, Objekte, Konzepte und Eigenschaften vereinen. User können eigene Bilder hochladen oder Vorlagen verwenden und mit Hilfe von Bildsynthese neue Bilder erstellen. Doch auch dieses Tool hat bereits Kritik einstecken müssen. Neben unklaren Eigentums- und Urheberrechten, sowie Haftungsfragen, lehnen viele Künstler:innen solche Tools strikt ab. Damit würden in wenigen Sekunden Werke entstehen, für die Menschen mehrere Tage brauchen. Außerdem sei es schon kritisch zu beachten, in welchem Umfang Trainingsdaten von realen Künstlern verwendet wurden. Durch Nutzung solcher Tools würden Künste allgemein weniger Wertschätzung erfahren. Unter anderem deshalb verzichtet Getty Images beispielsweise komplett auf Bilder, die durch Dall-E und ähnliche Apps entstanden sind.

D-ID.com ist nun ebenfalls auf dem Markt erhältlich. Hier wird – wie auch bei Meta – auf die Stable Diffusion Technologie gesetzt. User können darin eigene Avatare, oder mit nur einem Bild kurze Videos kreieren. Dafür werden eigene Dateien hochgeladen, es kann aber auch aus einem Pool von Vorschlägen gewählt werden. Text, Sprache und sogar Akzente können auf die Bilder gelegt werden und animierte Bildfolgen generieren. D-ID könnte Unternehmen mit ihren Avataren großen Mehrwert bieten. Ob und wie schnell sich der Online-Trend in unserem Geschäftsalltag wirklich integriert, bleibt aber abzuwarten.

Let´s get in touch

Quellen: