Generative KI

in der Erklärfilm­produktion – ein Zukunftsmodell?

10. Aug. 2023 | 6 Minuten Lesezeit

Mitarbeiterfoto Jacques Alomo

Jacques Alomo
AI Innovation

Was Sie aus diesem Artikel mitnehmen

  • Wie und ob KI die Produktion von Erklärfilmen effizienter macht
  • Wo es im Produktionsprozess läuft und wo es noch hakt
  • Welche Rolle der Mensch dabei spielt
  • Wie wir gemeinsam ein KI-Filmprojekt mit Ihnen realisieren

Seit mehr als 15 Jahren begeistern wir mit unseren Erklärfilmen Kunden aus allen Branchen. Als Premiumanbieter haben wir höchste Ansprüche an transparente Projektabwicklung und an die Qualität des finalen Filmes: sprachliche Eleganz, visuelle Ästhetik und didaktischer Anspruch stehen dabei im Fokus.

Mit unseren effizient gestalteten Prozessen können wir eine Vielzahl an Projekten in perfekter Qualität umsetzen. Doch angesichts der fortdauernden Begeisterung für generative KI haben wir uns gefragt: Kann KI uns noch effizienter machen? Schneller? Vielleicht sogar beides? Die Antwort auf diese Fragen präsentieren wir Ihnen in diesem Blogartikel.

Direkt zum – mit Hilfe von KI – produzierten Film

Der Erklärfilm „Phishing“ bringt nicht nur ein komplexes Thema in zweieinhalb Minuten auf den Punkt, sondern: bei Konzeption und Produktion des Filmes haben wir voll auf die neuen Möglichkeiten generativer KI gesetzt. (Stand: August 2023)

Gliedern wir erst mal den abstrakten Produktionsablauf in seine essenziellen Phasen:

  • Kreativer Textentwurf: Basierend auf den Kundenunterlagen oder des Briefings entwerfen wir den Sprechtext.
  • Visuelles Storyboard: Passend dazu, erstellen wir das Storyboard mit den passenden Bildern für jede Szene des Sprechtexts – wenn gewünscht sogar mit einem eigens für den Kunden entworfenen visuellen Stil.
  • Lebendige Animation: Schließlich hauchen wir den Bildern und ihren Elementen Leben ein, fügen Sound und Sprecherstimme hinzu – und fertig ist der Erklärfilm.
Eine mit KI generierter Illustration, sie zeigt einen jungen Mann der vor einem Laptop sitzt und im Hintergrund fliegen verschiedene Objekte die an Notizbücher und elektronische Geräte erinnern herum.

Um es vorwegzunehmen: für unseren mit Hilfe von KI erstellten Film haben wir länger gebraucht als bei herkömmlicher Produktion (Stand: August 2023)! Die meiste Zeit steckten wir dabei in den völlig neuen Illustrationsworkflow, die Gestaltung der Grafiken. Die anderen Arbeitsschritte konnten gleich schnell oder schneller abgeschlossen werden.

Schauen wir uns die Unterschiede im Ergebnis mal genauer an:

Standard-Filmproduktion

Eine klassische youknow Filmproduktion mit viel Liebe zum Detail.

  • Sprechtext von unserem erfahrenen Konzeptionsteam geschrieben
  • Zeichnungsplanung erzeugt durch geballte Motion Design Power
  • Händisch gestaltete reduzierte Grafiken sorgen für eleganten zurückhaltenden Look bei überschaubarem Aufwand
  • Echte Stimme ermöglicht mehr Stimmvariation
  • Manuelle Animation durch unsere Motion Design Experten

Filmproduktion mit KI-Unterstützung

Auch hier floss viel Liebe in die Produktion, flankiert von der Nutzung schlauer und schneller AI-Tools

  • Sprechtext durch GPT4
  • Zeichnungsplanung durch GPT4
  • Aufwendige KI-Grafiken erzeugen „Premiumlook“
  • Menschenähnliche, mit KI generierte Stimme
  • Manuelle Animation durch unsere Motion Design Experten

Unser Fazit

Was die eitliche Umsetzung betrifft, lag die Gesamtdauer – trotz des erstmaligen Experiments – nur leicht über der einer normalen Filmproduktion. Die Qualität variierte stark in den verschiedenen Projektphasen und Gewerken.

Texterstellung

Hier erzielten wir in deutlich kürzerer Zeit ein für uns akzeptables Ergebnis. Die KI lieferte nicht nur Textfragmente, sondern gleich einen soliden Text als Ausgangsbasis. Der „menschliche Feinschliff“ beanspruchte nur einen Bruchteil der üblichen Zeit, der normalerweise für die Texterstellung benötigt wird. Dies gelingt jedoch nur, wenn das Briefing für das Sprachmodell umfangreich vorbereitet wird. 👍

ACHTUNG: Achten Sie unbedingt darauf, wo die Daten der von Ihnen verwendeten generativen KI-Tools liegen, ob auf amerikanischen Servern oder DSGVO-konform auf europäischen. Prüfen Sie das unbedingt, bevor Sie sensible oder vertrauliche Daten hochladen.

Bildgenerierung

Hier ging es im Prozess bildlich gesprochen immer einen Schritt voraus und zwei zurück. Die KI ist gut darin, Bildideen zu entwickeln und Alternativen in Stil, Szene und Anmutung anzubieten. Dadurch lassen sich szenische Tiefen für mehr Ausdruck in deutlich weniger Zeit generieren. Zudem bringt sie frischen Schwung rein und kann ein inspirierender Sparringspartner sein. 👍

Aber der Teufel steckt im Detail:

  • Feinheiten und kleinteilige Ausschnitte bereiteten der KI Schwierigkeiten. Es gilt: Je kleiner das Objekt im generierten Bild, desto niedriger die Qualität bzw. die Wahrscheinlichkeit, dass das Objekt richtig dargestellt wird.
  • Initialaufwand für die Erstellung eines Stilprompts kann viel Zeit in Anspruch nehmen.
  • Es bedarf vieler Iterationen, um eine konsistente Szenendarstellung zu erzielen.
  • Grafische oder abstrakte Darstellungen, wie Icons oder Interfaces, sind nur schwer bis gar nicht möglich, da die Modelle noch keine perfekten Linien ziehen können und Interfaces von der korrekten Abbildung vieler kleiner Elemente leben.
  • Die generierten Bilder müssen nachträglich bearbeitet werden, um die Elemente für die Animation vorzubereiten. Das ist deutlich aufwendiger, da man nicht mit Vektorgrafiken arbeitet, sondern mit gerasterten Grafiken. auch Inkonsistenz im Licht und Schattenspiel.
  • Hinzu kommt, dass die KI in Bildern „denkt“ (obwohl sie natürlich nicht wirklich denkt), während erfahrene (Motion) Designer/-innen von Anfang an in filmischen Sequenzen denken. Wir sind sicher, dass man die KI auch dorthin bringen kann, das erfordert aber einen (noch) hohen Aufwand in das Training der KI. Der Gesamtaufwand summiert sich daher auf mindestens das Doppelte der ursprünglichen Zeit.
  • Durch neue Modelle und deren Kombination wird in Zukunft mehr Kontrolle möglich sein. Trotzdem braucht es erstmal eine neue Arbeitsweise. 👎

Fehler bei der Bildgenerierung

Diese Illustration, die mit AI generiert wurde, zeigt eine Person mit Kopfhörern, die an einem Schreibtisch sitzt und ein Telefon hält. Der Schreibtisch ist mit einem Laptop, einer Tasse und einem Stiftehalter ausgestattet. Im Hintergrund ist eine Stadtlandschaft durch große Fenster zu sehen. Ein Fehler ist der fehlende linke Arm.
Diese mit AI generierte Illustration zeigt eine Person, die mit den Rücken zum Betrachtenden an einem Schreibtisch mit einem Laptop sitzt. Der Raum ist modern eingerichtet, mit einem Bücherregal auf der linken Seite, einer Stehlampe und einem Schrank auf der rechten Seite. Im Hintergrund sind große Fenster zu sehen, die abstrakte Formen zeigen. Der Fehler ist der Körper beziehungsweise die unnatürliche Haltung der Beine der Person.
Diese von KI generierte Illustration zeigt eine weibliche person die an einem Laptop arbeitet, die Szene wird von der Seite gezeigt. Der Laptop ist viel zu groß proportioniert und die Hände sehen unförmig aus.
Eine von KI generierte Illustration, die einen Laptop zeigt und im Hintergrund fliegen Symbole von Briefumschlägen und Texten herum. Der Laptop ist unproportional.
Diese mit AI generierte Illustration zeigt einen Mann der vor einem Laptop sitzt, neben ihm stehen Pflanzen und eine Tasse. Der Hintergrund erinnert an einen Sternenhimmel. Der Fehler ist, dass der Mann dem Betrachtenden den Rücken zuwendet.
Diese mit AI generierte Illustration zeigt eine Person, die vor einem Computerbildschirm sitzt und einen Finger auf den Bildschirm richtet. Der Schreibtisch ist mit einer Tastatur, einer Maus und einem Becher ausgestattet. Im Hintergrund sind zahlreiche schwebende Briefumschlagsymbole zu sehen, die E-Mails darstellen. Der Fehler ist dass die Person zwischen Tastatur und Bildschirm steht und nicht am Schreibtisch im Vordergrund steht.
Diese Illustration, die mit AI generiert wurde, zeigt eine beziehungsweise zwei Personen in einem Büro, die an einem Schreibtisch arbeiten. Die Person hält ein Telefon und einen Stift, während sie auf ein Dokument schaut. Die Szene ist in Blau- und Orangetönen gehalten, was eine Abendstimmung suggeriert. Im Hintergrund sind Fenster mit einer Stadtlandschaft zu sehen. Ein Fehler im Bild ist, dass die Personen die eigentlich nur eine sein sollte, ineinander verschmolzen sind.

Animation

  • Die Figuren mussten mit dem sogenannten „Puppet Tool” animiert werden. Dabei wird das Bild der Figur mit Punkten versehen, die anschließend bewegt werden können, wodurch sich das Bild entsprechend verzerrt. Die Bewegungen sind dabei sehr limitiert und beschränken sich auf z. B. leichte Kopf- und Armbewegungen. Normalerweise werden Figuren in unseren Filmen schon bei der Illustration in einzelne Bestandteile aufgeteilt (z. B. Augen, Kopf, Arme, Beine etc.). Die KI-gestützte Bilderstellung macht eine solche Aufteilung noch etwas aufwendiger, da man hier nachträglich die Figuren aufteilen müsste. Das Puppet Tool ist somit zeitsparender und kann einfache Bewegungen gut darstellen.
  • Durch Effekt-Stockmaterial konnte den Bildern zusätzlich Leben eingehaucht werden. Dabei wurden Sonnenreflexionen, Staubpartikel und digitales Rauschen verwendet. Die Herausforderung hierbei war es, das Material an die KI generierten Bilder anzugleichen.
  • Ein Großteil der Szenen wurde mit Hilfe von sogenannten „2,5D Kamerafahrten” umgesetzt. Dabei werden die flachen 2D Elemente in einem dreidimensionalen Raum aufgefächert und mit einer künstlichen Kamera abgefilmt. Dies erzeugt ein räumliches Gefühl, mit dem wir trotz statischer Bildelemente Dynamik und Spannung erzeugen können. Diese Technik nutzen wir bereits hin und wieder in unseren aktuellen Filmen. Allerdings sind dort die einzelnen Elemente weniger statisch als in unserem KI-Film. Die Kamerafahrten sollen also letztendlich kaschieren, dass sich im Bild nicht allzu viel bewegt.
  • Die Bilder wurden in einer 4K Auflösung angelegt, um bei den oben beschriebenen „2,5D Kamerafahrten” eine stets hohe Bildschärfe zu gewährleisten. Durch die daraus resultierenden größeren Datenmengen wurde die Arbeit im Animationsprogramm etwas verlangsamt. Auch das finale Ausspielen des Filmes dauerte ca. 5-mal so lange als üblich. Unsere aktuellen Filme werden in Full HD angelegt, ebenso die dafür verwendeten Grafiken.

Der Gesamtaufwand in der Animation war in etwa gleich zu dem eines animade Erklärfilms. Das Stockmaterial und die vielen Kamerafahrten machen den Film überraschend lebendig und dynamisch. Die Animation hat sich eher auf das Aufwerten der KI-Bilder konzentriert, anstatt auf eine kleinteilige Animation der verschiedenen Bildelemente. Sofern die Figuren keine komplexen Bewegungen vollführen müssen und die Bilder stets szenisch gehalten werden, bietet diese Art der Produktion eine gute Alternative zu unserem bisherigen Workflow.

Gesamtergebnis (Stand: August 2023)

Es ist offensichtlich, dass unsere bewährten Abläufe nicht einfach durch KI ersetzt werden können, um effizienter und einfacher in der Produktion zu sein. Die Nutzung von KI kann viele Vorteile bieten, erfordert jedoch eine andere Herangehensweise und Anpassungen im Gesamtworkflow. Textbasierte Elemente lassen sich bereits jetzt effizienter gestalten, bei der Bildgenerierung und insbesondere bei der Animation gibt es aktuell jedoch noch keine guten Lösungen am Markt, die einen echten Skalenvorteil ermöglichen. Hier gilt es aufmerksam zu bleiben und neue Modelle und Technologien stets zu testen und in die Workflows zu integrieren. Wir davon aus, dass es nur wenige Monate dauern wird, bis die KI hier ebenfalls erstklassige Ergebnisse liefern kann. Es gibt jedoch auch Grenzen für die Flexibilität der KI. Die gestalterische Freiheit und Kontrolle über Ergebnisse sind geringer als bei manueller „Kreation", dafür können die Resultate einzigartig sein!

Achtung: Für uns ist klar, dass der Mensch weiterhin die zentrale Rolle spielen wird, wenn es darum geht, die Ergebnisse der KI zu bewerten, die besten Ergebnisse auszuwählen, sie miteinander zu verknüpfen und zu bearbeiten. Hier ist jemand gefragt, der über die notwendige Vision und Erfahrung verfügt, um die Resultate sorgfältig zu kuratieren.

AI vs. Standard – die Ergebnisse im Vergleich

Standard-Filmproduktion

Filmproduktion mit KI-Unterstützung

Gut zu wissen

Dieses Experiment wurde von einem professionellen Erklärfilm-Produktionsteam durchgeführt. Ich, Jacques Alomo, Head of AI Innovation bei youknow & Founder von creamlabs AI, bin selbst seit Langem in der Filmproduktion tätig und habe mich schon sehr früh mit generativer KI beschäftigt. Diese Kombination ermöglichte es uns erst, im Experiment rasch Erkenntnisse zu sammeln und sinnvolle Verbesserungen in jeder Iteration vorzunehmen. Ob bei Text, Bildern oder Bewegtbildern: Der richtige Prompt ist letztendlich der Schlüssel zum Erfolg. Schnelle Anpassungen erfordern ein tiefes Verständnis der gängigen KI-Modelle, ihrer Funktionsweise und Handhabung.

Wir bleiben am Ball und setzen unsere Experimente fort. Möchten Sie mitmachen?

Melden Sie sich gerne bei uns per E-Mail. Wir planen, mit drei Interessenten im Rahmen weiterer KI-gestützter Produktionen tiefer in diese Thematik einzutauchen und belohnen Sie mit einem großzügigen Rabatt!

Ein Schmankerl zum Schluss 🎧😂🙀: Für das Voice-Over haben wir auf ElevenLabs (text-to-speech-Software) zurückgegriffen (Stand: August 2023). Dazu haben wir einen Satz aus dem Sprechtext von verschiedenen Stimmen „nachsprechen“ lassen – quasi ein digitales Casting – und uns dann für einen Sprechavatar entschieden. Nachdem wir den gesamten Text eingespeist hatten, entstand dieses skurrile Ergebnis:

Für die Produktion verwendete KI-Tools:

Machen Sie Lernen zum Erfolgsfaktor für Ihre Organisation

Sie haben die Ziele, wir haben die Lösungen – gemeinsam finden wir die beste für Sie.

Cookies

Cookies?

Auf unserer Website verwenden wir neben technisch notwendigen Cookies auch solche, deren Zweck die Analyse von Website­zugriffen oder die Personalisierung Ihrer individuellen Nutzer­erfahrung ist. Ihre Einwilligung in die Verwendung können Sie jederzeit widerrufen. Für weitere Informationen, lesen Sie bitte unsere Datenschutz­richtlinie: Datenschutzerklärung