Sora ist der neue Text-zu-Video-Generator des ChatGPT-Herstellers OpenAI. Folgendes wissen wir über das neue Tool, das gleichermaßen Besorgnis und Aufregung hervorruft.
Der Hersteller von ChatGPT taucht nun in die Welt der durch künstliche Intelligenz (KI) erstellten Videos ein.
Lernen Sie Sora kennen – den neuen Text-zu-Video-Generator von OpenAI. Das Tool, das das in San Francisco ansässige Unternehmen am Donnerstag vorgestellt hat, nutzt generative KI, um auf der Grundlage schriftlicher Befehle sofort kurze Videos zu erstellen.
Sora ist nicht der Erste, der diese Art von Technologie vorführt. Branchenanalysten verweisen jedoch auf die hohe Qualität der bisher angezeigten Videos des Tools und stellen fest, dass seine Einführung einen bedeutenden Sprung sowohl für OpenAI als auch für die Zukunft der Text-zu-Video-Generierung insgesamt darstellt.
Dennoch weckt diese Technologie, wie alles im heutigen schnell wachsenden KI-Bereich, auch Befürchtungen hinsichtlich möglicher ethischer und gesellschaftlicher Auswirkungen. Folgendes müssen Sie wissen:
Was kann Sora und kann ich es schon nutzen?
Sora ist ein Text-zu-Video-Generator, der mithilfe generativer KI Videos mit einer Länge von bis zu 60 Sekunden basierend auf schriftlichen Eingabeaufforderungen erstellt. Das Modell kann auch Videos aus einem vorhandenen Standbild generieren.
Generative KI ist ein Zweig der KI, der etwas Neues schaffen kann. Beispiele hierfür sind Chatbots wie ChatGPT von OpenAI und Bildgeneratoren wie DALL-E und Midjourney.
Ein KI-System zum Generieren von Videos zu bekommen, ist neuer und anspruchsvoller, basiert aber zum Teil auf der gleichen Technologie.
Sora ist noch nicht für die öffentliche Nutzung verfügbar (OpenAI gibt an, mit politischen Entscheidungsträgern und Künstlern zusammenzuarbeiten, bevor das Tool offiziell veröffentlicht wird), und es gibt noch vieles, was wir nicht wissen. Aber seit der Ankündigung am Donnerstag hat das Unternehmen eine Handvoll Beispiele von Sora-generierten Videos geteilt, um zu zeigen, was es kann.
OpenAI-CEO Sam Altman nutzte auch X, die Plattform, die früher als Twitter bekannt war, und forderte Social-Media-Nutzer auf, zeitnah Ideen einzusenden.
Später veröffentlichte er realistisch detaillierte Videos, die auf Aufforderungen wie „zwei Golden Retriever beim Podcasting auf einem Berggipfel“ und „ein Radrennen auf dem Meer mit verschiedenen Tieren als Sportler auf Fahrrädern mit Blick auf eine Drohnenkamera“ reagierten.
Während von Sora generierte Videos komplexe, unglaublich detaillierte Szenen darstellen können, stellt OpenAI fest, dass es immer noch einige Schwächen gibt – darunter einige räumliche und Ursache-Wirkungs-Elemente.
OpenAI fügt beispielsweise auf seiner Website hinzu: „Eine Person könnte in einen Keks beißen, aber der Keks hat danach möglicherweise keine Bissspur mehr.“
Welche anderen KI-generierten Videotools gibt es?
Sora von OpenAI ist nicht das erste seiner Art. Google, Meta und das Startup Runway ML gehören zu den Unternehmen, die ähnliche Technologien demonstriert haben.
Dennoch betonen Branchenanalysten die scheinbare Qualität und die beeindruckende Länge der bisher geteilten Sora-Videos.
Fred Havemeyer, Leiter der US-amerikanischen KI- und Softwareforschung bei Macquarie, sagte, dass die Einführung von Sora einen großen Fortschritt für die Branche darstellt.
„Man kann nicht nur längere Videos machen, ich verstehe bis zu 60 Sekunden, sondern die erstellten Videos sehen auch normaler aus und scheinen die Physik und die reale Welt tatsächlich mehr zu respektieren“, sagte Havemeyer.
„In den Video-Feeds werden nicht mehr so viele ‚Uncanny Valley‘-Videos oder Fragmente angezeigt, die … unnatürlich aussehen.“
Während es im letzten Jahr „enorme Fortschritte“ bei KI-generierten Videos gab – einschließlich der Einführung von Stable Video Diffusion im vergangenen November – sagte Rowan Curran, leitender Analyst bei Forrester, dass solche Videos für die Charakter- und Szenenkonsistenz stärker „zusammengefügt“ werden müssten.
Die Konsistenz und Länge von Soras Videos stellen jedoch „neue Möglichkeiten für Kreative dar, Elemente von KI-generierten Videos in traditionellere Inhalte zu integrieren und jetzt sogar aus einer oder mehreren Eingabeaufforderungen vollständige Erzählvideos zu erstellen“, sagte Curran gegenüber The Associated Press per E-Mail am Freitag.
Was sind die potenziellen Risiken?
Obwohl Soras Fähigkeiten Beobachter seit dem Start am Donnerstag in Erstaunen versetzt haben, bestehen auch weiterhin Bedenken hinsichtlich der ethischen und gesellschaftlichen Auswirkungen der Verwendung von KI-generierten Videos.
Havemeyer weist beispielsweise auf die erheblichen Risiken im möglicherweise angespannten Wahlzyklus 2024 hin.
Eine „potenziell magische“ Möglichkeit, Videos zu erstellen, die realistisch aussehen und klingen, wirft eine Reihe von Problemen innerhalb der Politik und darüber hinaus auf, fügte er hinzu – und verwies auf Bedenken hinsichtlich Betrug, Propaganda und Fehlinformationen.
„Die negativen externen Effekte der generativen KI werden im Jahr 2024 ein entscheidendes Diskussionsthema sein“, sagte Havemeyer. „Es ist ein erhebliches Problem, mit dem sich jedes Unternehmen und jeder Mensch in diesem Jahr auseinandersetzen muss.“
Technologieunternehmen haben immer noch das Sagen, wenn es um die Kontrolle von KI und ihren Risiken geht, während Regierungen auf der ganzen Welt daran arbeiten, aufzuholen.
Im Dezember hat die Europäische Union eine Einigung über die weltweit ersten umfassenden KI-Regeln erzielt, das Gesetz wird jedoch erst zwei Jahre nach der endgültigen Genehmigung in Kraft treten.
Am Donnerstag teilte OpenAI mit, dass es wichtige Sicherheitsmaßnahmen ergreift, bevor es Sora allgemein verfügbar macht.
„Wir arbeiten mit Red Teamern zusammen – Domänenexperten in Bereichen wie Fehlinformationen, hasserfüllte Inhalte und Voreingenommenheit – die das Modell kontrovers testen werden“, schrieb das Unternehmen.
„Wir entwickeln außerdem Tools zur Erkennung irreführender Inhalte, beispielsweise einen Erkennungsklassifikator, der erkennen kann, wann ein Video von Sora erstellt wurde.“
Anna Makanju, Vizepräsidentin für globale Angelegenheiten bei OpenAI, bekräftigte dies, als sie am Freitag auf der Münchner Sicherheitskonferenz sprach, bei der sich OpenAI und 19 weitere Technologieunternehmen zu einer freiwilligen Zusammenarbeit verpflichteten Bekämpfung von KI-generierten Wahl-Deepfakes.
Sie bemerkte, dass das Unternehmen Sora „auf eine Art und Weise veröffentlichte, die recht vorsichtig ist“.
Gleichzeitig hat OpenAI nur begrenzte Informationen darüber preisgegeben, wie Sora gebaut wurde.
Im technischen Bericht von OpenAI wurde nicht offengelegt, welche Bild- und Videoquellen zum Training von Sora verwendet wurden – und das Unternehmen reagierte am Freitag nicht sofort auf eine Anfrage nach weiteren Kommentaren.
Die Veröffentlichung von Sora erfolgt auch vor dem Hintergrund von Klagen einiger Autoren und der New York Times gegen OpenAI und seinen Geschäftspartner Microsoft wegen der Verwendung urheberrechtlich geschützter Werke zum Trainieren von ChatGPT.