OpenAI Sora KI-Videogenerierung Modell eingeführt; jetzt für zahlende Abonnenten verfügbar
OpenAI hat am Montag endlich Sora, sein Videogenerierungsmodell für künstliche Intelligenz (KI), auf den Markt gebracht. Im Februar stellte das Unternehmen Sora ausgewählten Personen vor und veröffentlichte nun eine andere Variante des Modells namens Sora Turbo. Sora kann Videos in 1080p-Auflösung generieren, die bis zu 20 Sekunden lang sein können. Das KI-Modell wurde auf einer eigenständigen Plattform bereitgestellt, die derzeit als Website verfügbar ist. Insbesondere ist Sora derzeit nur für zahlende Abonnenten von ChatGPT mit festgelegten Ratenbegrenzungen verfügbar.
OpenAIs Sora-KI-Videogenerierungsmodell
In einem Blogbeitrag kündigte das KI-Unternehmen die Einführung von Sora an und erläuterte die Funktionen des Modells. Sora wurde erstmals Anfang dieses Jahres vorgestellt und das Modell wurde wiederholt verschoben. Das Unternehmen hatte angegeben, dass der Grund für die Verzögerung die Stärkung der Sicherheits- und Datenschutzparameter des Modells sei.
Nach einer Verzögerung von fast neun Monaten hat OpenAI Sora jedoch als eigenständige Plattform auf den Markt gebracht, auf die hier zugegriffen werden kann. Es ist derzeit nur für Abonnenten von ChatGPT Plus und Pro verfügbar. Wer kein Abonnement hat, kann derzeit kein neues Konto auf der Website erstellen. Plus-Nutzer sind auf 50 Videos mit 480p-Auflösung oder weniger Videos mit 720p pro Monat beschränkt.
Mit dem ChatGPT Pro-Abonnement, das kürzlich für 200 $ pro Monat eingeführt wurde, können Benutzer Videos mit „10x mehr Nutzung, höheren Auflösungen und längerer Dauer“ erstellen. Genau wie bei „weniger Videos“ hat das Unternehmen jedoch nicht quantifiziert, was hohe Auflösungen und längere Dauer bedeuten würden.
Sora kann derzeit Videos in den Seitenverhältnissen Breitbild, Hochformat und Quadrat erstellen. Benutzer können auch ihre Videos und Bilder hochladen, um den Inhalt zu erweitern, neu zu mischen und in die erstellten Videos einzufügen. Das KI-Modell ermöglicht auch die Erstellung von Videos von Grund auf mithilfe von Textaufforderungen. Darüber hinaus können Benutzer über eine Storyboard-Schnittstelle bestimmte Eingaben für jedes Bild festlegen.
Was die technischen Details angeht, erklärte OpenAI, dass Sora ein Diffusionsmodell ist, bei dem die KI viele Bilder gleichzeitig voraussieht, um den Inhalt über den 20-Sekunden-Zeitraum konsistent zu halten. Das KI-Modell verwendet eine Transformer-Architektur und übernimmt die Recaptioning-Technik von DALL-E 3.
OpenAI hob auch die Details zu den Modelldaten hervor. Das Unternehmen behauptete, es habe über seine Datenpartnerschaften eine breite Palette von Daten aus dem öffentlichen Bereich sowie Daten von Personen bezogen, die mit dem Modell arbeiten. Die öffentlichen Daten sollen aus Datensätzen für maschinelles Lernen und Web-Crawls gesammelt worden sein.
Das Unternehmen ging auch eine Partnerschaft mit Shutterstock Pond5 ein und beauftragte Datensätze, um proprietäre Daten für das KI-Modell zu generieren. Schließlich wurden auch Daten für Sora von KI-Trainern, Red Teamern und Mitarbeitern gesammelt.
Um die mit einem realistischen KI-Videogenerierungsmodell verbundenen Risiken zu minimieren, fügt OpenAI sowohl sichtbare Wasserzeichen als auch Metadaten gemäß den von der Coalition for Content Provenance and Authenticity (C2PA) festgelegten Standards hinzu. Das Unternehmen behauptete auch, es habe dem Modell Schutzmaßnahmen für Medien-Uploads hinzugefügt, die Personen beinhalten.
Das KI-Unternehmen erklärte außerdem, dass Sora daran gehindert werde, Videos zu erstellen, die schädliche Formen des Missbrauchs wie sexuellen Kindesmissbrauch und sexuelle Deepfakes enthalten. Darüber hinaus wird die Anzahl der Uploads, die Benutzer vornehmen können, beim Start begrenzt sein.