ByteDance, das Unternehmen hinter TikTok, hat OmniHuman-1 vorgestellt, ein KI-Modell, das Fotos und Audiodateien in lebensechte Videos verwandeln kann. Dies zeigt die schnellen Fortschritte Chinas im Bereich der künstlichen Intelligenz. Laut den Forschern von ByteDance übertrifft dieses multimodale Modell die bisherigen KI-generierten menschlichen Videos erheblich und ermöglicht realistische Darstellungen von sprechenden, singenden und sich bewegenden Personen.

Durchbrüche in der KI-gestützten Videogenerierung
Die KI-gestützte Bild-, Video- und Audiosynthese—häufig mit Deepfakes in Verbindung gebracht—steht im Zentrum von Debatten über Unterhaltungsmöglichkeiten und Betrugsrisiken. Die KI-Abteilung von ByteDance hat sich als führend in diesem Bereich positioniert, insbesondere mit der Doubao-App, die sich als beliebtestes KI-Produkt für Verbraucher in China etabliert hat.
Obwohl OmniHuman-1 noch nicht öffentlich zugänglich ist, sind Beispielvideos viral gegangen, die seine bemerkenswerten Fähigkeiten demonstrieren. Eine der beeindruckendsten Demos zeigt einen 23-sekündigen Clip von Albert Einstein, der eine Rede hält. Kyle Wiggers von TechCrunch beschrieb das Ergebnis als „erschreckend gut“ und möglicherweise „die realistischsten Deepfake-Videos bisher“.
>>>000505 for Whitlock DNFT-PRG Tadiran
Die Veröffentlichung von OmniHuman-1 erfolgt inmitten der Bemühungen der USA, Chinas KI-Entwicklung einzuschränken, während chinesische Unternehmen weiterhin bedeutende Fortschritte in der Videogenerationstechnologie machen. Die Jimeng AI-Plattform von ByteDance, die die Modelle PixelDance und Seaweed integriert, erhält regelmäßige Updates, um die Konsistenz und Realitätsnähe der generierten Videos weiter zu verbessern.
Weitere chinesische Technologieunternehmen treten in diesen Markt ein, darunter Kuaishou Technology mit der Kling-App sowie mehrere KI-Startups wie Zhipu AI, Shengshu Tech und MiniMax.
Mit Innovationen wie OmniHuman-1 positioniert sich ByteDance als führender Anbieter von KI-generierten Videos und könnte eine ernsthafte Konkurrenz für Tools wie Sora von OpenAI darstellen, das im Dezember 2024 einer breiteren Öffentlichkeit zugänglich gemacht wurde. Da sich KI-gestützte Videotechnologie rasant weiterentwickelt, dürften sich ihre Anwendungen in den Bereichen Unterhaltung, digitale Medien und Content-Erstellung erheblich ausweiten.