OpenAIは2024年2月中旬動画生成AI Soraを正式発表しました。
Sorahaテキスト指示からリアリズムと創造性に溢れる映像を生成する能力を持つ最先端のAIモデルです。
ChatGPTの開発元が満を持して発表した新規AIとして非常に注目を集めています。
物理的な動きを模倣する学習をしているとされ、より自然な動きを映像として制作できるようになっている可能性があり、期待が集まっています。
公式サイト:https://openai.com/sora
テキストベースの映像生成
Soraはテキストから直接ビデオを生成するAIで、先行して公開された他の映像生成ツールの強みと同等かそれ以上の実力を持っていると目されています。
ユーザーが入力したテキスト指示に基づいて、リアリズムと創造性に富んだ映像を生み出すことができます。
この技術は、映像制作のプロセスを大きく変革する可能性があり、従来の映像制作に必要だった時間やリソースを大幅に削減することが期待されます。
特に撮影など技術的、人員的に時間や資材が必要だったものを大きくショートカットしていく可能性があります。
また、Soraは物理的な世界の動きを理解し再現することを目指しており、現在発表されている他の動画生成AIよりもより自然でリアルな質感を再現できると期待されています。
将来的には現在GPTと画像生成AIであるDALL-Eが連携しているように、プロンプトをより表現豊かにできる可能性もあるでしょう。
Soraの使用例と実現可能性
Soraによる映像生成の可能性は広大です。例えば、ユーザーが「雪の中を歩く赤いジャケットを着た人」といった具体的なシナリオをテキストで入力することにより、Soraはその指示に基づいたリアルなビデオを生成します。
デモでは1分程の動画をいくつか公開しています。
女性は自然に歩き、地面の反射や町の喧騒が聞こえてくるような様子も再現されています。
街のワンショットだけではなく、人物と一緒にカメラが移動し、背景が移り変わっていくさまも収録されています。
美術館の様なデモでは内部の絵画も作られており、まるで本当にそこに存在しているかのような質感を再現しています。
課題と安全対策
Soraの開発において、OpenAIは安全性と倫理的な使用を重視しています。
現在、Soraは物理的な相互作用や特定の原因と結果の関係を完全に理解することには限界があります。
このため、OpenAIは「レッドチーム」を通じたリスク評価や、クリエイティブプロフェッショナルへの限定的なアクセス提供など、慎重なアプローチを取っています。
安全対策として、生成されるコンテンツの監視と評価を徹底し、技術の倫理的な応用を確保しています。