未来已来 横空出世的“Sora”是什么

发布时间:2024-03-22


Sora,美国人工智能研究公司OpenAI发布的人工智能文生视频大模型但OpenAI并未单纯将其视为视频模型,而是作为“世界模拟器” ),于2024年2月16日正式对外发布 。Sora这一名称源于日文“空”(そら sora),即天空之意,引申含义还有“自由”,以示其无限的创造潜力。

只需要给Sora一个文本提示,它就能创造出与描述相符的视频。例如,Sora可以用来制作社交媒体上的短视频,或者用于广告和市场营销领域,创造出宣传视频和产品演示。例如,OpenAI公布的一个视频片段,提示要求制作“一个矮矮的毛茸茸的怪物跪在红蜡烛旁边的动画场景”,还有一些详细的舞台指示(“睁大眼睛和张开嘴巴”)以及对所需氛围的描述。结果,Sora创造了一种皮克斯风格的生物,似乎具有来自《怪兽电力公司》(Monsters, Inc.)中的怪物的DNA。



3月20日下午,在由江苏省文化产业发展联合会主办的紫金文化产业沙龙现场,来自人工智能前沿学者清华大学新闻与传播学院的沈阳教授,以《人工智能驱动下的文化产业变革》为主题,为现场观众深度剖析了人工智能技术在文化产业中的创新应用和影响。指出了Sora的三大亮点:60秒长视频镜头流畅,Sora可以保持视频主体与背景的高度流畅性与稳定性;多角度镜头视觉表现丰富,Sora在一个视频内实现多角度镜头,分镜切换符合逻辑;理解真实世界的能力惊艳,Sora对于光影反射、运动方式、镜头移动等细节处理得十分优秀……展现出前所未见的专业视频生成能力。

尽管Sora的功能十分的强大,但其在模拟复杂场景的物理现象、理解特定因果关系、处理空间细节、以及准确描述随时间变化的事件方面OpenAI Sora都存在一定的问题。例如,视频中的角色与物体的交互方式在物理上或许并不可行,也做不到随着时间的推移而保持一致。

Sora,代表了人工智能领域的一次重大突破,其核心是一个多方面的人工智能系统,能够理解和执行跨越不同领域的任务。对影视、直播、媒体、广告、动漫、艺术设计等多个行业产生深远影响。在当前短视频时代,Sora已经可以承担短视频的摄影、导演和剪辑等任务。未来,Sora生成的多种用途视频将对短视频、直播、影视、动漫、广告等行业产生深远的影响。

供稿人:周彬 2024年 3月