首页| 新闻| 图片| 评论| 共青团| 温暖的BaoBao| 青年之声| 青春励志| 青年电视| 中青校园| 中青看点| 教育| 文化| 军事| 体育| 财经| 娱乐| 第一书记网| 地方| 游戏| 汽车
首页>> 新闻 >  即时新闻 >>  正文

Sora为何出道即碾压主流AI视频模型:文生视频最长纪录,对世界有全面认知

发稿时间:2024-02-19 09:59:00 来源: 澎湃新闻 作者:胡含嫣 中国青年网

  近日,AI(人工智能)新锐巨头OpenAI推出文生视频模型Sora,将人们的视线再次引到了AI视频生成赛道。

  由于在AI生成视频的时长上成功突破到一分钟,再加上演示视频的高度逼真和高质量,Sora立刻引起了轰动。不过,OpenAI尚未宣布Sora对公众正式开放的日期。Sora将首先被提供给安全团队,以评估产品的危害或风险,一些视觉艺术家、设计师和电影制作人也能获得Sora的访问权限。

  在Sora推出之前,已经出现了一些用户认可度较高的AI生成视频模型。为什么Sora能引发如此大的轰动?多家外媒对三款热门文生视频模型Runway、Pika Labs和Stable Video进行了分析,并比较了Sora和它们之间的技术差别。

时长:60秒 vs 16秒

  在Sora横空出世之前,Runway一直被视为AI生成视频的默认选择,尤其是自去年11月推出第二代模型以来,Runway还被称为“AI视频界的MidJourney”。第二代模型Gen-2不仅解决了第一代AI生成视频中每帧之间连贯性过低的问题,在从图像生成视频的过程中也能给出很好的结果。

  Runway能够生成已经很逼真的四秒短视频。来源:Runway

  而在Sora发布后,Runway的CEO克里斯托瓦尔·巴伦苏埃拉(Cristóbal Valenzuela)便在X平台上发布了两个字:“Game On(比赛开始了)。”

  Sora最震撼的技术突破之一在于其输出的视频时长。Runway能够生成4秒长的视频,用户可以将其最多延长至16秒,是AI生成视频在2023年所能达到的最长时长纪录。Stable Video也提供4秒的视频,Pika则提供3秒的视频。在这一方面,Sora以1分钟的时长向竞争对手们提出了挑战。

  Sora传播度最高的时长60秒的视频之一,女子行走在东京街头。来源:Sora

  Sora模型能够实现视频时长突破,主要功臣是其所采用的扩散Transformer架构,而Sora的创始者之一、现任OpenAI工程师的William Peebles刚在去年和别人一同发布了针对该架构的研究论文。

  本质上,Sora和Pika、Runway采用了相似的底层模型,即Diffusion扩散模型。不同之处在于,Sora把其中的实现逻辑进行了变化,将U-Net架构替换成了Transformer架构。

  不过目前,外界尚不清楚Sora提供了哪些功能以供用户定制输出视频,因此Runway仍可能是Sora的替代方案之一。今年1月,Runway刚宣布,用户将能够通过多头运动笔刷(Multi Motion Brush)功能实现对AI生成视频中多个元素的运动控制。此外,Runway也因其提供了集合多种AI工具的视频制作解决方案而备受推崇。

  镜头语言:运动镜头 vs 静止视角 

  值得注意的是,X平台上的一些用户表示,在OpenAI推出Sora的2月15日晚上,AI视频生成初创公司Stability AI也在官网和X平台上发布了新动态,宣布了Stable Video Diffusion更新1.1版本。但是,几分钟后,这两条消息都迅速消失了。

  被Stability删掉的文章截屏。来源:X平台

  外界无从得知这究竟是由于操作失误,还是Stability观察到了两种AI生成视频之间的巨大质量差异,选择重新制作广告。Stable Video和前两款产品一样,都没能脱离现有文生视频的一般模式,即输出单一的、通常是静止视角的短视频片段。相比之下,Sora的宣传视频包括变换摄像机角度、电影式剪辑和场景变换,也就是人们常说的镜头语言的使用。

  此外,许多分析都指出,Sora带有世界模型的特质。所谓世界模型便是对真实的物理世界进行建模,让机器能够像人类一样,对世界产生一个全面而准确的认知。这一特性使得AI视频生成更流畅、更符合逻辑,降低了视频模型的训练成本,提升了训练效率。

  由Sora生成的“赛博朋克背景下机器人的生活故事”。来源:Sora

  和Runway一样,Stability AI的CEO埃马德·莫斯塔克(Emad Mostaque)也在X平台上感慨“奥特曼(OpenAI的创始人兼CEO)真是一个魔术师”,并称Sora可以被视为AI视频的GPT3,将在未来几年内得到扩展、细化、调整和优化。

  劣势:有无免费选项,能否开源

  和前辈们相比,Sora也存在两个可能令其不会被用户青睐的问题:有无免费选项,以及能否开源。

  作为AI视频领域的新晋竞争者,Pika Labs于去年11月推出了生成式AI视频工具Pika 1.0,也在推出时凭借精美的演示视频引起了轰动。Pika已于去年12月公开,与Runway具备相似的质量,并在短时间内建立了一个非常活跃的用户社区。

  Pika生成的视频截图。来源:Pika

  最重要的是,和其他竞争对手相比,Pika提供了更具吸引力的免费使用选项。Runway只会给用户125个不可续的免费积分,而Pika每天都会给用户发放30个积分,这使得它在短时间内拥有了一个庞大且活跃的用户社群。

  Stability AI旗下的Stable Video Diffusion则是一款开源的视频生成模型。类似于图像版的Stable Diffusion,该模型可以根据用户自己的需求进行定制,并且可以在个人设备上进行本地安装,而Sora大概率永远不会提供这种功能。

  目前,Stable Video Diffusion也仅供部分用户试用,在Stability的官网上可以加入等待列表。

责任编辑:纪佳琦
 
  • 女子大脑有蛔虫
  • 酒厂拔掉葡萄藤
  • 他收藏751个小汽车
  • 月售车票0张
  • 英千架航班取消
  • 捡到4年前漂流瓶
  • 辞职带娃周游世界
  • 四居室租给40人
相关新闻
加载更多新闻
热门排行
热 图
  • 月球表面硫元素
  • 瑞士冰川恐消融
  • 每周图片精选
  • 世界读书日
青独家

这支足球劲旅来自高原

不一样的少年男团

两个鬼故事什么字起名好听宝宝取名起名大全 姓马简单好听的男孩起名林北林天策的余姓起名字猪宝宝起名用字的起名测凶吉市场营销公司起名百事通nba直播瓷都取名好字取名起名大全史姓女孩起洋气名字大全高一语文电子版教材甘肃卫视节目表给饭店起个什么名字好听绍起名字无限流小说排行榜建材店起名大全名称起名诸葛企鹅媒体平台为自己的团购店起名财务通宠物店起名叶凡唐若雪小说全文免费阅读完整版适合给房屋地产起名赵斗淳在素媛肠子里放了什么江苏公共频道濮阳周易起名电话关于元宵节的诗词2020年9月出生的男孩起名少年生前被连续抽血16次?多部门介入两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”淀粉肠小王子日销售额涨超10倍高中生被打伤下体休学 邯郸通报单亲妈妈陷入热恋 14岁儿子报警何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言张家界的山上“长”满了韩国人?男孩8年未见母亲被告知被遗忘中国拥有亿元资产的家庭达13.3万户19岁小伙救下5人后溺亡 多方发声315晚会后胖东来又人满为患了张立群任西安交通大学校长“重生之我在北大当嫡校长”男子被猫抓伤后确诊“猫抓病”测试车高速逃费 小米:已补缴周杰伦一审败诉网易网友洛杉矶偶遇贾玲今日春分倪萍分享减重40斤方法七年后宇文玥被薅头发捞上岸许家印被限制高消费萧美琴窜访捷克 外交部回应联合利华开始重组专访95后高颜值猪保姆胖东来员工每周单休无小长假男子被流浪猫绊倒 投喂者赔24万小米汽车超级工厂正式揭幕黑马情侣提车了西双版纳热带植物园回应蜉蝣大爆发当地回应沈阳致3死车祸车主疑毒驾恒大被罚41.75亿到底怎么缴妈妈回应孩子在校撞护栏坠楼外国人感慨凌晨的中国很安全杨倩无缘巴黎奥运校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变王树国卸任西安交大校长 师生送别手机成瘾是影响睡眠质量重要因素国产伟哥去年销售近13亿阿根廷将发行1万与2万面值的纸币兔狲“狲大娘”因病死亡遭遇山火的松茸之乡“开封王婆”爆火:促成四五十对奥巴马现身唐宁街 黑色着装引猜测考生莫言也上北大硕士复试名单了德国打算提及普京时仅用姓名天水麻辣烫把捣辣椒大爷累坏了

两个鬼故事 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化