OpenAI新推文字生成影片Sora AI模型!社群:能颠覆影视产业

2024-02-16 18:18:12

OpenAI执行长Sam Altman在上个月中旬曾透露,下一代ChatGPT将是一款更全面的多模态模型(Fullymultimodal),不仅延续目前的功能,还将新增“影片生成”的能力。

OpenAI新推文字生成影片Sora AI模型!社群:能颠覆影视产业

就在今(16)日凌晨,OpenAI在X上介绍一款名为Sora的新模型,其建立在DALL·E和GPT模型的研究之上,可根据文字提示生成长度一分钟的影片。尽管目前尚未向市场推出,但释出的范例影片已引起社群广泛讨论。

“隆重介绍Sora,我们的文字转影片模型。Sora能够创造长达60秒的影片,特色包括高度细致的场景、复杂的摄影机运镜,以及表情丰富的多角色互动。”

Sora模型的能力

OpenAI在官网中声明,Sora能够产生具有多个角色、特定类型的运动以及主体和背景的准确细节的复杂场景。该模型不仅了解用户在提示中提出的要求,也了解这些东西在物理世界中的存在方式,甚至可以在单一生成的影片中创建多个镜头,准确地保留角色和视觉风格。

除了能够仅从文字指令生成影片外,这个模型还具有将现有静态图片转化为影片的能力,能够精准地将图片内容动态化,并注重细节的表现。此外,它还能够接续现有的影片内容,或是补充那些缺失的画面。

官方释出的几个短影片范例,品质也令人惊奇,知名Podcast主持人及AI研究员Lex Fridman就回覆道:“哇。这真是太神奇了!”,不少网友则回覆:“整个影视产业就因为这则推文而死亡了。RIP”、“你这样做确实会危害相关工作”…等。

Sora模型的弱点

不过,OpenAI也指出当前的Sora模型仍存在弱点。它可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系的具体实例。例如,一个人可能咬了一口饼干,但之后饼干可能没有咬痕。

该模型还可能混淆提示的空间细节,例如混淆左右,并且可能难以精确描述随着时间推移发生的事件,例如遵循特定的运镜轨迹。

OpenAI表示,在将Sora模型整合到OpenAI的产品中之前,他们将采取多项重要的安全措施。具体来说,OpenAI开放让红队成员(redteamers)评估Sora可能带来的危害或风险,他们是在错误信息、仇恨内容和偏见等领域的专家。

同时,他们也允许一些视觉艺术家、设计师与电影制作人进行测试,期待他们的反馈能改进模型,使其更好地服务于创意产业专业人士。

传言OpenAI正开发搜寻引擎产品

另外还有个传言是,《The Information》引述知情人士报导,OpenAI正在开发一款网路搜寻产品,可能会挑战Google的搜寻引擎王位,知情人士指出,该产品将部分使用微软的Bing提供支援。

OpenAI尚未正式确认该计划,但该公司的目标是扩展其知识和网页浏览能力,这可能会为该工具带来可能性。

211COIN发布此信息目的在于传播更多信息,与本网站立场无关,文章内容仅供参考,不代表任何确定性判断,且不构成投资建议,请谨慎对待,风险自担。
相关阅读
Copyright © 2018-2022 211COIN版权所有.