OpenAI新推文字生成影片Sora AI模型！社群：能颠覆影视产业

2024-02-16 18:18:12

OpenAI执行长Sam Altman在上个月中旬曾透露，下一代ChatGPT将是一款更全面的多模态模型(Fullymultimodal)，不仅延续目前的功能，还将新增“影片生成”的能力。

就在今(16)日凌晨，OpenAI在X上介绍一款名为Sora的新模型，其建立在DALL·E和GPT模型的研究之上，可根据文字提示生成长度一分钟的影片。尽管目前尚未向市场推出，但释出的范例影片已引起社群广泛讨论。

“隆重介绍Sora，我们的文字转影片模型。Sora能够创造长达60秒的影片，特色包括高度细致的场景、复杂的摄影机运镜，以及表情丰富的多角色互动。”

Sora模型的能力

OpenAI在官网中声明，Sora能够产生具有多个角色、特定类型的运动以及主体和背景的准确细节的复杂场景。该模型不仅了解用户在提示中提出的要求，也了解这些东西在物理世界中的存在方式，甚至可以在单一生成的影片中创建多个镜头，准确地保留角色和视觉风格。

除了能够仅从文字指令生成影片外，这个模型还具有将现有静态图片转化为影片的能力，能够精准地将图片内容动态化，并注重细节的表现。此外，它还能够接续现有的影片内容，或是补充那些缺失的画面。

官方释出的几个短影片范例，品质也令人惊奇，知名Podcast主持人及AI研究员Lex Fridman就回覆道：“哇。这真是太神奇了！”，不少网友则回覆：“整个影视产业就因为这则推文而死亡了。RIP”、“你这样做确实会危害相关工作”…等。

Sora模型的弱点

不过，OpenAI也指出当前的Sora模型仍存在弱点。它可能难以准确模拟复杂场景的物理原理，并且可能无法理解因果关系的具体实例。例如，一个人可能咬了一口饼干，但之后饼干可能没有咬痕。

该模型还可能混淆提示的空间细节，例如混淆左右，并且可能难以精确描述随着时间推移发生的事件，例如遵循特定的运镜轨迹。

OpenAI表示，在将Sora模型整合到OpenAI的产品中之前，他们将采取多项重要的安全措施。具体来说，OpenAI开放让红队成员(redteamers)评估Sora可能带来的危害或风险，他们是在错误信息、仇恨内容和偏见等领域的专家。

同时，他们也允许一些视觉艺术家、设计师与电影制作人进行测试，期待他们的反馈能改进模型，使其更好地服务于创意产业专业人士。

传言OpenAI正开发搜寻引擎产品

另外还有个传言是，《The Information》引述知情人士报导，OpenAI正在开发一款网路搜寻产品，可能会挑战Google的搜寻引擎王位，知情人士指出，该产品将部分使用微软的Bing提供支援。

OpenAI尚未正式确认该计划，但该公司的目标是扩展其知识和网页浏览能力，这可能会为该工具带来可能性。

211COIN发布此信息目的在于传播更多信息，与本网站立场无关，文章内容仅供参考，不代表任何确定性判断，且不构成投资建议，请谨慎对待，风险自担。

3257