手游网手游攻略手游评测一句话生成60秒逼真视频，OpenAI文生视频模型Sora刷屏，原来可以这样玩

一句话生成60秒逼真视频，OpenAI文生视频模型Sora刷屏，原来可以这样玩

时间：2024-08-18 10:01:16 来源：头条浏览：0

枫口财经记者刘健

在开发出流行的聊天机器人ChatGPT 后，OpenAI 继续在生成人工智能领域进行创新。 2月16日，OpenAI发布了Sora，这是一种新的AI模型，可以通过快速的文本提示创建“现实”和“富有想象力”的60秒视频。 Vincent 视频模型Sora 包含高度详细的场景、复杂的摄像机运动、充满活力的情感的多个角色，甚至可以从静态图像制作动画。索拉不仅了解你在提示中要求什么，而且还了解这些东西在物质世界中是如何存在的。

文本生成的视频具有逼真的效果。目前，OpenAI官网上关于Sora的信息有限。 “我们教人工智能理解和模拟运动中的物理世界，目的是训练模型来帮助人们解决他们需要的问题。”Sora还表示，它可以根据文本描述生成长达60秒的视频，还可以创建在单个生成的视频中反映角色或视觉风格的多个镜头。

Sora 可以一次生成整个视频，也可以扩展生成的视频以使其更长。 OpenAI 表示：通过让模型一次生成多个帧，我们解决了即使生成的主体暂时离开视线也确保生成的主体不会发生变化的难题。

OpenAI 表示，Sora 是基于之前对DALL-E 和GPT 模型的研究。使用DALLE 3 技术更密切地跟踪生成视频中用户的文本描述。除了能够生成视频之外，该模型还可以从现有的静态图像生成视频，并准确、细致地制作图像内容的动画。该模型还可以提取和增强现有视频并填充缺失的帧。

目前，OpenAI官网已更新了Sora生成的48个视频演示，色彩鲜艳，效果逼真。

OpenAI Sora 的AI 生成视频图像：猛犸象在雪地里行走

上面截图中的视频文字如下：几只巨型猛犸象在雪地上行走，长毛随风飘扬。远处是白雪覆盖的树木和雄伟的雪山，在午后的阳光下闪闪发光。远处高高悬挂的云朵和太阳营造出温暖的光线，大型毛茸茸的哺乳动物的低镜头拍摄令人惊叹，摄影和景深都很美丽。

有些作品的光影动态效果令人印象深刻，例如东京路灯霓虹灯下行走的女子视频、阿马尔菲海岸一座教堂的鸟瞰图、跪着的卡通怪物等。神秘地出现在前景中。融化的蜡烛。

OpenAI Sora 的AI 生成视频图像：在东京霓虹灯路灯下行走的女人

上图截图中的视频文字提示为：一位时尚女性走在充满温暖霓虹灯和动画城市标志的东京街道上。她穿着黑色皮夹克、红色裙子、黑色靴子，拎着黑色钱包。她戴着墨镜，涂着红色口红。她走起路来充满自信和轻松。街道潮湿且反光，在五彩的灯光下营造出镜面般的效果。许多行人在周围走动。

在某些场景中，Sora 的效果足以“掩盖真实的事物”，在东京地铁列车车窗的8 秒视频拍摄中，除了移动的火车车窗的反射之外，Sora 的效果也足以“掩盖真实的事物”。真实的东西。”也得到证实。视频也非常真实。

Sora 的声明被网友称为游戏结束后，OpenAI 首席执行官Sam Altman 要求社交媒体用户使用文本提示在线提交创意内容。

“新罕布什尔州的一位自由摄影师建议我使用完整的电影灯光，”大约一个小时后，奥特曼用一段逼真的视频回应道。

奥特曼的动作展示了Sora模型实时生成视频的能力。

苏州证券此前表示，视觉算法在通用性、即时性、生产质量和稳定性方面的最新进展将促进技术拐点的到来和流行应用的出现。 3D 资产生成和视频生成等领域受益于普遍算法的成熟，但数据和算法挑战比图像生成更具挑战性。鉴于LLM对人工智能各个领域的加速影响以及更好的开源模型的出现，该行业很可能在2024年取得更大的发展成功。

2023年底至2024年初，Pika、HeyGen等AI视频应用将陆续发布，展现多模态技术的不断进步和成熟。毫无疑问，刚刚发布的Sora车型加剧了这一球场的激烈竞争。

网友们游戏结束了，丢了工作。

一些人已经开始“哀悼”整个行业。

有网友表示，电影界将彻底翻天覆地。未来，你会写剧本，就可以直接拍电影，不再是“制作”电影，而是“生成”电影。从现在开始，从导演到演员再到摄影师，所有人都将失业。

YouTuber 之一帕迪·加洛韦(Paddy Galloway) 表达了他对Sola 的看法，他表示内容创作行业已经永远改变，这并不夸张。 “我在YouTube 世界里工作了15 年，我对OpenAI 刚刚展示的内容感到无语……动画师和3D 艺术家陷入困境，资源网站变得无关紧要，每个人都可以毫无障碍地做到这一点。你将有机会获得优秀的产品，并且内容背后的“想法”和故事将变得更加重要。 ”

Sora还有进步的空间，Sora的视频一发布就震惊了业界。这不是第一个AI 视频，但其他公司也有类似的用于文本生成视频的AI 模型，其中Google 测试了名为Lumiere 的模型，Meta 测试了名为Emu 的模型，人工智能初创公司Runway 也在开发相应的产品。不过，外媒报道称，人工智能专家和分析师指出，Sora 的视频长度和质量都超过了之前看到的水平。

硅谷一家AI公司的从业者表示，根据他的经验，Sora在演示视频中展示的能力远远超过了Pika和Runway，他说：“Pika只能处理3到15秒的视频。”但Sora可以直接生成一分钟的视频。” “视频。从画面效果和持续时间来看，空绝对是一个重大进步。”

CNN援引市场研究公司ABI Research高级分析师海登的话说，随着新的个性化内容在不同渠道传播，《Sora》可能会对数字娱乐市场产生重大影响。我告诉过你了。

空有时会做出不合理的事情，例如在跑步机上倒跑。

不过，现在的Sora还有很多需要改进的地方。 OpenAI 提示：当前的Sora 模型也存在弱点，难以准确模拟复杂场景中的物理现象，并且可能无法理解某些因果关系。

空在理解空间细节时感到困惑，无法理解因果关系的具体实例，例如有人制作了某人咬饼干的视频，但随后饼干上没有留下咬痕。

Sora 制作的视频：五只狼崽在绿草环绕的碎石路上顽皮地互相追逐。

Sora 制作的视频中，动物和人突然出现，尤其是在有许多实体的场景中。此外，Sora 很难准确描述随着时间推移发生的事件，例如跟踪摄像机的特定轨迹。

Sora 制作的视频：在沙漠中发现了一把普通的塑料椅子，被小心地挖出来并清除灰尘。在此示例中，Sora 没有将椅子建模为刚体，导致物理交互不准确。

OpenAI 表示，计划与专家团队合作测试其最新模型，并留意错误信息、仇恨内容和偏见。 OpenAI 还表示，它正在开发工具来帮助检测误导性信息，包括可以确定Sora 何时生成视频的检测分类器。其文本分类器会检查并拒绝违反使用政策的文本输入提示，例如极端暴力、色情内容、骚扰图像和名人肖像。 “我们还开发了一个强大的图像分类器，可以审查生成的每个视频帧，以确保其在向用户显示之前符合使用政策。”

OpenAI 表示，Sora 将首先提供给网络安全教授来评估该产品的危险和风险。选定的视觉艺术家、设计师和电影制作人也将可以访问Sora，收集有关创意专业人士如何使用Sora 的反馈。

标题：一句话生成60秒逼真视频，OpenAI文生视频模型Sora刷屏，原来可以这样玩

链接：www.ggaan.com/news/sypc/3427.html

版权：文章转载自网络，如有侵权，请联系删除！

[db:tags]