Sora最强敌人出现，Google Veo 3.1正式发布，强调电影级画质和精准控制。

该模型引入了对象级编辑、多图像场景控制以及第一帧和最后一帧过渡等新功能，旨在为用户提供更好的创意控制和电影级图像质量，以与 OpenAI Sora 提供的竞争相媲美。
Veo 3.1通过为用户提供电影制作能力并准确再现品牌视觉和其他特征，为零售和广告等行业的标准化内容制作带来价值。
据10月16日消息，当OpenAI的Sora在网络上引发热议时，谷歌正式推出了新一代AI视频生成模型Veo 3.1，以期在这场AI视频大战中重新取得胜利。周三，谷歌宣布其旗舰视频生成工具现已向Gemini支付用户开放，支持调用Flow电影制作平台、Gemini API和Vertex AI平台。谷歌的更新首先添加了对象级编辑、多图像场景控制t 和最后一帧过渡，以及 AI 视频生成器更丰富的背景音频，为用户在处理每条消息时提供更多创意控制和电影质量。如果说Sora 2是AI世界的“抖音”，以速度和便捷取胜，那么Veo 3.1就是更注重品质、沉浸感和专业把控的“Netflix”。这可能标志着有史以来最实用的人工智能视频生成工具的到来。精确控制：从“接受结果”到“塑造愿景”与Sora 2的“只生产并获得结果”不同，Veo 3.1让用户能够微调每个细节。通过提高分辨率和加快制作速度，Google 真正将电影制作的权力交给了您。其主要进步体现在： ·对象编辑：视频版本的“智能填充”（内容感知填充），可以从任何场景中添加或删除对象。 · 场景扩展：将视频扩展到原始结局之外，同时保留一段时间的环境音效无止尽的叙述延续。 · 智能过渡：只需指定两个静止图像（第一张和最后一张）即可生成电影质量的开头或结尾过渡。 -多图引导：通过多张参考图精准控制人物、物体、场景的氛围。对象级编辑：重建故事的新维度。这次最引人注目的更新是对象级别的精确编辑。用户现在可以通过添加或删除物体、人物甚至风景来改变故事的方向，就像专业编辑一样。 “插入对象”功能目前可用，“删除对象”功能即将推出。这些更新使编辑场景变得直观和简单，无论是让猫头鹰或树木突然出现在森林中，还是用宇宙飞船代替汽车，所有这些都只需简单的点击即可。通过指向和请求可以轻松删除不匹配的项目。更棒的是，Veo 3.1 可以自动处理光照和场景的阴影，确保所有编辑自然地融入您的图像。四大独特武器：Veo 的差异化优势 Veo 真正的竞争优势是：一套模块化创意工具使人工智能成为专业视频工作流程的一部分。 · 将材质转换为视频：输入多个参考图像，Veo 将它们合并成一个有凝聚力的场景，让您可以完全控制样式和元素。 · 第一帧和最后一帧：通过提供第一张和最后一张静态图像，模型自动生成平滑的过渡，非常适合情感过渡和瞬间运动等效果。 · 场景扩展：继续现有视频的叙述，并保持视觉风格和背景音频一致。 · 插入/删除对象：执行复杂的世界构建和讲故事，包括清除屏幕和添加新项目。获得音频升级：全新的沉浸式讲故事体验除了改进的图像质量外，Veo 3.1 还带来了重大改进音频方面的进步。新模型提供了更丰富的背景音效和更好的叙事理解，让您更自然地跟随电影的叙事结构。从那时起，场景就开始体现出幽默、节奏和基调。对他而言，空对节奏和声音的控制力仍然有限。 Veo 3.1 承诺理解上下文并帮助您作为您的个人制作助手创建场景。价格透明，成本可控。 Veo 3.1 目前处于预览阶段，仅适用于 Gemini API 的付费用户。计费标准延续前几代： · 标准版：每视频秒 0.40 美元 · 快速版：每视频秒 0.15 美元 Veo 3.1 采用按需付费计费模式，仅对成功生成的视频收费，不收取任何费用。这种透明的定价策略使业务团队能够更好地控制其预算。该型号支持 24fps 帧速率下的 720p/1080p 分辨率。基本时长为 4 至 8 秒，但可通过“延长”功能延长至 148 秒。特别值得一提的是，企业用户上传产品图片和品牌风格参考后，系统可以准确地再现这些视觉元素，并保持生成的各种内容的一致性。这对于零售、广告等行业的标准化内容制作极其有价值。完全融入谷歌生态系统更新后的视频AI模型完全融入谷歌生态系统。用户可以通过Gemini应用程序使用Veo 3.1及其Fast版本创建模型，开发人员也可以通过Vertex AI平台和Gemini API调用模型。 Veo 今年早些时候的首次亮相震惊了业界。 Veo 2推出几个月后，新一代机型戴尔在视频质量上实现了质的飞跃。显然，YouTube 庞大的视频资源为训练 AI 模型提供了条件独特的解决方案。现在，谷歌已经很快发布了具有大量新功能的 Veo 3.1。据谷歌介绍，Veo 3.1可以更准确地理解关键词并产生更好的视频内容，同时还能减少无效计算的消耗。 Veo 3 的标志性音频系统也得到了进一步优化。之前型号的文本转视频功能仅限于 720p 水平视频输出，但为了适应互联网上对垂直内容不断增长的需求，Veo 3.1 现在支持 16:9 水平和垂直视频输出。谷歌此前承诺将 Veo 视频工具集成到 YouTube Shorts 中，YouTube Shorts 采用与 TikTok 相同的竖屏格式。 Veo 3.1 的发布无疑为实现这一承诺铺平了道路。预计未来Veo生成的符合平台格式要求的视频在TikTok中的出现频率将大幅增加。此举还使谷歌能够在与其前竞争对手 OpenAI 的竞争中保持强势，后者最近集成了新的w 版本的视频 AI 进入其移动应用程序。技术竞赛：从音频同步到社交适应今年早些时候的 I/O 开发者大会上宣布，Veo 3 是第一个实现原生 AI 来生成同步音频的工具，使其成为第一个具有此功能的视频生成工具。谷歌今年持续加大对生成媒体的投入，其AI成像模型（如生成“纳米香蕉宇宙飞船”的模型）也受到广泛关注。然而，OpenAI的强大攻击彻底改变了竞争格局。 ChatGPT 制造商不仅宣布了其 Sora 视频生成系统的新版本，还开发了一款类似于 TikTok 的社交应用程序。虽然 Sora 的邀请码在爱好者中很难找到，但专家很快指出它能够生成真实的深度伪造内容。我们进一步担心这可能会进一步加剧在线状况的恶化信息生态系统并充斥着人工智能生成的劣质内容（AI slop）。 Veo 和 Sora 等人工智能视频生成器的兴起凸显了生成式人工智能在创意产业中所扮演的备受争议的角色。许多摄像师、电影制作人和创作者担心他们的工作将被用来训练人工智能模型，最终将制作公司和流媒体平台变成取代人类创作者的工具。随着舆论的上升，越来越多的艺术家和作家起诉人工智能公司侵犯版权和其他知识产权问题。随着两家领先科技公司持续加大对人工智能视频领域的投资，这场创新、创意生态和知识产权保护的复杂博弈正在进入一个新阶段。（一点）

由 admin

发表回复取消回复

您错过了

中国驻以色列使馆发布关于在以色列中国公民转移、撤离登记的通知。

视频丨迪拜国际机场航站楼遇袭

谷歌翻译推出 Gemini AI 功能，提供同义词替换和上下文信息

谷歌发布Android 17 Beta 2：EyeDropper颜色选择API等发布

Sora最强敌人出现，Google Veo 3.1正式发布，强调电影级画质和精准控制。

由 admin

相关文章

视频丨迪拜国际机场航站楼遇袭

谷歌发布Android 17 Beta 2：EyeDropper颜色选择API等发布

Antropic 放弃标志性的“安全栏杆”承诺

发表回复 取消回复

您错过了

中国驻以色列使馆发布关于在以色列中国公民转移、撤离登记的通知。

视频丨迪拜国际机场航站楼遇袭

谷歌翻译推出 Gemini AI 功能，提供同义词替换和上下文信息

谷歌发布Android 17 Beta 2：EyeDropper颜色选择API等发布

发表回复取消回复