阿里开源通义万相Wan2.1-VACE 助力视频生成与编辑

当前位置 : 首页>电脑数码>阿里开源通义万相Wan2.1-VACE 助力视频生成与编辑

阿里开源通义万相Wan2.1-VACE 助力视频生成与编辑

【太平洋科技快讯】近日，阿里巴巴宣布开源其全能型视频生成与编辑模型“通义万相 Wan2.1-VACE”。该模型功能全面，单一模型即可支持文生视频、图像参考视频生成、视频重绘、视频局部编辑、视频背景延展以及视频时长延展等全系列基础生成和编辑能力，号称目前业界功能最全面的视频生成与编辑模型之一。

通义万相 Wan2.1-VACE 的核心优势在于其强大的多功能性，它能够根据文字描述生成视频，也能基于静态图像生成动态视频。此外，该模型还支持对现有视频进行重绘，提升画面质量，并能对视频中的特定区域进行局部编辑。值得一提的是，它可以扩展视频背景，增加场景的深度和广度，还能延长视频的播放时间，使内容更加丰富。这些功能覆盖了视频创作从生成到编辑的各个环节，为创作者提供了极大的便利。

此次阿里巴巴此次开源了两个版本：1.3B 和 14B。其中，1.3B 版本针对消费级进行了优化，使得普通用户也能轻松运行。而 14B 版本则拥有更强大的性能，适合对计算资源要求较高的专业场景。

据悉，通义万相是阿里巴巴通义系列 AI 绘画创作大模型的一部分，最初于 2023 年 7 月 7 日上线，主要用于辅助图片创作。2024 年 9 月 19 日的阿里云栖大会上，通义万相视频生成大模型正式发布，标志着其正式进军视频生成领域。该模型不仅能够生成影视级高清视频，还具备较强的中文理解能力，能够更好地理解中文指令。

通义万相视频生成模型在今年 1 月初升级至 2.1 版，在处理复杂运动、还原真实物理规律、提升电影质感及优化指令遵循方面取得了显著进展。2 月 25 日，阿里巴巴宣布全面开源万相 2.1 模型，进一步推动了该模型的应用与普及。