【太平洋科技快讯】近日, 阿里巴巴宣布开源其全能型视频生成与编辑模型“通义万相 Wan2.1-VACE”。该模型功能全面,单一模型即可支持文生视频、图像参考视频生成、视频重绘、视频局部编辑、视频背景延展以及视频时长延展等全系列基础生成和编辑能力,号称目前业界功能最全面的视频生成与编辑模型之一。
通义万相 Wan2.1-VACE 的核心优势在于其强大的多功能性,它能够根据文字描述生成视频,也能基于静态图像生成动态视频。此外,该模型还支持对现有视频进行重绘,提升画面质量,并能对视频中的特定区域进行局部编辑。值得一提的是,它可以扩展视频背景,增加场景的深度和广度,还能延长视频的播放时间,使内容更加丰富。这些功能覆盖了视频创作从生成到编辑的各个环节,为创作者提供了极大的便利。
此次阿里巴巴此次开源了两个版本:1.3B 和 14B。其中,1.3B 版本针对消费级进行了优化,使得普通用户也能轻松运行。而 14B 版本则拥有更强大的性能,适合对计算资源要求较高的专业场景。
据悉,通义万相是阿里巴巴通义系列 AI 绘画创作大模型的一部分,最初于 2023 年 7 月 7 日上线,主要用于辅助图片创作。2024 年 9 月 19 日的阿里云栖大会上,通义万相视频生成大模型正式发布,标志着其正式进军视频生成领域。该模型不仅能够生成影视级高清视频,还具备较强的中文理解能力,能够更好地理解中文指令。
通义万相视频生成模型在今年 1 月初升级至 2.1 版,在处理复杂运动、还原真实物理规律、提升电影质感及优化指令遵循方面取得了显著进展。2 月 25 日,阿里巴巴宣布全面开源万相 2.1 模型,进一步推动了该模型的应用与普及。
丁丁打折网©版权所有,未经许可严禁复制或镜像 ICP证: 湘ICP备20009233号-2
Powered by 丁丁打折网本站为非营利性网站,本站内容均来自网络转载或网友提供,如有侵权或夸大不实请及时联系我们删除!本站不承担任何争议和法律责任!
技术支持:丁丁网 dddazhe@hotmail.com & 2010-2020 All
rights reserved