阿里近期正式发布了新一代万相2.6系列模型,此次升级主要聚焦于专业影视制作与高端图像创作领域。作为国内首款支持角色扮演功能的视频模型,万相2.6的登场无疑为AI视频生成赛道投下了一颗重磅炸弹。目前,该模型已在全球范围内展现出极为全面的功能特性,涵盖了音画同步、多镜头生成以及声音驱动等核心技术,并已同步上线阿里云百炼平台及万相官网,供创作者们尝鲜体验。

这一版本的核心亮点在于其强大的视频生成能力,尤其是备受瞩目的角色扮演功能。现在的AI已经不仅仅是生成画面,更是学会了演戏。用户只需提供一段输入视频,万相2.6就能精准捕捉其中角色的外观特征与音色特点,随后按照提示词的要求,让该角色在新的场景中进行单人表演、多人互动,甚至是人与物的合拍。这意味着,创作者可以轻松地让同一个数字演员在不同剧本中穿梭,极大地降低了虚拟角色的制作门槛。

在叙事能力上,万相2.6也展现出了导演级的素养。它具备多镜头叙事功能,能够将用户给出的一句简单提示词,智能转化为包含分镜脚本的连贯视频。更难能可贵的是,在不同镜头之间,模型能够保持主体形象、场景氛围等关键信息的高度一致,避免了以往AI视频中常见的跳戏问题。配合升级后的自然音画同步技术,多人对话场景变得更加稳定,人声表达真实自然,背景音乐与歌曲的质感也得到了显著提升,彻底告别了嘴型对不上的尴尬局面。此外,视频生成的时长上限被延长至15秒,相比以往稍纵即逝的片段,这多出的几秒钟足以承载更完整的故事情节,让时空内容的容量得到了有效扩充。

除了视频领域的突破,万相2.6在文生图方面也进行了深度打磨。它对艺术风格的把控展现出了极高的美学水准,能够精准捕捉各类风格关键词的灵魂,无论是肌理、色彩还是笔触,细节刻画都生动丰富。特别是在写实人像生成上,模型有效削弱了那股挥之不去的AI塑料感,人物神态自然,肤质真实,光影处理恰到好处。对于设计师而言,新模型还支持文字生成以及图表、插画与海报设计,能够根据长文本内容自动生成图文混排的视觉作品,不仅美观而且逻辑清晰。

在图像生成的操控性上,万相2.6同样表现不俗。它支持多图融合生成,允许创作者对多张图片进行任意参考、组合或替换,从而碰撞出全新的视觉灵感。同时,为了满足商业级的使用需求,模型在保持角色、风格或元素的一致性上下足了功夫,并提供了精确的镜头与光影控制功能。用户可以指定视角远近及光影细节,确保每一张生成的图片都能完美契合预设的空间氛围与创意构思。
丁丁打折网©版权所有,未经许可严禁复制或镜像 ICP证: 湘ICP备2023003002号-11
Powered by 丁丁打折网本站为非营利性网站,本站内容均来自网络转载或网友提供,如有侵权或夸大不实请及时联系我们删除!本站不承担任何争议和法律责任!
技术支持:丁丁网 dddazhe@hotmail.com & 2010-2020 All
rights reserved