【太平洋科技快讯】12月3日,腾讯公司宣布,其混元大模型成功上线视频生成能力,标志着继文生文、文生图、3D生成之后,腾讯在AI领域再次实现重大技术突破。该模型的参数量高达130亿,成为当前最大的视频开源模型。
混元大模型支持中英文双语输入,并具备“超写实”的视频生成能力,画面质量高,不易变形。在镜面或镜子场景中,模型能实现镜面反射动作与外部场景的完全同步,光影反射效果符合物理规律。
据悉,混元大模型采用了DiT架构,并结合新一代文本编码器,有效提升了语义遵循能力。这使得模型在描绘多个主体时更加精准,能够实现更细致的指令和画面呈现。
感兴趣的用户可在腾讯元宝App中的“AI应用”板块选择“AI视频”申请试用。同时,企业客户可通过腾讯云提供服务接入,目前API已同步开放内测申请,此次开源行动涵盖了模型权重、推理代码、模型算法等完整模型,免费提供给企业和个人开发者使用。
丁丁打折网©版权所有,未经许可严禁复制或镜像 ICP证: 湘ICP备20009233号-2
Powered by 丁丁打折网本站为非营利性网站,本站内容均来自网络转载或网友提供,如有侵权或夸大不实请及时联系我们删除!本站不承担任何争议和法律责任!
技术支持:丁丁网 dddazhe@hotmail.com & 2010-2020 All
rights reserved