阿里巴巴开源万相视频大模型,性能超越Sora
作者:行业趋势分析师•更新时间:23小时前•阅读0
阿里巴巴在AI领域再下一城,正式开源旗下视频生成模型——万相2.1。这一开源举措不仅填补了视频生成领域高质量开源的空白,更标志着全球AI竞赛进入白热化阶段。

阿里巴巴开源万相视频大模型,性能超越Sora
性能超越Sora,开源力度空前
万相2.1在权威评测集VBench中,以总分86.22%的成绩,大幅超越Sora、Luma、Pika等国内外模型,稳居榜首位置。此次开源,阿里巴巴不仅提供了14B版本的专业版模型,还提供了1.3B版本的消费级GPU版本,覆盖了专业创作与家用场景。
版本 | 参数规格 | 适用场景 |
---|---|---|
14B版本 | 140亿参数 | 专业创作 |
1.3B版本 | 13亿参数 | 家用场景 |
1.3B版本仅需单卡8.2G显存即可生成480P高清视频,成本门槛大幅降低。
推动AI行业发展,中文AI应用生态迎爆发期
阿里巴巴此次开源万相2.1,不仅为开发者提供了强大的工具,加速视频生成领域的技术创新和应用拓展,也推动了中文AI应用生态的爆发。目前,国内AI明星公司DeepSeek正在持续开源,百度也已宣布于6月30日起全面开源文心大模型4.5。
此外,国外OpenAICEO山姆·奥特曼此前承认,闭源策略站在了错误的一边,而马斯克的Grok-3则采取了开源策略,可见开源已成为全球AI领域的发展趋势。
万相2.1的三大核心亮点
1. 精准还原复杂运动和物理交互:万相2.1能够精准还原复杂运动和物理交互,为视频创作带来更多可能性。
2. 直接生成中英文字幕:万相2.1支持直接生成中英文字幕,方便视频创作者进行多语言发布。
3. 开源高效变分自编码器:万相2.1采用了自研的高效变分自编码器,在保证性能的同时,降低了计算复杂度,使得更多用户能够轻松使用。
阿里巴巴开源万相2.1视频大模型,标志着全球AI竞赛进入白热化阶段。因为开源浪潮的推进,中文AI应用生态有望迎来爆发期,为用户带来更多优质、便捷的视频创作体验。
欢迎分享,转载请注明来源:小川电商