1. 首页 > 电商大学

阿里巴巴开源万相视频大模型,性能超越Sora

阿里巴巴在AI领域再下一城,正式开源旗下视频生成模型——万相2.1。这一开源举措不仅填补了视频生成领域高质量开源的空白,更标志着全球AI竞赛进入白热化阶段。

阿里巴巴开源万相视频大模型,性能超越Sora
阿里巴巴开源万相视频大模型,性能超越Sora

性能超越Sora,开源力度空前

万相2.1在权威评测集VBench中,以总分86.22%的成绩,大幅超越Sora、Luma、Pika等国内外模型,稳居榜首位置。此次开源,阿里巴巴不仅提供了14B版本的专业版模型,还提供了1.3B版本的消费级GPU版本,覆盖了专业创作与家用场景。

版本 参数规格 适用场景
14B版本 140亿参数 专业创作
1.3B版本 13亿参数 家用场景

1.3B版本仅需单卡8.2G显存即可生成480P高清视频,成本门槛大幅降低。

推动AI行业发展,中文AI应用生态迎爆发期

阿里巴巴此次开源万相2.1,不仅为开发者提供了强大的工具,加速视频生成领域的技术创新和应用拓展,也推动了中文AI应用生态的爆发。目前,国内AI明星公司DeepSeek正在持续开源,百度也已宣布于6月30日起全面开源文心大模型4.5。

此外,国外OpenAICEO山姆·奥特曼此前承认,闭源策略站在了错误的一边,而马斯克的Grok-3则采取了开源策略,可见开源已成为全球AI领域的发展趋势。

万相2.1的三大核心亮点

1. 精准还原复杂运动和物理交互:万相2.1能够精准还原复杂运动和物理交互,为视频创作带来更多可能性。

2. 直接生成中英文字幕:万相2.1支持直接生成中英文字幕,方便视频创作者进行多语言发布。

3. 开源高效变分自编码器:万相2.1采用了自研的高效变分自编码器,在保证性能的同时,降低了计算复杂度,使得更多用户能够轻松使用。

阿里巴巴开源万相2.1视频大模型,标志着全球AI竞赛进入白热化阶段。因为开源浪潮的推进,中文AI应用生态有望迎来爆发期,为用户带来更多优质、便捷的视频创作体验。

欢迎分享,转载请注明来源:小川电商

原文地址:https://www.jinhanchuan.com/70946.html