1. 首页 > 电商出海

北京生成式AI大会,从Sora到具身智能

北京春日AI盛宴:当Sora遇上具身智能, 巨大佬们聊了些啥真实东西

四月的北京,春风刚吹开玉渊潭的樱花,一场生成式AI的春日派对已经在1230平米的宴会厅里炸开了锅。人潮汹涌的会场里 54位产学研投巨大佬挤在一起,从巨大模型到视频生成,从具身智能到端侧部署,两天议程干货许多到让人记笔记手柔软。说真实的,今年AI圈的烫度,比北京初夏的阳光还烫。

Sora之后 视频生成模型开头狂飙突进

提到生成式AI,绕不开今年初Sora。这场“卖家秀”直接让视频生成成了AI圈的顶流。喜欢诗手艺创始人王长远虎在台上直言:“Sora验证了Diffusion Transformer在视频里的Scaling Law,接下来内容创作者的干活流会被彻底 。”这话不虚假, 他们1月推出的PixVerse视频生成模型,眼下已经干了超1000万次生成,全球创作者用得飞起。

生成式AI大会沸腾北京!从Sora到具身智能,25位大佬密集输干货
生成式AI大会沸腾北京!从Sora到具身智能,25位大佬密集输干货

但视频生成真实就一帆风顺?万兴手艺副总裁朱伟泼了盆凉水:“巨大模型在音视频领域缺数据、 结构麻烦、算力本钱高大,长远期视频相关模型少许得可怜。”他们倒是不怵, 4月28日要公测“天幕”音视频巨大模型,60秒视频一键生成,还能视频生视频、文生音乐,这波操作够结实核。

具身智能的“凉思考”:数据少许、 动作困难,但95%成功率是咋来的

如果说视频生成是AI的“视觉革命”,那具身智能就是AI的“身体觉醒”。银河通用机器人创始人王鹤站在台上时 台下不少许人盯着他们放的视频——机器人根据语音指令抓取不同材质、形态的物体,成功率95%。

“但别被数字骗了。”王鹤话锋一转,“面向通用机器人的具身许多模态巨大模型,数据来源有限,动作高大频输出太困难。”他们用了笨办法:建三层级系统,结实件打底,仿真实世界合成数据训练泛化技能,巨大模型坐镇。这招管不管用?从95%的成功率看,至少许在抓取场景里算是啃下了结实骨头。

不过具身智能的坑远不止这些个。硅基智能CTO林会杰私下聊时说:“物理世界的变量太许多了 光照、摩擦力、物体形状……这些个在数字世界里轻巧松,现实中全是雷。”但他说归说眼里还是闪着光,“敢做具身智能的公司,眼下都是敢啃结实骨头的狠角色。”

端侧巨大模型:手机里的“AI巨大脑”, 真实能省下服务器钱

AI巨大模型越来越卷,参数动不动就千亿级,但跑在手机、眼镜这些个终端上,才是真实本事。vivo AI解决方案中心总监谢伟钦说:“端侧巨大模型是AGI的关键路径, 用户数据平安了服务器本钱也省了。”他们自研的蓝心巨大模型,已经能在手机端跑起来了。

安谋手艺产品总监杨磊更实在:“100亿参数级别的模型,最适合终端设备。”他们自研的“周容易”NPU, 专门给端侧巨大模型优化架构、解决内存墙问题,能一边支持CNN和Transformer,国内外主流巨大模型都适配上了。说白了就是让手机里的AI“脑子”更灵光、更省电。

李未可手艺更狠,直接把AI塞进眼镜。他们发布的WAKE-AI许多模态巨大模型, 针对眼镜端优化,语音返回速度90%,ASR字错率不到2%,户外运动、实时翻译全搞定。合伙人古鉴说:“眼镜比手机更轻巧薄,室外场景AI落地,它才是以后。”新鲜品马上要推,这波押注够巨大胆。

买卖化困局:TPF和PMF两座巨大山, 创业者得熬

生成式AI烫得发烫,但真实要赚钱,没那么轻巧松。启明创投合伙人周志峰 比其他领域长远得许多,得一边跨过TPF和PMF两座巨大山。”这话戳中了不少许创业者的痛点。

生数手艺CEO唐家渝的思路是:“做通用许多模态巨大模型, 图像、3D、视频相互促进,场景一变能飞迅速反应。”他们选的是原生许多模态路线,赌的是通用性带来的买卖化广度。阳光保险AI首席学问家杜新鲜凯则找到细分赛道:“巨大模型和保险底层逻辑天然契合, 做卖、客服、管理三个智能化,算是啃下了老一套行业的结实骨头。”

开源还是闭源?巨大佬们吵起来了

生成式AI路线之争,开源和闭源绝对是焦点。始智AI创始人刘道全力挺开源:“AGI之路千万条,开源至关关键。”他们去年9月上线的wisemodel.cn,已经囊括国内基本上巨大模型公司的开源模型。但硅基智能林会杰反着来:“眼下闭源领先,但以后开源一定更优良。互联网时代,头部搜索公司哪个不是靠开源?”

有意思的是安谋杨磊和联汇手艺赵天成都提到“基础设施”。赵天成说:“AI早期不确定性巨大,投基础设施更稳。”他2020年回国创业, 就是看中细小模型定制化本钱高大,转做工具链,后来又盯上预训练模型和Agent,目标是“五年后个个企业都有数字助手,效率提升10倍以上。”

AI基础设施:算力、 柔软件栈,结实核玩家在默默攒劲

生成式AI狂飙,背后是基础设施的结实核支撑。中科曙光智能计算产品事业部副总经理胡晓东说:“巨大模型闭环流程个个环节柔软件栈需求不同,得全栈搞定。”他们推出的DAS AI Software Stack, 支持巨大模型飞迅速迁移优化,还搞了个创地方WorkSpace,把平台能力整合分配,AI落地能省不少许事。

云天励飞的“云天天书”巨大模型负责人余晓填把巨大模型比作“信息压缩机”:“参数、 算力、数据、人才,人才最关键。”他们搞“算法芯片化”, 在巨大模型落地第三阶段“场景找手艺”时在精度、本钱、效率的“三角约束”里找到了平衡点。联汇手艺更直接, 搞“模型+工具+应用”三位一体产品栈,给企业给全栈AI2.0解决方案,员工提质增效,这波B端生意算盘打得精。

以后已来:AI for Robotics, 下一个爆发点在哪

前Meta首席工事负责人胡鲁辉趋势是语言到许多模态、数据到向量数据库、Agent到巨大模型操作系统、微调到Plugin。”但他话锋一转,“下一个AI2.0爆发点,我看优良AI for Robotics。”

银河通用机器人王鹤深厚有同感:“搞懂物理世界困难, 数据标准化、场景麻烦、结实件管束、算力本钱高大,全是挑战。”但挑战里藏着机会。他提到仿真实世界合成数据、三维模态模型提升泛化性,这些个方向,已经有公司在默默突破。

会场散时天色已暗,但聊聊声没停。生成式AI从Sora的视频狂想, 到具身智能的身体实践,再到基础设施的结实核支撑,这条路上,有人狂奔,有人沉淀,有人吵,但没人不信——AI沉构世界的速度,比我们想象中迅速得许多。明天还有29位嘉宾登场,这场AI的春日盛宴,远没到散场的时候。

欢迎分享,转载请注明来源:小川电商

原文地址:https://www.jinhanchuan.com/249843.html