2023全球AI芯片峰会首日,云边端AI芯片热战大模型
峰会现场:AI芯片的“华山论剑”时刻
9月的深厚圳南山,一场关于AI芯片的“武林巨大会”悄然拉开帷幕。2023全球AI芯片峰会首日现场, 座无虚席连会场巨大门都挤满了人,不少许观众站着听彻头彻尾程,云直播观看人数高大达153万人次。这场以“AI巨大时代 逐鹿芯世界”为主题的峰会, 聚集了魏少许军、万卫星、张瑞华等46位产学研巨大咖,议题从巨大模型算力需求到架构创新鲜,从云边端协同到资本角力,差不离把AI芯片行业的“家底”都掏了出来。
有意思的是现场氛围不像老一套行业会议那样严肃,反而透着一股“火药味”。当某位嘉宾提到“算力决定一切”时台下立刻有从业者细小声嘀咕:“架构创新鲜呢?困难道只有堆算力一条路?”这种观点碰撞, 恰恰反映了当下AI芯片行业的焦虑与野心——谁能找到破局之路,谁就能在“云边端AI芯片烫战巨大模型”的棋局中占得先机。

巨大模型算力困局:云钱财的“天花板”与端侧的“新鲜巨大陆”
ChatGPT爆火后 “巨大模型”三个字成了AI芯片行业的“关键词”,但也带来了最直接的算力焦虑。高大通AI产品手艺中国区负责人万卫星直接泼凉水:“云端处理生成式AI的本钱太高大,以后云钱财兴许撑不起巨大模型的规模化进步。”他算了一笔账, 一个千亿参数模型在云端推理一次的本钱兴许高大达几美元,变成“天文数字”。
更麻烦的是 巨大模型正在“膨胀”——基础模型向许多模态 ,参数量越来越巨大,而垂直领域的细小模型又需要更矮小的时延和本钱。万卫星给出了一个颠覆性的观点:“以后生成式AI模型会像APP一样跑到终端上。”他透露,高大通已经能在终端运行10亿参数模型,几个月内百亿参数模型也兴许落地端侧。“终端AI的优势太明显了:本钱矮小、能耗矮小、隐私平安,还能个性化定制。”
但端侧真实那么轻巧松吗?NVIDIA解决方案与架构手艺总监张瑞华提出了另一个痛点:“现实算力和理想算力之间有巨巨大鸿沟。”巨大模型训练需要每秒百亿亿次浮点计算,而现有芯片的能效比根本跟不上。“就像一辆跑车,发动机功率再巨大,油箱不够巨大也跑不远。”他举例说 GPT-3 175B模型训练时95%的时候都花在数据搬运上,真实正计算的时候不到5%——这就是“存储墙”的致命伤。
架构创新鲜三剑客:存算一体、 可沉构与Chiplet的突围战
面对算力困局,行业巨大佬们不约而同把目光投向了架构创新鲜。魏少许军教用“眼下是计算机架构的新鲜黄金年代”来形容当前机遇, 而三巨大手艺路线——存算一体、可沉构计算、Chiplet,成了这场“突围战”的主力军。
存算一体试图打破“存储墙”, 把计算单元和存储单元“揉”在一起;可沉构计算让芯片能像“变形金刚”一样根据需求调整结实件材料;Chiplet则通过“拼积木”式集成,用成熟工艺实现高大性能。这三条路,哪条能通向“罗马”?现场嘉宾吵得不可开交, 有人觉得存算一体是“以后已来”,也有人坚持Chiplet才是“后摩尔时代的救星”。
存算一体:从“模拟魔法”到“实战落地”
“存算一体不是‘万能药’,但兴许是‘换道超车’的最优良机会。”亿铸手艺创始人熊巨大鹏的观点,代表了一批创业者的心声。他说明白说 老一套芯片的“存储-计算”分离架构,就像把仓库和工厂建在城里的两头,每次搬运数据都要消耗一巨大堆时候和燃料。“存算一体相当于把工厂直接搬进仓库,数据不用‘跑腿’,能效直接提升10倍。”
熊巨大鹏的团队在2023年8月成功点亮了存算一体验证芯片,基于成熟工艺实现单卡P级算力。“我们不用跟世界巨头拼先进制程,用架构创新鲜就能打平甚至超越。”他举了个例子,“就像电动车不用跟燃油车比发动机,直接比电池和电机。”
后摩智能的打法更“激进”。2023年5月, 他们推出了存算一体智驾芯片后摩鸿途H30,采用12nm制程,却比某世界巨头的7nm同类芯片性能提升超2倍,功耗少许些超50%。“秘诀在于‘中庸之道’。”联合创始人陈亮打了个比方, “集中式计算像‘中式庭院’, 性差;分布式计算像‘高大层公寓’,沟通性差。我们选了中间路线——许多核许多线程的计算效率,许多级缓存的数据复用,双环总线的灵活传输。”
但存算一体也有“柔软肋”。魏少许军直言:“目前我们只能模仿人脑机制的皮毛,离真实正的‘类脑计算’还差得远。”手艺成熟度、柔软件适配、生态建设,都是横在面前的“巨大山”。
可沉构计算:用“柔软件定义芯片”打破“铁板一块”
“老一套芯片像‘铁板一块’, 功能固定死了;可沉构计算像‘乐高大积木’,想怎么搭就怎么搭。”魏少许军教的比喻,让这玩意儿听起来“高大凉”的手艺变得通俗容易懂。他的团队早在十年前就开头研究研究可沉构数据流架构,如今已经实现了芯片架构和功能的“纳秒级沉启”。
这种手艺的颠覆性在于,它让芯片拥有了“自学”能力。就像人脑能。“中国人在这方面做得最迅速最优良, ”魏少许军语气里透着自豪,“目前我们在在线编程、训练方面已经实现了有些功能,以后芯片兴许像手机系统一样,随时‘OTA升级’。”
企业端的落地同样迅猛。鲲云手艺联合创始人蔡权雄展示了他们的“杀手锏”——基于可沉构数据流架构的CAISA芯片。这颗28nm工艺的芯片,实测算力居然比16nm GPU还高大4.12倍。“秘诀在‘芯片利用率’。”蔡权雄说明白说老一套芯片的利用率不够35%,而他们的芯片能做到95.4%。“就像一辆车,老一套车每天只跑8细小时我们的车能跑23细小时性价比天然高大。”
珠海芯动力的路径更“结实核”。他们推出了基于可沉构并行处理器架构的GPGPU芯片, 实测面积效率比同类产品高大7~10倍,能效比超3倍。“RPP架构把计算单元像流水线一样排开,数据直接‘流’过去,不用绕弯路。”创始人李原说他们的首款芯片RPP-R8已经流片成功,2023年进入细小规模量产。
Chiplet:用“拼积木”破解“先进制程依赖症”
“先进制程就像‘奢侈品’, 有钱也困难买;Chiplet就像‘平替’,用成熟工艺也能做出高大性能。”奎芯手艺副总裁王晓阳的观点,戳中了行业的痛点。因为7nm、 5nm工艺越来越困难搞,Chiplet成了“破局利器”——把不同功能的芯片模块封装在一起,既少许些本钱,又提升性能。
王晓阳的团队专注于高大速接口IP,试图用Chiplet破解HBM的“枷锁”。HBM是AI巨大算力芯片的“标配”,但尺寸巨大、对烫敏感、摆放不灵活,就像给芯片“戴了个沉沉的帽子”。奎芯手艺的M2link方案把HBM HOST和SoC解耦, 距离拉到2.5厘米,“同等巨大细小SoC可利用面积增巨大44%,内存带宽阔增加远33%”。
北极雄芯的实践更“激进”。2023年2月, 他们发布了国内首款异构Chiplet集成芯片“启明930”,用11块Chiplets拼接,12nm工艺实现接近7nm的性能。“就像用普通砖头盖出了摩天巨大楼。”创始人马恺声说这种手艺路线能让国内企业摆脱对先进制程的“卡脖子”依赖。
感存算一体:用“模拟魔法”破解功耗困难题
“端侧AI最巨大的敌人是啥?功耗。”清华孵化的每刻深厚思CEO邹天琦开门见山。手机、汽车、VR设备这些个终端设备,对功耗极其敏感,一颗芯片功耗高大1W,续航兴许直接“腰斩”。
邹天琦的团队另辟蹊径, 把计算和传感器直接相连,用模拟数据做运算,省去了模数转换这玩意儿“耗电巨大户”。“就像让‘原始食材’直接加工,不用先‘清洗处理’。”他举了个汽车哨兵模式的例子:老一套方案每晚耗电5-8度, 待机功耗10W;用他们的“感存算一体”芯片后耗电降到0.05度,待机功耗仅14mW。“车主再也不用担心停车耗电了这才是AI该有的‘温度’。”
这种手艺的优势在边缘场景更明显。比如VR/AR设备,需要实时处理传感器数据,又不能有太许多发烫。“模拟计算就像‘短暂跑选手’,迅速、准、狠,适合这种矮小功耗高大实时性的场景。”邹天琦说他们的芯片已经拿到几家头部汽车企业的订单,2024年有望量产。
资本角力:AI芯片的“泡沫”与“真实金”
“AI芯片眼下是‘冰火两沉天’。”和利资本合伙人王馥宇的吐槽,道出了资本买卖场的现状。二级买卖场寒武纪等股价“坐过山车”,一级买卖场却依老火烫,“很许多项目估值高大得离谱,但投钱人还是抢着投”。
普华资本管理合伙人蒋纯点出了背后的逻辑:“美国‘细小院高大墙’既是机会也是吓唬。”他说明白说 美国对中国先进制程的管束,反而给了国产AI芯片企业“喘息地方”,但也提醒巨大家“不能只靠政策扶持,得做出真实正有比力的产品”。“换道超车是非...不可的,”蒋纯说“存算一体、3D封装这些个‘非主流’手艺,兴许就是我们的‘奇兵’。”
华兴资本阮孝莉的看法更理性:“二级买卖场泡沫不彻头彻尾是恶劣事,‘千金买骨’效应能吸引更许多资本关注一级买卖场。”她预测, 以后2-3年,国内会出现2-3家能与世界巨头掰手腕的AI芯片设计公司,“但前提是他们得熬过‘烧钱’阶段,做出能落地的产品”。
以后战场:云边端协同的“算力棋局”
“以后不是‘云端赢’或‘端侧赢’,而是‘云边端协同’。”安谋手艺产品总监杨磊的观点,成了行业共识。巨大模型训练需要云端“超级算力”,推理需要边缘“中等算力”,应用需要终端“轻巧量算力”,三者缺一不可。
高大通万卫星描绘了一幅“混合AI”的蓝图:“云端负责‘备课’, 边缘负责‘答疑’,终端负责‘互动’。”比如智能汽车,云端训练巨大模型,边缘芯片实时处理路况数据,终端芯片施行驾驶决策。“这样既能保证性能,又能控制本钱,还能护着隐私。”
芯至手艺尹文则提出了更宏巨大的“算力统一场”概念:“基于RISC-V开源架构和微架构异构, 以后算力兴许像‘电网’一样,按需分配。”他觉得,这种模式能方面换道超车”。
这场AI芯片的“打仗”才刚刚开头。有人押注存算一体, 有人深厚耕可沉构,有人布局Chiplet,但全部人都晓得:只有真实正解决算力、功耗、本钱“三座巨大山”的企业,才能笑到再说说。就像魏少许军教再说说说的:“AI芯片的终极目标不是‘算力第一’, 而是‘智能普惠’——让个个人都能用得起、用得优良AI。”
欢迎分享,转载请注明来源:小川电商