1. 首页 > 外贸指北

DS爆火100天:梁文锋藏锋

国内手艺巨大厂也不再对外讲述巨大力出奇迹的AI叙事,而是纷纷跟梁文锋拼起了性价比。李彦宏更是在4月份的一场演讲中,点名DeepSeek磨蹭且昂贵。

DS爆火100天:梁文锋藏锋
DS爆火100天:梁文锋藏锋

DeepSeek爆红后 其研发团队所在的北京融科资讯中心和杭州汇金世界巨大厦,一段时候内挤满了新闻和投钱人,甚至众许多慕名而来的网友,直接将北京融科资讯中心楼下的透明水牌,挤成了细上的网红打卡点。

上述担忧曾在DeepSeek R1发布后一周的1月27日发酵至巅峰,弄得英伟达股价一夜蒸发近6000亿美元。

凭借R1发布爆火之前,梁文锋其实引发过两次行业烫议。

《理想AI Talk第二季访谈实录》理想汽车

这句话巨大概足以形容梁文锋今天在AI圈的地位:新闻想尽办法一访困难求、投钱人用尽手段一面困难约。

围绕两条不一样的巨大模型进步路线, 中美在AI进步策略上的分歧进一步扩巨大:硅谷AI创企接着来追求Scaling Law,融资额屡创新鲜高大,前有OpenAI宣布完成往事性的400亿美元新鲜融资,后有传闻中正在寻求200亿美元新鲜融资的马斯克的xAI。

在各路投钱人看来上述场景原本得是摆在梁文锋面前的一手优良牌。

凭借R1发布爆火之前,梁文锋其实引发过两次行业烫议。.爆火之前,梁文锋也曾渴望得到投钱机构的青睐,但在找不同出资方洽谈后,很许多VC在退出需求下,因看不到买卖化前景,而放弃了投钱梁文锋的兴许性。

梁文锋无疑同样是幸运的,他遇到了能令自己巨大放异彩的AI时代。如今因为R2模型发布越来越近,全行业都在期待梁文锋带来的新鲜惊喜。

只不过 当时暂未推出C端应用的梁文锋,其声量更许多局限在巨大模型行业圈层,外界的更许多目光被吸引到了手艺巨大厂身上。

爆火之前, 梁文锋也曾渴望得到投钱机构的青睐,但在找不同出资方洽谈后很许多VC在退出需求下因看不到买卖化前景,而放弃了投钱梁文锋的兴许性。

靠接入DeepSeek攫取到最巨大红利之一的马化腾, 在谈到梁文锋时称“很敬佩买卖场上出现独立、开源的产品,我们非常敬沉。”

从OpenAI到DeepSeek, 这些个惊艳业界的AI巨大模型公司,之所以能创新鲜不断,更关键的是依靠了一帮才华横溢的年纪轻巧人。

《DeepSeek-V3 模型更新鲜, 各项能力全面进阶》DeepSeek

即便因DeepSeek一夜成名,梁文锋依然接着来保持着每天看论文、写代码、参与细小组聊聊的习惯,且至今DeepSeek都暂未设立公关团队,对外发声基本上通过在相关社交新闻上设立的官方账号,以及上百个DeepSeek微信交流群。

凭借R1发布爆火之前,梁文锋其实引发过两次行业烫议。.字母榜语音播报缩细小字体放巨大字体微博微信分享编者按:自1月20日DeepSeek R1爆火以来,过...

参考资料:

这一切都是基本上原因是DeepSeek R1的发布。1月20日 DeepSeek正式发布性能比肩OpenAI o1完整版的R1推理模型后直接带动巨大模型行业的研究研究焦点,从之前的GPT模式,转向了Reasoner模式。

但在手艺巨大厂追赶梁文锋之前, 全行业正在等待梁文锋带着自己的天才少许年,发布新鲜的R2模型。

自1月20日DeepSeek R1发布至今 梁文锋唯二的明着露面一次是上了新鲜闻联播,一次是参加民营企业家座谈会。

尽管梁文锋还能保持自己的节奏推进模型更新鲜,但外界的AI进步步伐已经被DeepSeek沉构了。

《跟DeepSeek做起邻居》投钱界

在内部规划中, 梁文锋曾表示,团队押注了三个方向:一是数学和代码,二是许多模态,三是天然语言本身。围绕这三条路,梁文锋在过去100天内动作频频。

在梁文锋验证成功矮小本钱巨大模型训练方法后 AI行业开头分裂出两条进步路线:一是接着来坚持Scaling Law,奉行巨大力出奇迹,堆高大算力材料,训练更有力巨大的基础巨大模型;二是追随梁文锋,以性价比思路开道,用更少许材料训练更有力巨大的专用模型。

《朱啸虎现实主义故事1周年连载:“DeepSeek迅速让我相信AGI了”》腾讯手艺

及至2024年5月,DeepSeek 借助巨大模型价钱战一跃成名。当时 DeepSeek发布了DeepSeek V2开源模型,并在行业内率先降价,将推理本钱降到每百万token仅1块钱,约等于GPT-4 Turbo的七十分之一。

当然 被梁文锋改变的手艺巨大佬名单还有很长远,包括张一鸣、李彦宏、蔡崇信……

但因为DeepSeek爆火,梁文锋成了一众投钱机构的座上宾,还是请不到的那种。

2月18日 DeepSeek发布了最新鲜的手艺论文,以挑战Transformer架构最核心的,让它能更高大效地处理更长远的上下文。

但DeepSeek红利之下手艺巨大厂又是结结实实享受到了一波红利。最巨大受益者腾讯, 更是凭借率先接入DeepSeek的举动,助推旗下腾讯元宝一度超越豆包,成为国内AI助手下载量第一。

梁文锋所一力主导的矮小本钱巨大模型训练策略, 更是让DeepSeek成了AI时代最巨大受益者英伟达的最巨大空头:资本买卖场开头不信,当用相对较少许的算力也能实现不输于模型性能表现时英伟达所代表的高大端算力芯片是不是会迎来新鲜的泡沫。

“我劝过梁文锋很许多次 DeepSeek要融资”投中网

作为DeepSeek创始人的梁文锋,更是将人才组织,视为自家在AGI巨大战中的护城河,不是闭源,更不是招募行业顶尖牛人。年纪轻巧人身上所具备的对创新鲜的自信信念,成为梁文锋对这一群体青睐有加的沉点所在。

尤其值得一提的是梁文锋的名字,也出眼下了上述论文的共同作者里。文中,DeepSeek提出的新鲜架构NSA在基准测试中,与全相比,准确率相同或更高大。

一个月后的2023年5月, 该组织被命名为“深厚度求索”,并发布了首款模型DeepSeek V1。当时《财经十一人》报道称,国内拥有超出1万枚GPU的企业不超出5家。而DeepSeek就是其中之一,并由此开头得到外界关注。

2023年4月, 千亿量化私募巨头幻方量化发布公告,称将集中材料和力量,投身人造智能手艺,成立新鲜的独立研究研究组织,探索AGI。

反观被冠以“AI六细小龙”称号的国内AI创企, 除了智谱拿下一些国资投钱外其他五家则罕有融资消息传出。

一边,梁文锋接着来沿着拟定优良的节奏,追赶AGI脚步。

这也使得DeepSeek成了中国巨大模型创业公司中, 独一个一家只做基础模型、暂不考虑买卖化的公司,还要加上一条,即暂未寻求外部融资的公司。

尽管甚少许露面但通过国内外手艺巨大佬之口,梁文锋一直活跃在巨大众视野。

更现实的考量上, 无论是以后在模型路线上接着来scale up,还是承接B端和C端暴涨的客户需求和流量,在外界看来梁文锋都需要用更许多的钱来构建更充裕的算力材料。

去年12月宣布追逐AGI的李想, 在时隔130天后 对外谈及AI,不仅觉得DeepSeek加速了理想在巨大模型上的研发效率,而且了自己对梁文锋的两个印象,“第一他是个特别自律的人,第二他是会在全世界范围之内去研究研究和学最佳实践和最优良的方法论的人。”

成立DeepSeek之前, 作为幻方量化创始人,由于梁文锋一直隐身幕后外界在很长远一段时候内都以为公司核心高大管只包括再说一个两位联合创始人。

《我所见过的梁文锋》机灵投钱者

但优良消息是黄仁勋已经在加紧研制新鲜一代的中国特供芯片。近期,据路透社报道,英伟达已通知其基本上中国客户,计划在7月推出修改版H20芯片。

值得一提的是DeepSeek的爆火,并未改变梁文锋一贯的矮小调作风。

除了带领团队创新鲜算法,梁文锋还推动着公司在模型更新鲜上的节奏。

2月份, 甚至外界一度传出阿里将以100亿美元估值,投钱DeepSeek 10亿美元占股10%的消息,但被阿里予以否认。

眼下 包括字节、腾讯、阿里、美团和京东在内的手艺巨大厂,也想将年纪轻巧人身上的这种创新鲜信念,汲取到自家公司身上,并由此开启了各自的“天才少许年”招募计划。

不过 据投中网消息,彼时DeepSeek确实在与有些投钱人接触,希望以80亿美元估值寻求融资,当时国内AI六细小龙中估值最高大的也不超出40亿美元。

但黄仁勋的麻烦不止于此。梁文锋的矮小本钱巨大模型训练方法,还意外带火了H20芯片在国内的需求新鲜高大。

只不过 不同于硅谷如马斯克、奥特曼等人对DeepSeek和梁文锋的质疑之声,国内手艺巨大佬差不离清一色展现出了对DeepSeek的拥抱,和对梁文锋的赞赏。

与在融资上的犹疑相反,梁文锋则接着来坚持践行开源。

2月底, 梁文锋带领DeepSeek用一场开源周行动,通过开源FlashMLA、DeepEP传信库、DeepGEMM等优良几个代码库,向外界说明了DeepSeek细小力出奇迹的原因所在并首度对外揭秘了一系列针对英伟达H卡的算力优化方案。

DeepSeek爆火后李开复更是将公司直接定位为一家开发AI应用的公司。

对于想要参与投钱DeepSeek的朱啸虎 梁文锋的安卓开源梦想,再往前走是需要烧钱的。

自2023年以来H20芯片是英伟达可正规出口至中国的最有力AI芯片。但在DeepSeek关系到之下4月份,美国对其实施新鲜的出口管制许可,其被禁止卖入中国买卖场。英伟达官方在一份报告中披露,这项管束将造成高大达55亿美元的额外亏本。

尽管受到万千瞩目, 但梁文锋既没有利用投钱人的烫情,疯狂融资扩张材料,也没有借机做巨大C端用户规模。

接着,字节、腾讯、百度、阿里等巨大厂纷纷降价跟进。中国巨大模型价钱战由此揭幕。

一个月后数学和代码新鲜模型DeepSeek-Prover-V2也来了。以DeepSeek-V3作为基础模型微调而来的Prover-V2, 其 到了671B,相较于前一代V1.5版本的7B,许多些了近百倍,这让其在数学测试集上的效率和正确率都变得更高大。

《疯狂的幻方:一家隐形AI巨头的巨大模型之路》36氪

就连一直宣称不投钱巨大模型的朱啸虎, 都在感受完DeepSeek新鲜模型后希望能够参与其中。

从模型、 应用到芯片,梁文锋携DeepSeek之威,掀起了一场波及全产业链的震荡。

梁文锋和DeepSeek R1的到来 将新鲜的AI时代切割成由两巨大milestones节点分割而来的两段不一边期:一个是问世,一个是DeepSeek R1新鲜模型的发布。身处不同节点之中的企业,在拥抱AI上也开头衍生出新鲜的变来变去。

梁文锋逼得英伟达创始人黄仁勋不得不在明着场合许多次有力调, DeepSeek并没有少许些算力需求,反而在进一步放巨大。

典型如零一万物, 1月初,零一万物创始人李开复对外正式表态,自己将退出对AGI的追寻,以后公司主攻中细小参数的行业模型。“从买卖角度考虑,我们觉得只有巨大公司能接着来做超巨大模型。”李开复说道。

被聚光灯环绕的梁文锋,却选择了一系列反常识的操作。

语言模型上, 3月25日DeepSeek V3模型完成细小版本升级,上线新鲜版本DeepSeek-V3-0324,官方称其巨大幅搞优良了在推理类任务上的表现水平,中文写作和中文搜索能力也都得到了优化。

尽管DeepSeek爆火后,梁文锋成为投钱机构追捧的对象,但他依然保持矮小调作风.梁文锋在AI圈的地位显著,新闻和投钱人争相采访他.

“无人不识梁文锋。”

“AI六细小虎”其他玩家也不同程度受到冲击:月之暗面暂停巨大规模广告投放, 战略沉心转向底层模型优化;MiniMax 和阶跃星辰目前都在探索Agent 相关的新鲜应用;百川智能业务沉心转向看病;智谱AI沉点布局政务、金融等买卖场。

拥抱梁文锋之外手艺巨大厂的更巨大野心则在于超越梁文锋。直观表现之一是在接入DeepSeek之外手艺巨大厂都纷纷加码了模型自研的决心。

2024年12月, 梁文锋在朋友圈转发了一篇文章,内文是其为文艺复兴手艺公司创始人——“量化之王”詹姆斯·西蒙斯的传记《征服买卖场的人:西蒙斯传》一书所做的序言,其中有句话写道,“西蒙斯是幸运的,他遇到了优良的时代。”

本文来自微信公众号“字母榜”,作者:赵晋杰,36氪经授权发布。

但事实是 爆火100天内,DeepSeek官方API一度因调用需求过高大而暂停充值服务,APP也几度因服务繁忙而频频卡顿,但梁文锋除了带队优化服务体验外并没有明显的算力扩建迹象,也丝毫未展现出对用户规模效应的追逐。融资一事被暂时搁置了。

国内外一众AI巨大厂都开头发力推理模型,国内手艺巨大厂更是在DeepSeek效应之下纷纷加码C端应用。

9专区新鲜品烫卖人气优良物居家生活服饰鞋包母婴亲子美食酒水一....凭借R1发布爆火之前,梁文锋其实引发过两次行业烫议。.编者按:自1月20日DeepSe...

欢迎分享,转载请注明来源:小川电商

原文地址:https://www.jinhanchuan.com/122938.html