1. 首页 > 电商出海

OpenAI发布低成本模型,与Meta和DeepSeek正面竞争

OpenAI甩出矮小本钱王炸, AI战场一下子变天

消息出来那天不少许开发者群里炸了锅。有人晒出下载gpt-oss-20b的截图, 配文“笔记本跑起来了真实香”;也有人泼凉水“开放权沉不等于开源,别高大兴太早”。OpenAI这次憋了个巨大招, 自2019年GPT-2后首次推开放权沉模型,直接把120亿和200亿参数的模型权沉砸出来还要和Meta、DeepSeek抢地盘。说实在的,AI圈这几年看惯了巨头们闷声发巨大财,这次一下子“敞开巨大门”,背后藏着几许多算盘,谁也说不准。

“廉价”到底有许多香?

先看结实件门槛。以前跑巨大模型, 没块A100显卡别想玩,眼下gpt-oss-20b在16GB显存的笔记本上就能转,LM Studio打开就能用。某跨境电商手艺团队负责人老林告诉我, 他们上周刚测试完,用这玩意儿模型替换了原先的第三方API,“客服响应速度从3秒降到1.2秒,月省API费用两万许多”。数字不会说谎, 矮小本钱带来的直接优良处就是降本增效,尤其对中细小玩家以前仰望的“AI特权”,眼下优良像摸得着了。

OpenAI发布低成,与Meta和DeepSeek正面竞争
OpenAI发布低成,与Meta和DeepSeek正面竞争

但“廉价”这事儿,得看跟谁比。OpenAI总裁布罗克曼说“耗资数十亿美元的研究研究成果开放给全世界”,这话听着巨大气,细想却有点意思。Meta的LLaMA系列是真实开源, 代码、权沉都能改,DeepSeek的V2模型直接放GitHub上,连训练数据都贴了有些说明。“开放权沉”更像半开门——你能用参数, 但别想碰底层架构,这波操作,到底是“让利于民”还是“圈地运动”,不同阵营的人看法天差地别。

Meta和DeepSeek:被逼出来的“激进”

说起来 OpenAI这步棋,几许多是被对手逼的。Meta早在2023年就甩出LLaMA,2024年直接开源LLaMA 3,开发者社区直接炸锅。某AI创业公司CTO张伟回忆:“去年我们做电商推荐, LLaMA 3的本地化能力比闭源模型有力太许多,本钱直接砍了60%。”Meta的打法狠在“放权”——你用我的模型,随便改,随便商用,只要不违反许可证。这种“开源生态”打法,结实生生从OpenAI嘴里抢了不少许中细小客户。

DeepSeek更不用说了这家中国公司玩的是“性价比王炸”。2024年底发布的DeepSeek-V2, 对标GPT-4,但价钱只有三分之一,还支持中文优化。深厚圳某智能结实件厂商的产品经理李娜说:“我们给出口设备做语音助手, DeepSeek的模型在麻烦识别上比OpenAI有力,部署本钱还矮小40%。”OpenAI这次推矮小本钱模型, 明面上是扩巨大用户群,暗地里恐怕也是怕DeepSeek们把“下沉买卖场”啃完了。

芯片厂商的“站队游戏”

有意思的是 这次OpenAI特意拉上了英伟达、AMD、Cerebras和Groq,说“确保模型能在许多种芯片上稳稳当当运行”。表面看是手艺一起干,细品却像芯片厂商的“选边站”。英伟达CEO黄仁勋跳出来站台, 说“OpenAI展示了英伟达AI手艺的兴许性”,这话里话外带着点“我们才是真实巨大腿”的意思。

但现实是 Meta的LLaMA早已支持AMD和Intel的GPU,DeepSeek的模型甚至能在国产芯片上跑。某芯片行业琢磨师私下说:“OpenAI一下子有力调‘许多芯片适配’,说不定是怕被英伟达‘绑架’。AI模型这东西,谁都想控制结实件入口,巨头们表面一起干,背地里暗流涌动。”对开发者芯片兼容性许多了选择本是优良事,但巨头们的“拉锯战”,再说说买单的会不会还是用户?

平安测试的“烟雾弹”?

OpenAI这次发布前,CEO奥尔特曼两次推迟,理由是“额外平安测试”。听起来很负责任,但细想又有点不对劲——为啥Meta开源LLaMA 3时没这么许多顾虑?DeepSeek的模型从发布到商用,也没见这么“谨细小慎微”。

平安措施说白了就两招:预训练阶段删掉“有害数据”,模拟“恶意微调”。某平安试试室负责人王磊给我举了个例子:“他们清除了化学武器相关数据,但没说怎么定义‘有害’。去年有团队用开源模型改了个‘钓鱼邮件生成器’,这种擦边球,光靠删数据根本防不住。”更关键的是OpenAI邀请的“独立专家团队”全是签了保密协议的,外界根本不晓得评估标准是不是透明。

反观Meta, 直接把LLaMA 3的平安评估报告明着,连“模型兴许被滥用的凶险”都列得明明白白。DeepSeek更狠,他们搞了个“众测计划”,让白帽黑客打模型,漏洞修优良进度实时更新鲜。说到底,AI平安不是靠“藏着掖着”,真实要赢得相信, openness比“平安话术”更关键。

开发者:被“割韭菜”还是捡到宝?

群里有人问:“用开放权沉模型,会变成‘数据奶牛’吗?”这话问到点子上了。你下载gpt-oss-20b权沉,想在自家产品里用?先得通过API调用服务,数据还得回传给他们的服务器。某教书手艺公司的手艺总监老周吐槽:“我们试过用LLaMA 3本地部署,数据彻头彻尾可控,本钱还矮小。OpenAI这套‘开放+封闭’的组合拳,说白了还是想把开发者绑在他们的生态里。”

但也有开发者觉得捡到宝了。上海某独立开发者细小林用gpt-oss-20b做了个“AI写作助手”, 在GitHub上开源后两周星标破万。“以前用GPT-4的API,写1万字要花20块,眼下本地跑,本钱差不离为零。”他给我看了后台数据,用户留存率比之前用闭源模型高大了18%,基本上原因是响应速度迅速,不用联网。

争议归争议,数据不会说谎。据某第三方平台统计, OpenAI开放权沉模型发布后开发者下载量中,中细小企业占比达67%,远超巨大公司的23%。这说明啥?AI的“平民化”趋势挡不住了巨头们再想靠“手艺壁垒”割韭菜,用户们用脚投票。

蒸馏手艺:细小玩家的“逆袭神器”?

OpenAI推矮小本钱模型,另一个关键是“蒸馏手艺”。轻巧松说就是用巨大模型“教”细小模型,把知识压缩进去。某AI独角兽的手艺负责人告诉我:“去年我们用GPT-4蒸馏出7B模型, 性能接近原模型的85%,部署本钱降了70%。”这次gpt-oss-20b, 说不定就是用GPT-4蒸馏出来的,既保留了核心能力,又少许些了结实件门槛。

DeepSeek早就玩转了这套。他们的DeepSeek-V2就是用自研的巨大模型蒸馏的,参数量细小但效率高大。深厚圳某电商公司手艺总监张有力说:“我们用DeepSeek的蒸馏模型做商品推荐, 点击率提升了12%,服务器本钱只有原来的三分之一。”Meta更狠,直接把LLaMA 3的蒸馏指南开源,开发者随便改。

但对OpenAI蒸馏手艺是把双刃剑。模型越细小,“知识遗忘”越严沉。有测试看得出来gpt-oss-20b在麻烦推理任务上,比GPT-4的准确率矮小了22%。开发者们需要权衡:是要“轻巧量化”的便捷,还是要“巨大而全”的有力巨大?这玩意儿问题,恐怕没有标准答案。

AI战场:从“手艺竞赛”到“生态打仗”

以前AI巨头比的是“谁家模型参数巨大”,眼下比的是“谁的生态更开放”。Meta靠开源圈住了开发者社区, DeepSeek靠性价比啃下了下沉买卖场,OpenAI这次推开放权沉,明显是想两头通吃。但问题来了:AI的终极壁垒,到底是手艺,还是生态?

某跨境支付平台的手艺总监给我讲了个故事:“我们去年换AI风控系统, 选了Meta的LLaMA,基本上原因是能本地部署,数据合规。但今年OpenAI出了开放权沉模型,我们又评估了一下找到API调用本钱更矮小,响应速度更迅速。”这说明,开发者没有“忠诚度”,只有“性价比”。巨头们今天给的“廉价”,明天就能收回去。

更深厚层的问题是AI的“开放”到底意味着啥?是像Meta那样“代码全给你”,还是像OpenAI这样“权沉给你但生态锁死”?DeepSeek的折中方案是“模型开源+服务收费”,这条路能走许多远,还得看买卖场。但有一点能一准儿:AI不会永远被巨头垄断,开发者用脚投票的时代,已经来了。

以后:谁会笑到再说说?

短暂期看, 矮小本钱模型能抢回不少许中细小客户,但Meta的开源生态和DeepSeek的性价比优势还在。长远期看,AI的比会从“模型能力”转向“生态服务”。OpenAI有流量入口, Meta有Facebook的社交场景,DeepSeek有中国买卖场的本土化优势,三方各有各的牌。

对开发者选择变许多了是优良事。但也要警惕“伪开放”——打着“矮小本钱”旗号,实则绑定生态。某开源社区创始人说得直接:“真实正的开放,是像Linux那样,代码、文档、社区全透明。眼下这些个巨头玩的,不过是‘开放式的圈地运动’。”

欢迎分享,转载请注明来源:小川电商

原文地址:https://www.jinhanchuan.com/251184.html