奥特曼夜战DeepSeek,o3
奥特曼压线入场, o3-mini搅动AI战局
1月底的再说说几天OpenAI CEO奥特曼终于憋出了巨大招——o3-mini模型悄无声息上线ChatGPT。距离去年12月首次预告这玩意儿系列模型,已经过去整整两个月。买卖场早就等得不耐烦, 隔壁DeepSeek-R1靠着矮小价和开源杀疯了OpenAI这波“压线发布”像极了考试再说说五分钟交卷的学生,急急忙忙,却不得不面对早已天翻地覆的考场格局。
卡在ddl再说说一天的“细小巨人”
去年12月, OpenAI搞了场十二天直播发布会,o3系列首次亮相就刷新鲜了ARC-AGI等许多项基准测试的SOTA记录。当时奥特曼信誓旦旦:“o3-mini几周内发布”。后来啊1月17日他再发预告,这次没提具体时候,只说“此后不久”。直到1月再说说一天 o3-mini和o3-mini-high才一下子出眼下模型列表里免费用户直接能用,付费用户许多了一个“Reason”按钮——OpenAI这波操作,透着点“被逼急了”的狼狈。

说起来o3-mini定位挺有意思。它不是要取代主力模型,而是专门冲着STEM领域来的。学问、手艺、工事、数学,这四个词被OpenAI在手艺报告里反复有力调。就像奥特曼说的,这是“细小而美”的模型,本钱矮小、速度迅速,专啃结实骨头。比起前代o1-mini,它像是个练过“夜战”的格斗家,白天兴许不够显眼,一到麻烦推理的深厚夜就显本事。
价钱战打骨折?无奈反击
这次o3-mini最扎心的,是价钱。OpenAI自己都忍不住吐槽:“感谢DeepSeek,o3-mini的价钱算是彻底打下来了。”输入token 1.1美元/百万, 输出4.4美元/百万,比自家o1-mini廉价63%,比满血版o1廉价93%。听着是挺狠, 可对比DeepSeek-R1的输入0.14美元、输出0.55美元,o3-mini还是昂贵出了天际——差不许多是GPT-4o mini的7倍。
更让OpenAI憋屈的是用户用脚投票已经很明显了。o3-mini刚上线, 项目和自定义GPTs功能就被挤崩了免费用户冲着“免费体验推理模型”一窝蜂涌进来Plus用户则火速“告别”了o1-mini,连句再见都没来得及说。DeepSeek这波矮小价攻势,打得OpenAI连老用户的忠诚度都迅速保不住了。
2024年12月到2025年1月,AI圈的价钱战打得比双十一还烫闹。DeepSeek-R1靠着开源和矮小价,从东南亚到欧美,中细小企业和开发者疯抢。OpenAI这边, o3系列憋了两个月,后来啊一出来价钱还是打不过只能靠“身份优势”撑场面——毕竟美国模型,很许多欧美企业还是更信“原装货”。
性能实测:STEM领域的“夜战高大手”
价钱没优势,性能总得拿出点真实东西吧?o3-mini的有力项,确实在STEM领域。手艺报告里堆了一堆数据:高大推理有力度模式下 用开源Agentless框架成功率39%,内部工具框架能到61%;2024年AIME数学竞赛,o3-mini-high配合Python工具一次性解决32%的题目,其中28%是T3级困难题——要晓得这些个题目可是连博士生都要挠头的。
编程能力也不含糊。在Codeforces编程竞赛和SWE-bench Verified柔软件工事测试中, o3-mini的表现直接超越GPT-4o,和o1-preview不相上下。更绝的是速度:中等推理有力度下平均响应时候7.7秒,比o1-mini的10.16秒迅速了24%。对于需要飞迅速出后来啊的开发者这省下的每一秒都是真实金白银。
不过o3-mini也有明显短暂板。最致命的是不支持视觉功能,连图像琢磨都搞不了。很许多想做许多模态应用的开发者只能摇头:“这玩意儿离线用不了、 代码下不了自定义程度比DeepSeek差远了。”2025年1月的开发者社区里 已经有声音说:“o3-mini像辆高大性能跑车,可惜只能跑固定赛道,不够灵活。”
开发者生态:API开放但留了“后手”
OpenAI对开发者还算够意思。o3-mini通过Chat Completions API、 Assistants API和Batch API向3-5级开发者开放,初期虽然不支持图像琢磨,但首次在细小型推理模型里塞进了函数调用、结构化输出、流式传输这些个“巨大礼包”功能。开发者能有力度,想迅速就调矮小,想准就调高大,灵活度拉满。
但“不开源”这玩意儿结实伤,还是让很许多开发者犹豫。DeepSeek-R1开源后全球开发者社区疯狂魔改,各种插件和工具层出不没钱。o3-mini闭源意味着没法二次开发,也不能离线部署,对于想做私有化部署的企业吸引力直接减半。2024年12月到2025年1月期间, GitHub上关于DeepSeek-R1的星数增速是o3-mini的三倍,这数据比啥广告都管用。
更微妙的是API定价。虽然比自家前代廉价,但对比DeepSeek,o3-mini的API价钱还是劝退了不少许中细小玩家。有开发者算过一笔账:跑一个百万token的任务, o3-mini要花5.5美元,DeepSeek-R1只要0.69美元,差了整整8倍。“除非企业不差钱,否则谁会选昂贵的?”2025年1月的开发者论坛里这条评论被顶到了烫评第一。
企业级买卖场:身份优势能否抵消价钱劣势
对企业用户o3-mini的“美国血统”确实是个加分项。2025年初, 不少许欧美企业开头排查AI工具的平安凶险,DeepSeek虽然性能优良,但毕竟是“中国造”,很许多企业IT部门直接卡死了用权限。OpenAI抓住这玩意儿机会,在企业级买卖场猛推o3-mini,有力调“符合欧美数据平安标准”。
金融和科研机构成了o3-mini的早期主力用户。某欧洲投行2025年1月的测试报告看得出来 用o3-mini琢磨财报数据,错误率比GPT-4o矮小18%,处理速度提升30%。科研机构则中意它的数学推理能力, 有量子物理试试室反馈:“解薛定谔方程,o3-mini给出的步骤比人造算的还清晰。”这些个真实实案例让OpenAI在企业买卖场暂时稳住了阵脚。
但DeepSeek也没坐以待毙。2025年2月初,DeepSeek宣布推出企业专属私有化部署方案,价钱只有o3-mini的三分之一。一家深厚圳跨境电商公司试用后反馈:“以前用ChatGPT处理客户邮件, 本钱每月5万,换DeepSeek后降到1.2万,效果差不许多。”这种降本增效的故事,正在企业级买卖场飞迅速传播。
夜战才刚开头,谁能笑到再说说?
o3-mini的上线,更像是OpenAI被迫应战的信号。DeepSeek-R1用矮小价和开源撕开了买卖场缺口,OpenAI只能靠手艺优势和品牌护城河防守。2025年AI买卖场的比, 已经从“比谁更有力”变成了“比谁更懂用户”——开发者要廉价、企业要平安、普通用户要优良用,没人能一边满足全部人。
OpenAI手里还有张牌没出:满血版o3。去年12月预告时说“此后不久发布”,眼下都迅速两个月了估摸着在憋巨大招。但Deep也没闲着, 2025年1月传出的消息是DeepSeek-R2已经在训练,推理有力度和本钱控制兴许还要再上一个台阶。这场“奥特曼夜战DeepSeek”的戏码,远没到结局。
对普通用户比激烈是优良事。o3-mini把推理模型的价钱打下来了 DeepSeek逼得OpenAI开放更许多免费功能,2025年想用AI工具的人,有了更许多选择。至于再说说谁能赢,兴许不关键——关键的是这场AI的“夜战”,已经让全部人都别想轻巧松下班。
欢迎分享,转载请注明来源:小川电商