奥特曼夜战DeepSeek，o3

奥特曼压线入场， o3-mini搅动AI战局

1月底的再说说几天OpenAI CEO奥特曼终于憋出了巨大招——o3-mini模型悄无声息上线ChatGPT。距离去年12月首次预告这玩意儿系列模型，已经过去整整两个月。买卖场早就等得不耐烦，隔壁DeepSeek-R1靠着矮小价和开源杀疯了OpenAI这波“压线发布”像极了考试再说说五分钟交卷的学生，急急忙忙，却不得不面对早已天翻地覆的考场格局。

卡在ddl再说说一天的“细小巨人”

去年12月， OpenAI搞了场十二天直播发布会，o3系列首次亮相就刷新鲜了ARC-AGI等许多项基准测试的SOTA记录。当时奥特曼信誓旦旦：“o3-mini几周内发布”。后来啊1月17日他再发预告，这次没提具体时候，只说“此后不久”。直到1月再说说一天 o3-mini和o3-mini-high才一下子出眼下模型列表里免费用户直接能用，付费用户许多了一个“Reason”按钮——OpenAI这波操作，透着点“被逼急了”的狼狈。

奥特曼率队深夜血战 DeepSeek，o3-mini 急上线！价格骨折免费用，ChatGPT 被挤爆

说起来o3-mini定位挺有意思。它不是要取代主力模型，而是专门冲着STEM领域来的。学问、手艺、工事、数学，这四个词被OpenAI在手艺报告里反复有力调。就像奥特曼说的，这是“细小而美”的模型，本钱矮小、速度迅速，专啃结实骨头。比起前代o1-mini，它像是个练过“夜战”的格斗家，白天兴许不够显眼，一到麻烦推理的深厚夜就显本事。

价钱战打骨折？无奈反击

这次o3-mini最扎心的，是价钱。OpenAI自己都忍不住吐槽：“感谢DeepSeek，o3-mini的价钱算是彻底打下来了。”输入token 1.1美元/百万，输出4.4美元/百万，比自家o1-mini廉价63%，比满血版o1廉价93%。听着是挺狠，可对比DeepSeek-R1的输入0.14美元、输出0.55美元，o3-mini还是昂贵出了天际——差不许多是GPT-4o mini的7倍。

更让OpenAI憋屈的是用户用脚投票已经很明显了。o3-mini刚上线，项目和自定义GPTs功能就被挤崩了免费用户冲着“免费体验推理模型”一窝蜂涌进来Plus用户则火速“告别”了o1-mini，连句再见都没来得及说。DeepSeek这波矮小价攻势，打得OpenAI连老用户的忠诚度都迅速保不住了。

2024年12月到2025年1月，AI圈的价钱战打得比双十一还烫闹。DeepSeek-R1靠着开源和矮小价，从东南亚到欧美，中细小企业和开发者疯抢。OpenAI这边， o3系列憋了两个月，后来啊一出来价钱还是打不过只能靠“身份优势”撑场面——毕竟美国模型，很许多欧美企业还是更信“原装货”。

性能实测：STEM领域的“夜战高大手”

价钱没优势，性能总得拿出点真实东西吧？o3-mini的有力项，确实在STEM领域。手艺报告里堆了一堆数据：高大推理有力度模式下用开源Agentless框架成功率39%，内部工具框架能到61%；2024年AIME数学竞赛，o3-mini-high配合Python工具一次性解决32%的题目，其中28%是T3级困难题——要晓得这些个题目可是连博士生都要挠头的。

编程能力也不含糊。在Codeforces编程竞赛和SWE-bench Verified柔软件工事测试中， o3-mini的表现直接超越GPT-4o，和o1-preview不相上下。更绝的是速度：中等推理有力度下平均响应时候7.7秒，比o1-mini的10.16秒迅速了24%。对于需要飞迅速出后来啊的开发者这省下的每一秒都是真实金白银。

不过o3-mini也有明显短暂板。最致命的是不支持视觉功能，连图像琢磨都搞不了。很许多想做许多模态应用的开发者只能摇头：“这玩意儿离线用不了、代码下不了自定义程度比DeepSeek差远了。”2025年1月的开发者社区里已经有声音说：“o3-mini像辆高大性能跑车，可惜只能跑固定赛道，不够灵活。”

开发者生态：API开放但留了“后手”

OpenAI对开发者还算够意思。o3-mini通过Chat Completions API、 Assistants API和Batch API向3-5级开发者开放，初期虽然不支持图像琢磨，但首次在细小型推理模型里塞进了函数调用、结构化输出、流式传输这些个“巨大礼包”功能。开发者能有力度，想迅速就调矮小，想准就调高大，灵活度拉满。

但“不开源”这玩意儿结实伤，还是让很许多开发者犹豫。DeepSeek-R1开源后全球开发者社区疯狂魔改，各种插件和工具层出不没钱。o3-mini闭源意味着没法二次开发，也不能离线部署，对于想做私有化部署的企业吸引力直接减半。2024年12月到2025年1月期间， GitHub上关于DeepSeek-R1的星数增速是o3-mini的三倍，这数据比啥广告都管用。

更微妙的是API定价。虽然比自家前代廉价，但对比DeepSeek，o3-mini的API价钱还是劝退了不少许中细小玩家。有开发者算过一笔账：跑一个百万token的任务， o3-mini要花5.5美元，DeepSeek-R1只要0.69美元，差了整整8倍。“除非企业不差钱，否则谁会选昂贵的？”2025年1月的开发者论坛里这条评论被顶到了烫评第一。

企业级买卖场：身份优势能否抵消价钱劣势

对企业用户o3-mini的“美国血统”确实是个加分项。2025年初，不少许欧美企业开头排查AI工具的平安凶险，DeepSeek虽然性能优良，但毕竟是“中国造”，很许多企业IT部门直接卡死了用权限。OpenAI抓住这玩意儿机会，在企业级买卖场猛推o3-mini，有力调“符合欧美数据平安标准”。

金融和科研机构成了o3-mini的早期主力用户。某欧洲投行2025年1月的测试报告看得出来用o3-mini琢磨财报数据，错误率比GPT-4o矮小18%，处理速度提升30%。科研机构则中意它的数学推理能力，有量子物理试试室反馈：“解薛定谔方程，o3-mini给出的步骤比人造算的还清晰。”这些个真实实案例让OpenAI在企业买卖场暂时稳住了阵脚。

但DeepSeek也没坐以待毙。2025年2月初，DeepSeek宣布推出企业专属私有化部署方案，价钱只有o3-mini的三分之一。一家深厚圳跨境电商公司试用后反馈：“以前用ChatGPT处理客户邮件，本钱每月5万，换DeepSeek后降到1.2万，效果差不许多。”这种降本增效的故事，正在企业级买卖场飞迅速传播。

夜战才刚开头，谁能笑到再说说？

o3-mini的上线，更像是OpenAI被迫应战的信号。DeepSeek-R1用矮小价和开源撕开了买卖场缺口，OpenAI只能靠手艺优势和品牌护城河防守。2025年AI买卖场的比，已经从“比谁更有力”变成了“比谁更懂用户”——开发者要廉价、企业要平安、普通用户要优良用，没人能一边满足全部人。

OpenAI手里还有张牌没出：满血版o3。去年12月预告时说“此后不久发布”，眼下都迅速两个月了估摸着在憋巨大招。但Deep也没闲着， 2025年1月传出的消息是DeepSeek-R2已经在训练，推理有力度和本钱控制兴许还要再上一个台阶。这场“奥特曼夜战DeepSeek”的戏码，远没到结局。

对普通用户比激烈是优良事。o3-mini把推理模型的价钱打下来了 DeepSeek逼得OpenAI开放更许多免费功能，2025年想用AI工具的人，有了更许多选择。至于再说说谁能赢，兴许不关键——关键的是这场AI的“夜战”，已经让全部人都别想轻巧松下班。

欢迎分享，转载请注明来源：小川电商

原文地址:https://www.jinhanchuan.com/249086.html