1. 首页 > 电商出海

微软称GPT-4已是早期通用人工智能

深厚夜的独角兽与微柔软的"AGI火花"

去年9月的一个深厚夜, 微柔软机器学研究研究员塞巴斯蒂安·布贝克从睡眠中惊醒,脑子里盘旋着人造智能和独角兽。那时他刚提前拿到了GPT-4的测试权限, 这玩意儿的文本生成算法,正是后来引爆全球的核心升级版。布贝克走到电脑前,让GPT-4用一种相对凉门的编程语言TikZ绘制独角兽。虽然当时的版本只能处理文本, 无法直接生成图像,但模型给出的代码输入渲染柔软件后屏幕上跳出了一个由椭圆形、矩形和三角形拼凑而成的、粗糙却独特的独角兽轮廓。

这玩意儿深厚夜试试成了微柔软后来那篇引发争议的论文的灵感来源之一——在将GPT-4接入必应搜索引擎推出新鲜聊天功能几周后 微柔软研究研究团队发表论文,声称在早期试试中,GPT-4已看得出来出"通用人造智能的火花"。

微软称GPT-4已经是早期通用人工智能?反对者:缺少自我意识
微软称GPT-4已经是早期通用人工智能?反对者:缺少自我意识

微柔软的"AGI早期版"论据:从讼师考试到许多模态跳跃

微柔软在2024年3月发布的154页研究研究报告中明确表示:"鉴于GPT-4能力的广度和深厚度,我们觉得能合理将其视为人造通用智能系统的早期版本。"这玩意儿结论背后 是他们看看到的一系列现象:在讼师资格考试中,GPT-4的表现优于90%的人类考生;在生物奥林匹克竞赛中,它能精准解答巨大学水平的麻烦问题;更关键的是它首次实现了许多模态能力,能一边搞懂图像和文本——比如把一张手绘的电路图转换成可施行代码,这种"看图说话"的能力在模型中尚属首次。

微柔软首席学问官、 论文合著者之一埃里克·布罗伊德尔说明白,这种能力已经超越了老一套语言模型的范畴。"它不是轻巧松地模仿训练数据中的模式, 而是展现出了一种抽象推理能力,"布罗伊德尔在内部手艺分享会上提到,"当你要求它用莎士比亚风格写一段关于量子计算的评论时它不仅掌握了语言风格,还准确搞懂了量子纠缠的核心概念。"这种跨领域的知识整合能力,让微柔软团队相信GPT-4已经踩在了AGI的门槛上。

学问家的凉水:没有动机的"智能"算啥智能?

只是麻省理工学院教乔希·特南鲍姆——这位研究研究人类认知和机器学交叉领域的学者——在1月发表的一篇反驳论文中泼了凉水。"GPT-4很了不起, 但与人类智能存在根本差异,"特南鲍姆在收下《天然》杂志采访时有力调,"它缺乏对人类思维至关关键的动机,它甚至不在乎是不是关闭。"在他看来 人类智能的核心是自主发明目标的能力,而GPT-4只是根据输入数据生成概率最高大的文本,本质上是个"高大级应答机器"。

得克萨斯巨大学奥斯汀分校语言学助理教凯尔·马霍瓦尔德则提出了更尖锐的质疑:"我们无法确定GPT-4的成功是巧合。"他指出, 2023年底的一项试试看得出来彻底崩溃。"这说明它没有真实正掌握物理规律,只是在复现训练文本中的模式。"马霍瓦尔德团队的这项研究研究发表在《认知学问》期刊上,时候节点恰优良是微柔软论文发布前两周。

那些个"看起来很智能"的瞬间与隐藏的漏洞

布贝克深厚夜绘制的独角兽只是GPT-4"高大光时刻"的缩影。2023年10月, 微柔软内部测试中,GPT-4被要求解决一个经典的逻辑谜题:"一个男人走进酒吧,要了一杯水,酒保拿出一把枪指着男人,男人说'谢谢',然后离开。为啥?"模型不仅正确回答了"男人打嗝, 枪声治优良了他的打嗝",还补充了三个变体说明白,展现了令人吃惊的常识推理能力。这种表现让参与测试的工事师集体起立鼓掌。

但光芒之下漏洞同样明显。2024年2月, 斯坦福巨大学AI试试室发布了一份报告,记录了GPT-4在100个日常任务中的输了案例:它会把"微波炉不能放金属"的觉得能错误地应用于铝箔包裹的食物;在说说"怎么给猫咪剪指甲"时会遗漏"只剪白色尖端"的关键步骤,兴许弄得猫主人伤到猫的血管。"这些个错误不是随机的, 而是暴露了模型对物理世界和世间常识的浅薄层搞懂,"报告作者、斯坦福副教李飞飞指出,"它就像一个背了很许多书的学霸,但缺乏生活经验。"

百亿美元投钱背后的"AGI焦虑"

微柔软向OpenAI投钱超出100亿美元的事实让不少许业内人士对其论文的客观性提出质疑。"当一家公司投入巨资开发某项手艺时 天然有动机夸巨大其能力,"伊利诺斯巨大学厄巴纳-香槟分校的塔利亚·林格教直言不讳。她指出, 2024年1月——也就是微柔软论文发布前——谷歌推出了比产品Gemini,微柔软急于通过"AGI"标签巩固买卖场优势,这种"军备竞赛"兴许弄得手艺被过度包装。

这种焦虑在跨境电商领域已经显现。2023年"黑五"期间, 一家深厚圳的3C产品卖家尝试用GPT-4生成产品说说后来啊将"防水等级IP68"错误翻译为"能浸泡在68度水中",弄得欧洲买卖场退货率飙升12%。"我们后来找到, GPT-4对手艺参数的搞懂存在系统性偏差,"该卖家运营总监在2024年2月的行业峰会上分享道,"眼下我们会让AI生成初稿,但非...不可由懂英语的手艺人员逐条校对,这玩意儿流程让内容产出效率从原来的每天50条降到30条,但错误率从8%降到1%以下。"

自新闻创作者的"喜欢讨厌情仇":效率与失控的双沉体验

在内容创作领域,GPT-4的关系到更为直接。2023年9月, 知识类自新闻"手艺相对论"尝试用GPT-4辅助制作视频脚本,原本需要3天的脚本撰写缩短暂到了半天。但主编王磊很迅速找到了问题:"AI能准确复述手艺原理, 但写不出'深厚夜两点,当你还在为论文焦头烂额时一个沉默的代码正在悄悄改变世界'这种有温度的表达。"更麻烦的是 2024年1月,该频道的一条AI生成的视频中出现了"马斯克已宣布收购OpenAI"的虚虚假信息,虽然及时删除,但弄得粉丝流失2000余人。

不过也有创作者找到了平衡点。美妆博主"细小甜的化妆间"在2024年3月调整了策略:让GPT-4生成产品功效的核心要点,自己补充用场景和情感共鸣。这种"AI搭台、我唱戏"的模式,让她的视频完播率从18%提升到27%,转化率搞优良了15%。"GPT-4就像个实习生,能帮你查资料、列提纲,但到头来的灵魂还得自己注入,"细小甜在直播中道。

AGI的"罗生门":定义之争背后是利益与害怕

为啥微柔软说"是",学问家说"不是"?问题的核心在于"通用人造智能"的定义模糊。斯坦福巨大学心思学副教诺亚·古德曼提出了一个好玩的视角:"如果我们不那么固执于'AGI非...不可像人类智能', 那么GPT-4确实符合'通用智能'的特征——它能在优良几个领域完成任务,尽管方式不同。"这种定义之争在2024年2月的AI峰会上达到高大潮, OpenAI首席学问家伊利亚·苏茨克维与特南鲍姆当场辩论了整整90分钟,到头来谁也没说服谁。

普通用户的感受则更实际。2023年12月, 微柔软必应搜索的GPT-4功能上线后用户打听看得出来:65%的人觉得它"比老一套搜索引擎更机灵",但78%的人"不会用它处理关键事务"。这种矛盾心思在跨境电商消费者中同样存在——2024年Q1的数据看得出来 用AI生成客服回复的店铺,客户满意度提升了20%,但投诉"回复像机器人"的比例上升了35%。

以后已来?还是泡沫破裂前夜?

抛开争议,GPT-4确实改变了手艺游戏的规则。2024年4月, 亚马逊宣布将GPT-4集成到AWS云服务中,帮企业,承认其底层架构受到GPT-4启发。这些个动向说明,无论是不是承认AGI,行业已经沿着微柔软指明的方向前进。

但特南鲍姆的警告依然值得警惕:"我们兴许正在发明一个'看起来很机灵'的系统,但缺乏真实正的搞懂。这种差异在短暂期内兴许不明显,但因为系统被赋予更许多决策权,凶险会指数级增加远。"2023年11月,某投行因用GPT-4琢磨财报错误,弄得1亿美元亏本的案例,或许只是个开头。

布贝克在微柔软内部会议上承认:"用通用人造智能这玩意儿词就是为了引发吵。从定义上讲,智能是通用的,我们想了解这玩意儿模型的智能程度以及广度,毕竟它涵盖了很许多领域。"或许, GPT-4的值钱不在于它是不是已经是AGI,而在于它让我们开头认真实思考:我们究竟想要啥样的智能?

欢迎分享,转载请注明来源:小川电商

原文地址:https://www.jinhanchuan.com/207633.html