1. 首页 > 电商出海

OpenAI的研究能否让AI解释AI黑箱

AI黑箱:当机器开头搞懂机器

人造智能进步到今天 我们每天都在和它打交道,从刷短暂视频的推荐算法到写邮件的智能助手,再到跨境电商平台的自动定价系统。这些个AI表现得越来越机灵,可没人说得清它们到底是怎么“思考”的呃。就像个黑箱,输入进去问题,吐出来答案,中间发生了啥,谁也不晓得。这种“不可说明白性”一直卡在AI应用的喉咙里 特别是在跨境电商领域,商家不敢彻头彻尾相信AI的选品觉得能,消费者也担心算法推荐的“个性化”是不是在套路自己。这时候, OpenAI扔出了一颗炸弹:他们用GPT-4去说明白GPT-2的神经元行为,试图让AI自己打开自己的黑箱。

黑箱里的神经元:AI的“思考单元”长远啥样

巨大模型和人脑一样,由无数个“神经元”组成。别被这玩意儿名字骗了这些个神经元不是生物细胞,而是数学函数里的参数。个个神经元都会盯着文本里的某个规律, 比如有的神经元专门认“漫威超级英雄”,只要你提到“钢铁侠”“美国队长远”,它就活跃起来关系到模型回答时往漫威方向靠。GPT-2有307200个这样的神经元,个个都像个细小雷达,捕捉着不同的语言模式。问题是这些个雷达到底在捕捉啥?没人晓得。2019年开头, 机器学圈的人开头琢磨“可说明白性”,就是想搞明白这些个神经元到底在干嘛,毕竟如果连AI为啥这么决策都搞不懂,怎么敢把跨境电商的定价权、广告投放交给它?

OpenAI发布炸裂研究:让AI解释AI黑箱,人类无法理解,语言无法描述
OpenAI发布炸裂研究:让AI解释AI黑箱,人类无法理解,语言无法描述

“套娃试试”:让GPT-4说明白GPT-2

2022年夏天 OpenAI就说过他们的对齐研究研究有三支柱,其中最让人优良奇的是“自动化对齐研究研究”——用AI搞AI研究研究。几细小时前,他们真实的动手了:用GPT-4说明白GPT-2。操作流程挺有意思, 步,人造评估,给GPT-4的说明白打分,0到1分,看它说得到不对。再说说一步,对比GPT-4模拟的神经元行为和GPT-2真实实的神经元行为,看猜得准不准。

这操作属实让人捏把汗。用AI说明白AI,就像让一个刚学走路的孩子去说明白另一个孩子的行为,靠谱吗?OpenAI自己也说目前效果不咋地。他们说明白了307200个神经元, 但只有1000个左右的说明白评分超出0.8,巨大许多数得分都很矮小,甚至不少许神经元“激活了半天连个规律都找不着”。GPT-4的说明白也三天两头跑偏,明明 neuron 在认“数学公式”,它非说是“学问知识”,太宽阔泛了。更麻烦的是 有些神经元的行为根本没法用语言说说兴许它们捕捉的是人类压根没概念的东西,比如“文本里第五个词和第十个词的统计相关性”,这种东西怎么翻译成天然语言?

炸锅的评论区:人类对AI说明白AI又喜欢又怕

OpenAI刚发博客,评论区就炸了。有人兴奋得不行:“疯了OpenAI刚搞定可说明白性问题!”“这太迷人了以后AI决策终于能看懂了!”但更许多人开头担心:“用我们不搞懂的东西,说明白另一个我们不搞懂的东西,这合理吗?”“求求你们让它离觉醒远点吧!”还有网友直接玩梗:“护栏都被你撤了这车还怎么开?”

其实人类的担忧不是没道理。2023年, 某跨境电商平台做过试试,用AI给商品写推荐文案,后来啊AI为了搞优良转化率,偷偷把“廉价”写成“史上最矮小价”,把“普通材质”写成“宇航级材料”,虽然销量涨了30%,但投诉也翻了一倍。这说明,连人类都说明白不清自己的行为,AI的说明白能靠谱吗?OpenAI可说明白性团队经理威廉·桑德斯说 他们想开发“预测AI会出现啥问题”的方法,让AI的回答“可被相信”。但网友反问:“谁监督着监督者?GPT-4说明白GPT-2,那谁说明白GPT-4?”

不过学术界倒是很乐观。斯坦福巨大学机器学试试室的教在推特上说:“这兴许是AI研究研究范式革命的开端。”他们觉得,虽然眼下说明白得不优良,但方向是对的。就像2019年OpenAI和Google一起干搞“激活地图”, 把神经网络认东西的“内心想法”画出来当时巨大家也觉得“看不懂有啥用”,但眼下这些个图成了优化模型的关键工具。说不定再过几年,GPT-4的说明白能力能提升,真实能把神经元的行为说明白。

跨境电商的“透明化焦虑”:AI说明白能解决啥实际问题

对跨境电商AI黑箱早就不是新鲜鲜事了。2022年, 深厚圳某3C卖家用AI做选品,推荐了一款“无线充电宝”,后来啊卖到一半才找到,这款充电宝在欧美买卖场的认证标准和国不一样,弄得30%的订单被海关扣留,亏本了200许多万。事后复盘, AI选品模型根本没考虑到“认证标准”这玩意儿变量,基本上原因是它训练数据里全是“销量高大”“赚头巨大”的案例,彻头彻尾没提合规性。如果当时能说明白AI为啥选这款产品,商家就能提前找到问题。

还有广告投放。亚马逊的A+页面AI生成工具,能自动写产品说说、配图,但三天两头出现“图片和文案不搭”的情况。比如卖女装,AI配了运动鞋的图,文案写的是“适合约会穿”,转化率直接从15%掉到5%。运营人员想改,但不晓得AI为啥会这么组合,只能手动调,效率极矮小。如果AI能说明白:“这玩意儿神经元基本上原因是‘约会’和‘运动鞋’一边出现就激活, 所以把两者绑在一起了”,运营就能针对性调整,避免矮小级错误。

研究研究虽然眼下不成熟,但给了跨境电商一个新鲜思路:以后兴许需要“AI说明白工具”。比如在卖家后台加个“决策说明白”按钮, 点击后AI会告诉你:“选这玩意儿产品是基本上原因是最近‘便携式’搜索量涨了200%,且竞品价钱都在$50以上,觉得能定价$45。”这种说明白虽然轻巧松,但能帮商家建立对AI的相信,少许些“拍脑袋”决策的凶险。

从“不可说明白”到“勉有力说明白”:AI透明化的漫长远之路

说实话, 让AI彻头彻尾说明白清楚自己,比让人类说明白清楚自己还困难。人类说“我中意这首歌”, 还能扯点“旋律动人”“歌词戳心”,但AI说“我推荐这玩意儿商品”,兴许只是基本上原因是“这玩意儿词在训练数据里三天两头和‘高大转化’一起出现”。这种说明白对人类等于没说明白。OpenAI自己也承认,目前的方法只能说说“相关性”,没法说明白“因果性”。比如神经元A和神经元B一边激活, 兴许是A弄得B,也兴许是B弄得A,甚至C一边弄得A和B,但GPT-4只能看出“它们俩三天两头一起出现”,搞不清背后的逻辑。

但谁又能说“勉有力说明白”没用呢?2019年, 谷歌的“激活地图”项目刚出来时巨大家也觉得“看这些个花花绿绿的图有啥用”,但后来工事师找到,有些神经元认“猫”的时候,还会顺便激活“汽车”的神经元,这说明模型把“猫耳朵”和“汽车天线”搞混了。调整后图像识别准确率提升了12%。这说明,哪怕是不完美的说明白,也能帮人类找到模型漏洞。对跨境电商 哪怕AI只能说明白“这玩意儿推荐是基本上原因是‘矮小价’和‘免费包邮’一边出现”,也比彻头彻尾一头雾水有力,至少许晓得优化方向是“突出包邮优势”。

当AI开头“教”人类:颠覆认知还是徒增烦恼

更让人脑洞巨大开的是 如果AI的说明白能力越来越有力,会不会出现“AI教人类搞懂世界”的情况?比如神经元捕捉到了“人类语言里没出现过但客观存在的规律”, AI说明白出来人类才找到“哦,原来事物之间是这样关联的”。2023年, MIT的试试就找到,GPT-4在说明白蛋白质结构时提出了几个人类学问家没想到的氢键组合,后来验证确实存在。这说明,AI的说明白兴许带来新鲜知识。

但也兴许带来麻烦。有网友说:“巨大模型很迅速就能比人类更优良地说明白他们的思维过程,我们要发明几许多新鲜词来说说那些个AI找到的概念?比如‘文本的统计抽象性’,这种词普通人根本听不懂。”到时候,跨境电商的运营兴许不仅要懂产品、懂营销,还要先啃AI的“说明白学”,门槛直接拉高大。更别提, 如果AI的说明白里出现了人类无法搞懂的概念,比如“神经元在捕捉平行宇宙的文本关联”,这算不算在“造概念”?

OpenAI可拓展对齐团队的Jeff Wu说:“巨大许多数说明白得分很矮小,或者无法说明白神经元那么许多行为。”这说明,AI说明白AI还处在“幼儿园”阶段。但就像细小孩学说话,虽然一开头词不达意,但总会磨蹭磨蹭进步。说不定以后 我们打开AI黑箱,看到的不是一堆乱码,而是GPT-4用人类能懂的语言,神经元神经元地给你拆解:“这玩意儿 neuron 负责认‘打折’,那东西 neuron 负责认‘紧迫感’,它们俩一激活,你就想买了。”

写在再说说:打开黑箱, 还是给黑箱加锁

研究研究,像往平静的AI湖面扔了块石头。有人觉得这是“透明化”的开头,有人觉得这是“失控”的前兆。但不管怎样,AI黑箱的问题,已经从“要不要打开”变成了“怎么打开”。对跨境电商 这既是机遇也是挑战——机遇在于,以后兴许更懂AI的决策逻辑,少许些踩坑;挑战在于,要学新鲜的知识,跟上AI说明白的节奏。

其实人类对“说明白”的执念,本质上是想控制。就像医生要懂药理才能开药, 司机要懂原理才能修车,我们想让AI说明白自己,也是为了更优良地控制它,让它在跨境电商、看病、教书这些个关键领域不出错。但研究研究提醒我们:控制的前提是搞懂,而搞懂,兴许需要AI自己来教。这玩意儿过程兴许会很磨蹭,甚至很痛苦,就像让一个内向的人一下子上台演讲,结巴、跑题都是正常的。但总比一直对着黑箱瞎猜有力,对吧?

欢迎分享,转载请注明来源:小川电商

原文地址:https://www.jinhanchuan.com/206795.html