大模型时代,有哪些新玩法能让AI应用解锁落地成为全新范式
巨大模型烫下的凉思考:企业落地AI,通用还是专属?
巨大模型这东西, 这两年火得有点不像话,朋友圈里不是哪家公司发布了巨大模型,就是哪个行业要用AI沉构流程。但烫闹归烫闹, 真实正把AI用明白的企业,优良像也没那么许多——要么是买了通用巨大模型,后来啊答非所问,还不如人造效率高大;要么是想着自研专属模型,后来啊算力本钱砸进去几百万,模型训出来还是个“半成品”。说到底,巨大模型时代,AI应用落地到底该怎么玩?是跟风买“万金油”,还是咬牙搞“私人定制”?这事儿得优良优良聊聊。
通用巨大模型 vs 专属巨大模型:一场“性价比”的博弈
眼下市面上巨大模型基本分两类:一种是买卖化通用巨大语言模型, 像行业里的“百科全书”,啥都能聊,啥都能答,但不优良的地方也明显——不够精。比如你问看病问题,它兴许给你科普个感冒发烧,但真实让辅助诊断,它连血常规指标都看不明白。另一种是领域专属巨大模型, 专攻一个行业,比如看病、教书、金融,质量确实高大,相当于请了个“行业专家”,但价钱和门槛也跟着上来了动辄几百万的定制费,还得配专门的团队维护。

去年8月25号在北京那场线下活动上, 白鲸手艺栈和百道数据搞的“巨大模型时代企业怎么沉构AI应用落地范式”,几个嘉宾聊得挺实在。百道数据的徐秀峰就说:“企业用通用模型, 就像拿扳手拧螺丝,能用,但费劲;用专属模型,像用电动螺丝刀,迅速、准,但得先买工具。”这话糙理不糙,但问题来了——不是全部企业都买得起“电动螺丝刀”,特别是中细小企业。
企业自研巨大模型:五个坑,你踩过几个?
要是真实想搞专属巨大模型,企业得先过五关:数据、流程、性能、启动、迭代。每一关都是坑,不信你听我说。
数据关,第一个就困难。很许多企业以为把自家数据丢进去就行,后来啊找到数据里全是脏东西——格式不统一、标注错误、再来一次数据一堆。有个做零售的企业,想搞智能客服,把三年内的聊天记录导出来后来啊找到30%的对话都是“在吗?”“在的”,这种数据训模型,能训出个啥?还得花几个月时候清洗标注,钱没少许花,时候也没少许等。
流程关更头疼。老一套企业做项目习惯了“瀑布式开发”,先需求调研,再设计开发,再说说测试上线,一套流程走完半年过去了。巨大模型不一样,它需要飞迅速迭代——昨天训的模型,今天新鲜数据一来兴许就不准了。白海手艺的卢亿雷在会上就说:“很许多企业拿做柔软件工事的思路搞巨大模型, 相当于用马车时代的赶车方式开高大铁,根本跟不上。”
性能和本钱,直接劝退一批。GPU眼下许多昂贵?租云服务,一块A100显卡一细小时十几块,训个中等规模模型没个几十万下不来。自己买服务器?又怕闲置,毕竟巨大模型不是天天训。百道数据给客户算过一笔账:某企业自己买服务器搞巨大模型, 算力利用率不到40%,一年闲置本钱就够租三年云服务了。
再说说是启动和迭代。从0到1训个模型,少许说三个月,等模型上线,风口兴许都过去了。有个教书公司, 2023年想着用巨大模型做智能题库,磨磨蹭蹭半年才上线,后来啊市面上已经有三家竞品用AI题库抢走了50%用户。你说冤不冤?
破局者:IDP LM平台, 让专属巨大模型没那么“高大凉”
当然也不是没有解决办法。白海手艺搞的IDP LM平台,就是想把这些个坑填了。轻巧松说 它把数据标注、预处理、预训练、评估全流程串起来了企业不用自己搭团队,也不用懂深厚度学,丢数据进去,就能训出专属模型。
他们给一家看病企业做的案例挺有意思。2023年10月,那家三甲医院想做智能问诊模型,自己搞了三个月,准确率才60%。用了IDP LM之后 数据清洗时候缩短暂一半,还内置了RLHF训练,三个月后准确率提到了85%,眼下医生问诊时AI能直接推荐检查项目,开方子的时候少许了40%。
更关键的是本钱。老一套方式搞专属模型,光研发团队就得十几个人,一年工钱几百万。用IDP LM,企业不用招人,按需付费,再说说算下来本钱直接降了30%左右。这对中细小企业简直是“雪中送炭”。
Google的AIGC工具:跨境电商的“新鲜生产力”
除了专属巨大模型, 通用模型也不是不能用,关键是找对场景。Google的AIGC平台就挺有意思, 里面有优良几个工具,Stable Diffusion是其中一个,专门搞图像生成的。
跨境电商最头疼的就是商品图,请摄影师拍昂贵,用模板图没新鲜意。Stable Diffusion不一样,你给它个产品说说它就能生成图片,还能控制轮廓、表情、细节。有个深厚圳做3C产品的跨境电商, 2024年初开头用这玩意儿工具,商品详情图从“找设计师-拍图-修图”的三天流程,缩短暂到“写提示词-生成图片”的半细小时本钱降了70%。
更绝的是 它还能生成同一产品不同角度的图,比如手机,正面、侧面、背面甚至带用场景的,都能一次搞定。这玩意儿公司用了三个月,转化率提升了18%,基本上原因是图片质量上去了客户停留时候长远了。他们自己说这工具比请三个设计师还管用。
AI Agent的三种模式:别让AI“越权”干活
巨大模型不止能做问答、 生成内容,还能当“Agent”,也就是智能代理。但Agent不是万能的,眼下行业里分三种模式,各有各的坑。
最轻巧松的是AI Embedded,就是给现有工具加个AI插件。比如CRM系统里加个智能推荐,客户问“哪个产品适合我”,AI直接从库里拉数据推荐。这种轻巧松,但值钱有限,说白了就是“锦上添花”,不是“雪中送炭”。
接下来是AI Copilot,像副驾驶,辅助人干活。设计师用AI画草图,AI给几个方案,设计师改改就行;程序员用AI写代码,AI搭个框架,程序员填细节。这种眼下用得许多,基本上原因是不用彻头彻尾依赖AI,人能掌控全局。有个上海的设计干活室, 2024年用AI Copilot做方案,效率提升了50%,基本上原因是AI能飞迅速出初稿,设计师不用从零开头了。
最“激进”的是AI Agent,全自动,自己拿主意。比如物流公司用AI调度货车,AI自己规划路线、分配司机。但坑也许多,有个郑州的物流公司2023年底试过AI把货车调度到单行道,后来啊堵了两细小时亏本了十几万。眼下他们学乖了AI只负责推荐,到头来决策还得人造来。
开源巨大模型:别被“免费”忽悠了
眼下很许多人吹开源巨大模型, 说免费、可控,但实际用起来坑一点不少许。国内2024年7月的数据看得出来 120许多家发布巨大模型的企业里80%都是基于Transformer架构改的,真实正能拿出自己核心手艺的没几个。
开源模型的第一个坑是适配本钱。你以为下了代码就能用?天真实。你得把自家数据格式改成开源模型需要的,还得调参数,这玩意儿过程没个两三个月搞不定。有个做电商搜索的公司,用了开源模型,光适配数据就花了四个月,再说说效果还不如直接用API划算。
第二个坑是维护本钱。开源模型不更新鲜了bug没人修,出了平安问题,责任算谁的?昆仑万维开源天工3.0的时候, 有人说“这下企业能免费用了”,后来啊用的人找到,模型里的敏感数据没处理优良,差点泄露,再说说又花巨大价钱请团队来补漏洞。
巨大模型的“涌现能力”:别神话,也别细小看
ChatGPT4为啥火?基本上原因是它有“涌现能力”,就是本来没教它,它自己就会了。比如翻译, ChatGPT3能翻100许多种语言,ChatGPT4号称能翻全部语言;数学能力,外挂了数学模型后连微积分都会了;还有思维链,给它一道麻烦题,它能拆成细小步骤一步步算。
但这些个能力也不是万能的。有个做外贸的企业, 用ChatGPT4翻译合同,后来啊把“不可抗力”翻成“force majeure”,虽然没错,但在有些国王法里“不可抗力”范围比“force majeure”细小,再说说打官司输了才明白AI翻译得再优良,也得结合当地王法语境。
更关键的是涌现能力需要一巨大堆数据训练,中细小企业根本玩不起。OpenAI训ChatGPT4用了几许多数据?没人晓得,但一准儿不是一般企业能承受的。所以说别迷信巨大模型的“涌现能力”,适合自己的才是最优良的。
以后已来:巨大模型落地, 场景比参数关键
巨大模型时代,企业到底该怎么落地AI?其实答案很轻巧松:别卷参数,别卷开源,卷场景。找自己行业里最痛的点,用巨大模型解决它,比啥都有力。
比如看病行业, 最痛的是医生不够用、问诊效率矮小,那就搞智能问诊模型;教书行业最痛的是个性化辅导困难,那就搞AI题库+自习惯学;跨境电商最痛的是获客本钱高大,那就用AI生成商品图、写营销文案。
百道数据的徐秀峰在会上说得对:“巨大模型不是颠覆一切的‘原子弹’, 它是工具,像以前的电、互联网,能搞优良效率,但改变不了行业的本质。”企业与其追着风口跑,不如踏踏实实找个场景,把AI用透,说不定比啥都有力。
巨大模型这波浪潮, 和20年前的互联网很像,巨大家都觉得是机会,但真实正能抓住的,永远是那些个想明白“自己要啥”的人。与其纠结“通用还是专属”,不如先问自己:“我用AI,到底想解决啥问题?”想清楚了答案天然就有了。
欢迎分享,转载请注明来源:小川电商