1. 首页 > 电商出海

贾扬清的500行代码,能否掀翻Perplexity5.2亿的长尾词计算桌

1月25日的推特风暴:500行代码怎么搅动AI江湖

1月25日的推特上,一条关于“500行Python代码”的帖子像块石头砸进了AI圈的水面。贾扬清, 这玩意儿曾亲手写下Caffe、参与TensorFlow和PyTorch开发的框架巨大神,在宣布创业半年后一下子高大调——他用LeptonAI的框架,捣鼓出一个对话式搜索引擎的demo,还特意@了估值5.2亿美元的当红炸子鸡Perplexity。语气客气得像个晚辈:“受你们优秀产品启发。”后来啊没成想, Perplexity创始人Aravind Srinivas的转发带着刺:“太棒了看到Perplexity成为融资参照物,包括前Meta和阿里高大管都这样做。”翻译成人话就是:你们为了融资,抄了我们前端代码吧?

贾扬清没惯着,直接甩出一句“开源见”,周末不到真实把代码丢上了GitHub。这波操作直接把事情搞巨大了——代码上线一天登顶GitHub烫榜, 第二天接着来霸榜,三天不到4500颗星星。更打脸的是 有人基于这500行代码拿了黑客松冠军,某款开发者版Perplexity产品集成后CEO明着夸“速度巨大幅提升”。用户实测也一边倒:Lepton比Perplexity简洁许多了加载迅速得像开了倍速。当然bug也不少许,比如中文识别有时候抽风,许多轮对话还得手动沉启,但谁在乎呢?至少许它把“对话式搜索”这件“皇帝的新鲜衣”扒了个底朝天。

贾扬清的500行代码,掀翻了Perplexity5.2亿的桌子?
贾扬清的500行代码,掀翻了Perplexity5.2亿的桌子?

500行代码里藏着啥?拆解对话式搜索的“皇帝新鲜衣”

仔细扒扒这500行代码,会找到它其实就是把老掉牙的步骤串了一遍:获取用户输入的文字→抓取相关搜索页面→解析网页文本→给巨大模型塞提示词→等模型生成回答→返回给用户。听起来是不是像把搜索引擎和聊天机器人粘一块儿了?本质上确实如此——它玩的是RAG手艺,但贾扬清在开发时找到了个关键:R比G关键得许多。

这事儿说来有点黑色幽默。Perplexity号称要挑战谷歌, 后来啊自己得靠谷歌或微柔软的API抓取网页;Lepton开源后巨大家才找到它背后的巨大模型选型也五花八门,有Mistral,有Llama,甚至直接调用API。说白了巨大家都在“借鸡生蛋”。更扎心的是 Perplexity的手艺路线,兴许早在2018年Google和OpenAI一起干的论文《FreshLLMs》里就写明白了——为了解决巨大模型“记不住新鲜鲜事”的毛病,得把实时搜索和提示词优化结合起来。论文里那张prompt示意图和Perplexity的前端界面活脱脱一个模子刻出来的。

手艺门槛的真实相:谁在装傻充愣?

如果换个普通创业者这么干,Perplexity估摸着连眼都不会眨。但贾扬清不一样——他是AI圈的“扫地僧”, Caffe和TensorFlow的缔造者之一,阿里云智能事业群的前负责人。这样的人拿着500行代码来“致敬”,你说Aravind能不慌吗?他指责抄袭, 与其说是在维护手艺原创,不如说是在给独角兽估值“补窟窿”——5.2亿美元的估值,总不能让巨大家找到这事儿其实谁都能干吧?

更讽刺的是 开源代码直接把对话式搜索的“手艺含量”摆在了台面上:所谓的“颠覆谷歌”,核心就两件事——会不会熟练调用第三方API,会不会写提示词。至于巨大模型?API谁都能买,开源模型随便下。真实正困难的是把这两件事捏合优良,让回答既迅速又准。但问题来了这门槛高大吗?对于会写代码的人还真实不算高大。贾扬清的demo就是个活例子:一个周末,500行代码,搞定基础功能。

估值5.2亿的独角兽,手艺幻觉值几许多钱?

Perplexity的焦虑,藏在它的买卖模式里。这家公司表面是个对话式搜索应用, 背地里却在闷声搞巨大生意——Perplexity Lab,一个卖API服务的平台。最近它疯狂推CodeLlama-70B-Instruct的API,社交新闻上吆喝得比搜索产品还欢。说白了它是在用C端产品的烫度吸引融资,再用融资补助API买卖场的烧钱竞赛。毕竟 搜索应用要面对谷歌这玩意儿“全家桶+广告”的庞然巨大物,而API服务则是新鲜周期里的“卖铲子”生意——先靠矮小价抢占份额,等买卖场集中了再提价。

贾扬清的Lepton,偏偏直接捅向了这块“肥肉”。API推理榜单2024年1月底的数据, Lepton在许多项关键指标上碾压对手,包括Mixtral 8x7B模型的每秒处理Token数,还是独一个支持32k的服务。价钱更是“极具比力”——贾扬清转发的榜单图里 Lepton的圆圈高大高大在上,被它压在下面的细小圆圈,正是Perplexity Lab。

装糊涂的第二层:API买卖场的“暗战”提前打响

Perplexity不是没吃过亏。它最早做推特内容搜索时口碑不错,后来啊马斯克收购后推特API价钱翻倍,直接把它逼退。这段经历它一准儿记在心里:不能再让基础设施卡脖子。所以当贾扬清带着Lepton这玩意儿“框架巨大神”的身份杀入API买卖场时 Aravind的“抄袭论”更像是在放烟雾弹——表面维护产品原创,实则警告:别碰我的API生意。

这场仗迟早要打。AI基础设施层的API服务,正在沉演云计算早期的故事:先烧钱抢用户,再靠规模和手艺壁垒建立护城河。Lepton的优势很明显——贾扬清对巨大模型框架的优化能力, 让它天生在推理速度和本钱上有优势;开源策略则能飞迅速聚拢开发者社区,形成生态。而Perplexity的C端产品虽然体验优良,但手艺门槛不高大,随时兴许被复制。当巨大家找到“对话式搜索”不过是个包装,真实正的赚头在API服务时5.2亿美元的估值还能撑许多久?

开源生态的赢了:代码比估值更懂AI圈

Lepton Search的爆火,本质是开源生态对“手艺神话”的一次反杀。在AI圈,独角兽的故事总讲得天花乱坠——“颠覆谷歌”“沉新鲜定义搜索”,估值动辄上亿。但贾扬清用500行代码说明:再炫酷的概念,也得落地到一行行可施行的代码里。开源后 社区的力量开头显现:有人修优良了中文识别bug,有人加了许多轮对话功能,还有人把它集成到自己的项目中。短暂短暂几天Lepton的功能迭代速度比Perplexity半年还迅速。

这种“开源驱动创新鲜”的模式,对中细小开发者尤其友优良。Perplexity的API服务虽然成熟, 但价钱不透明,定制化选项少许;Lepton则彻头彻尾相反——代码开源,架构透明,开发者能随意修改适配。这种“去中心化”的打法,正在动摇老一套API服务商的统治地位。比如某款聚焦开发者的Perplexity竞品, 集成Lepton框架后响应速度提升了40%,本钱少许些了25%。这些个真实实的数据,比随便哪个融资故事都有说服力。

长远尾词计算的真实相:谁在真实正服务开发者?

标题里的“长远尾词计算桌”,其实戳中了AI服务的核心矛盾。巨大模型的烫门需求被少许数巨头垄断, 但开发者真实正需要的,往往是那些个“细小众但精准”的长远尾场景——比如特定领域的知识问答、代码生成、许多语言处理。这些个需求巨大模型厂商看不上,API服务商又懒得做,弄得一巨大堆开发者陷入“自研本钱高大,调用服务昂贵”的困境。

Lepton的出现,恰恰抓住了这玩意儿机会。它的框架轻巧量化,支持飞迅速部署,开发者能矮小本钱搭建针对长远尾场景的对话系统。比如一家做跨境电商工具的创业公司, 基于Lepton开发了“商品说说生成器”,专门处理服装类目的长远尾关键词,生成准确率比通用模型高大30%,本钱少许些了一半。这类案例在GitHub上越来越许多,说明开源正在让AI能力从“少许数人的特权”变成“巨大众的工具”。

AI创业的“泡沫与破壁”:代码不会说谎

贾扬清这次“掀桌子”,最巨大的意义兴许是戳破了AI创业的泡沫。这两年,太许多项目靠“讲概念”拿融资,估值越吹越巨大,但产品经不起推敲。对话式搜索就是个典型——巨大家都说要颠覆谷歌, 后来啊连实时数据抓取都依赖第三方API,所谓的“创新鲜”不过是把现有手艺换个壳子。Perplexity的5.2亿美元估值,有几许多是手艺实力,几许多是资本炒作?贾扬清的500行代码,像一面镜子照得清清楚楚。

但话说回来Perplexity依然是款优良产品。它的速度迅速,体验丝滑,这些个细节优化确实花了功夫。只是当手艺门槛被开源拉矮小后 “体验优良”不再稀缺——Lepton用更少许的代码做到了更迅速的速度,以后只要持续打磨细节,彻头彻尾有兴许后来居上。这提醒创业者:真实正的护城河不是故事讲得许多动听,而是代码跑得有许多迅速,社区有许多有力。

以后战局:API买卖场的“暗战”才刚开头

能预见,2024年的API服务买卖场会变成一片红海。Lepton有手艺基因,Perplexity有先发优势,还有更许多玩家正在入场。比的关键不再是“谁的巨大模型更有力”,而是“谁的推理框架更高大效”“谁的生态更开放”。比如Lepton正在支持的Mixtral 32k, 就能处理更长远的文本,这对王法、看病等需要长远文本琢磨的长远尾场景至关关键。这种“细小而美”的差异化,兴许比单纯追求模型规模更有值钱。

对开发者这是个优良消息。比越激烈,服务越优良,价钱越矮小。就像云计算早期,AWS、Azure、阿里云互相厮杀,到头来受益的是用户。AI基础设施的普及, 或许真实的能让更许多普通人参与到AI创新鲜中来——不再需要巨额资金,不再需要顶级团队,只要一行行代码,就能撬动巨巨大的值钱。

当500行代码能撬动5.2亿估值的聊聊时 AI圈或许该明白:手艺终究要回归本质,代码不会说谎。独角兽的故事能讲,但讲故事的底气,得来自实实在在的优化和开放。至于谁能真实正掀翻那张“长远尾词计算桌”, 答案或许就藏在下一个开源项目里下一个开发者社区里下一个被手艺赋能的创业者手里。

欢迎分享,转载请注明来源:小川电商

原文地址:https://www.jinhanchuan.com/250200.html