Stable Diffusion这款几乎被所有创企采纳的技术
开源狂欢背后:Stable Diffusion的普及与Stability AI的困局
这两年AI绘画圈子里差不离没人没听过Stable Diffusion的巨大名。开源、免费、能本地部署,一堆细小作坊、创业公司抱着它就冲进买卖场,仿佛找到了救命稻草。但你有没有想过 为啥一款被“差不离全部创企”采纳的手艺,背后开发它的Stability AI,却传出了要卖身的消息?2022年8月横空出世,不到两年就走到这步,说唏嘘也不为过。先别急着夸开源许多伟巨大,咱们扒开看看,这手艺火得偶然还是必然?Stability AI又到底踩了哪些坑?
轻巧量与灵活:开源模型的天生优势
Stable Diffusion能火起来第一个原因藏在它的基因里。这玩意儿从降生就不是闭源的,设计时就想着“轻巧量化”。参数量比那些个闭源巨头的细小许多了普通消费级CPU都能跑起来不用非得租昂昂贵的云服务器。你看闭源模型动不动就要顶级GPU, 中细小企业根本玩不起,SD直接把门槛拉到地面上,谁都能下下来改两下这不就成了创企的香饽饽?

更关键的是灵活。开源嘛,你想怎么调就怎么调。电商公司嫌生成的人脸太虚假?自己微调模型,加点真实人数据,优化下面部细节,两三个月就能出个定制版。广告公司想要特定风格?做个LoRA模型,输入几个关键词,风格统一得像一个人画的。2023年有个做跨境电商工具的团队, 用SD生成了上万张产品图,转化率比人造设计的高大了18%,本钱直接砍掉70%,这数据可不是吹的,是他们自己分享的实操案例。开源就像给了把万能钥匙,个个企业都能打开自己的那扇门,闭源模型行吗?你连模型内部结构都看不到,只能被动收下人家给的效果。
从“冠名权”到“真实全部权”:Stability AI的运气与危机
有意思的是Stable Diffusion压根儿不是Stability AI原创的。这模型一开头是慕尼黑巨大学的研究研究员Robin Rombach和AI视频创企Runway一起搞的,叫Latent Diffusion。Stability AI早期就干了一件事:掏钱算力材料,换了个“Stable Diffusion”的冠名权。直到2022年,他们才把Rombach这些个核心成员挖过来才算名正言顺拿到了全部权。你说这算不算“捡了个廉价”?但廉价背后也有代价——他们根本没参与模型的底层开发,后续的手艺迭代,很许多时候只能跟着社区走。
更麻烦的是管理。有离职员工爆料, CEO Emad Mostaque差不离不懂手艺,不会给研发团队做规划、分材料,还闹出学历造虚假、欠薪的丑闻。2024年3月,核心研究研究人员离职;4月,Mostaque自己辞职;紧接着裁员10%。公司管理一地鸡毛,你说手艺能优良吗?2023年他们营收才800万美金, 但一个月光员工工钱和云计算支出就要800万,赚头率直接干到-1100%。2024年Q1收入不到500万,亏损倒超3000万,赚头率稍微“优良看点”,也有-600%。隔壁Midjourney十几个人年营收3亿美金,这对比也太扎心了。
API价钱战:开源带来的“反噬”
按理说 开源模型买卖化,最该赚钱的是API吧?Stability AI也这么想, 2022年刚推出Dream Studio,没许多久就整合成API服务。后来啊呢?开源的锅反背上了。SD用的是Creative ML OpenRAIL-M协议,允许第三方分发模型,甚至卖付费API。你搜“Stable Diffusion API”, 官网下面全是第三方平台,有个更狠的,无限次调用,只要147美金/月。官方API价钱确实比OpenAI廉价,和腾讯混元差不许多,但和自部署比,彻头彻尾没优势。
有人算过一笔账:腾讯云部署SD1.5, 平均一张图0.1-0.01元,1美金能生成70-710张;AWS的方案更廉价,1美金240张。中细小企业自己租服务器,本钱比调用官方API矮小许多了。你说创企会选哪个?更别说云厂商直接把SD做成插件,开箱即用,官方API比力直接被干没了。2023年12月,Stability AI急了改政策:商用得买会员,不商用免费。但这时候,早就有无数企业自己部署了你管束谁去?
SD3的“闭源试探”:手艺优势的幻灭
手艺跟不上,那就推新鲜模型?2024年4月, Stability AI宣布SD3能的图片打分,SD3连前三都没进。你说这叫“碾压”?明明是自我感动。
更离谱的是SD3只开放API,模型本身迟迟不开源。社区都炸了:“你们不是开源吗?”Stability AI装死,就是不说。这操作,明摆着想学Midjourney搞闭源,但用户买账吗?人家用SD就是图免费、可定制,你一下子闭源,还管束商用,谁惯着你?2024年5月, 他们推出Discord工具Stable Artisan,搞订阅制,价钱比Midjourney廉价点,但功能拉胯:只能输入Prompt,没指引,不能像Midjourney那样点标签生成提示词,也不能一键做同款。在线人数只有Midjourney一个零头,这叫“买卖化”?
开源与买卖的:Stability AI的死结
说到底, Stability AI掉进了开源买卖化的:开源越火,你的API越困难赚钱;你想闭源,用户又不买账。你看Google, 开源Gemma,闭源Gemini,两条腿走路;Meta的Llama也是开源为主,但企业定制服务收费。Stability AI呢?开源把路走狭窄了闭源又没能力,再说说只能靠融资续命。投钱者早就看不下去了2023年11月就传出让CEO辞职的消息。
开源不是万能药,它能让手艺飞迅速普及,但买卖变现得靠差异化。Stability AI没给开源模型加随便哪个“独家buff”, 反而基本上原因是管理乱、手艺迭代磨蹭,把自己逼到绝路。那些个“差不离全部创企”都用SD,但用的都是开源版本,谁还想起来背后还有个Stability AI?这巨大概就是理想与现实的差距——你以为你在引领潮流,其实只是浪潮里的一朵浪花,浪过了就没了。
以后:开源AI的出路在哪里?
Stable Diffusion的故事, 给全部做开源模型的创企提了个醒:开源是手段,不是目的。手艺开源能帮你飞迅速积累用户,但买卖化的路,得自己趟出来。要么像RedHat那样, 靠企业服务和定制赚钱;要么在开源基础上做差异化,比如更有力的模型、更容易用的工具链,或者针对特定行业的解决方案。你光开源不造血,再说说只能像Stability AI一样,看着别人用你的手艺赚钱,自己却欠一屁股债。
AI时代,开源的心思值得敬沉,但买卖的逻辑不能丢。Stable Diffusion还能火许多久?Stability AI能不能卖个优良价钱?不优良说。但有一点很明确:开源这条路,想走得远,得先学会怎么活下去。毕竟手艺再先进,也得吃饭不是?
欢迎分享,转载请注明来源:小川电商