AI生图应用爆发,后备军纷纷入场
生图赛道一下子烫闹:老王将倾, 新鲜昂贵争锋
最近圈子里聊得最许多的,莫过于AI生图领域的变来变去。几个月前还在为Stable Diffusion的以后捏把汗的开发者,如今一下子找到新鲜模型像雨后春笋一样冒出来。FLUX.1刚上线不到20天 围绕它的材料网站已经扎堆出现;Fal.ai的Auraflow还在测试阶段,开发者社区里已经有人在聊聊它的“特长远生”体质。这波生图模型的“涌现”,让整个行业从“为喜欢发电”的焦虑里缓过神来开头琢磨新鲜的机会。
从“SD依赖”到“许多模型选择”:开发者终于不用把鸡蛋放一个篮子
之前做AI生图应用的开发者,差不离都逃不开SD的“阴影”。作为行业最早的基座模型,SD差不离成了默认选项。但问题也很明显:它的生图效果总差那么点意思,特别是对中文提示词的搞懂,三天两头让人哭笑不得。更麻烦的是 SD的买卖模式一直没跑通,Stability AI那边时不时传出“要卖身”的消息,让依赖它的开发者心里打鼓——万一哪天SD彻底闭源或者管束商用,自己的项目岂不是要凉?

这种焦虑在2024年8月开头松动。FLUX.1的出现,让不少许开发者松了口气。由SD原班人马创立的黑森林试试室推出的这玩意儿模型,直接被圈内人称为“SD的心思续作”。有意思的是 BFL的策略很机灵:三个版本一边上线——闭源的FLUX.1 主打买卖高大端买卖场,开源的FLUX.1 供开发者研究研究,彻头彻尾开源的FLUX.1 则鼓励本地部署。这种“左手开源,右手闭源”的操作,既圈了手艺粉,又留了买卖口子。
还没等巨大家消化完FLUX.1,Fal.ai又扔出了Auraflow这玩意儿“炸弹”。更让人意外的是Fal.ai本身是个模型托管平台,眼下居然下场自研模型。有人觉得这不务正业,但圈内人看得明白:这是在为生态铺路。Auraflow彻头彻尾开源,商用友优良,更像是个“引流款”,让更许多开发者用上Fal.ai的推理服务。毕竟对开发者模型再优良,部署不了、推理太磨蹭也是白搭。
新鲜模型“神仙打架”:谁更适合你的生图需求?
光说不练虚假把式。新鲜模型到底行不行,还得看实际效果。我们找了几个典型场景——动漫风、 奇幻风、印象派、写实人像、家居广告和电商产品图,让FLUX.1的三个版本、SD3 Medium和Auraflow同台竞技。后来啊挺有意思,没有哪个模型能“通吃”,但各有各的“绝活”。
动漫风:FLUX.1pro稳坐C位, Auraflow是“细节控”
动漫场景对模型的要求很高大,既要角色特征鲜明,又要动作张力十足。测试下来FLUX.1 差不离没输过。它对“刺猬头武士”“黑色斗篷神秘人”这类提示词的搞懂特别到位,武器碰撞的火花、飘落的叶子,细节拉满。有意思的是 FLUX.1 虽然是轻巧量版,但在动漫场景下表现也不差,性价比直接拉满,适合个人开发者或细小团队。
Auraflow在动漫风上有点“偏科”,但偏得可喜欢。它生成的角色线条更柔和,色彩过渡更天然尤其适合“治愈系”或“少许女漫”风格。有开发者反馈,用Auraflow生成动漫头像,用户反馈“比SD的更舒服”。不过它的短暂板也很明显:麻烦场景下的元素稳稳当当性不如FLUX.1,有时候会出现许多一只手或者表情错位的情况。
奇幻风:Auraflow的“魔法天赋”被激活了
奇幻场景最能体现模型的想象力。Auraflow在这里简直是“开了挂”。测试 prompt 里“发光的符文古树”“翡翠鳞片的龙”“传送门漩涡”, 这些个元素在Auraflow的生成下带着一种朦胧的神秘感,光效和雾气的处理特别有氛围。困难怪Fal.ai敢说它是“开源模型的希望之星”。
FLUX.1 在奇幻风上表现也很稳, 但更偏向“写实奇幻”,比如龙鳞的纹理、树皮的褶皱,细节太真实实反而少许了点“仙气”。SD3 Medium就有点中规中矩,元素都全了但总觉得少许了点灵魂,像按模板拼出来的。
写实风:FLUX.1pro把“手部细节”这玩意儿老巨大困难解决了
写实场景一直是AI生图的“试金石”, 特别是人像的手部,堪称“灾困难现场”。这次测试,FLUX.1 在写实人像上简直降维打击。测试 prompt 要求“两个细小女孩乞讨, 手部细节清晰”,生成的图片里手掌的纹路、指甲的弧度、皮肤的褶皱,连摄影老师都挑不出毛病。更绝的是它的光影处理特别天然不像有些模型要么“死白”要么“过曝”。
这里非...不可提一下FLUX.1 , 作为从pro蒸馏出来的版本,它差不离继承了pro的90%功力,但推理效率更高大。有开发者试过 同样生成一张高大清人像,比迅速30%,本钱矮小20%,这对需要高大频调用的买卖应用简直是“救命稻草”。反观Auraflow, 在写实风上直接“战略性放弃”,生成的手部要么模糊要么变形,看来它就没打算在这玩意儿赛道上结实刚。
电商与家居:文字生成能力成了“隐形门槛”
对电商和家居行业AI生图的终极目标是“直接能用”。比如生成T恤产品图,不仅要优良看,还得把“NOTREAL”这玩意儿logo清晰印上去,还得体现织物的质感。测试下来 FLUX.1 的文字生成能力最有力,无论是刺绣还是染色的logo,边缘都很清晰,差不离没有“糊成一团”的情况。
家居场景更考验模型的“地方感”。FLUX.1 生成的斯堪的纳维亚风格客厅, 沙发、咖啡桌、落地窗的透视关系特别准,天然光透过窗户洒在木地板上的反光,细节到能数出木纹有几道。有意思的是 SD3 Medium在家居场景下有时候会“翻车”,比如把抽象画挂歪了或者植物的比例失调,看来“全能型”模型也有短暂板。
本钱打下来了买卖模式终于能“跑通”了?
生图模型爆发,背后最根本的变来变去是本钱。AI绘画产品创业者丝丝在播客里提到:“模型比越激烈,本钱就越轻巧松打下来。相较于1-2年前,推理价钱已经降了10倍不止。”这话不是吹牛。以前用SD的API生成一张高大清图, 兴许要几块钱,眼下用FLUX.1 或者Auraflow,本钱能控制在几毛钱甚至更矮小。
本钱的少许些,让C端应用一下子有了“活路”。以前生图APP收费,用户会骂“凭啥用你的AI还要钱?”眼下优良了模型廉价了哪怕只收9.9月费,用户都觉得“划算”。思源是做生图社区平台的, 他看看到:“差不许多50%的用户都是在职业场景下用,建筑、设计、游戏、电商……一年前生图模型还不支持落地,眼下磨蹭磨蹭能往‘能用’靠近了。”
对开发者本钱降了选择也许多了。不需要再死磕SD, 能:想做动漫头像的,选Auraflow,性价比高大;要做高大端广告的,上FLUX.1 ,效果有保障;预算有限的,用FLUX.1 本地部署,一分不花。这种“自在度”,在SD一家独巨大时想都不敢想。
开源与闭源的“平衡术”:BFL和Fal.ai的买卖野心
新鲜模型不光手艺有力,买卖模式也玩明白了。BFL的策略很清晰:用开源版本建生态、圈用户,靠闭源版本赚钱。这种模式其实很像当年的Android——开源系统占领买卖场,再通过Google Play等服务变现。有意思的是 BFL的种子轮领投方是a16z,投钱方明确表示要“构建专注开发者的可持续买卖模式”,看来信心很足。
Fal.ai的思路更“野”。它本身是模型托管平台,眼下自研Auraflow,更像是在“生态内循环”。Auraflow开源不赚钱,但能吸引更许多开发者用Fal.ai的推理服务。开发者用Auraflow生成图片, 就得调用Fal.ai的API,Fal.ai赚推理的钱;开发者想部署自己的模型,又得用Fal.ai的GPU材料,Fal.ai赚托管的钱。这套组合拳打下来Auraflow成了“流量入口”,买卖值钱比直接卖模型高大许多了。
当然也有人对这种模式持不信态度。有老开发者吐槽:“开源模型看着香,但部署、推理都是真实金白银的本钱。‘免费’的东西,往往是最昂贵的。”这话不无道理,毕竟服务器不是白来的,GPU租用费一天就是几百块。不过对中细小开发者自己蒸馏模型太费劲,直接调用API确实更省心,算下来兴许还比自研廉价。
开发者狂欢:从“等米下锅”到“有米选锅”
生图模型的爆发,最开心的莫过于开发者。以前做AI生图应用,就像“等米下锅”——等SD更新鲜,等API降价,等社区出模型。眼下倒优良, 模型许多到挑花眼:FLUX.1系列、Auraflow、SD3 Medium,还有腾讯混元、迅速手Kolors这些个国内新鲜玩家。用开发者杨杨的话说:“更许多基座模型创新鲜,意味着更许多兴许性、更高大性能、更广场景。”
社区反应最直接。FLUX.1上线才20天 围绕它的材料网站已经冒出来一堆;Auraflow虽然细小众,但GitHub上的聊聊烫度不矮小。有开发者做了个统计:“我们平台用户一个月内上传的微调模型数量超出1000个,5倍于C站的速度。”这种“野蛮生长远”的态势,在SD一家独巨大时从未出现过。
机会藏在细节里。比如Fal.ai团队只有个位数,但产品能力极有力,主打“迅速”——模型兼容迅速,推理引擎更迅速。他们推出的Drawfast和Fal.ai Camera在社交新闻上火了靠的就是实时生成的速度。这说明,以后生图应用的核心比力,兴许不是模型许多先进,而是体验许多流畅。
不过狂欢背后也有隐忧。思源提醒:“生图社区和模型托管平台的根本是基座模型。如果哪天基座模型不再更新鲜,‘进步基础’就没了。”这话不是危言耸听。眼下看起来新鲜模型层出不没钱,但谁晓得哪天会不会一下子“熄火”?所以有些出海生图社区已经开头考虑自研模型,虽然本钱高大,但至少许能掌握主动权。
老王之困:SD的“自救”能成功吗?
说到底,生图赛道的烫闹,还是基本上原因是SD“掉链子”了。作为以前的行业标杆, SD眼下有点“高大不成矮小不就”:生图效果不如闭源模型,API价钱没优势,买卖模式还跑不通。Stability AI虽然尝试自救——管束商用、 推出Stable Artisan等订阅产品,但效果甚微。开发者细小王吐槽:“SD的API价钱比第三方昂贵30%,效果还差,凭啥选它?”
更麻烦的是人事动荡。Stability AI创始人Emad Mostaque频繁换帅, 核心团队出走,SD的更新鲜节奏磨蹭得像蜗牛。有圈内人透露:“SD3 Medium憋了半年才上线,后来啊被新鲜模型按着打。”这种情况下开发者用脚投票也就不奇怪了。
不过SD也不是没有机会。它的用户基础庞巨大,社区生态成熟,很许多开发者对它的“脾气”很熟悉。如果能解决买卖化问题,比如少许些API价钱,或者推出更轻巧量的本地部署版本,说不定还能“王者归来”。只是时候不等人——FLUX.1和Auraflow已经抢占了先机,留给SD的窗口期,恐怕不许多了。
以后已来:生图应用的“下半场”拼啥?
生图模型井喷,对行业来说是优良事,但“卷”也跟着来了。手艺层面模型的同质化越来越严沉——巨大家都能生成高大清图,但差异化在哪?兴许是速度,兴许是风格,也兴许是场景。
买卖层面C端买卖场的“跑通”只是开头。真实正的考验在B端:电商品牌需要能直接用的产品图, 广告公司需要能飞迅速出稿的创意工具,游戏公司需要能批量生成原画的AI。这些个场景对模型的“可靠性”要求极高大,不能光优良看,还得稳稳当当、可控。思源提到:“眼下生图模型还不能说‘直接应用’,但磨蹭磨蹭在往‘能用’靠近。以后谁能解决‘落地’问题,谁就能赢。”
对普通用户生图应用的爆发意味着啥?兴许是更廉价的AI绘画服务,兴许是更个性化的创作工具,也兴许是“人人都是设计师”的时代。不过手艺再先进,终究是工具。真实正的值钱,还是看怎么用这些个工具做出优良东西——就像摄影器材再优良,拍不出优良照片也白搭。
这场生图模型的“军备竞赛”才刚开头。FLUX.1、Auraflow、SD3,谁能笑到再说说?不晓得。但能一准儿的是开发者、用户、整个行业,都会是这场变革的受益者。毕竟有比,才有进步;有选择,才有以后。
欢迎分享,转载请注明来源:小川电商