1. 首页 > 电商出海

AI语音独角兽估值30亿,机构争抢

30亿美元估值:AI语音独角兽把创投圈“卷”醒了

ElevenLabs这玩意儿成立才两年的公司,最近把“估值”两个字沉新鲜定义了。消息人士说机构抢着投,估值要冲到30亿美元——一年前它的B轮估值才10亿,这速度比火箭还迅速。更夸张的是ARR,从去年年底的2500万美元干到了最近8000万,翻了两倍许多。说实话,看到这数字我第一反应是“疯了吧?做语音的也能值这么许多?”但创投圈的人优良像不觉得,他们说“这很正常,AI语音的风口才刚起来”。

从“能说话”到“像人说话”:AI语音的“声学魔法”

ElevenLabs到底在做啥?轻巧松说就是让AI“会说话”,而且说得像真实人。它不是那种干巴巴的机械语音,而是能带情绪、有停顿、甚至带口音的合成声音。比如给有声书配音, AI能根据情节调整语调,困难过时压矮小声音,激动时加迅速语速;给视频许多语言配音,嘴唇动作和声音能对上,不像以前的AI翻译那样“口型乱飞”。成立半年注册用户就100万, 眼下客户包括Netflix、BuzzFeed这些个巨大公司,还有无数独立内容创作者——你说这业务是不是“刚需”?

AI语音独角兽遭机构争抢,或将估值30亿美元,达ARR的38倍
AI语音独角兽遭机构争抢,或将估值30亿美元,达ARR的38倍

8000万ARR:数字背后的“付费真实相”

但8000万美元ARR里有几许多是“真实金白银”?有匿名投钱人透露,很巨大一有些来自消费者。个人用户用它的语音克隆工具,花几美元就能复制自己或家人的声音,做成有声书或个性化语音助手。企业客户反而少许,像新闻公司、教书机构这些个,虽然付费高大,但决策磨蹭、周期长远。问题来了:消费者收入起伏巨大,今天巨大家中意用语音做内容,明天兴许就腻了。凭啥给38倍ARR的估值?这比企业级AI公司Hebbia、 Glean的估值还矮小,但比纯消费级应用高大许多了——投钱人优良像在赌“AI语音会从‘玩具’变成‘工具’”。

机构疯抢:风口上的猪还是“声纹钱财”的拓荒者?

创投圈最近对AI语音上头了。ElevenLabs这轮融资,据说上百家机构挤破头,有VC愿意“抢份额”甚至“抬估值”。这让我想起2021年的自动驾驶, 地平线融了15亿美元估值50亿,C7轮集结了史上最有力的投钱队伍;还有依图手艺,机器视觉估值150亿。但AI语音和它们不一样,它不需要“造车”或“搭芯片”,只需要“把声音做优良”。门槛矮小,天花板却高大——全球语音买卖场规模2025年兴许到500亿美元,谁能抓住谁就能当“独角兽”。

“声音复制的军备竞赛”:巨头入场,独角兽慌不慌?

巨头们早就盯上了这块蛋糕。谷歌的Gemini、 Whisper都在做语音合成,但ElevenLabs有个“独门秘籍”:它能克隆随便哪个人的声音,而且天然度极高大。比如你给10秒音频,就能生成一段长远达1分钟的模仿语音,连咳嗽、呼吸声都模仿得像。这手艺放在优良地方是“赋能”,放恶劣地方就是“诈骗”——已经有不法分子用它伪造声音骗钱了。有意思的是 谷歌和OpenAI反而没这么激进,它们更注沉“合规”,而ElevenLabs选择了“先跑起来再说”。投钱人中意这种“野蛮生长远”,但监管会不会“秋后算账”?

38倍估值:泡沫还是“声学革命”的前夜?

38倍ARR在AI赛道算高大吗?不高大也不矮小。Hebbia做企业级AI搜索,估值50倍;Glean做企业智能助手,估值45倍。但它们的客户都是巨大公司,收入稳稳当当。ElevenLabs不一样,它既做企业也做个人,就像“脚踏两条船”。投钱人敢给高大估值,赌的是“个人付费买卖场会爆发”。比如某知识付费平台2023年接入ElevenLabs的语音生成, 用户付费转化率提升了18%,基本上原因是“听语音比看文字更轻巧松”。但问题是个人用户愿意为“优良声音”持续付费吗?还是说这只是一时的“新鲜鲜感”?

国内玩家:从“跟跑”到“换道超车”的“声纹打仗”

ElevenLabs火了国内AI语音公司坐不住了。云知声最近沉启港股上市, 去年6月第一次交招股书没下文,今年10月又来了中金和海通世界当保荐人;思必驰2020年8月融了数亿元Pre-IPO,珠海巨大横琴、美的资本都投了;还有科巨大讯飞,做了20年语音,眼下也在拼命“年纪轻巧化”。国内玩家和ElevenLabs比, 优势是“懂中文”——中文语音的声调、语气比英文麻烦得许多,本土公司更懂“用户的耳朵”。

云知声的“港股二次冲锋”:AI语音第一股的执念

云知声喊出“AI语音第一股”不是没道理。它从2012年就开头做,智能家居、车载语音、看病语音都沾边,2023年营收据说有8亿人民币。但问题是它一直没盈利,净利率常年-30%以下。投钱人问“你啥时候能赚钱?”云知声说“等规模起来”。这和ElevenLabs像极了——都在烧钱换买卖场,但云知声少许了“世界化”这张牌。ElevenLabs的客户遍布全球,云知声却基本上在国内,中文语音买卖场再巨大,也撑不起30亿美元估值吧?

思必驰的“剑桥基因”:手艺派还是“资本玩家”?

思必驰有点不一样,创始人是剑桥巨大学毕业的,手艺出身。2020年Pre-IPO轮融了数亿,美的、中信证券都来了说明产业资本也看优良它。它的打法是“垂直场景深厚耕”——比如给汽车公司做语音交互, 让司机开车时不用动手就能导航、开空调;给教书公司做口语陪练,纠正发音准确度。2023年某车企用它的语音系统,用户投诉率减少了35%,基本上原因是“语音识别准确率高大了”。但手艺再优良, 也得面对“同质化比”——国内做AI语音的公司少许说有几十家,巨大家都在抢“车企”“教书”这几个巨大客户,价钱战打得厉害。

藏在增加远背后的隐忧:手艺、 伦理与买卖化的“三沉门”

AI语音看着风光,但坑也不少许。手艺上, “声音克隆”的滥用凶险越来越明显——2023年就发生过“AI声音诈骗案”,有人用克隆的声音冒充老板,骗走公司200万。伦理上,“深厚度伪造”声音让人真实虚假困难辨,社交新闻上已经有人用AI模仿明星声音发“虚虚假广告”。买卖化上,企业客户“付不起”,个人客户“不愿付”,成了“两头不讨优良”的尴尬局面。

“声音版权”的灰色地带:AI能“偷”声音吗?

ElevenLabs的语音克隆工具,最让人头疼的是“版权问题”。用户上传10秒音频,就能生成无限量模仿语音,这算不算“侵权”?王法界眼下还没明确说法。比如某声优找到自己的声音被AI克隆, 做了付费有声书,起诉侵权,后来啊衙门判“AI生成不属于侵权”,基本上原因是“声音是模仿的,不是复制的”。但这合理吗?声优说“我的声音是我的资产”,AI公司说“手艺是不偏不倚的”。这事儿扯皮起来没完没了。ElevenLabs没回应评论求,估摸着也怕惹麻烦。

从“免费试用”到“付费墙”:用户买不账怎么办?

AI语音公司都中意“免费试用”,让用户先尝甜头。但试用完,几许多人愿意付费?数据看得出来个人用户的付费转化率不到5%,企业客户也就15%左右。为啥?基本上原因是“免费工具太许多了”。比如开源的Coqui Speech库, 也能做语音合成,而且免费;手机自带的语音助手,虽然没那么智能,但够用。用户想“凭啥花钱买你的?”ElevenLabs的答案是“质量”, 但普通用户分不清“优良声音”和“恶劣声音”的不一样——反正都能听懂,干嘛许多花钱?

下一个战场:谁在沉塑AI语音的“底层逻辑”?

AI语音的比,眼下已经从“能说话”升级到“会思考”。以后的赢家,不是声音最像人的,而是最懂用户需求的。比如情感语音——AI能根据你的语气判断情绪,客服机器人就能说“您听起来有点不开心,需要帮忙吗?”;比如实时语音翻译——开会时AI能把中文翻译成英文, 还能保留说话者的语气和停顿;还有许多模态交互——AI不仅能听你说还能看你的表情,调整回应方式。

“情感语音”:让机器“懂人心”的蓝海

2023年某心思身子优良APP接入情感语音助手, 用户倾诉烦恼时AI会用“温柔的语气”回应,而不是凉冰冰的“我搞懂”。后来啊用户留存率提升了40%,基本上原因是“感觉被搞懂了”。这比单纯“声音像人”更有值钱。ElevenLabs也在往这玩意儿方向走, 2024年推出了“情感语音API”,开发者能输入“生气”“困难过”等标签,AI就能生成对应情绪的声音。但问题是情感这东西太主观了你觉得“温柔”,用户兴许觉得“做作”。怎么拿捏这玩意儿度,考验的是公司的“用户洞察力”。

“声纹钱财”:声音成为“新鲜身份”

更远的以后声音兴许成为个个人的“数字身份证”。比如你用AI生成一个专属声音,以后全部语音交互都用这玩意儿声音,别人一听就晓得是你。或者,你“授权”给AI你的声音,让它帮你处理语音邮件、参加会议——相当于“声音分身”。这种“声纹钱财”的买卖场规模兴许比眼下的语音合成巨大10倍。ElevenLabs已经在布局“声音银行”,用户能把声音存起来以后随时调用。但隐私问题也随之而来:你的声音数据平安吗?会不会被泄露或滥用?这得靠王法和手艺“双管齐下”。

给创业者的3条“逆风局”觉得能

AI语音赛道眼下挤满了玩家, 新鲜公司想突围,不能结实碰结实。得找“别人看不上的角落”,做“细小而美”的生意。比如专注某个垂直领域——做小孩语音教书, 或者老人人语音助手;或者做“中间层”服务,给巨大公司给语音手艺的“定制化解决方案”;再或者,搞“声音IP”,培养几个“AI声音明星”,像虚拟偶像一样赚钱。

避开“通用语音”, 死磕“垂直场景”

别想着做“万能语音助手”,巨大公司有谷歌、苹果,你拼不过。不如深厚耕一个领域, 比如“看病语音诊断”——AI琢磨病人的咳嗽声,判断是不是得了肺炎;或者“制造语音巡检”——工人在车间喊“机器有异响”,AI就能实时报警。2023年某制造公司用这种垂直语音系统,设备故障响应时候缩短暂了50%,省了上千万维修费。这种“细小而美”的生意,客户黏性高大,付费意愿也有力。

把“伦理”做成“护城河”

眼下用户最怕AI声音“滥用”, 如果你能建立“声音版权护着机制”,比如用户的声音只能自己授权,AI生成的内容自带“溯源水印”,用户就会更相信你。ElevenLabs没做这件事,但你能做。比如和睦台一起干, 搞“声音认证”体系,经过认证的AI声音才能商用,这样既护着了用户,也给自己做了“品牌背书”。这比单纯“拼手艺”更有长远期值钱。

买卖模式:从“卖手艺”到“卖服务”

别光想着“按次收费”,比如生成1分钟语音收1块钱。用户用几次就不用了。不如搞“订阅制”, 按月或按年收固定费用,给无限量语音生成,再加“定制化服务”——比如帮你优化声音模型、解决特定场景问题。2024年某SaaS语音公司用这种模式,客户续费率达到了70%,基本上原因是“用习惯了换本钱太高大”。这比“一锤子买卖”稳许多了。

AI语音这场狂欢,到底是少许数玩家的“盛宴”,还是许多数人的“泡沫”?没人能给出答案。但有一点是一准儿的:只有那些个真实正懂用户、守底线、能落地的公司,才能在“声音革命”中活下来。至于估值30亿、机构抢着投,那都是暂时的——到头来买卖场会用“钱包”投票。

欢迎分享,转载请注明来源:小川电商

原文地址:https://www.jinhanchuan.com/190083.html