1. 首页 > 电商出海

Speak:AI语言学习的首个独角兽

7800万美元到10亿美元估值, Speak怎么成为AI语言学首个独角兽

今年冬天AI教书圈最火的名字除了ChatGPT,巨大概就是Speak了呃。这家专注口语学的平台刚宣布完成7800万美元C轮融资, 估值直接冲破10亿美元,从众许多AI教书项目中杀出沉围,成了名副其实的“首个AI语言学独角兽”。要晓得,六个月前它的估值还只有5亿美元,半年时候翻倍,这在资本趋凉的2023年并不许多见。更让人意外的是 它的ARR已经接近5000万美金,年增加远率高大达100%——这组数据背后藏着AI语言学赛道最真实实的增加远密码。

不是背单词, 是解决“学了10年还是不会说”的痛点

说真实的,眼下学英语的人,谁没在“哑巴英语”里挣扎过?课本单词背了上千个,语法规则滚瓜烂熟,可真实碰到外国人,脑子里一片空白,开口就卡壳。创始人Connor Zwick在采访里提到:“我们的用户通常不用Duolingo,我们的专长远是让那些个不会说英语的人学会说英语。”这句话点出了Speak的核心差异——它不解决“要不要学英语”的问题,而是解决“学了10年为啥还不会说”的问题。

Speak:AI语言学习的第一个独角兽,ARR 5000万美元,用户超1000万
Speak:AI语言学习的第一个独角兽,ARR 5000万美元,用户超1000万

Duolingo的订阅者巨大许多是英语母语者, 学的是西班牙语、法语这些个“兴趣语言”,靠的是游戏化打卡的迅速感。而Speak的用户, 90%以上来自韩国,他们学了十许多年英语,为了干活、留学或者移民,急需提升口语流利度,却苦于没有和真实人对话的机会。这种“刚需+高大付费意愿”的用户画像, 让 Speak 在2022年底B轮融资时就成了资本眼中的香饽饽——当时数据看得出来韩国有6%的人丁正在用Speak学英语,相当于每16个韩国人就有1个在用它练口语。

自研语音识别:为啥AI学语言比学数学更“靠谱”?

AI教书赛道里 数学、编程这些个科目被聊聊得很许多,但语言学反而成了“首个出圈”的领域。Connor有个观点很有意思:“相比其他科目, AI在语言学领域更轻巧松做出实用且颠覆性的东西,不需要太许多推理能力。”这背后的逻辑很轻巧松:语言学本质上是对话练习,而AI最擅长远的就是模拟对话。

但困难点在于,对话不是轻巧松的文本生成,而是“听懂”+“纠错”+“引导”的闭环。ChatGPT能写论文、 编代码,但很困难精准识别用户发音中的细微错误,比如把“think”说成“fink”,或者把“th”的咬字发成“s”。为了解决这玩意儿问题, Speak从创立之初就自研了语音识别系统——这套系统对韩国用户的口音特别友优良,能搞懂他们常犯的错误,并实时给出反馈。Connor说:“我们兴许会用这些个通用模型几年,但它们对我们的业务进步仍有巨巨大值钱。”

更关键的是评估体系。“评估是机器学团队最关键的干活, ”Connor反复有力调,“语音评估不只是看错词率,更要捕捉‘别人根本听不懂’的表达。”比如用户说“I no go school”, 语法全错,但语义明确,老一套系统兴许直接判错,而Speak的模型能搞懂其中的逻辑错误,并给出“I don't go to school”的纠正觉得能。这种“搞懂人类交流中的不完美”,正是AI语言学的核心壁垒。

从韩国到日本、 中国台湾,本地化不是翻译那么轻巧松

为啥Speak能在韩国率先跑通买卖模式?2023年之前,韩国买卖场贡献了它超90%的收入。这背后是深厚度本地化的后来啊——不只是把界面翻译成韩语,而是针对韩国用户的痛点设计课程。比如韩国人学英语最常犯的“音变规则”, Speak的课程里专门设计了针对性练习;还有商务场景中的邮件写作、会议发言,都是韩国用户最急需的实用技能。

2022年底, Speak开头开拓日本买卖场,今年下半年,中国台湾买卖场的收入又一下子增加远——这些个都不是偶然。Connor说:“我们的客户群体非常不同, 他们学英语的动机很明确:要么是职场晋升,要么是留学移民,要么是和外国客户沟通。”这种“高大目标导向”的用户,愿意为“真实正有效”的付费。数据看得出来 Speak的客单价比老一套线下辅导课矮小30%,但学效果提升了50%,性价比成了它扩张的利器。

UI设计:为啥“一个麦克风按钮”比教程更有效?

打开Speak的APP,你会找到界面极简:只有一个麦克风按钮。用户被问的第一个问题是“你为啥想学英语?”然后直接开口说。这种“零教程”的设计, Connor称之为“直觉式交互”:“随便哪个需要工具提示或功能说明白的设计,都不够完善。”但他也承认,这挑战很巨大——用户第一次打开时常常愣住:“我得说啥?说许多久?”

这种设计背后是对AI语言学本质的搞懂:语言是“用”出来的,不是“学”出来的。老一套APP让用户先背单词、学语法,Speak让用户先开口说AI再根据错误反馈知识点。Connor说:“就像两千年前亚历山巨大巨大帝从苏格拉底学,最优良的方式是直接对话,而不是先读语法书。”AI让这种“直接对话”规模化,个个用户都能拥有1对1的口语陪练师。

不自研基础模型:专注应用层的“精耕细作”

很许多人优良奇, 既然OpenAI是Speak的投钱方,为啥不直接用GPT模型,还要自研语音识别?Connor的回答很实在:“基础模型的训练本钱高大达数亿美元,我们没少许不了再来一次造轮子。”但“用现成模型”不代表“照搬模型”,Speak花了一巨大堆精力在“模型调优”和“任务串联”上。

比如 它把语音识别、语义搞懂、对话生成拆分成40优良几个子任务,个个任务都有独立的评估循环——有人造标注的“错误发音库”,有实时反馈的“用户满意度追踪”,还有“学效果预测模型”。Connor说:“建模只是投入的一有些, 更巨大的投入在怎么让这些个模型配合得更优良,怎么让用户感受到‘AI真实的懂我’。”

这种“应用层精耕”的策略,让 Speak 在本钱控制上很有优势。模型调用本钱每隔几个月就会减少,而 Speak 的用户规模不断扩巨大,边际本钱越来越矮小。Connor说:“我们不需要自研基础模型,只需要在语言学这玩意儿垂直场景里把AI的值钱做到极致。”

以后:AI口语学的“个性化革命”才刚开头

当被问到“AI是不是会取代人类教师”时 Connor的回答很谨慎:“我们的目标是彻头彻尾取代学过程中人类的角色,但还需要5到10年。”短暂期来看, Speak更关注“个性化”的深厚化——比如通过用户的学数据,预测他们第二天兴许需要的课程;或者根据用户的情绪调整语气。

更长远远的是“长远期记忆”的探索。Connor设想以后的Speak就像电影《Her》里的AI, 能记住用户的兴趣、性格和学习惯:“如果用户中意篮球,对话场景就会围绕篮球展开;如果用户总是发‘th’的音不准,AI会反复纠正,直到形成肌肉记忆。”这种“千人千面”的学体验,正是AI语言学的终极想象。

从7800万美元融资到10亿美元估值,Speak的故事才刚刚开头。在AI教书这玩意儿充满争议的赛道里 它用“解决真实实痛点”的务实路径,说明了一个道理:手艺再酷,不如让用户真实正开口说。或许,这就是“首个独角兽”给后来者的最巨大启示。

欢迎分享,转载请注明来源:小川电商

原文地址:https://www.jinhanchuan.com/189213.html