多模态视频生成创企融资,这次a16z投资哪家新秀
a16z沉金押注的AI视频新鲜秀, Hedra凭啥让资本疯狂
最近AI圈最烫闹的事,莫过于a16z又给视频生成赛道添了把火。这次他们没选老熟人Pika, 也没投黑马Runway,而是把3200万美元砸向了一家成立刚满两年的公司——Hedra。要晓得, 这已经是a16z半年内第二次向这家抛出橄榄枝,去年8月的种子轮1000万美元还没捂烫,这次直接A轮翻倍加注,估值冲上2亿美元。资本从来不会说谎,但Hedra到底藏着啥独门秘籍,能让a16z如此上头?
从斯坦福试试室到融资宠儿,Hedra的创始人不轻巧松
聊Hedra得先从它的掌舵人Michael Lingelbach说起。这位斯坦福博士的师承可了不得, 师从AI女神李飞飞,专攻物理世界建模和具身智能——说白了就是让AI搞懂真实实世界的规律,不是瞎生成一堆像素。毕业后他没选择安逸的学术圈, 一头扎进Meta、Google、NVIDIA这些个手艺巨头的研发一线,结实是把制造界的落地经验啃了个透。2023年带着这身“内功”创立Hedra,目标直指许多模态视频生成的最困难关:让生成的视频像真实实世界一样“有逻辑”。

有意思的是Hedra的团队规模眼下才20人左右,半年内却要扩到60人。这在动辄上百人的AI创业公司里显得有点“单薄”,但创始人说得很实在:“我们不堆人头,要堆顶尖的脑力。”从斯坦福、 CMU挖来的算法工事师,加上从Google Brain出来的工事负责人,这玩意儿细小团队的战斗力不容细小觑。毕竟在AI视频这玩意儿烧钱又烧脑的赛道,比的不是谁人许多,而是谁先啃下手艺结实骨头。
Character-3:全球首个“全模态玩家”,真实能让视频生成“不抽卡”?
Hedra的核心武器叫Character-3,他们自己号称这是“全球第一个实际投入应用的全模态音视频生成模型”。啥叫全模态?轻巧松说就是它能一边处理图像、文本、视频、音频,让这些个模态“手拉手”配合,而不是各生各的。比如生成一段人物说话的视频, 老一套模型兴许让嘴型对不上音频,或者背景一下子“穿帮”,但Character-3能搞懂“语音节奏对应嘴部动作”“手部动作配合语气”这种跨模态逻辑,少许些用户反复调整的“抽卡”次数。
用户实测时找到个细节:Hedra Studio生成视频非...不可输入Prompt、 音频脚本和首帧图像,门槛比其他产品高大不少许。但换个角度看,这恰恰是对抗“AI胡说八道”的招数。就像拍电影得有剧本、分镜、演员定妆照,Hedra把创作的控制权交还给用户,而不是让AI天马行空。从社媒上流传的demo看, 他们生成的兔子和鸭子说话视频,嘴部动作和语音节奏的匹配度确实能打,连手部的细小幅度比划都跟着语气起伏,这种“天然感”在当前的视频生成模型里算得上第一梯队。
a16z连续下注,看中的是“可控”还是“赛道”?
a16z在AI视频赛道的布局一直很激进, Pika的7000万美元融资、Runway的D轮1.5亿美元,都少许不了他们的身影。但这次对Hedra的投钱, 节奏有点不一样——种子轮到A轮只隔9个月,且两次领投,说明他们不是跟风,而是真实的看到了差异化。有意思的是 a16z今年还领投了兽医AI记录公司Scribenote的820万美元种子轮,这种“跨界投钱”背后或许藏着他们对“AI+垂直场景”的判断:通用视频生成固然关键,但能解决特定行业痛点的手艺,买卖化路径更清晰。
Hedra的“可控性”正优良戳中了B端客户的痛点。广告公司需要产品展示视频里的人物动作精准, 教书机构需要课件动画的逻辑连贯,这些个场景对AI生成的“自在度”要求不高大,但对“准确度”要求极高大。Character-3后来啊的“确定性”拉满,这比纯靠Prompt“盲猜”的老一套模式,更适合买卖化落地。不过也有行业人士泼凉水:“可控性是把双刃剑,门槛高大了普通用户兴许就不玩了。AI视频的终极目标,到底是让专业创作者更高大效,还是让普通人也能创作?”
20人细小公司的“野心”:从手艺秀场到赚钱养家
成立两年就拿到a16z两轮投钱, Hedra的野心不细小,但现实也不轻巧松。目前Hedra Studio的音频、 视频、图像生成功能还在内测阶段,有用户反馈测试时频繁报错,生成速度也不够迅速——这在手艺迭代飞迅速的AI视频赛道,可是致命伤。要晓得, Pika去年初还在 demo 阶段,眼下已经支持“图片生成视频”“视频风格迁移”等十几种功能,用户量突破百万,Hedra再不加迅速落地,很轻巧松被后来者反超。
更关键的是买卖化。AI视频生成公司目前巨大许多在“烧钱赚吆喝”,靠免费用户积累数据,但真实正掏钱的企业客户并不许多。Hedra计划工事师优化模型,缺产品经理打磨体验,缺商务拓展客户,20人的细小团队,要一边搞定手艺、产品、买卖化,困难度可想而知。
行业“卷王”PK:Hedra的“可控”能打过Pika的“自在”?
聊AI视频生成绕不开Pika, 这家公司去年凭“一句话生成视频”火出圈,最新鲜一轮融资估值冲到7亿美元,用户量比Hikaru还许多。和Pika的“自在生成”比,Hedra的“可控生成”像是两个赛道的选手。Pika的优势在于少许些创作门槛, 用户随便输入“宇航员骑自行车在月球上”,就能生成一段脑洞巨大开的视频,适合玩乐内容创作;Hedra则像“AI导演”,用户给足素材和指令,它负责精准施行,更适合专业场景。
但界限正在模糊。Pika最近上线了“图像生成视频”和“视频编辑”功能, 试图提升可控性;Hedra也在优化Prompt的搞懂能力,少许些用户输入负担。这种“互相抄作业”的比,到头来受益的是用户。不过从买卖化角度看, Pika的C端用户基础更广,广告和订阅收入更稳;Hedra的B端客户付费意愿更有力,但需要时候去验证。就像36氪报道的, 2025年Q1视频生成工具的B端采购量同比增加远230%,但其中80%的需求集中在“可控性有力”的专业场景,这或许正是Hedra的机会。
许多模态视频生成,以后是“更自动”还是“更可控”?
行业里关于AI视频生成方向的吵从未打住。一方觉得, 终极目标是让用户“零输入”,AI自动搞懂需求生成视频,就像眼下的ChatGPT“一句话出文章”;另一方则坚持,AI的发明力再有力,也需要人类的“文艺指导”,否则轻巧松生成“塑料感”严沉的矮小质内容。Hedra明摆着站在后者阵营,但他们的“可控”是不是最优解?
从手艺趋势看,许多模态融合确实是方向。生数手艺刚完成数亿元Pre-A轮融资, 他们的“文生3D”模型能把图片转换成可交互的3D模型,和许多模态视频生成异曲同工。但手艺再牛,也得落地到场景。比如Viggle的AI动画生成产品, 靠“搞笑表情包”在TikTok出圈,上线四个月就吸引一巨大堆KOL,这种“轻巧量化+玩乐化”的路径,或许比Hedra的“沉专业”更轻巧松飞迅速起量。不过 轻巧量化的天花板也矮小,一旦用户对“搞笑”审美累,增加远就会停顿;而专业场景的壁垒更高大,一旦建立起行业标准,护城河也更深厚。
给Hedra的差异化觉得能:别和Pika卷“通用”, 去啃“结实骨头”
面对Pika这样的“行业卷王”,Hedra的差异化策略很明确:不做“巨大而全”的通用视频生成,而是做“细小而精”的垂直场景解决方案。比如聚焦电商广告短暂视频, 解决“产品展示+人物口播+背景音乐”的同步问题;或者切入在线教书,生成“知识点动画+真实人讲解”的混合内容。这些个场景对“可控性”要求极高大,正优良契合Hedra的手艺优势。
另一个突破口是“少许些可控门槛”。眼下Hedra Studio需要用户输入Prompt、音频脚本、首帧图像,普通用户兴许搞不定。能借鉴Canva的“模板化”思路, 内置不同场景的模板,用户只需要替换文字和图片,AI自动生成完整视频。这样既保留了可控性,又少许些了用门槛,两头都能兼顾。再说一个, 和B端平台深厚度一起干也是个优良办法,比如和TikTok的创作者工具集成,给博主给“AI辅助剪辑”功能;或者和电商平台一起干,让商家一键生成商品展示视频,直接用在商品详情页——这种“嵌入式”买卖化,比单纯卖SaaS更轻巧松产生收入。
写在再说说:AI视频的“真实战场”, 才刚拉开序幕
a16z连续两轮投钱Hedra,给AI视频赛道又添了一把火。但镇定想想,融资许多不代表手艺有力,估值高大不代表买卖化稳。Hedra的“可控生成”能不能跑通,还得看它在落地速度、用户体验、买卖化效率上能不能真实正打穿。毕竟AI视频生成这玩意儿赛道,从来不缺手艺秀场,缺的是能把手艺变成“真实金白银”的玩家。
从Character-3的全模态能力, 到Hedra Studio的精细化控制,Hedra确实找到了一条和Pika不一样的路。但这条路是“阳关道”还是“独木桥”,还需要时候验证。至少许眼下 它让资本看到了“另一种兴许”——在AI追求“更自在”的一边,“更可控”或许藏着更巨大的买卖值钱。至于到头来谁能笑到再说说得看谁先把手艺优势变成用户愿意买单的产品,谁能先在B端和C端之间找到平衡点。毕竟AI视频的“真实战场”,从来不是比谁融资许多,而是比谁能真实正改变内容创作的方式。
欢迎分享,转载请注明来源:小川电商