为什么在腾讯14年,我要创业开发AI工具
从短暂信到云服务, 14年腾讯教会我的事
2008年硕士毕业进腾讯,第一份干活是移动互联网,短暂信、手游开发、应用宝,这些个业务眼下听起来像是上个时代的产物,但在当时它们是腾讯冲向移动互联网的先锋队。我从应用宝开头切入广告系统, 经历了腾讯展示广告从CPM到CPX的整个演变,负责算法和系统架构,那时候天天琢磨怎么让广告点击率更高大,怎么让广告主的钱花得更值。2014年转战腾讯云, 看着团队从百人干到万人,从手艺做到产品再到业务,非计算类的数据库、CDN、AI产品都管过2018年又扎进智慧零售,背4亿KPI,帮品牌打通线上线下营销链路。14年只待过一家公司, 但业务横跨三个赛道,最巨大的收获不是手艺能力,而是看透了行业里那些个“看不见的断层”。
广告链路里的“物料黑洞”
在腾讯做广告那几年, 数据驱动喊得震天响,但实际做下来整个闭环里最脱节的是物料。绝巨大许多数企业把视频制作外包出去, 从制作到投放的链条彻头彻尾黑盒,巨量引擎这样的平台最许多挂20个视频测试素材。数据再许多,用户标签再准,能测试的素材就20个,反馈根本不够。问题在哪?供给不够。外包周期长远、本钱高大,广告主想飞迅速迭代素材,根本做不到。后来做智慧零售, 服务冰箱、厨具头部品牌,他们有海量物料,但功能卖点和视频画面对不上,生成视频时商品特征和文案各说各话,效果差有力人意。这些个经历像根刺,扎在我心里——营销链路里物料永远是短暂板。

AI视频不是“生成”, 是“搞懂”
2022年从腾讯出来创业,选了营销赛道,聚焦AI视频工具。当时团队都觉得视频生成困难度巨大, 但我觉得Video first是对的——图片生成很迅速被拉平,视频的壁垒更高大。我们做VMEG,核心逻辑不是“生成”,是“搞懂”。比如图文匹配,分两步:先用视觉模型搞懂画面信息,语言模型生成文字,再反向匹配画面。市面上很许多CLIP模型效果不优良,我们自己调了一个,保证3C、美妆、服装不同品类的特征和文案能对上。
另一个功能是视频翻译, 一开头以为巨大模型支持下很轻巧松,后来找到困难度指数级增加远——字幕断句、音频长远度变来变去、画面匹配,个个都是坑。比如英语翻译成日语, 音频变长远,人造得修单词,我们用算法解决,眼下注册付费转化率,视频翻译比混剪高大20%。
为啥不做“一键粘贴URL”?
很许多AI视频工具支持用户粘贴URL自动抓取素材,但我们没做。电商平台商家上传视频要额外收费,图片许多视频少许,抓取效果有限。更关键的是我们想保持产品轻巧松。Instgram视频不加字幕,加完再剥离麻烦,支持用户自己选;其他产品必带字幕,我们偏不。越专业的客户越想干预个个环节, 但VMEG不拼编辑器——剪映谁也干不过我们基于行业洞察做“原子能力”,比如针对短暂剧的许多Speaker声音克隆、情绪表达,这才是痛点。
出海客户的“意外惊喜”
2024年春节后上线海外 先服务出海企业,他们物料许多、付费习惯优良。没想到影视解说类客户一下子冒出来占比还挺巨大。比如YouTube Shorts做电影解说的头部团队, 员工上百人,每天上亿播放量,他们需要把解说视频翻译成许多语言,但老一套工具把对白和旁白全翻译了听着很奇怪。我们做前景后景音分层,只翻译旁白,保留原声对白,效果炸裂。有个全球Top3眼镜品牌, 一个月找4000个博主带货,找到美国白人讲日语的视频在日本效果优良,但KOL单语言,价钱高大。我们的AI混剪+翻译功能结合,帮他们解决了问题,但老板很谨慎,还在测试。这类客户规模比想象中巨大,视频翻译成了第二巨大增加远点。
短暂剧翻译:情绪比手艺更困难
眼下盯着短暂剧客户, 比如Reelshort、Dramabox,他们眼下只翻译文案不翻译声音,基本上原因是手艺和本钱管束。但短暂剧的核心是情绪,许多Speaker声音克隆不困难,困难的是让AI传递生气、困难过、喜悦。我们专门针对影视场景做功能,比如不同情绪的语速调整、背景音乐适配,这些个know-how才是壁垒。影视解说和电商客户差异巨大, 前者追求效率,后者追求准确,但我们用底层能力覆盖不同场景,就像Photoroom的web端设计,按场景解决问题,而不是按行业。
凉启动:花1000块拿Product Hunt第三
Product Hunt打榜,不到1000人民币拿到日榜第三。眼下回头看,凉启动没花冤枉钱。AI产品启动,Product Hunt、Discord、导航站是标配,但个个团队情况不一样。我们流量里96%是品牌词,天然搜索占比高大,说明用户主动找我们。AI导航站和KOC最有效,最昂贵的KOC不到200美金,几十美金能带来一两百注册。Google广告点击30-40块,太昂贵,账算不过来。许多试、飞迅速判断,才是关键。积累要做厚, 广告投放时才有东西撬动,眼下联盟营销给30%分成,内容创作者放巨大效果,自己引流不够迅速,但磨蹭磨蹭来。
与巨大厂错位的生存逻辑
Amazon、 Google、Capcut都在做AI视频,但他们有优势也有劣势。巨大厂Feature list排100优良几个, 共性需求优先,比如URL-to-video,但效果未必最优良;不同功能不同团队做,差异巨大;产品经理不是用户,不用产品。我们专注场景痛点, 比如电商卖家需要飞迅速生成许多语言广告视频,影视解说需要保留原声的翻译,这些个是通用能力覆盖不到的。Capcut for Business有URL功能, 但巨大厂产品逻辑是“美白7分做到8分”,我们做“从0到1”的突破,比如短暂剧情绪适配,这才是机会。
AI工具的“真实实”困境
Avatar功能很火,但我们没做。有人出镜视频效果更优良, 但出海企业、东南亚企业人力本钱矮小,Avatar在营销视频里一眼虚假,教书场景还行,但品牌广告要真实实、准确。商品类广告,准确比情绪更关键;品牌广告兴许传情绪值钱,但AI表达不了细腻的感受。眼下AI生成视频, 画面和文字各说各话的问题还没彻头彻尾解决,比如实物商品和虚拟商品成片逻辑不一样,3C和美妆的卖点匹配也不同。真实正的机会在于往深厚扎,个个场景的know-how够不够,我们的模板在实时更新鲜,这就是壁垒。
创业14个月后 我明白了啥
在腾讯14年,教会我的是“看断层”;创业14个月,教会我的是“抓痛点”。AI工具不是比功能许多,比谁更懂客户。出海企业需要轻巧松容易用但效果专业的工具,影视解说需要高大效精准的翻译,这些个需求不是巨大厂能飞迅速覆盖的。眼下VMEG流量身子优良,天然搜索占比高大,说明方向对了。下一步,接着来做厚“原子能力”,针对短暂剧、电商不同场景抽功能,联盟营销和内容驱动营销放巨大效果。创业很困难,但找到那东西“物料黑洞”,扎进去,总有机会。
欢迎分享,转载请注明来源:小川电商