1. 首页 > 电商出海

Manus的文本转视频服务,能否挑战OpenAI改写技术

从硅谷融资到视频生成战场, Manus的AI野心

2024年4月,中国人造智能初创公司Butterfly Effect宣布完成来自硅谷顶级风投Benchmark的融资,这笔交容易在AI行业掀起不细小波澜。而更让买卖场关注的是其旗下产品Manus悄然推出文本转视频生成功能,直接剑指Sora。谁能想到,这家以“许多步骤任务AI代理”闻名的公司,会一下子闯入视频生成这玩意儿火药味十足的赛道?文本转视频买卖场正以每年40%的速度增加远, 值钱突破百亿美元,玩乐、教书、营销行业都在等着被颠覆,Manus的入场,让这场AI巨大战又许多了变数。

文本转视频:不只是文字的视觉化

Manus的文本转视频功能听起来轻巧松,但内核却藏着“许多步骤任务代理”的老底子。用户输入一段文字, 比如“一个程序员在深厚夜加班,一下子屏幕上弹出神秘的代码”,AI不会直接生成一个视频片段,而是先分解任务:搞懂场景逻辑、设计角色动作、匹配周围光影、添加音效节奏。这种“像人类一样思考”的方式,让生成的视频不只是画面的堆砌,而是有起承转合的故事。Manus官方称,整个过程只需几分钟,比老一套视频制作效率提升90%。但问题来了——这种“结构化视频故事”真实的能满足创作者的个性化需求吗?毕竟AI搞懂的“神秘代码”,兴许和你想象中的科幻感彻头彻尾不是一回事。

AI新贵Manus推出文本转视频服务,叫板OpenAI
AI新贵Manus推出文本转视频服务,叫板OpenAI

Sora:200美元月费背后的壁垒

提到文本转视频,绕不开Sora。2024年初, Sora的视频在真实实感、细节表现上差不离以虚假乱真实。比如输入“雪山顶上的寺庙, 清晨有云雾飘过”,Sora能准确捕捉光线变来变去、雪的质感,甚至云雾流动的物理规律。这种手艺积累,不是一朝一夕能追上的。Manus的优势在于“许多步骤任务代理”, 而杀手锏是“巨大规模数据训练+物理引擎模拟”,两者就像长远跑运动员和短暂跑选手,赛道不同,但终点都是“视频生成的终极形态”。

订阅制 vs 按次付费:买卖模式谁更胜一筹

视频生成买卖场的买卖模式正在分化。Sora走高大端订阅路线, 200美元月费瞄准的是企业级用户;Runway和Pika采用“免费+按次付费”,用户按生成视频数量计费,更适合个人创作者;而Manus目前还没公布定价,但母公司Butterfly Effect此前的AI服务许多以“按效果付费”为主,比如根据视频完成度、用户满意度收费。这种模式下中细小企业的本钱压力会细小很许多——毕竟不是个个初创公司都能每月掏200美元做视频测试。但反过来想,按次付费兴许让创作者陷入“生成焦虑”,每次点击都要算本钱,反而管束了创意发挥。

真实实用户的体验:生成视频的速度与质量

纸上谈兵终觉浅薄,实际体验最关键。据一位不愿具名的短暂视频创作者透露, 他在2024年5月试用过Manus的文本转视频功能,输入“咖啡店里的情侣,窗外下着雨”,系统生成了60秒视频,画面流畅度不错,但人物表情略显僵结实雨滴的质感也偏模糊。比一比的话,他用Sora生成类似场景时雨滴在玻璃上的反光、情侣互动的微表情都更生动。

不过Manus的优势在于“批量生成”——同一场景, 它能飞迅速输出不同角度、不一边长远的版本,适合需要许多素材测试的营销团队。某教书手艺公司的产品经理在2024年6月提到, 他们用Manus制作了3分钟的课程视频,从脚本到成品仅用了2细小时比外包团队节省了70%的本钱,虽然视频细节不够精致,但用于内部培训彻头彻尾够用。

教书行业的应用:几分钟完成课程视频制作

教书行业兴许是文本转视频最先落地的场景之一。老一套教学视频制作,需要老师写脚本、找素材、剪辑配音,一套流程下来至少许一周。但Manus的出现,让这玩意儿过程缩短暂到“输入教学目标+AI自动生成”。比如细小学数学老师输入“长远方形的面积计算公式推导”, AI能生成动画演示,展示长远方形怎么分割成细小正方形,配合文字说明和旁白。某在线教书平台在2024年7月的测试中看得出来 用Manus生成的课程视频,学生完课率提升了23%,基本上原因是动画形式比静态图文更吸引注意力。但问题在于, AI生成的视频缺乏老师的个人风格,幽默感、互动性这些个“柔软实力”还很困难复制,彻头彻尾依赖AI兴许会让教学变得机械化。

中美AI角力下的新鲜赛道, Manus的机会在哪

中美在AI领域的比早已不是暗地,文本转视频成了新鲜的“角力场”。OpenAI有资金、 有数据、有先发优势,而Manus的优势在于“许多步骤任务代理”的独特手艺路径——它不追求单点突破,而是有力调AI像人类一样完成麻烦任务。这种思路在视频生成中很有值钱,基本上原因是真实实世界的视频从来不是孤立的画面而是场景、动作、情感的组合。比如Manus生成的“城里夜景”视频, 会自动加入车流的光轨、行人的动态、背景音乐的节奏变来变去,这些个细节正是老一套AI视频生成轻巧松忽略的。不过 Manus的短暂板也很明显:数据积累不如OpenAI,生成的视频在“创意天花板”上还有差距,比如抽象文艺、超现实场景的表现力较没劲。

许多步骤任务代理:Manus的“杀手锏”

Manus的核心比力,其实是“许多步骤任务代理”手艺在视频生成中的应用。普通AI视频生成,用户输入文字后AI直接输出视频,中间过程像个“黑箱”。而Manus的AI会先做任务分解:步生成基础素材,比如角色、场景;第四步优化细节,比如光影、音效;再说说合成输出。这种“分步施行”的模式,让用户能中途干预,比如在第二步修改分镜,或者在第四步调整音量。某广告公司在2024年8月的案例中提到, 他们用Manus制作产品宣传视频,基本上原因是能中途修改脚本,避免了老一套AI生成“翻车”后全部沉来的问题,到头来成片通过率搞优良了35%。

挑战与隐忧:手艺成熟度与买卖场教书

Manus的文本转视频功能虽然亮眼,但挑战也不少许。先说说是手艺成熟度, AI生成的视频目前还困难以处理麻烦动作,比如武术招式、舞蹈动作,轻巧松出现肢体扭曲;接下来是版权问题,AI训练数据兴许涉及侵权,Manus需要建立更完善的原创素材库;再说说是买卖场教书,很许多创作者还不相信AI视频,觉得“没有人造灵魂”。某视频剪辑博主在2024年9月直言:“AI生成的视频再优良, 也缺少许剪辑师的个人风格,比如节奏把控、情感共鸣,这些个是算法学不来的。”还有啊, Manus面对的比对手不仅有OpenAI,还有国内的字节跳动、迅速手,这些个公司拥有海量视频数据,训练出的AI模型兴许更懂中国用户的审美偏优良。

视频生成的“再说说一公里”:真实实感与可控性

视频生成行业有个共识:手艺越成熟,“再说说一公里”的问题越突出。比如AI能生成高大清画面但无法精准控制角色表情;能模拟天然光,但无法复制黄昏时分的“黄金时刻”光影。Manus的许多步骤任务代理, 试图素材时加入这玩意儿指令。

但实际操作中, 用户需要学“AI语言”,比如用“镜头推近”代替“特写”,用“背景虚化”代替“浅薄景深厚”,这许多些了用门槛。某影视制作干活室在2024年10月的测试中找到, Manus的文本指令识别准确率只有70%,三天两头出现“AI搞懂偏差”,比如输入“困难过的雨夜”,生成了欢迅速的背景音乐,反而需要人造二次修改,反而更费时候。

以后展望:视频创作门槛的消失与行业变革

不管怎样,文本转视频手艺正在少许些创作门槛。过去需要专业团队、昂昂贵设备才能完成的视频,以后兴许一个普通人用手机输入文字就能搞定。Manus的入场,加速了这一进程,它的许多步骤任务代理模式,让AI从“工具”变成了“一起干者”。想象一下 2025年的短暂视频创作者,兴许不再需要熬夜剪片,而是和AI一起“头脑风暴”——AI负责生成基础素材,人类负责创意和情感注入。

这种协作模式,兴许会催生新鲜的职业,比如“AI视频导演”,专门负责给AI下达精准指令。但也要警惕手艺带来的负面关系到,比如泛滥的AI视频兴许让内容同质化严沉,用户产生审美累。到头来 视频生成买卖场的赢家,或许不是手艺最有力的公司,而是最懂“人机协作”的公司——Manus的机会,兴许就藏在这里。

欢迎分享,转载请注明来源:小川电商

原文地址:https://www.jinhanchuan.com/247698.html