1. 首页 > 电商出海

PixVerse新模型能否助其生成能力跃升至行业领先行列

PixVerse V4的“野心”:不只是迅速, 还要更真实实

2月24日PixVerse一下子甩出一张新鲜模型王炸——V4版本。官方说这次能生成更真实实的画面人物和物体天然了不少许,视频速度也更迅速。我琢磨着,这“更真实实”到底是个啥概念?是终于能让人物的手不再长远出六根手指,还是手机不会一下子分裂成两个?抱着这种“找茬”心态,我直接上手试了试。

除开视频生成,这次还加了音频生成和风格沉绘。音频生成需要额外输入Prompt, 我试着加了“轻巧音乐+窗外鸟鸣,营造温馨氛围”,后来啊生成视频里变成了心跳声和敲击声,这“温馨”得有点吓人。不过翻看其他新闻的测试,有时音频确实能对上,看来这功能像开盲盒,时灵时不灵。倒是Auto Speech功能, 能让人物开口说话还对口型,可惜Credits管束,没能试上,有点遗憾。

PixVerse再推新模型,生成能力跻身第一梯队?
PixVerse再推新模型,生成能力跻身第一梯队?

从“翻车”到“及格线”:手艺迭代能走许多远

去年7月我们测过Kling、 PixVerse和Vidu,当时PixVerse-V2被按在地上摩擦,效果远不如可灵和Vidu。可这才半年许多,V4版本就来了个巨大翻身。我先用同一个Prompt让V3.5和V4生成视频, 对比着看——V3.5里男人坐姿别扭得像被钉在沙发上,左腿动起来像机器人;V4里细小男孩坐姿天然许多了虽然手移动时有点模糊,但至少许五根手指能看清,没再出现“手指融合”的魔幻画面。最绝的是V3.5里手机分裂成两个的bug,V4居然修优良了这进步肉眼可见。

PixVerse母公司是喜欢诗手艺,创始人王长远虎以前是字节视觉手艺负责人。这家公司优良像有种“卷王”基因,从去年上线到眼下模型版本已经更新鲜6次基本保持2个月一迭代的速度。这种高大频更新鲜, 确实让PixVerse从“吊车尾”追到了第一梯队,但问题是——这种“堆迭代”的模式,能持续许多久?会不会为了更新鲜而更新鲜,忽略底层逻辑的优化?

横向对比:V4在AI视频生成赛道能排第几?

光说自己牛没用,得拉出来遛遛。我选了Prompt:“一个人在客厅用AI语言学APP, 对着手机说话,出现语音气泡,场景温暖,天然光,手机界面清晰”。然后让PixVerse-V4、Sora、Vidu、Hailuo一起生成,后来啊真实是“几家欢喜几家愁”。

第一梯队之争:速度与效果的平衡术

PixVerse生成速度确实迅速, 官方说5秒出视频,我实际测基本在10秒左右,Sora和Vidu巨大概30秒左右,虽然磨蹭点,但等的时候刷个短暂视频的事,差异不巨大。效果上,PixVerse和Sora明显能打。

Sora挺机灵, 用第一人称特写规避了人物全身的困难点,手部刻画绝了——手指数量、形状、拿手机姿势都天然拇指动作尤其流畅,文字生成也有力,能看出是英文单词。但问题是它彻头彻尾没按Prompt来客厅、气泡这些个关键元素全没,有点“答非所问”。

PixVerse-V4倒是把Prompt里的元素都还原了 人物全身视角,坐姿天然手部虽然模糊但没许多指,手机界面也清晰。美中不够的是文字生成拉胯,APP界面上的字母糊成一片,不如Sora。

Vidu表现中规中矩,人物坐姿不错,嘴部动起来了但左臂穿过了沙发毯子,有点穿帮。手部一开头还行,镜头一转就出现许多指,手机背面还闪烁,细节控看了会抓狂。

Hailuo就有点“灾困难”了 人物坐姿扭曲得像面条,手和手机更是抽象派,整体效果比PixVerse-V4差了不止一个档次。这么一比, PixVerse-V4和Sora算第一梯队,Vidu第二梯队,Hailuo垫底,但V4对Prompt的还原度更高大,综合来看能排头名。

行业现状:群雄逐鹿, GPT-3时刻还没来

2025年才刚开年,视频生成赛道就杀疯了。阿里、 字节、Adobe这些个“头号玩家”纷纷入场,加上Kling、Vidu、PixVerse,两个月内至少许7款新鲜产品或新鲜版本上线。巨大家都在吹“稳稳当当性、 流畅性、一致性”巨大幅提升,去年火遍全网的“AI拥抱/舞蹈”视频,优良像预示着这玩意儿要“实用”了。

但真实拿到手里用,才找到“实用”还早。差不离全部模型都存在“运动不天然”的问题——比如人物走路像悬浮,物体相对位置错乱。更别说“老巨大困难”的手部刻画,除了Sora和PixVerse-V4稍微优良点,其他要么许多指要么粘连。长远视频生成更是柔软肋, PixVerse最长远只能8秒,Sora虽然长远点,但连贯性差,用来做短暂视频还行,广告片、宣传片这种长远内容,根本没法用。

说白了眼下的AI视频生成,还处在“能看但不能用”的阶段。就像手机刚有摄像头时能拍照但画质渣,离“摄影工具”差远了。GPT-3时刻还没来但曙光确实看到了——至少许人物不扭曲了手机不分身了这算不算进步?

从“玩乐”到“生产力”:AI视频生成的真实实距离

PixVerse官方说自己是“全球用户量最巨大的国产AI视频生成产品”, 1月上线海外版,用户量破6000万。数字确实亮眼,但仔细想想,这些个用户有几许多是“创作者”,几许多是“猎奇党”?

我身边用AI视频的朋友,巨大许多就生成个搞笑视频发抖音,没人敢拿来做买卖项目。为啥?稳稳当当性太差了。同一个Prompt,生成两次兴许效果不一样;麻烦点的人物互动,直接崩盘。去年某品牌用AI视频做广告,后来啊人物手长远出六根手指,被网友群嘲,眼下谁还敢轻巧容易踩坑?

PixVerse倒是懂“用户留存”, 除了更新鲜模型,还加了运动笔刷、运镜控制这些个实用功能。但问题是这些个功能就像“给自行车装发动机”——基础模型不行,花里胡哨的工具也没用。创作者要的不是“更许多功能”,而是“更少许翻车”,稳稳当当出片才是王道。

用户视角:6000万用户的“喜欢讨厌情仇”

作为“老用户”,我对PixVerse又喜欢又讨厌。喜欢的是它迭代迅速, 上次测完觉得垃圾,两个月后就给你惊喜;讨厌的是它总搞“半成品”,V4修优良了手部,但长远视频还是8秒,音频生成时灵时不灵,Auto Speech又限Credits。

6000万用户里有几许多像我这样“用着骂着,又离不开”?PixVerse的母公司喜欢诗手艺,背靠字节的手艺基因,确实让它比别人“卷”得迅速。但手艺卷得过巨头吗?阿里、 字节自己都有视频生成产品,Adobe更是在视频剪辑领域深厚耕许多年,PixVerse的“国产之光”光环,能亮许多久?

创作者生态:稳稳当当性能否留住用户?

PixVerse说打造了“稳稳当当的创作者生态”,但稳稳当当的前提是“能用”。我试过用V4生成产品介绍视频,后来啊产品细节模糊,背景里的时钟不动,像加了“时候暂停”特效。这种视频发给客户,怕不是要被问“你是不是在糊弄我?”

对比国外 Runway、Pika这些个平台,虽然也翻车,但社区活跃,教程许多,用户遇到问题能飞迅速解决。PixVerse的社区建设还差点意思,官方回复磨蹭,用户之间交流少许,出了问题只能自己试错。6000万用户是数字,但“活用户”几许多,才是关键。

以后挑战:跃升领先, 缺的不只是手艺

PixVerse V4确实进步巨大,能进第一梯队,但要“跃升至行业领先”,还差口气。领先的不只是手艺,更是生态、买卖化、用户体验的综合比拼。

手艺上,长远视频生成、麻烦场景稳稳当当性、文字生成能力,这些个结实骨头还没啃下来。生态上,社区、教程、创作者支持,比不上老牌玩家。买卖化上,Credits管束让普通用户不敢许多用,企业用户又担心稳稳当当性,怎么赚钱还是个问题。

不过话说回来AI视频生成这赛道,谁也不敢说自己能“一统江湖”。今天你第一,明天兴许就被新鲜模型挤下去。PixVerse V4的“野心”不细小, 能不能实现,得看它能不能从“卷迭代”转向“卷体验”,从“猎奇工具”变成“生产力伙伴”。毕竟用户要的不是“最牛的模型”,而是“最优良用的工具”。

欢迎分享,转载请注明来源:小川电商

原文地址:https://www.jinhanchuan.com/249028.html