1. 首页
  2. 7x24H 快讯

54 亿烧不动,Sora 死了:匿名中国模型用 38 秒踢开下一扇门

OKX欧易app

OKX欧易app

欧易交易所app是全球排名第一的虚拟货币交易所,注册领取6万元盲盒礼包!

APP下载   官网注册

Seedance 2.0

2026年3月底到4月初,AI视频赛道在两周内连续发生了两件标志性事件。

第一件:曾经被行业奉为“白月光”的 Sora,于3月24日被 OpenAI 宣布全面关停——独立 App、API 接口及 ChatGPT 内嵌视频功能全部下线,OpenAI 彻底退出消费级视频生成市场。

第二件:不到两周后的4月7日,一匹代号为“欢乐马”(HappyHorse-1.0)的匿名模型,毫无征兆地空降全网最权威的 AI 视频盲测榜单 Artificial Analysis,以压倒性的分数直接登顶。

一个是硅谷巨头在日均1500万美元的烧钱游戏中选择认输,一个是来历不明的技术黑马踢穿了中国团队长期把持的盲测榜首。两件事发生在同一时间窗口,看似无关,实则指向同一个判断:AI 视频的竞争规则正在发生质变——从“谁的模型更聪明”转向“谁的算力更便宜、谁的合规墙更厚”。

Seedance 2.0

Seedance 2.0

屠榜真相:碾压级的纯视觉,与“偏科”的黑马

判断一匹黑马的成色,先看裁判是谁。

Artificial Analysis Video Arena 不是厂商自嗨的公关榜,而是几千名真实用户在完全不知情的情况下,对生成的视频盲测投出的 Elo 积分。

HappyHorse-1.0 的成绩单是压倒性的。

Seedance 2.0

在“文本到视频(不含音频)”赛道,它拿下 1357 分(截至4月9日),甩开第二名 Seedance 2.0(1273 分)整整 84 分。这意味着在盲测中,用户选择它的概率显著高于其他任何模型。被它踩在脚下的,不仅有字节跳动,还有 Kling 3.0、SkyReels V4 等一众明星产品。

Seedance 2.0

不过“偏科”也是事实。一旦纳入音频维度,它在“文本到视频(含音频)”赛道上以 1217 分仅以 3 分之差输给了 Seedance 2.0(1220 分)。换句话说,HappyHorse-1.0 踢穿的是字节的纯视觉技术口碑防线,但在音频-视觉综合体验上,Seedance 仍然守住了阵地。

这场屠榜的意义,更多在于打破了“国产视频模型已经固化”的市场预期——一个新的挑战者可以凭 15B 参数的小模型,在纯视觉维度上碾压所有大厂。

它凭什么这么快?

在单张顶级 H100 显卡上,它生成一段 1080p 高清视频(含同步音频)只需要 38.4 秒。速度的底气来自底层 150 亿参数(15B)的统一 Transformer 架构,结合 DMD-2 蒸馏技术,将推理步数压缩到仅 8 步。

通俗来说,传统的视频大模型像是一个“外包团队”——文本大模型先读懂你的需求,再交接给扩散模型去“画图”,中间沟通损耗极大。而 HappyHorse-1.0 采用的统一 Transformer 架构是个“全能通才”,在同一个神经网络里同时处理文本和视觉像素,消除了跨模态的中间损耗。Seedance 2.0

Seedance 2.0

有意思的是,HappyHorse-1.0 在登榜初期(4月7-8日)曾被质疑为“营销期货”——官网声称开源,但 GitHub 仓库和模型下载链接一度全是 404 或“敬请期待”。但就在4月9日,多家媒体报道称其已正式宣布开源,用户可在官网通过文本生成和图片生成两种方式在线体验。从“薛定谔的开源”到真金白银放出权重,只用了不到 48 小时。

Seedance 2.0

 匿名阳谋:大厂为何蒙面入局?

业界目前有两种最主流的猜测。

一是它出自阿里淘天集团新成立的“未来生活实验室”,由原快手技术副总裁、可灵AI负责人张迪领衔。

二是它深度借鉴了国内初创公司 Sand.ai 的 daVinci-MagiHuman 底层技术——知乎用户 Vigo Zhao 将 HappyHorse-1.0 的公开基准数据与已知模型逐条核对,发现两者高度吻合,界面新闻也报道称“技术圈认可度最高的结论”是 HappyHorse 系 daVinci-MagiHuman 的优化迭代版本。

上述猜测目前均未得到官方证实。不过,今早有独家消息称,HappyHorse-1.0确系阿里巴巴研发,由前快手副总裁、可灵技术负责人张迪带队,他于2025年11月回归阿里。此外,阿里云将很快将该模型上线百炼平台,阿里巴巴近期的组织调整也与此有关。

截止发稿前,阿里官方尚未回应。

问题来了:既然手握屠龙刀,大厂为什么不开发布会?为什么要匿名混迹在第三方盲测平台?

虽然目前缺乏官方解释,但从行业惯例和商业逻辑推测,背后至少有两层计划。

第一层,是免费的“数据收割”。

当前 AI 视频最大的瓶颈是缺真实的人类偏好数据。匿名空降盲测平台,等于让全球网民免费给它做 A/B 测试。不花一分钱,就能精准锚定模型在真实世界里的缺陷。

第二层,是规避致命的“合规地雷”。

AI 视频正处在版权诉讼的火山口。在大模型没建好数字水印和肖像拦截机制前实名发布,极易招来好莱坞的天价索赔。匿名测试,既秀了肌肉,又做好了法律上的物理隔离。

不过,从另一面看,HappyHorse-1.0 的狂欢,映衬着 Sora 的落寞。同样是做视频,命运为何两极分化?细想来看,Sora 的退出,其实撕开了这个行业最血淋淋的伤疤:ROI(投资回报率)严重倒挂。

据 SemiAnalysis 测算,Sora 的日均运行成本高达 1500 万美元,一年烧掉约 54 亿美元。它的扩散模型架构每生成 1 秒视频需要渲染约 30 张图像,但生成结果中常见的物体变形、运动不连贯等问题导致大量视频只能废弃,最终可用率据分析机构推算仅有 5% 到 10%

产出 1 条可用视频,浪费了十倍以上的算力。当一个工具无法嵌入用户的日常工作流,仅仅沦为“猎奇玩具”时,没人愿意持续买单。据 a16z 合伙人披露的数据,Sora 的 1 天留存率仅 10%,7 天只有 2%,30 天只剩 1%,60 天接近 0%。

Sora 用 54 亿美元年成本和断崖式下跌的留存曲线,证明了纯扩散模型暴力堆算力的路线走不通。而 HappyHorse-1.0 给出了另一个答案——15B 参数、统一 Transformer 架构、8 步推理、单卡 38.4 秒。两者之间的差距,不是参数规模,而是架构效率。扩散模型是算力黑洞,统一 Transformer 是算力压缩器。这场架构之争的胜负,可能比任何单次屠榜都更有行业信号意义。

再看留在场上的中国 AI 巨头,打的是另一场算力经济账。

先看 API 调用成本:

字节跳动的 Seedance 2.0,其 1080p 纯视频生成的 API 定价是 46 元人民币 / 100 万 Tokens。根据实测,生成 15 秒视频约消耗 30.888 万 Tokens,换算下来,生成一秒钟的商业级视频,成本约 1 元人民币(约合 0.14 美元)。

这就是商业现实。对于绝大多数企业来说,直接调用每秒约一毛多美金的闭源 API,远比花上百万元买 H100 服务器去折腾所谓的“开源模型”香得多。

千万级框架:巨头厮杀的终极壁垒

如果你觉得算力便宜就是唯一壁垒,那就太天真了。

想接入 Seedance 2.0 并使用真人参考图生成视频,企业需要签订千万级的年度预付框架合同。同时,新签框架还须缴纳预付金的 50% 或 100 万元(取高值)作为保证金,且一年后方可逐步释放。

这道千万级的门槛,本质上是让企业为主体责任买单的保证金——将生成深伪视频(Deepfake)的法律风险,通过商业合同转移给有抗风险能力的头部 B 端企业。

今年2月中旬,一位爱尔兰导演用 Seedance 2.0 生成的汤姆·克鲁斯和布拉德·皮特在屋顶打架的逼真视频火遍全网。2月13日,迪士尼律师 David Singer 起草的停侵权函送达字节跳动,美国电影协会(MPA)随后也严厉指控 Seedance 2.0“大规模未经授权使用受版权保护的内容”,演员工会 SAG-AFTRA 也对未经授权使用会员肖像发出了尖锐批评。

为了自保,巨头设立了极高的资金门槛与企业资质审查(KYC)。

他们根本不在乎 C 端普通用户能做几段搞笑视频,他们要的是成为 B 端工业化内容生产的“水电煤”。通过垄断算力基建和建立严苛的授权体系,把中长尾竞争者彻底挡在门外。

后 Sora 时代的大洗牌,给行业留下了什么?

AI 视频的底层基建游戏,已经是重资本、重算力的巨头专属牌桌。但牌桌上博弈的是基础设施,桌下的缝隙里反而长出了真金白银的机会。

核心逻辑很简单,算力成本正在以肉眼可见的速度下探——从 Sora 时代的每秒数美元,到今天 Seedance 2.0 的每秒约 1 元人民币,再到 HappyHorse-1.0 开源后理论上可做到的本地零边际成本。每一次成本下探一个数量级,就会催生一批新的商业场景。

综合来看,AI视频生成领域,当前最值得关注的三个方向可能是:

电商带货视频自动化。国内短视频平台的商品推广视频目前仍以人工拍摄为主,单条成本 500-2000 元,制作周期 2-5 天。如果用 API 算力将这个成本压缩到 10-50 元、制作周期缩短到分钟级,整个投放逻辑会被重写——测试素材量可以从每天 10 条暴增到 1000 条,A/B 测试的效率和精准度将质的提升。

短剧工业化生产。竖屏短剧正在全球市场爆发,单集预算通常在 5-15 万元,但拍摄周期和演员成本是刚性瓶颈。AI 视频虽然还无法替代真人演技,但在场景空镜、过场转场、特效画面等“非情绪化”镜头上已经可以替代 30%-40% 的拍摄工作,直接压缩制作总成本。

出海广告本地化。同一个产品在东南亚、中东、拉美投放,需要不同语言、不同人种、不同文化符号的广告素材。传统方式需要多国团队分别拍摄,AI 视频可以把这个过程压缩到一个人一台电脑一天之内完成,且成本几乎不随市场数量线性增长。

这三个方向有一个共同特征:它们不要求模型跑分第一,不要求生成电影级画质,但要求成本足够低、速度足够快、稳定性足够好——而这恰恰是 API 调用比本地部署更适合的场景。

HappyHorse-1.0 踢开了门。但门后面站着的是字节和快手们经营了两年的商业基础设施——算力供应链、合规审查体系、B 端客户网络。

技术黑马可以赢得一个周末的掌声,但赢得战争需要的是另一个维度的积累。从今天起,AI 视频的竞争规则已经从“谁的模型更强”转向“谁的工作流更厚”。(本文首发钛媒体App,作者| AGI-Signal,编辑|林深) 

<
OKX欧易app

OKX欧易app

欧易交易所app是全球排名第一的虚拟货币交易所,注册领取6万元盲盒礼包!

APP下载   官网注册
相关文章