微软开源前沿语音 AI 家族 VibeVoice：单次处理 90 分钟多说话人对话，GitHub 迅速获 27K Star

作者: AIBase 2026-03-30

OKX欧易app

欧易交易所app是全球排名第一的虚拟货币交易所，注册领取6万元盲盒礼包!

APP下载官网注册

微软近日开源了名为VibeVoice的前沿语音 AI 模型家族，涵盖自动语音识别（ASR）和文本转语音(TTS)等多项能力。该项目以其强大的长音频处理、多说话人自然对话生成以及实时低延迟特性，迅速在开发者社区引发关注，目前已在 GitHub 收获约27K Star。

作为开源研究框架，VibeVoice 采用 MIT 许可协议，支持本地部署，无需云端订阅费用，旨在推动语音合成领域的协作与创新。模型家族主要包括三个核心成员，各有侧重，共同解决了传统语音 AI 在长序列处理、说话人一致性和自然流畅性上的痛点。

VibeVoice-ASR-7B:长达60分钟的结构化语音转文本利器

VibeVoice-ASR-7B 是一个统一的语音转文本模型，能够一次性处理长达60分钟的音频文件，直接输出结构化转录结果。输出不仅包含“谁在说话”（说话人识别）、“何时说话”(精确时间戳)，还包括“说了什么”(详细内容)，并支持自定义热词功能，可有效提升专有名词或技术术语的识别准确率。该模型支持超过50种语言，适用于长篇会议记录、播客转录等复杂场景。

社区开发者已基于该模型开发出实用工具，例如一款名为Vibing的语音输入法，支持 macOS 和 Windows 平台。用户反馈显示，其识别速度和准确率表现不错，可显著提升日常语音输入效率。

VibeVoice-TTS-1.5B:90分钟多说话人富有表现力的语音生成

VibeVoice-TTS-1.5B 是专注于文本转语音的核心模型，能在单次生成中产出长达90分钟的连续音频，支持最多4个不同说话人进行自然对话模拟。模型生成的语音富有表现力，听起来自然流畅，能模拟真实的停顿、强调和情感转折，非常适合制作播客、长音频叙事、有声书或多角色对话内容。

相比许多传统 TTS 模型仅支持1-2个说话人，VibeVoice-TTS 在长形式、多说话人一致性上实现了显著突破。其底层采用连续语音分词器（声学与语义分词器）结合低帧率设计(7.5Hz)，大幅提升了长序列处理的计算效率。

VibeVoice-Realtime-0.5B:约300毫秒延迟的实时 TTS

VibeVoice-Realtime-0.5B 专注于实时场景，支持流式文本输入，首音频输出延迟约300毫秒，同时还能生成约10分钟的长篇语音。该模型特别适合需要即时回应的交互应用，如实时语音助手或直播配音场景。

此外，项目还引入了实验性说话人支持，包括多语言语音和多种英语风格变体，为开发者提供更多定制空间。

AIbase 点评:微软 VibeVoice 的开源不仅降低了高性能语音 AI 的使用门槛，还为本地部署提供了完整解决方案。项目曾因潜在误用风险短暂下架，后通过嵌入音频水印、可听免责声明等安全机制重新上线，体现了负责任 AI 开发的原则。目前，开发者可在 GitHub 仓库和 Hugging Face 获取模型权重，并通过 Colab 等平台快速试用。

随着开源社区的持续贡献（如针对 Apple Silicon 的优化 fork），VibeVoice 有望在内容创作、无障碍工具、语音交互等领域加速落地。感兴趣的开发者可访问微软官方项目页进一步探索

项目地址：https://github.com/microsoft/VibeVoice

内存条价格跳水，内存股集体下跌，内存超级周期见顶了？

Tom Lee 再喊「加密寒冬 4 月终结」，但他的预测记录让社区炸了锅

OKX欧易app

欧易交易所app是全球排名第一的虚拟货币交易所，注册领取6万元盲盒礼包!

APP下载官网注册

MYX短时突破1.33美元，24小时涨幅扩大至290%

火星财经消息，8 月 5 日，据行情数据，MYX 短时突破 1.33 美元，现报价 1.2985 美元，24 小时涨幅扩大至 290%，市值升至 2.15 亿美元。

2025-08-05 21:41:03
数据：过去 1 小时 Binance 净流入 3,309.34 万 USDT

火星财经消息，据 Coinglass 数据显示，Binance 在过去 1 小时内净流入 3,309.34 万 USDT。

2026-02-02 15:45:02
30余家加密企业联名促美国国会澄清“资金传输人”法律定义

火星财经消息, Coinbase、Kraken、Uniswap Labs 等 34 家加密企业与基金会联合致信美国国会，要求澄清司法部对《刑法第 1960 条》“资金传输人”定义的广泛解释，称其

2025-03-27 09:15:02
DefiLlama 创始人：Figure TVL 数据真实性存疑，未因 X 平台粉丝数拒其上榜

火星财经消息，DefiLlama 创始人 0xngmi 在社交平台发文表示，DefiLlama 发现 Figure 链上资产与交易量严重不符：BTC 和 ETH 储备极少，其自有稳定币供应有限，

2025-09-13 20:35:01
英国破产署任命首位加密专家，负责在破产程序中追踪加密货币

火星财经消息, 英国破产署任命首位加密情报专家 Andrew Small，他将负责在破产程序中追踪加密货币。数据显示，在过去五年中，英国破产署将加密货币认定为可由清算人追回的资产的案件数量增加了

2025-06-10 00:21:02
Binance Research：2026 年对稳定币、代币化、预测市场等赛道感兴趣

火星财经消息，Binance Research 发布 2025 年回顾及 2026 年展望报告，其中提及：“展望 2026 年，我们对几个关键主题特别感兴趣，并预计这些领域在全年将取得显著进展。

2026-01-15 18:55:03
Zerebro 创始人：正在构建面向消费者的代理 Launchpad Zentients

火星财经消息，Zerebro 创始人 Jeffy Yu 发推表示，其正在构建面向消费者的代理 Launchpad Zentients。Zentients 的目标是创建一个无缝的 UI/UX 来启

2024-12-30 10:23:13
某用户硬件钱包长期未使用电池鼓包，换电池后发现钱包已初始化

火星财经消息，慢雾余弦在 X 平台转发了一项关于硬件钱包使用的安全案例：“某用户将 BTC 存储到了某硬件钱包里以为高枕无忧，过了几年拿出来发现电池鼓包不能用了，找了同款钱包然后去华强北换了电池

2025-03-21 11:13:01

OKX欧易app

欧易交易所app是全球排名第一的虚拟货币交易所，注册领取6万元盲盒礼包!

APP下载官网注册

币种	价格	涨跌幅
BTC 比特币	￥780,779.71 $109,400.40	-0.3%
ETH 以太坊	￥28,519.55 $3,996.07	-1.19%
USDT 泰达币	￥6.50 $0.91130	-5.75%
SOL Solana	￥1,445.15 $202.49	+1.27%
BNB 币安币	￥6,915.37 $968.96	+1.59%
XRP 瑞波币	￥6.50 $0.91130	-5.75%
DOGE 狗狗币	￥1.64 $0.22965	-0.39%
USDC USD	￥7.13 $0.99940	+0.02%
ADA 艾达币	￥5.61 $0.78600	+1.87%
AVAX Avalanche	￥204.61 $28.67	-1.51%
TRX 波场	￥6.50 $0.91130	-5.75%
TON Toncoin	￥19.44 $2.72	+2.14%
SHIB Shiba	￥0.00019 $0.0000260	+5.78 %
XLM 恒星币	￥2,75 $0,38580	-0.85%
DOT 波卡币	￥60.21 $8.31	+2.4 %
LINK ChainLink	￥148.80 $20.85	-0.33%
OKB OK币	￥1,351.87 $189.42	+1.69%
BCH 比特现金	￥6.50 $0.91130	-5.75%
SUI Sui	￥25.56 $3.53	+4.94 %
PEPE Pepe	￥0.0000660 $0.0000093	-1.28%