新闻中心 > 基层声音  > 正文

​Soul围绕AI实时互动持续发力,SoulX-FlashTalk开源解锁行业新可能

2026-06-10 11:38:02   来源:映象网

5034

SoulApp持续加码AI交互技术研发,其AI团队SoulAILab今年年初正式开源实时数字人生成模型SoulX-FlashTalk,作为14B参数实时数字人模型,它首次实现0.87s亚秒级延时、32fps高帧率、超长视频稳定生成与全身动作交互,为实时生成式数字人行业提供可落地商用方案,推动大参数量数字人从实验室走向应用。Soul团队秉持技术创新理念,深耕AI交互领域,致力于打造沉浸、多元、智能的交互体验,此次开源既是技术共享,也是赋能行业、共建生态的一步。

SoulX-FlashTalk在响应速度上实现颠覆性突破,亚秒级延时让数字人交互更自然。实时视频交互中,延迟是体验核心,SoulX-FlashTalk通过全栈加速引擎极致优化,将首帧输出延时降至0.87s,达成亚秒级响应。这一突破让14B级大模型数字人首次具备即时反应能力,消除传统生成滞后感,实现零延迟反馈,视频通话、直播弹幕、智能客服等场景下,均能提供自然流畅、无卡顿的深度对话。高帧率输出稳定32fps,远超直播25fps标准,画面丝滑流畅,证明大模型经深度优化可兼顾高参数与高效率。

解决长视频痛点、实现全身高保真交互,是SoulX-FlashTalk的核心优势。传统数字人长视频生成易出现面部不一致、画质下降、身份漂移、动作单一等问题,限制应用场景。SoulX-FlashTalk采用自纠正双向蒸馏技术,引入多步回溯自纠正机制,主动模拟并修正长序列误差,实现无感纠错且画质无损;模型完全保留双向注意力机制,每帧生成可同步参考过去与未来上下文,从根源抑制身份漂移,超长直播中数字人口型、面部、背景稳定一致,无模糊变形。动作表现突破传统局限,支持音频驱动全身肢体动态合成,依托14BDiT建模能力消除手部畸形与模糊,精准呈现手部细节,维持99.22%身份一致性,平衡动作灵动性与画面稳定性。

为平衡质量与速度,Soul团队设计科学训练策略与高效推理体系。训练采用两阶段策略,第一阶段延迟感知时空适配,结合动态长宽比分桶微调,适配低分辨率与短帧序列;第二阶段自纠正双向蒸馏,通过DMD框架压缩采样步数、移除CFG加速,搭配多步回溯自纠正与随机截断策略优化显存。推理依托全栈加速引擎,通过混合序列并行、算子级优化、3DVAE并行化、整链优化,大幅提升推理速度,达成亚秒级延迟。传统单向模型易出现时间不一致与身份漂移,双向注意力机制充分利用全局上下文,提升生成一致性与细节质量。

SoulX-FlashTalk推理架构流程图

权威数据集测试中,SoulX-FlashTalk性能全面领先,适配多行业落地需求。TalkBench-Short与TalkBench-Long测试中,短视频ASE达3.51、IQA达4.79、Sync-C达1.47,刷新视觉保真度与口型同步精度;长视频Sync-C达1.61,抑制同步漂移,长短视频均稳定32fps,指标超越行业主流模型。依托性能,模型可应用电商AI直播、短视频制作、AI教育、NPC交互、AI客服等领域,解决数字人直播画质模糊、口型错位痛点,助力企业降本增效。Soul此前开源SoulX-Podcast登顶HuggingFaceTTS趋势榜,GitHub星标超3300。今年,团队陆续开源了实时数字人生成方向的SoulX-FlashTalk、SoulX-FlashHead、SoulX-LiveAct,歌声合成模型SoulX-Singer,全双工语音对话控制模块SoulX-Duplug,一系列动作标志着Soul开源战略升级,未来团队将聚焦核心交互能力,携手开发者共建AI+社交生态。

文章关键词:数字,SoulX-FlashTalk,模型 责编:兰明群
5034

相关阅读 换一换

  • 牧原股份与阿里云携手共建养猪大模型 赋能农业新质生产力

    映象网讯(大象新闻记者 赵勇生)当前,人工智能正以前所未有的速度重构各行各业。从金融、智能制造到精准医疗、智慧农业,AI大模型已从“概念热”走向“场景深融”,成为培育新质生产力、推动高质量发展的重要引擎。 6月1日,牧原食品集团股份有限公

  • 工行焦作分行:数字化转型赋能高质量发展

    今年以来,工行焦作分行紧扣总行、省分行“数字工行”战略部署,立足地方经济发展,以科技赋能为核心,深耕数字金融领域,全面推进数字化转型,以创新服务模式、夯实技术底座、优化运营效能,为地方实体经济发展注入强劲数字动能。 数字金融是金融创新的核心

  • 光影北境,阿拉维斯竞技携手米兰体育共拓新篇

    随着2025/26赛季西甲联赛正式落幕,围绕西班牙足球市场的区域合作也持续增加。近日,来自维多利亚市的阿拉维斯竞技宣布,与米兰体育展开区域合作,双方后续将围绕数字观赛环境与内容互动展开协同。 在官宣发布会现场了解到,此次阿拉维斯竞技与米兰

  • 全球第一!智元斩获WorldArena世界模型总分冠军!

    大象新闻

慢新闻

辟谣:新疆塔什库尔干县发生4.0级地震,这些谣言勿信! 辟谣:新疆塔什库尔干县发生4.0级地震,这些谣言勿信!

新闻推荐

网站简介 | 版权声明 | 广告服务 | 联系方式 | 网站地图

Copyright © 2012 hnr.cn Corporation,All Rights Reserved

映象网络 版权所有