近期,Soul App AI团队(Soul AI Lab)正式开源实时数字人生成模型SoulX-FlashTalk,这款14B参数模型实现0.87s亚秒级超低延时、32fps高帧率输出,还能稳定生成超长视频,为行业提供可商用的实时生成式数字人解决方案,推动大参数量数字人技术落地应用。Soul团队始终深耕AI能力建设,聚焦技术创新打造沉浸多元交互体验,此次开源正是这一理念的落地,模型在速度、延迟、效果与保真度上均表现优异,助力行业突破传统数字人技术瓶颈。

SoulX-FlashTalk拥有四大核心亮点,全面升级实时互动体验。其首帧视频输出延时仅0.87s,依托全栈加速引擎极致优化,让14B级大模型数字人具备即时反应能力,消除传统大模型生成的滞后感,适配视频通话、直播弹幕互动、智能客服响应等全场景实时交互需求。同时,模型搭载14B超大DiT模型,推理吞吐量达32fps,远超直播所需25fps标准,画面丝滑流畅,印证大模型经深度加速优化后仍能保持高效运行。
针对数字人长视频生成易出现面部不一致、画质下降的痛点,SoulX-FlashTalk采用独家自纠正双向蒸馏技术,引入多步回溯自纠正机制,实时修正长序列生成误差,实现无感纠错且画质无损。模型保留双向注意力机制,每帧生成可同时参考过去与未来上下文,从根源抑制身份漂移,确保超长直播中数字人口型、面部细节与背景稳定一致,避免模糊变形。此外,模型突破传统数字人仅面部对口型的局限,支持音频驱动的全身动作生成,凭借14B DiT建模能力消除手部畸形与模糊,精准呈现手部细节,兼顾动作灵动性与99.22%的身份一致性。
技术层面,SoulX-FlashTalk采用两阶段训练策略平衡质量与速度。第一阶段为延迟感知时空适配,结合动态长宽比分桶微调;第二阶段为自纠正双向蒸馏,通过DMD框架压缩采样步数、移除CFG实现加速,搭配多步回溯自纠正与随机截断策略,高效优化显存。同时,团队打造全栈加速引擎,通过混合序列并行、算子级优化、3D VAE并行化及整链优化,大幅提升推理速度,实现亚秒级延迟。传统单向模型易出现时间不一致与身份漂移,而SoulX-FlashTalk的双向注意力机制有效解决这一问题,提升生成一致性与细节质量。

在TalkBench-Short与TalkBench-Long数据集测试中,SoulX-FlashTalk表现全面领先,短视频评测中ASE达3.51、IQA达4.79,口型同步Sync-C为1.47;长视频生成中Sync-C达1.61,且长短视频均稳定维持32fps高帧率,远超行业主流模型。依托优异性能,模型可广泛应用于电商7×24小时AI直播、短视频制作、AI教育、NPC交互、AI客服等场景,解决传统数字人直播画质模糊、口型错位问题,降低运营成本。此前Soul AI Lab曾开源语音合成模型SoulX-Podcast,登顶HuggingFace TTS趋势榜,GitHub星标超3100,此次开源标志Soul进入开源新阶段,未来将持续推进开源,携手全球开发者共建AI+社交生态。
(免责声明:本文为本网站出于传播商业信息之目的进行转载发布,不代表本网站的观点及立场。本文所涉文、图、音视频等资料之一切权力和法律责任归材料提供方所有和承担。本网站对此咨询文字、图片等所有信息的真实性不作任何保证或承诺,亦不构成任何购买、投资等建议,据此操作者风险自担。如本信息内容涉及侵权,请及时与本网联系jinbw2024@126.com)
近日,中国电信推出试商用词元(Token)套餐,提供面向个人和开发者的多档位选择,最低月费9.9元起,中国移动和中国联通也在积极布局。 消息一出,立即引发广泛关注,有网友表示,还没搞懂词元是什么,运营商都有套餐了。那么三大运营商推出的词元套
大象新闻
当晚风掠过弗留利球场,看台灯光重新亮起,一则来自意甲联赛的合作消息也随之对外公布,乌迪内斯足球俱乐部日前确认,与OD体育正式建立区域合作伙伴关系,双方未来将围绕数字体育内容、赛事互动以及区域传播等方向展开合作。 相比意大利足坛众多传统豪门
5月19日,DeepSeek在其小红书官方账号发布关于< think >字符触发模型异常回复的说明: 近期,我们关注到有用户反馈,在与 DeepSeek 模型的对话中输入“< think >”这类特殊字符后,模型偶发
大象新闻
5月17日,一年一度的世界电信和信息社会日如约而至,今年的主题为“数字生命线:在互联世界中加强复原力”。在河南,这条“生命线”正变得愈发坚韧、智慧。 中国移动始终与世界电信日的初心同频共振,从太行山麓到沙颍河畔,从万亩良田到智慧工厂,从飞驰
Soul App AI团队近期正式开源旗下实时数字人生成模型SoulXFlashTalk,作为行业内首个能够实现0.87秒亚秒级超低延时、32fps高帧率,并支持超长视频稳定生成的14B参数数字人模型,它凭借全维度性能升级,重新定义了实时在
映象网讯(映象网记者 李光远 通讯员 曾伏虎)技能筑梦,匠心育人;群贤齐聚,盛会启幕。5月16日,2026年度机械行业职业教育技能大赛“亚龙杯”智能制造技术集成及数字化应用赛项在信阳科技职业学院隆重开幕。机械工业教育发展中心副主任刘加勇,河
在日前举办的“人工智能+教育:变革 发展 治理”为主题的2026世界数字教育大会上,一项来自河南的创新成果引发全球关注。由河南省教育厅“人工智能+教育”领航计划重点推荐,河南警察学院与中国移动河南公司联合研发的“VR+5G互联警务实战训练系