新闻中心 > 基层声音  > 正文

​Soul实时数字人技术迭代升级,SoulX-LiveAct实现长时稳定新突破

2026-06-08 11:31:20   来源:映象网

5034

近段时间,SoulAppAI团队SoulAILab开源SoulX-LiveAct高鲁棒实时交互数字人模型,标志着Soul实时数字人技术完成从轻量化、高帧率到高鲁棒、长时稳定的全面迭代升级,形成SoulX-FlashTalk、SoulX-FlashHead、SoulX-LiveAct三款差异化数字人模型矩阵,覆盖从消费级显卡到高端算力、从面部表情到全身动作、从短时长到小时级稳定的全场景需求,技术路线清晰、能力持续增强,为实时交互数字人行业提供完整技术演进范式。

Soul实时数字人技术迭代始于轻量化高效模型研发,早期聚焦解决实时推理效率与低成本部署问题,推出SoulX-FlashHead轻量化模型,采用1.3B参数设计,优化模型结构与推理算法,实现单张RTX4090消费级显卡96FPS工业级生成速度,侧重快速部署、低算力消耗、高帧率输出,适配短视频、轻量虚拟互动、实时表情生成等轻量化场景,为数字人技术普及奠定低成本基础,验证轻量化模型在消费级硬件上的可行性与实用性。

在轻量化模型成功基础上,Soul进一步聚焦高帧率、低延时、长时稳定需求,推出SoulX-FlashTalk14B大参数数字人模型,实现0.87秒亚秒级超低延时、32FPS高帧率、超长视频稳定生成,大幅提升实时响应速度与生成流畅度,适配数字人直播、实时互动、虚拟主播等对实时性与流畅度要求较高的场景,解决早期模型帧率不足、延时较高、长时稳定性弱等问题,推动数字人实时交互体验升级,为高鲁棒模型研发积累技术经验与数据基础。

随着行业需求从“实时生成”转向“长时稳定实时交互”,Soul启动高鲁棒全身数字人模型研发,推出SoulX-LiveAct模型,聚焦小时级稳定、全身动作生成、双卡低成本部署三大核心需求,创新NeighborForcing与ConvKVMemory技术机制,解决长时生成显存爆炸、身份漂移、细节丢失、实时成本高等行业痛点,支持图像、音频、指令多模态驱动,生成表情生动、情绪可控、全身动作丰富的实时数字人视频,适配长期在线数字人直播、开放世界NPC互动、AI教育全身教学等复杂场景,完成从面部表情到全身动作、从短时长到小时级稳定的关键技术跨越。

LiveAct推理时序+Memory结构示意图

Soul数字人模型矩阵形成差异化互补格局:SoulX-FlashHead主打轻量化、低成本、高帧率,适配消费级硬件与轻量场景;SoulX-FlashTalk主打高帧率、低延时、长时稳定,适配中高端算力与实时直播场景;SoulX-LiveAct主打高鲁棒、全身动作、小时级稳定、双卡低成本,适配高端算力与长期在线复杂场景,三款模型覆盖不同硬件条件、性能需求、应用场景,满足开发者多样化开发需求。未来Soul将持续迭代优化模型性能,提升长时稳定性、实时效率、生成质量,拓展更多应用场景,完善实时交互多模态技术生态,坚持开源共建,携手全球开发者推动实时数字人技术持续进步。

文章关键词:实时,数字,模型 责编:兰明群
5034

相关阅读 换一换

慢新闻

辟谣:新疆塔什库尔干县发生4.0级地震,这些谣言勿信! 辟谣:新疆塔什库尔干县发生4.0级地震,这些谣言勿信!

新闻推荐

网站简介 | 版权声明 | 广告服务 | 联系方式 | 网站地图

Copyright © 2012 hnr.cn Corporation,All Rights Reserved

映象网络 版权所有