Soul实时数字人技术迭代升级，SoulX-LiveAct实现长时稳定新突破

近段时间，SoulAppAI团队SoulAILab开源SoulX-LiveAct高鲁棒实时交互数字人模型，标志着Soul实时数字人技术完成从轻量化、高帧率到高鲁棒、长时稳定的全面迭代升级，形成SoulX-FlashTalk、SoulX-FlashHead、SoulX-LiveAct三款差异化数字人模型矩阵，覆盖从消费级显卡到高端算力、从面部表情到全身动作、从短时长到小时级稳定的全场景需求，技术路线清晰、能力持续增强，为实时交互数字人行业提供完整技术演进范式。

Soul实时数字人技术迭代始于轻量化高效模型研发，早期聚焦解决实时推理效率与低成本部署问题，推出SoulX-FlashHead轻量化模型，采用1.3B参数设计，优化模型结构与推理算法，实现单张RTX4090消费级显卡96FPS工业级生成速度，侧重快速部署、低算力消耗、高帧率输出，适配短视频、轻量虚拟互动、实时表情生成等轻量化场景，为数字人技术普及奠定低成本基础，验证轻量化模型在消费级硬件上的可行性与实用性。

在轻量化模型成功基础上，Soul进一步聚焦高帧率、低延时、长时稳定需求，推出SoulX-FlashTalk14B大参数数字人模型，实现0.87秒亚秒级超低延时、32FPS高帧率、超长视频稳定生成，大幅提升实时响应速度与生成流畅度，适配数字人直播、实时互动、虚拟主播等对实时性与流畅度要求较高的场景，解决早期模型帧率不足、延时较高、长时稳定性弱等问题，推动数字人实时交互体验升级，为高鲁棒模型研发积累技术经验与数据基础。

随着行业需求从“实时生成”转向“长时稳定实时交互”，Soul启动高鲁棒全身数字人模型研发，推出SoulX-LiveAct模型，聚焦小时级稳定、全身动作生成、双卡低成本部署三大核心需求，创新NeighborForcing与ConvKVMemory技术机制，解决长时生成显存爆炸、身份漂移、细节丢失、实时成本高等行业痛点，支持图像、音频、指令多模态驱动，生成表情生动、情绪可控、全身动作丰富的实时数字人视频，适配长期在线数字人直播、开放世界NPC互动、AI教育全身教学等复杂场景，完成从面部表情到全身动作、从短时长到小时级稳定的关键技术跨越。

LiveAct推理时序+Memory结构示意图

Soul数字人模型矩阵形成差异化互补格局：SoulX-FlashHead主打轻量化、低成本、高帧率，适配消费级硬件与轻量场景;SoulX-FlashTalk主打高帧率、低延时、长时稳定，适配中高端算力与实时直播场景;SoulX-LiveAct主打高鲁棒、全身动作、小时级稳定、双卡低成本，适配高端算力与长期在线复杂场景，三款模型覆盖不同硬件条件、性能需求、应用场景，满足开发者多样化开发需求。未来Soul将持续迭代优化模型性能，提升长时稳定性、实时效率、生成质量，拓展更多应用场景，完善实时交互多模态技术生态，坚持开源共建，携手全球开发者推动实时数字人技术持续进步。

文章关键词：实时,数字,模型责编：兰明群

5034

慢新闻

辟谣：新疆塔什库尔干县发生4.0级地震，这些谣言勿信！

映象舆情