


引言
“数字人,是AI时代的通用交互界面。”
11月13日,主题为“效果涌现|AI in Action”的百度世界2025上,李彦宏一句话点破数字人的本质。
百度不仅业界首发“实时互动型数字人”,更将其技术全面开放——2秒响应、多模态交互、能思考、会接梗,一场由AI主导的“电商革命”,正悄然打响。

百度实时互动型数字人为中国智能经济铸造新质“数智生产力”,构建高效能“人工智能+”通路,重新定义直播电商,打开万亿增量市场,撬动场景革命并推动出海,不啻一场AI电商的阳谋。
大家有理由发问,实时互动型数字人是什么?将会是什么?应用场景在哪里?怎样重新定义旧有领域、开辟新赛道?它会成为一个通过交互范式革命引爆场景革命的现象级事件吗?谁在瑟瑟颤抖?
一、“数字人”:从科幻走入现实,不止于“虚拟偶像”
数字人并不是新鲜词。从《银翼杀手》中的虚拟角色,到初音未来的全息演唱会,我们早已在电影和娱乐中见过它的影子。
但直到今天,AI技术真正让数字人“活”了起来——
不再是“离线渲染”,而是实时交互;不再是“语音助手”,而是有形象、有情绪、能对话;不再是“预设脚本”,而是能思考、能决策。
关键技术推动者包括:Epic Games用MetaHuman工具,低成本打造高颜值数字人;英伟达用“蛋壳人”Demo,秀出实时AI驱动的数字人;Soul Machines为多家500强企业定制具有“生物力学模型”的数字员工,用于客户服务与营销,表情生动,情绪自然。
随着技术平台与工具的融合,如,英伟达的NVIDIA Omniverse Avatar集成语音、视觉与自然语言理解模型,Unity / Unreal Engine提供实时渲染与动画工具,百度智能云曦灵提供数字人制作与运营方案,科大讯飞推出虚拟人交互平台融合其语音技术,知料科技推出灵雀数字人可以快速完成声音克隆、形象克隆,推动数字人逐渐走向商业化。产品与应用上,翎Ling、AYAYI、柳夜熙等虚拟偶像/主播活跃于社交媒体与品牌营销,初音未来开创虚拟偶像文化;AI伴侣与社交领域则有Character.AI(文字交互角色)、Replika(具简单3D形象的聊天机器人)等。

而今,百度推出的“实时互动型数字人”,正在把技术推向商业化爆发的前夜。
二、实时互动数字人:多模态、实时性、个性化、场景化,能聊天、会卖货,还带情绪
什么是“实时互动型数字人”?
简单说,就是一个能和你“视频通话”的AI角色。
你说话,它听懂;你提问,它回答;你沉默,它还能主动找话题。
其核心能力包括:
实时响应:50-100毫秒内回复,像真人对话一样流畅;
多模态交互:语音、表情、动作同步生成,自然不僵硬;
人格化设定:有外貌、有声音、有性格,甚至能“爆梗”;
高说服力设计:基于认知心理学,能引导用户下单、学习、互动。
百度将其应用于“慧播星”平台,让数字人成为24小时在线的“主播智能体”。
冷场时,它能调度“助播智能体”搞气氛;用户提问时,它能实时解答、促成订单。
人工智能发展至今,前沿、热门且场景化明确的领域并不多见。假以时日,多模态、实时化、个性化、场景化的实时互动型数字人有很大可能性成为AI技术与应用的白热化焦点赛道之一。百度慧播星发布的高说服力数字人是多模融合且具备了思考、决策和执行能力的多智能体系统。
实时互动型数字人没有统一的定义,据笔者理解,它是指通过人工智能、计算机图形学、自然语言处理、实时渲染等技术构建的,能够通过语音、表情、动作等方式与真实人类进行“面对面”实时对话、双向交互并做出智能反应的虚拟角色和形象。其核心特征包括实时响应、多模态交互(语音、视觉、触觉等)和拟人化表现,可应用于智能客服、教育培训、直播电商、娱乐、养老等行业乃至面试、咨询、售后、助手、私域智能体等诸多场景。
高说服力数字人技术其核心在于通过多模态行为设计、认知心理学模型与动态决策算法,使虚拟角色具备影响人类决策的能力。该技术不仅要求流畅交互,更需精准触发用户的情感共鸣或信任感,从而引导行为转化(如消费、学习、健康管理等)。
总体来说,伴随百度的业内首发,实时互动型数字人已经从科幻走入现实,成为一个由技术融合驱动、业界共同推进的明确赛道。

百度实时互动(高说服力)数字人技术能力
纵观百度实时互动(高说服力)型数字人技术能力,它包括:
底座:文心大模型4.5Turbo、语音合成、视频生成模型;
剧本模式驱动,多模态精准对齐:讲品环节,静态匹配,复杂表现动作,完美匹配脚本;互动环节,动态匹配,生成匹配动作,打破动作循环;
高表现力动作生成:符合语义的复杂动作及指向性动作精准生成;数字人交互符合物理规律,长时间稳定可控;讲品、互动环节均稳定保持,多模态高度一致;
多人设风格脚本:根据题材、人设、话题、视频需求输入信息;模型自主思考,进行人设推理、摘要建设及大纲规划;进行自动评估续写,最终生成剧本,并形成口播文本、动作规划、表情标签、语调标签;
多智能体协同:AI大脑根据直播间的互动热度、用户行为、直播场观、评论内容,自主思考灵活决策,再调度多角色智能体,如运营智能体、互动智能体、场控智能体、主播智能体来执行特定任务,比如直播间有点冷清时调度助播智能体搞氛围,也可以调度运营专家发红包;直播间用户提问时,调度互动智能体来回答、促单。最后整体通过后验数据形成迭代闭环。
在实时响应,低时延上,百度实时互动数字人真人交流时延一般在50 到 100 毫秒,同时实现多模态的协调统一。这方面,百度是行业最领先的。数字人给出反馈时,像真人一样鲜活自然。数字人还能捕捉真实世界信息,拥有“懂细节” 的感知力,让每一次交流都充满临场感。
超头主播垄断了大部分的内容流量,往往让中小主播难以竞争。慧播星以全网的超头主播为资料库,打造了大师级的剧本模式,让每一位主播都能有超绝表现力。慧播星还有一个超能力的AI大脑,数字人可以根据直播间信号,实时思考决策,并且调度多角色智能体执行任务。
三、“人工智能+”不是说更在做,百度慧播星给智能经济打个样
8月26日,国家“人工智能+”行动意见正式发布,国家发改委称之为“中国智能经济发展路线图”。人工智能如何“+”、智能经济之路如何扎实有效,需要更多人工智能机构站出来。
这次慧播星的升级,其定位是:依托多项生成式 AI 技术,集合数字人主播形象生成、智能脚本创作、实时互动问答等多个亮点功能,广泛应用于电商交易、线索拓展、内容直播、视频创作等多个领域,帮助商家以更低成本进行数字人直播、数字人视频、数字人智能体,推动效益增长,成为“全球领先的全场景数字人平台”。

百度慧播星实时互动数字人,不仅是降本增效的工具,更是将“顶流主播”的能力,拆解为可复制的SaaS服务,实现高说服力数字人能力平台化。在展区,许多与会者亲身体验实时交互型数字人实时响应、声情并茂、明察善断的特性。
随着已在电商、法律、健康等30多个行业实现深度应用,并在军事、情感、文化等10个以上内容领域实现突破,超10万商家使用,百度慧播星数字人各项荣誉接踵而至:2025世界互联网大会乌镇峰会,慧播星获得“2025年度中国互联网企业创新发展十大典型案例”;国际知名咨询机构IDC的评测报告中,慧播星综合实力及市场份额行业第一,全面领先;全球咨询机构沙利文最具全球发展潜力的中国AI Agent Top10,慧播星成为入选该榜单的唯一数字人品牌。
将技术能力升维为人性化交互,预示一场交互范式革命的来临。
四、不止于带货:百度在下一盘什么棋?
直播电商的下半场,竞争不再是流量之争,而是“数智生产力”之争。
百度正在做的,不是创造一个虚拟偶像,它在打造的,是一套数字生产力系统,为中国智能经济铸造通用的“数智生产力”:
从“播报型数字人”升级为“交互型智能体”
从“工具型SaaS”延伸为“全链路出海服务体系”
从“中国市场”铺向美国、巴西、东南亚…
换句话说,百度正在用数字人,重新定义“人货场”中的“人”。
未来,你进入任何一个直播间,对面坐着的可能都不是真人,而是一个比你更懂产品、更会互动、还永不疲倦的数字主播。

结语:一场静悄悄的“AI阳谋”
数字人开播将是未来电商的“标配”。当别家还在卷价格、卷流量,百度已经把电商推进“数字人时代”。
这不是替代真人,而是重构直播的本质:更低的成本,更稳定的输出,更个性化的交互,更可控的“人设”。
从“播报”到“交互”,百度以数字人为钥,通过慧播星实时互动数字人实现多模态实时生成,打破虚实边界,技术驱动规模营收,打开万亿增量市场,开启AI商业化新纪元,由此重塑电商权力格局与电商生态,让我们隐约看到百度在“智能电商”重新定义赛道、逻辑与体验的阳谋。
或许,百度的野望不仅于此,出海也是他们未来商业布局的一部分。想象一下那个画面,中国AI正在批量“克隆”本土主播,送往海外直播间……
现实是,它已进入巴西市场,并与Kwai平台合作开展直播电商业务,巴西Kwai平台约20%的数字人主播OPM已超过真人主播。
也许不久之后,我们会在TikTok、Amazon、Kwai上,看到成千上万个“中国智造”的数字主播,用多国语言卖全球好货。
可以预见,这场由AI掀起的电商革命、多元场景革命,才刚刚开始。

作者简介:张晓峰,博士,“人工智能+”专家,大协同模式提出者,中国人工智能学会智慧能源专委会常务委员,北京天问数智科技中心主任,深度参与并见证从“互联网+”到“人工智能+”国家战略制定与行动的全过程,2015年,担任腾讯马化腾《互联网+:国家战略行动路线图》一书主编;2020年,担任百度李彦宏《智能经济:高质量发展的新形态》一书主编。智出东方青少年成长实验发起人,“互联网+百人会”发起人。