成本仅千元,数字人直播GMV超越真人主播,百度优选上演“真假”罗永浩!

发布时间:2025-06-27 16:17  浏览量:1

文|创业最前线

“这个老罗竟然是数字人,完全看不出来!”

1300万人次观看,GMV突破5500万元,是超头IP罗永浩在百度电商平台6月15日打下的直战绩。

这一成绩甚至超过了5月23日罗永浩本人直播带货GMV 5000万的数据。

当数字人老罗可以在直播间里无间断直播近7小时,不时和搭档蹦出一些罗氏风格的幽默段子、动作同步配合直播间产品讲解,还能同步上链接、发福袋,对弹幕公屏上的问题进行回应甚至结合热点进行调侃,这也意味着,AI数字人已经为传统电商打开了全新的想象空间。

这一切都基于文心4.5Turbo的技术迭代。

整场直播AI调用知识库1.3万次,生成9.7万字产品讲解内容,双数字人搭档做出超8300个动作,最终实现了对罗氏幽默的1:1复刻。

当数字人直播从只会对口型,发展到大动作都不崩的新阶段,百度AI数字人的业务边界也在持续外扩:罗永浩只有一个,但需要AI数字人赋能的主播和商家还有千万个。

1、1:1复刻“罗氏幽默”

老罗在百度的首场数字人直播效果显然超出了预期。

在这场直播中,有40%的动作片段是由AI生成,老罗和朱萧木组成了数字人搭档做出了8300个动作,符合物理运动规律且没有“崩”;同时100%脚本由AI生成,其中包括调用了1.3万次知识库,以及9.7万字的产品讲解内容。

从数据表现看,数字人老罗似乎比真人老罗更受欢迎——该场直播订单量较真人直播增长150%,在近7小时的直播长跑中,人均观播时长也增长了30%。

那么,一场兼具个人幽默感与塑品专业度的数字人直播是如何练成的?

直播间里的双人CP高度配合率先实现了数字人直播的体验新突破。

“老罗和朱萧木两个数字人生动还原了主播和助播的真实状态,配合得像真人一样自然。这次数字人直播间实现了双音轨,可以还原现实情况下双人互动语言相互打断等复杂场景。”百度副总裁、百度电商总经理平晓黎对「创业最前线」表示,“无论是商品讲解过程中的节奏切换,还是应对突发的互动需求,两个数字人都能自然应对。”

基于文心4.5T的技术升级和深度训练,这场数字人直播也实现了对“罗氏幽默”1:1复刻。

复刻的基础则来源于庞大的剧本生成能力。

“我们首先基于真人高克隆技术来生成数字人,通过上传真人视频回放,可以选择单人或是双人主播,确定好角色分配后,再进行选品。”百度电商商业业务部负责人、数字人创新业务部总监吴晨霞对「创业最前线」表示。

在选品方面,直播间会根据主推品、次推品、福利品等不同属性来设置脚本,团队会将所有产品的详情页信息和电商知识库的信息喂给大模型从而生成剧本,接着再进行下一步的剧本创作。

“数字人的幽默属性可以分为两种,一种是浅层幽默,另一种是深层幽默。”百度集团副总裁吴甜进一步解释道,浅层幽默指的是老罗的调侃、语言习惯和风格,大模型通过对罗永浩本人历史数据的挖掘和学习,以及规划模仿他的关键幽默元素进行复刻;深层幽默则更加复杂,要联系社会文化和社会热点等。

复刻“罗氏幽默”的难点在于,既要保证其人设的一致性,还要维持数字人的可控性。

“针对这两点,我们针对性地对老罗数字人进行训练和学习,一方面学习什么叫‘罗氏幽默’,最重要的是学习他的语言风格;另外还会学习他的口头禅、小动作,并进行针对性的特化训练。”吴甜补充道,“最终要让罗永浩本人都觉得像才可以。”

而要保证剧本创作的高互动性,一个关键点还在于对直播间里多模态信息的收集和反馈。

“剧本里融入了多模态元素,因此才能实现多模态和全模态的高度统一。”吴晨霞表示,老罗数字人在直播间的表现非常流畅,他在介绍产品时,讲的内容和动作完全匹配,而不像上一代数字人只能靠视频循环使用。

她还介绍道,此前的数字人是由唇形驱动,脚本改变后只有唇形跟着修改,而老罗数字人则能生成新的动作来匹配新的脚本,实现了动作和文本的高度统一。

在主副直播数字人之外,AI大脑还能在直播间里实现多智能体的配置——镜头外的主播、副播、场外音、场控、运营甚至水军等智能体角色都可以通过AI大脑来实现。

“我们通过流式生成的设计,让大模型有能力感知直播间的环境信号,让智能体们决定何时需要发起互动,例如发福袋、回复弹幕评论、与用户互动等。”吴甜表示。

(图 / 百度直播)

通过体验、内容和视觉上的技术突破,罗永浩数字人直播间的GMV也超越此前的真人直播间,而从该项目筹备到上线直播,百度团队仅用了三周时间。

2、数字人电商3.0

AI对传统电商的赋能并非新鲜事。

在电商领域,从智能客服、智能营销,到数字人主播、AI导购,各大电商平台正在如火如荼地进行着AI改造。

麦肯锡、艾瑞等行业咨询报告显示,目前92%的消费者在电商场景中接触过AI应用,商家端的AI工具使用率已经超过60%。

AI应用的爆发正在驱动智能电商加速演化,数字人也从最开始的行为笨拙成长为能够补充甚至替代真人主播。

早在数字人1.0时代,AI数字形象人物僵硬、动作循环,对于录制素材要求高,大多采用通用型文案,整体缺乏互动。

进入到数字人2.0超拟真时代,AI数字人已经能够实现动作拟真和人物的克隆,从语音和动作上仿真度更高,无论是脚本还是互动都更加灵活。

如今进入到3.0高说服力数字人阶段,也就是罗永浩数字人的表现阶段,不仅能够实现智能脚本创作,在神形音容上保持高度一致,还能通过AI大脑进行决策思考,实现对多智能体的合理调度。

(图 / 百度慧播星)

不妨展望一下数字人4.0阶段,在可预测的未来,数字人或将成为超越真人的存在,非但拥有真人不具备的超大知识库,还能多任务作业,最终实现直播间内容的千人千面。

百度优选作为百度集团旗下的智能电商平台,也在AI赋能方面持续探索。

面向用户,百度优选陆续上线了搜索智能导购、全网商品对比等能力,为用户提供了更高效的购物决策服务。如今,每天有超过2000万用户在百度使用智能导购进行购买决策;

面向商家,百度优选还发布了慧播星数字人、天枢智能营销平台、AI商家端等产品。截至目前,有超过10万的商家使用数字人开播,每天有超过600万的用户在数字人直播间购物。

今年618刚刚收官,不难从中发现数字人的身影。

在今年百度优选618省心好物节,平台头部商家采用真人+数字人混播,百万级以上商家GMV同比增长375%,腰部商家GMV同比增长344%,中小商家多采用纯数字人直播,GMV同比增长116%。百度优选的直播转化率同比提升31%,开播成本下降80%。

(图 / 百度慧播星)

数字人不仅成为新质生产力,真人和数字人协同直播也成为百度优选的平台特色。

“如果以带货GMV为评判标准,现在市面上数字人直播效果有一半能超越真人,还有一般直播效果持平,但未来高说服力数字人的直播效果一定会完全超越真人。”平晓黎表示。

在她看来,数字人直播在某些品类上存在明显优势,例如保健品销售在塑品环节,数字人知识面更广,能够讲解得更加透彻;教育公司的主播大多是老师,真正的名师无法天天开播,数字人就很好地解决了这个问题,让名师可以退居幕后从事教研工作。

“未来一定是数字人和真人共存的协同状态。”平晓黎补充道。

3、从罗永浩,到AI数字人普惠

数字人在直播间的引入不仅可以提升GMV和直播效率,在降低成本方面也颇有成效。

“数字人直播的成本较真人直播能够降低80%,对于中腰部的电商品牌可能节约得更多。”平晓黎表示,尤其像老罗这样的超头主播准备一场真人直播的时间和成本都非常高,数字人直播则可以很好地解决这一问题。

从技术角度看,吴甜则更加笃定数字人等新技术在未来将进一步降低直播成本。

(图 / 摄图网,基于VRF协议)

“数字人包括两部分成本,一部分来自生产制作数字人的成本,另一部分则是在线服务的成本。”吴甜表示,随着技术系统的完善和发展,未来数字人的制作成本会进一步下降,尤其是在罗永浩之外更广泛的没有强IP的主播,制作成本会有更大的降本空间。

随着开播时间越长、开播场次越多,数字人直播的边际收益也会越高,毕竟数字人只需要付出IT成本和现场运营成本,解放了真人主播。

“目前百度单个数字人的制作成本已经控制在千元左右,而一个普通商家真人直播的场地、设备、人工成本最低一个月也要上万元。”平晓黎说道。

对百度数字人来说,老罗无疑是一个标杆。

“大模型是具有泛化能力的,其在学习相应直播场景的大量数据后,同时也具备了迁移能力,可以把知名主播的学习能力迁移到普通主播身上。”吴甜表示,这也让百度数字人有了更多市场化以及规模化的空间。

而用AI普惠更多平凡主播和中小商家,正是百度打造数字人体系的初心。

近日,百度电商推出两大计划:梦蝶计划将通过流量扶持,超头主播数字人打造、预算扶持,实现百度优选超头主播的数量倍增;繁星计划则将再次追加10万个慧播星数字人,投入1亿元数字人消费补贴、千万级别的运营扶持,帮助更多的普通人、中小企业开启数字人直播。

“百度电商通过数字人帮商家卖货服务目前已经实现了商业化,一年纯数字人也贡献了几十亿的收入。”平晓黎表示。

老罗的数字人并非个例。数字人的价值是服务于人,当人人都可以当主播,智能电商的门槛被不断降低,百度数字人将真正实现AI普惠的终极目标。