凯发在线ღ◈◈,凯发k8旗舰厅ag凯发·k8国际官方网站ღ◈◈,今年 618 大促期间ღ◈◈,「交个朋友」在百度优选搞了场直播ღ◈◈,不过这场直播的主角不是人ღ◈◈,而是 AIღ◈◈。直播间里ღ◈◈,罗永浩和朱萧木两个数字人配合默契ღ◈◈,不抢话ღ◈◈、不抬杠ღ◈◈,只是一味地带货ღ◈◈、爆梗ღ◈◈、讲段子ღ◈◈,还时不时跟评论区网友来个互动ღ◈◈。
这逼真效果ღ◈◈,就连老罗本人看了都吓一跳ღ◈◈:「他们在那儿眉来眼去ღ◈◈,讲着跟我一样风格的段子ღ◈◈,有点恍惚……」
更离谱的是ღ◈◈,罗永浩数字人的直播「战绩」比真人还能打ღ◈◈,整场直播吸引了超 1300 万人次观看ღ◈◈,GMV 突破 5500 万元ღ◈◈,部分核心品类带货量ღ◈◈、用户平均观看直播时长均反超罗永浩本人在百度电商的直播首秀ღ◈◈。
如此以假乱真的数字人到底是怎么做出来的?据老罗在微博上「自曝」ღ◈◈,这用的是百度的多模协同数字人技术
传统数字人生成技术常面临语音ღ◈◈、语言ღ◈◈、视觉多模态割裂的问题ღ◈◈,具体表现为台词与语音语调不同步ღ◈◈、表情手势与语义错位等ღ◈◈,而百度的技术突破在于引入剧本驱动的多模协同ღ◈◈。
具体来说ღ◈◈,这套技术方案包含了剧本驱动的数字人多模协同ღ◈◈、融合多模规划与深度思考的剧本生成ღ◈◈、动态决策的实时交互ღ◈◈、文本自控的语音合成ღ◈◈、高一致性超拟真数字人长视频生成等五大创新技术ღ◈◈,使数字人的「神ღ◈◈、形ღ◈◈、音ღ◈◈、容ღ◈◈、话」达到高度统一ღ◈◈,最终呈现出一个具备高表现力ღ◈◈、内容吸引人凯发手机娱乐app下载ღ◈◈、人-物-场可自由交互的超拟真数字人ღ◈◈。
在百度这套多模协同数字人技术方案中ღ◈◈,剧本生成无疑是核心环节ღ◈◈,涵盖台词ღ◈◈、多模驱动和动态交互三部分ღ◈◈。
最核心的台词需要解决三大关键问题ღ◈◈。其一ღ◈◈,通过风格建模为不同风格提供精细化定制ღ◈◈,使台词呈现多样化风格ღ◈◈,并与主播的个性高度契合ღ◈◈;其二ღ◈◈,通过人设建模ღ◈◈、人物性格与行为逻辑的精准还原ღ◈◈,以及在双人直播场景中保持多角色协同ღ◈◈,塑造拟真化人设ღ◈◈;其三ღ◈◈,引入内容规划和深度思考机制ღ◈◈,在保证讲品信息准确ღ◈◈、富有说服力的同时增强吸引力ღ◈◈,同时为避免「幻觉」ღ◈◈,还在台词生成中融入事实校对和知识增强机制ღ◈◈,保证每一句话都经得起推敲ღ◈◈。
就以罗永浩数字人为例ღ◈◈,罗永浩和朱萧木都具有强烈的个人风格ღ◈◈,直播时经常会蹦出几句口头禅ღ◈◈,为打造可控性强ღ◈◈、极具真实感的虚拟主播ღ◈◈,百度基于文心大模型 4.5 Turboღ◈◈,投入海量真人直播数据ღ◈◈,依托「转录挖掘ღ◈◈、优质提炼ღ◈◈、仿写合成与自动评估」四个环节不断优化训练语料ღ◈◈,使模型深度吸收两位主播的语言特点与思维习惯ღ◈◈,并在迭代学习中持续逼近更契合的输出效果ღ◈◈。同时引入多角色协同机制凯发手机娱乐app下载ღ◈◈,对不同主播的表达逻辑进行建模ღ◈◈,使对话在语义推进ღ◈◈、节奏控制和风格调性上保持协调一致ღ◈◈,避免「各说各话」的割裂感ღ◈◈。
所谓多模驱动ღ◈◈,是指大语言模型基于任务目标与主播人设生成基础台词ღ◈◈,并同步输出视觉与语音的多维标签ღ◈◈。这些标签不仅是对语言内容的补充ღ◈◈,更是驱动音视频生成系统实现自然ღ◈◈、同步ღ◈◈、富表现力输出的关键指令ღ◈◈。比如ღ◈◈,在语音合成阶段校长也风流ღ◈◈,模型利用剧本中的段间标签精细控制不同语段之间语调衔接ღ◈◈,同时文本内容也能驱动 TTS 系统实现更细粒度的语调调控ღ◈◈。音频合成结果再进一步与视觉标签联动ღ◈◈,使视频生成系统能够实现唇动同步ღ◈◈、高表现力的动作设计和情绪表达ღ◈◈,从而在输出层实现「声ღ◈◈、形ღ◈◈、意」三模态的统一ღ◈◈。
在此基础上ღ◈◈,剧本生成还具备动态交互能力ღ◈◈。比如 AI 老罗在卖纯牛奶时ღ◈◈,有网友问 360 个月的宝宝能不能喝ღ◈◈,AI 老罗便以「我 600 个月都能喝ღ◈◈,谁还不是个宝宝呢」进行幽默回应ღ◈◈,这种回应背后不仅是语言生成ღ◈◈,更是基于人设风格ღ◈◈、场景上下文ღ◈◈、情绪基调等多模信息的综合决策ღ◈◈。
在数字人技术逐渐渗透直播ღ◈◈、电商ღ◈◈、客服等互动场景的过程中ღ◈◈,语音合成的自然度正成为决定用户沉浸感与信任度的关键因素校长也风流ღ◈◈。特别是在直播间ღ◈◈,观众希望听到的不是生硬的朗诵或机械音ღ◈◈,而是一种如同真人主播般富有情绪ღ◈◈、节奏自然ღ◈◈、具备沟通张力的表达方式ღ◈◈。因此ღ◈◈,数字人语音的「人味儿」越足ღ◈◈,交互的真实感就越强ღ◈◈,用户的接受度和互动意愿也随之提高ღ◈◈。
然而ღ◈◈,传统的语音合成技术往往呈现出字正腔圆但缺乏情感的表达风格ღ◈◈,在充满情绪张力的直播场景中ღ◈◈,这种过于规整的声音反而显得「出戏」ღ◈◈。它无法像人类主播一样ღ◈◈,适时展现语调的抑扬顿挫ღ◈◈、节奏的快慢变化ღ◈◈,也很难根据商品介绍ღ◈◈、互动节奏等变化调整情绪状态ღ◈◈,尤其是在呼吁用户下单ღ◈◈、介绍爆款产品这类关键话术环节ღ◈◈,传统 TTS 无法自然表达出情绪递进和感染力ღ◈◈,进而影响整个数字人系统的说服力与亲和力ღ◈◈。
针对这些现实痛点ღ◈◈,百度提出了「文本自控的语音合成」方案ღ◈◈,在大语言模型输出剧本之后ღ◈◈,负责语音合成的大模型会结合文本内容ღ◈◈、主播风格特点校长也风流ღ◈◈,以及对于细粒度韵律特征表示进行统一处理ღ◈◈,这一过程中语音模型不仅知道「要说什么」ღ◈◈,更知道「要怎么说」ღ◈◈,从而在生成语音时自然带出情绪波动与语言节奏ღ◈◈,使得语音在内容和表达方式上都更贴近真实人类ღ◈◈。
例如ღ◈◈,在罗永浩数字人直播间中凯发手机娱乐app下载ღ◈◈,主播语音高度还原本尊的音色和语调ღ◈◈,甚至在直播节奏中展现出自然的停顿ღ◈◈、强调和情绪变化ღ◈◈。同时ღ◈◈,百度还解决了直播中双人互动的挑战ღ◈◈。现实中校长也风流ღ◈◈,主播之间的配合往往包括打断ღ◈◈、附和ღ◈◈、重复等高频行为ღ◈◈,这对语音合成提出了连贯性和互动性的更高要求ღ◈◈。为此ღ◈◈,百度引入了「对话上下文编码器」ღ◈◈,将历史对话与当前对话的信息进行语音合成时的统一推理计算ღ◈◈,以此实现「双人配合」的自然过渡ღ◈◈。
在数字人直播场景中ღ◈◈,形象生成与驱动是当前技术难度最高的环节ღ◈◈。首先必须解决多模协同的问题ღ◈◈,它涉及多向的信息对齐ღ◈◈:剧本对视频表达提出具体要求ღ◈◈,TTS 语音又对视频节奏与动作生成形成约束ღ◈◈,反过来视频本身还需对语音进行校准ღ◈◈,最终需要实现「音ღ◈◈、容ღ◈◈、话」三者的一致性ღ◈◈。
其次ღ◈◈,主播在直播中往往伴随着大量手势ღ◈◈、动作和表情等「高表现力动作」ღ◈◈,它们对于强化用户情绪感染力具有显著作用ღ◈◈,因此在视频生成阶段ღ◈◈,不仅要忠实复现语言内容ღ◈◈,还需对这些高表现力动作进行准确建模与流畅合成ღ◈◈。
在场景交互层面ღ◈◈,数字人直播还面临「人-物-场」自由交互的复杂性ღ◈◈。主播需要与商品ღ◈◈、背景和空间布局进行符合物理逻辑的互动ღ◈◈,例如望向商品ღ◈◈、举起物品或指向展示区等ღ◈◈。若缺乏对空间关系的精准理解ღ◈◈,极易出现穿模ღ◈◈、错位等破坏沉浸感的瑕疵ღ◈◈。
此外ღ◈◈,直播时长也放大了技术一致性的难题ღ◈◈。一场超 6 小时的直播凯发手机娱乐app下载ღ◈◈,任何人物形象的波动ღ◈◈、商品定位的误差以及动作风格的不一致都会直接拉低观众体验ღ◈◈。
为此ღ◈◈,百度提出了「高一致性超拟真数字人长视频生成」技术方案ღ◈◈,将历史视频数据ღ◈◈、剧本脚本ღ◈◈、语音信息以及骨骼驱动等多模态信号作为输入ღ◈◈,经过多模态视频分析与理解ღ◈◈,分别生成具有高表现力的片段ღ◈◈、复杂人 - 物 - 场交互片段以及大动作大表情片段ღ◈◈,并在长时序上进行统一调度ღ◈◈,从而保证语音ღ◈◈、口型凯发手机娱乐app下载ღ◈◈、表情与动作始终保持高度同步ღ◈◈,实现真正的「音ღ◈◈、容ღ◈◈、话一致」ღ◈◈。
在罗永浩数字人直播项目中校长也风流ღ◈◈,这一技术方案得到了集中体现校长也风流ღ◈◈。罗永浩与朱萧木均具强 IP 属性校长也风流ღ◈◈,二者的形象ღ◈◈、语言风格ღ◈◈、互动节奏都需得到高度还原ღ◈◈。同时ღ◈◈,整场直播中所涉及的商品种类繁多ღ◈◈,体积ღ◈◈、位置ღ◈◈、用途各异ღ◈◈,对人 - 物交互的精度和响应速度提出了更高要求ღ◈◈。百度对人物 ID 与商品 ID 进行了独立建模与保持ღ◈◈,使得系统能够在长时间内容中持续稳定地控制人物表现与商品指向ღ◈◈,避免风格漂移与交互误差ღ◈◈,最终实现主播间自然流畅的配合ღ◈◈,语言节奏ღ◈◈、动作执行和商品展示高度统一的效果凯发手机娱乐app下载ღ◈◈。
早在十四年前ღ◈◈,移动互联网正值爆发期ღ◈◈,「人工智能」仍是实验室里的晦涩概念ღ◈◈,百度就把资源投向了一个看不见回报的领域ღ◈◈,这一选择在当时显得颇为超前甚至「另类」ღ◈◈。
时间给出了答案ღ◈◈。ChatGPT 的横空出世掀起生成式 AI 浪潮ღ◈◈,百度紧跟每一个关键节点ღ◈◈,连续发布重磅大模型成果ღ◈◈:从文心 3.0 到文心大模型 4.5ღ◈◈,再到融入深度思考能力的 X1 以及升级版 4.5 Turboღ◈◈,技术体系不断进化ღ◈◈,模型的认知深度和生成能力日益增强校长也风流ღ◈◈。
此次罗永浩数字人带货直播ღ◈◈,正是文心大模型的一次「最佳实践」ღ◈◈。它不仅彰显了百度技术的成熟与前沿ღ◈◈,更验证了大模型技术在真实商业场景中的高效与可行ღ◈◈。
可以预见ღ◈◈,随着深度思考ღ◈◈、知识增强ღ◈◈、意图理解与多角色交互等关键能力持续跃升ღ◈◈,百度的数字人将愈发拟真与智能ღ◈◈。这带来的不仅是效率提升ღ◈◈,更意味着技术投入带来的商业模式的「无人区」探索和价值重构ღ◈◈。
总之ღ◈◈,为了使每一个学生在学校都能开心快乐的成长ღ◈◈,我们的教育离不开和家长您的沟通及合作ღ◈◈,让我们共同担负起教育下一代的重任ღ◈◈,让孩子健康向上茁壮成长ღ◈◈。
一声莽牛咆哮ღ◈◈,声传上百里ღ◈◈,离火冲天ღ◈◈,一头赤红如血的巨牛ღ◈◈,高达十几米ღ◈◈,长达三十米ღ◈◈,自一座裂开的大山中冲出ღ◈◈,带着岩浆ღ◈◈,裹着火光ღ◈◈。
06月13日,福建三明迎来2024年首场降雪 当地高速部门保通保畅,工商信用卡逾期几天算逾期?逾期了怎么跟银行协商解决?,bobber官网,优信彩票计划,威尼斯人线日,用情绪价值赢得顾客“芳心”,
dz新闻信息服务许可证音像制品出版许可证广播电视节目制作经营许可证网络视听许可证网络文化经营许可证