以“以共商促共享 以善治促善智”为主题的2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC)于7月4日-7日在上海举行。从本届大会的参展情况看,今年的参展企业更注重AI、大模型等技术的场景应用落地展示。作为数字人行业的头部企业,相芯科技携全品类数字人产品及行业垂直解决方案亮相上海世博展览馆H1馆,集中展示数字人这一“新质生产力”的应用成果。
相芯科技前不久推出的业内首个大模型驱动的数字人直播产品——AI数字人直播(标准版)也首次亮相世界人工智能大会,吸引了众多参展观众驻足体验。有参展观众表示,从直播间的直播展示来看,通过接入大模型,数字人主播确实更接近一个鲜活灵动的“真人”,“不仔细看还以为是真人主播,直播表现很自然,回答又准确又流畅!”
基于大模型,相芯数字人主播可以自动消化和理解商品信息,将商品卖点以更口语、更有节奏的直播方式表达出来,自动引导用户下单,具备了更强的“导购售卖”能力。同时,相芯数字人主播还具备更接近真人电商主播的控场能力,无论是用户关于物流、优惠活动等标准化问题,还是用户的个性化推荐、互动闲聊等需求,数字人主播都可以迅速作出准确反应。
值得一提的是,在直播效果实现数量级提升的背后,是直播前准备工作的大大减少,不需要提前准备详尽的用户问答库,仅需“一键投喂”基本的商品信息,数字人主播就能自动完成学习、理解和输出,并在直播中,根据用户的反馈,及时生成回答内容,让回答更准确自然的同时还将大大降低商家的投入成本。
事实上,相芯科技一直在朝着让数字人“可用、易用、好用”的目标推进,为各行业打造真正的“新质生产力”。特别是在大模型等技术出现后,相芯科技更是不断探索“数字人+大模型”的更多可能性。在相芯看来,当下人工智能技术正从“感知智能”走向“认知智能”,感知智能是指AI可以像人一样听、说、看、认;认知智能则是指AI对人类语言的理解、思考和决策能力。相芯的目标是让数字人具备感知和认知能力,通过数字人将AI的感知和认知能力具象化,以数字人智能体的方式呈现,让人与AI的交流像人与人之间的交流一样自然,使AI成为有力的行业生产力工具,实现降本增效。
回到当下,2024年无疑是大模型、AIGC等技术加速商业落地的开端,企业更需要聚焦于垂直细分场景,基于行业专有数据和用户场景形成的数据闭环,持续优化行业独立大模型,构建自身的行业竞争壁垒。基于这一点,相芯正在不断推动AIGC、大模型等技术与数字人结合,加速行业应用落地。
一方面,相芯将AIGC技术应用于数字人的创建和驱动,实现降本增效。例如,通过AIGC技术,2D数字人的创建时间从几小时的视频素材缩短至30秒,大大降低了创建成本。同时,AIGC技术让数字人的动作、表情和声音更加灵动自然,接近真人效果。目前,相芯的视频数字人仅需输入文字或语音即可自动驱动,无需网络,仅靠手机本身的算力即可完成,具备高适配性,在本届世界人工智能大会上,相芯视频数字人就成为了焦点之一,吸引了众多参展观众体验。
另一方面,相芯正深入探索大模型等技术应用的可控性,利用海量垂直行业数据不断优化大模型,提升数字人主播的回复准确率和自然度,帮助商家进一步降本增效。如相芯AI数字人直播(标准版)就是基于相芯在电商行业的数据积累,优化出适用于电商直播行业大模型,让数字人直播互动实现AI全接管,无需大量预设,数字人主播也能自动准确回复。
如今,相芯已形成了包含卡通数字人、视频数字人、超写实数字人、仿真数字人、全真数字人在内的全品类数字人产品,并已经合作2000+客户,覆盖全球200+个国家和地区,涉及电商、手机、汽车、金融、互娱等二十多个行业。通过积累的海量垂直行业数据,相芯正在不断打造更智能、更可控的数字人行业解决方案。此次亮相2024世界人工智能大会,是相芯探索“数字人+大模型”的阶段成果展示,也打开了数字人+大模型的广阔应用图景。