y567788永利备用网站-yw99996 can

淘宝曝光虚拟主播 声音样本采自马云、高晓松
2020-09-01 18:45 编辑:李立 来源:y567788永利备用网站

本报记者 李立 上海报道

淘宝直播在最近一次内部分享会上曝光了虚拟主播,这个由阿里达摩院直接支撑的项目从今年年初秘密启动。

从曝光样本看,虚拟主播Bonne在主播休息时独立上岗,可以进行商品播报,为用户提供24小时智能货品推荐和1对1的在线服务。

“不管碰到什么问题,智能主播都可以在直播中给消费者解答,帮助主播和粉丝更好互动,”淘宝直播产品负责人岱妍告诉《中国经营报》记者,研制虚拟主播有两层目的,一是帮主播在休息时值班,做粉丝运营;二是在直播过程中,帮主播去完成一些没有办法及时完成的随时应答和粉丝互动,起辅助作用。

马云、矮大紧变声主播?

虚拟主播将不再是冷冰冰的机器,会和主播的个性化做强匹配,有独立的人设、独特的说话方式和声线,包括丰富的表情。短发、活泼,说话时大眼睛忽闪忽闪的虚拟主播Bonne,原型就是岱妍本人。

岱妍向记者透露,当时“抠”这个形象的初衷就是想让产品经理自己上阵,亲自体会怎么做主播怎么为粉丝提供更好的服务。

虚拟主播的开发是人工智能场景中非常复杂的应用之一,淘宝内部相关负责人告诉记者,淘宝直播背后站的是达摩院和顶级科学家,这个今年才开始的项目最根本的目的是帮助商家提效,阿里会在这个技术层面上持续投入,这也会是淘宝直播和其他直播平台的重要区别之一。

“主要的技术挑战来自两个层面,”alibaba达摩院资深算法专家陈海青先容,“第一个是人物表现力,怎么去结合多模态的信息去做人物表现力,比如嘴型、表情和肢体的驱动,同时涉及到大量的数据、以及大量的群体模型的数据搜集。

二是声音表现力,基于场景化的声音怎么能做到更好的表现力。剧本和商品挑战也很大,即便今天有大量的商品和详情页的数据,但是遇到‘双11’这样的重要节点,大家的技术还只具备小样本数据下的工作和能力。”陈海青说。

“在主播的人物驱动上,个性化TTS(人类语音用人工合成的方式产生)是很重要的一环。”据陈海青透露,很重要的一个重点在于目标说话人少且质量差,带有噪音混响,快速还原难度就很大。不过现在已经可以做到手机录音20句,90%的还原度,在半小时内完成构建。

记者发现声音采集样本中,收录了马云、逍遥子、高晓松(花名矮大紧)、周冬雨等人的声音样本,根据录音样本可以让马云、高晓松的声音出现在更多的场景里,比如让马云直播带货先容商品,高晓松直接开口飙英文都可以实现。

在人物驱动上,虚拟主播还在追求更细节的处理。经过数据对比发现,不同的语气、口头禅都会对直播带货产生不同影响,比如主播一开口套用了李佳琦的句式,“OMG,今年的大促活动也太划算了吧”,对商品的形容更具体生动“emm壳很酥脆,夹心也是入口即化哦”,带货的效率和转化率都会明显提升。

3.jpg

* 除《中国经营报》署名文章外,其他文章为编辑独立观点,不代表y567788永利备用网站立场。

* 未经本网授权,任何单位及个人不得转载、摘编或以其它方式使用上述作品,违者将被追究法律责任。

* 凡本网注明“来源:y567788永利备用网站” 或“来源:中国经营报-y567788永利备用网站”的所有作品,版权均属于y567788永利备用网站(本网另有声明的除外)。

* 如因作品内容、版权和其它问题需要同本网联系的,请在30日内进行。

* 有关作品版权事宜请联系:010-88890046 邮箱:banquan@cbnet.com.cn

y567788永利备用网站|yw99996 can

XML 地图 | Sitemap 地图