思必驰情感语音合成“以声传情”,让机器人表达更有温度
当我们回到家,智能管家会热情地欢迎你回家。
智能管家愉悦的声音和贴心的操作,让我们缓解情绪,享受24h拥有热水的家。
在人机沟通中,“高兴、撒娇、抱歉”等各种带有情感色彩的音色为机器人的情感表达赋予了更多活力,提升了人机交互体验。
基于深度学习技术和定制情感录音,思必驰发音人音色定制平台不仅能快速定制音色,更能合成高音质、多情感的音色,可呈现“高兴、抱歉、撒娇、中性”等多种情感声音,在韵律表现、声音层次感、情感表达等方面做到更加接近真人情感化表达的语音效果。
语音传情,思必驰打造多情感音色
音色是指不同声音表现在波形方面有与众不同的特性,不同的发声体由于其材料、结构不同,则发出声音的音色也不同。例如钢琴、小提琴和人发出的声音不一样,每一个人发出的声音也不一样。因此,音色也就是声音的特征。
人类的音色与机械音色不同的是,人类音色中更多的是含有高兴、抱歉、中性、撒娇等多种情感音色,能更精准的传达情绪。在智能语音应用普及的时代,平铺直叙式的合成语音已经不能满足场景需求,为机器合成音色注入情感成为人机沟通必不可少的一环。
思必驰发音人音色定制平台可高度模拟发音人的音色、韵律和停顿习惯,定制出高兴、抱歉、中性、撒娇等情感丰富的音色,满足人机交互、有声阅读、智能客服、语音助手、热门IP、新闻播报等场景的音色需求。用户仅需上传少量数据即可定制,简单快捷无技术门槛,普通用户也可快速定制专属音色。
例如,在智能客服场景中,面对顾客投诉反馈意见时,智能客服需要模仿人类的情绪,发出抱歉的情感音色来表达对顾客的歉意。
在有声阅读中,情绪的波动转折更加丰富,需要根据故事情节的发展表达不同情感,有表达愉悦的高兴音色、也有撒娇等音色。
在天气播报中,需要正式且亲和,情感含蓄的中性音色。
思必驰打造的情感音色,具有以下特色:
多情绪风格
覆盖“高兴、抱歉、中性、撒娇”等多个维度的情感音色表达,满足不同场景的合成需求;
音色可定制化
可根据企业客户不同定制需求,选择定制特定音色、特定情感;
音质更真实自然
合成的情感音色在情绪上富有表现力,更接近真人的韵律、情感,真实流畅,可进行高度拟人化的情感表达;
应用场景丰富
可应用在有声阅读、智能客服、语音助手、视频配音等多行业场景,提高人机交互体验,让互动充满乐趣。
背靠DUI平台,技能满格
经过多年的技术积累沉淀,思必驰已逐步形成了一套成熟的技术方案,语音合成服务已在车载、家电、智能客服等多个领域成功落地,为众多产品赋予了说话的能力。
在语音合成领域,此前已上线“声音复刻”服务,该服务支持男声、女声、童声的复刻,支持中、英文文本。
音色合成、声音复刻等各种个性化的赋能离不开思必驰DUI开放平台的支撑。思必驰DUI开放平台是为设备赋能语音交互场景的开发配置平台。语音交互过程涉及从声音采集、前端信号处理、语音唤醒、语音识别、语义理解、智能对话、资源调用、回复内容生成、动作执行、合成音播报的主要环节,思必驰DUI系统支持全链路语音技术使用,也支持单点技术应用,如语音唤醒、语音识别的单独使用或一两个联合使用。
去年,思必驰上线DUI标注训练一体化平台,提供数据标注-模型优化-测试评估-服务部署完整链路语音识别自主优化能力,支持私有化部署,协助企业在短期内实现识别效果“不可用->可用”的提升,实现快速更新响应,持续提升场景识别效果。
近期,思必驰即将上线语音识别自训练2.0版本,在功能、技术上做了进一步升级。未来,思必驰将持续推出创新服务,加快AI技术的场景落地能力,敬请期待!