博客
关于我
LiveVideoStack线上分享第五季(十四):情感合成,让语音交互效果更加“声入人心”...
阅读量:206 次
发布时间:2019-02-28

本文共 596 字,大约阅读时间需要 1 分钟。

语音合成技术已进入人们的日常生活:有声阅读、智能客服、智能家居等场景都已经出现了“它”的身影。

声音的可用性,可以通过自然度、可懂度、识别度等维度来考量。语音技术的进步,让机器合成的声音不再顿挫、冰冷,在自然度和可懂度等方面取得了不错的成绩,但当前合成效果在合成音的表现力上,特别是语气和情感方面,还存在不足。声音如果缺少情感,何谈表现力 ,又如何能提高用户交互的意愿?

今晚 7:30LiveVideoStack线上分享第五季,第十四期,我们邀请到了 标贝科技联合创始人兼CTO 李秀林 分享语音合成技术的发展,介绍如何进一步提高语音合成的表现力,让合成语音能够模拟表达说话人的情感状态,展望情感合成技术的未来发展趋势。

嘉宾简介

李秀林,标贝科技 联合创始人兼CTO

中国科学院声学所博士, 15年以上语音相关技术研发和学术研究,拥有个人语音专利30余项;曾就职于滴滴、百度等企业,担任语音相关业务负责人。

关于LiveVideoStack线上交流分享

为了给大家提供一个学习,交流的平台,畅聊音视频技术开发新趋势,新实践。我们推出了LiveVideoStack线上交流分享活动,邀请业内资深技术专家进行线上分享技术干货,解答热点问题。你可以通过以下方式参与:

  • 扫描图中二维码关注LiveVideoStack公众号【livevideostack

  • 回复“分享”,即可获得进入直播群的方式

转载地址:http://nmkp.baihongyu.com/

你可能感兴趣的文章
NISP国家信息安全水平考试,收藏这一篇就够了
查看>>
NIS服务器的配置过程
查看>>
NIS认证管理域中的用户
查看>>
Nitrux 3.8 发布!性能全面提升,带来非凡体验
查看>>
NiuShop开源商城系统 SQL注入漏洞复现
查看>>
NI笔试——大数加法
查看>>
NLog 自定义字段 写入 oracle
查看>>
NLog类库使用探索——详解配置
查看>>
NLP 基于kashgari和BERT实现中文命名实体识别(NER)
查看>>
NLP 模型中的偏差和公平性检测
查看>>
Vue3.0 性能提升主要是通过哪几方面体现的?
查看>>
NLP 项目:维基百科文章爬虫和分类【01】 - 语料库阅读器
查看>>
NLP_什么是统计语言模型_条件概率的链式法则_n元统计语言模型_马尔科夫链_数据稀疏(出现了词库中没有的词)_统计语言模型的平滑策略---人工智能工作笔记0035
查看>>
NLP、CV 很难入门?IBM 数据科学家带你梳理
查看>>
NLP三大特征抽取器:CNN、RNN与Transformer全面解析
查看>>
NLP入门(六)pyltp的介绍与使用
查看>>
NLP学习笔记:使用 Python 进行NLTK
查看>>
NLP度量指标BELU真的完美么?
查看>>
NLP的不同研究领域和最新发展的概述
查看>>
NLP的神经网络训练的新模式
查看>>