手机版 | 登陆 | 注册 | 留言 | 设首页 | 加收藏
当前位置: 网站首页 > 概念普及 > 文章 当前位置: 概念普及 > 文章

语音识别、声纹识别的区别及测试

时间:2019-11-16    点击: 次    来源:网络    作者:佚名 - 小 + 大

https://blog.csdn.net/alice_tl/article/details/82319781

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/alice_tl/article/details/82319781
 

很多除接触AI的小伙伴, 不清楚语音识别和声纹识别的区别,经常混淆概念,以为语音识别、声纹识别、语义识别是同一回事,其实不然。这篇文章主要为小伙伴普及一下这三者的区别, 并且分别讲一讲如何测试。

 

语音识别、声纹识别、语义识别的区别
声纹识别和语音识别在原理上一样,都是通过对采集到的语音信号进行分析和处理,提取相应的特征或建立相应的模型,然后据此做出判断。但二者的根本目的,提取的特征、建立的模型是不一样的。

语音识别的目的:识别语音的内容。并以电脑自动将人类的语音内容转换为相应的文字。

声纹识别的目的:识别说话人的身份。又称说话人识别,是生物识别技术的一种。

语义识别的目的:对语音识别出来的内容进行语义理解和纠正。比如同声翻译机。

 

声纹识别,是通过语音波形中反映说话人生理和行为特征的语音参数,进而连接到声纹库,一般式公安部声纹数据库,鉴别人的身份。所承载的功能特点和人脸识别是一样的,都是为了证明,“你是张三,还是李四”。

因此,声纹识别不注重语音信号的语义,而是从语音信号中提取个人声纹特征,挖掘出包含在语音信号中的个性因素。

而语音识别是从不同人的词语信号中寻找共同因素。

 

关于语音识别和声纹识别的测试重点分析
语音识别已经是比较成熟,测试的重点是声音的录入、及内容的识别准确性。

对声音的录入,也叫拾音而言:

1、录入时的声源、环境影响、距离影响

2、讲话人的语速、音量、音色等(通过对几家语音识别的开放demo进行评测后,发现女声的语音识别准确度要高过于男声)

对于识别的内容准确性而言,要考虑:

1、语种的覆盖,中文普通话、方言等,英文以及其他的外语等

2、语音的内容覆盖日常对话、衣食住行、新闻资讯等等

3、词库的涵盖,比如出了通用词库,是否包含了应用场景比如金融、法律、医疗对应领域的词库训练

4、不标准的发音和吐词等





 


声纹识别的测试

常见的声纹识别有固定数字、随机数字、固定文本和随机文本,以及其他的衍生等等。

不同于人类的双耳,机器的识别都是在数以百万、千万计的数据训练中不断改善的,如果没有足够的数据支持, 不能全方位的对声纹识别算法进行训练。

理论上来讲,声纹就像指纹一样,很少会有两个人具有相同的声纹特征。但比如双胞胎、亲属等,均可能存在极其相似的声音特征。另外说话环境、说话人身体健康状况、情绪变化等都能对声纹识别的结果造成极大影响。

因此声纹识别的重点在于是否能够轻易的被相似特征的声音攻击。
————————————————
版权声明:本文为CSDN博主「alice_tl」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/alice_tl/article/details/82319781

上一篇:听黄奇帆讲“区块链”  来源: 中国经济周刊

下一篇:没有了

友情链接
备案ICP编号  |   地址:宁波  |  版权:宁波市镇海九弟新媒体设计有限公司  |  电话:13958201172  |  
Copyright © 2019 天人文章管理系统 版权所有,授权chinachains.org使用 Powered by 55TR.COM