当前位置:主页 > 文艺论文 > 器乐论文 >

基于改进卷积神经网络与听觉谱图的乐器识别

发布时间:2021-12-31 17:54
  针对传统乐器识别需要音乐的低级声频特征及识别性能依赖特征选取的问题,利用接近人耳感知且低冗余度的听觉谱图作为5层深度卷积网络的输入,逐层抽象出音色的高级时频表示用于乐器识别。为有效捕获听觉谱图中的时频信息,将卷积网络第1层矩形卷积核改进为频率、时间轴上的多尺度卷积核。在IOWA乐器库上进行的仿真实验结果表明,该神经网能获得96. 95%的识别准确率,优于使用单一卷积核的神经网,在相同的网络结构下,基于听觉谱图得到的识别准确率较基于梅尔频率倒谱系数(MFCC)、语谱图分别高出9. 11%、3. 54%,且对打击乐器与同族乐器的错分率均较小。 

【文章来源】:计算机工程. 2019,45(01)北大核心CSCD

【文章页数】:7 页

【文章目录】:
0概述
1 基本原理
    1.1 听觉谱图
    1.2 CNN
    1.3 多尺度卷积核
2 实现步骤
3 仿真实验与结果分析
    3.1 多尺度卷积核评价
    3.2 CNN评价
    3.3 深度混合神经网络输入特征的评价
4 结束语


【参考文献】:
期刊论文
[1]一种改进的小波能量熵语音端点检测算法[J]. 李乐,王玉英,李小霞.  计算机工程. 2017(05)



本文编号:3560708

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/qiyueyz/3560708.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户dab32***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com