Development of a Respiratory Sound Labeling Software for Training a Deep Learning-Based Respiratory Sound Analysis Model,arXiv - CS - Sound

当前位置： X-MOL 学术 › arXiv.cs.SD › 论文详情

Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)

Development of a Respiratory Sound Labeling Software for Training a Deep Learning-Based Respiratory Sound Analysis Model
arXiv - CS - Sound Pub Date : 2021-01-05 , DOI: arxiv-2101.01352
Fu-Shun Hsu, Chao-Jung Huang, Chen-Yi Kuo, Shang-Ran Huang, Yuan-Ren Cheng, Jia-Horng Wang, Yi-Lin Wu, Tzu-Ling Tzeng, Feipei Lai

Respiratory auscultation can help healthcare professionals detect abnormal respiratory conditions if adventitious lung sounds are heard. The state-of-the-art artificial intelligence technologies based on deep learning show great potential in the development of automated respiratory sound analysis. To train a deep learning-based model, a huge number of accurate labels of normal breath sounds and adventitious sounds are needed. In this paper, we demonstrate the work of developing a respiratory sound labeling software to help annotators identify and label the inhalation, exhalation, and adventitious respiratory sound more accurately and quickly. Our labeling software integrates six features from MATLAB Audio Labeler, and one commercial audio editor, RX7. As of October, 2019, we have labeled 9,765 15-second-long audio files of breathing lung sounds, and accrued 34,095 inhalation labels,18,349 exhalation labels, 13,883 continuous adventitious sounds (CASs) labels and 15,606 discontinuous adventitious sounds (DASs) labels, which are significantly larger than previously published studies. The trained convolutional recurrent neural networks based on these labels showed good performance with F1-scores of 86.0% on inhalation event detection, 51.6% on CASs event detection and 71.4% on DASs event detection. In conclusion, our results show that our proposed respiratory sound labeling software could easily pre-define a label, perform one-click labeling, and overall facilitate the process of accurately labeling. This software helps develop deep learning-based models that require a huge amount of labeled acoustic data.

中文翻译：

呼吸声标签软件的开发，用于训练基于深度学习的呼吸声分析模型

如果听到不定肺音，呼吸听诊可以帮助医护人员发现异常呼吸状况。基于深度学习的最先进的人工智能技术在自动呼吸声分析的开发中显示出巨大的潜力。为了训练基于深度学习的模型，需要大量准确的正常呼吸声和不定声音的标签。在本文中，我们演示了开发呼吸音标签软件的工作，该软件可帮助注释者更准确，更快速地识别和标记吸入，呼出和不定呼吸音。我们的标签软件集成了MATLAB Audio Labeler的六个功能和一个商用音频编辑器RX7。截至2019年10月，我们已将9,765个15秒长的呼吸肺部音频文件标记为并获得了34,095个吸入标签，18,349个呼出标签，13,883个连续不定声音（CAS）标签和15,606个不连续不定声音（DAS）标签，这比以前发表的研究大得多。基于这些标签的经过训练的卷积循环神经网络表现出良好的性能，其中F1分数在吸入事件检测中为86.0％，在CASs事件检测中为51.6％，在DASs事件检测中为71.4％。总之，我们的结果表明，我们提出的呼吸声音标记软件可以轻松地预定义标签，执行一键式标记，并在整体上促进准确标记的过程。该软件有助于开发基于深度学习的模型，这些模型需要大量的标记声学数据。883个连续不定声音（CAS）标签和15,606个不连续不定声音（DAS）标签，比以前发表的研究大得多。基于这些标签的经过训练的卷积循环神经网络表现出良好的性能，其中F1分数在吸入事件检测中为86.0％，在CASs事件检测中为51.6％，在DASs事件检测中为71.4％。总之，我们的结果表明，我们提出的呼吸声音标记软件可以轻松地预定义标签，执行一键式标记，并在整体上促进准确标记的过程。该软件有助于开发基于深度学习的模型，这些模型需要大量的标记声学数据。883个连续不定声音（CAS）标签和15,606个不连续不定声音（DAS）标签，比以前发表的研究大得多。基于这些标签的经过训练的卷积循环神经网络表现出良好的性能，其中F1分数在吸入事件检测中为86.0％，在CASs事件检测中为51.6％，在DASs事件检测中为71.4％。总之，我们的结果表明，我们提出的呼吸声音标记软件可以轻松地预定义标签，执行一键式标记，并在整体上促进准确标记的过程。该软件有助于开发基于深度学习的模型，这些模型需要大量的标记声学数据。基于这些标签的经过训练的卷积循环神经网络表现出良好的性能，其中F1分数在吸入事件检测中为86.0％，在CASs事件检测中为51.6％，在DASs事件检测中为71.4％。总之，我们的结果表明，我们提出的呼吸声音标记软件可以轻松地预定义标签，执行一键式标记，并在整体上促进准确标记的过程。该软件有助于开发基于深度学习的模型，这些模型需要大量的标记声学数据。基于这些标签的经过训练的卷积循环神经网络表现出良好的性能，其中F1分数在吸入事件检测中为86.0％，在CASs事件检测中为51.6％，在DASs事件检测中为71.4％。总之，我们的结果表明，我们提出的呼吸声音标记软件可以轻松地预定义标签，执行一键式标记，并在整体上促进准确标记的过程。该软件有助于开发基于深度学习的模型，这些模型需要大量的标记声学数据。我们的结果表明，我们提出的呼吸声音标记软件可以轻松地预定义标签，执行一键式标记，并在整体上促进准确标记的过程。该软件有助于开发基于深度学习的模型，这些模型需要大量的标记声学数据。我们的结果表明，我们提出的呼吸声音标记软件可以轻松地预定义标签，执行一键式标记，并在整体上促进准确标记的过程。该软件有助于开发基于深度学习的模型，这些模型需要大量的标记声学数据。

更新日期：2021-01-06

点击分享查看原文

点击收藏

阅读更多本刊最新论文