朝鲜语语音音节自动切分算法的研究

摘要:针对目前语音语料人工标注效率低的问题,提出了一种朝鲜语连续语音语料的音节自动切分方法.该方法首先采用Seneff听觉模型提取音频的包络检测响应和广义同步检测响应等特征参数,其次结合朝鲜语发音特点确定音节的候选边界位置,最后通过静音段和摩擦音检测消除虚假边界,以提高边界检测的准确率.实验结果表明,该朝鲜语语音语料音节自动切分方法的准确率(93.56%)比传统的基于Seneff听觉模型的分割算法提高了14.59%,召回率(86.43%)比传统的基于Seneff听觉模型的分割算法降低了1.69%;因此,本文算法总体优于传统的基于Seneff听觉模型的分割算法.

关键词:
  • 朝鲜语语音语料  
  • 语料自动标注  
  • seneff听觉模型  
  • 语音音节分割  
作者:
李洺宇; 金小峰
单位:
延边大学工学院; 吉林延吉133002
刊名:
延边大学学报·自然科学版

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

延边大学学报·自然科学版紧跟学术前沿,紧贴读者,国内刊号为:22-1191/N。坚持指导性与实用性相结合的原则,创办于1962年,杂志在全国同类期刊中发行数量名列前茅。