基于自注意力机制的冗长商品名称精简方法

摘要:大部分电子商务网站为了吸引用户的关注,通常将商品的很多属性也纳入到商品名称中,使得商品名称中包括了冗余的信息,并产生不一致性.为解决这一的问题,提出了一个基于自注意力机制的商品名称精简模型,并针对自注意力机制网络无法直接捕捉商品名称序列特征的问题,利用门控循环单元的时序特性对自注意力机制进行了时序增强,以较小的计算代价换取了商品命名精简任务整体性能的提升.在公开商品短标题数据集LESD4EC的基础上,构造了商品名称精简数据集LESD4EC_L和LESD4EC_S,并进行了模型验证.一系列的实验结果表明本,所提出的自注意力机制冗长商品名称精简方法相对于其他商品名称精简方法在效果上有较大的提升.

关键词:
  • 自注意力机制  
  • 商品名称精简  
  • 门控循环单元  
作者:
傅裕; 李优; 林煜明; 周娅
单位:
桂林电子科技大学广西可信软件重点实验室; 广西桂林541004
刊名:
华东师范大学学报·哲学社会科学版

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

华东师范大学学报·哲学社会科学版紧跟学术前沿,紧贴读者,国内刊号为:31-1010/C。坚持指导性与实用性相结合的原则,创办于1953年,杂志在全国同类期刊中发行数量名列前茅。