您当前的位置: 首页 > 论文 > 2022,53(02) > 第九届中国计算机学会大数据学术会议论文选登
基金项目:
国家自然科学基金面上资助项目(62076006);安徽省自然科学基金面上资助项目(1908085MF189);安徽高校协同创新资助项目(GXXT-2021-008);安徽省重点研发计划国际科技合作专项资助(202004611020029)
分类号:
TP391
DOI:
10.16355/j.cnki.issn1007-9432tyut.2022.02.006
期刊号:
2022,53(02)
收稿日期:
修回日期:
通讯作者 | 单位 |
张顺香 | 安徽理工大学计算机科学与工程学院 |
摘要:
针对传统的属性词抽取模型难以有效抽取隐式属性词,导致属性词抽取不完整的问题,提出了一种基于截断历史注意力机制的商品评论属性词抽取框架THA-BiLSTM-CRF.首先,利用CBOW模型预处理文本,获得包含语义信息的词向量;然后,通过BiLSTM模型抽取文本特征;接着,引入截断历史注意力机制,建立包含属性词和单词间映射关系的词库,获取单词间的隐式关系;最后,通过CRF算法抽取隐式属性词。实验结果表明,该框架可以有效抽取隐式属性词,提高了属性词抽取的完整度。
关键字:
商品评论;属性词抽取;截断历史注意力机制;BiLSTM-CRF;