全部

基于BiLSTM-CRF的中医医案命名实体识别

基于BiLSTM-CRF的中医医案命名实体识别

艳玲
昕妤
丽娜
中医药信息第38卷, 第11期pp.15-21纸质出版 2021-11
85900

目的:

针对中医医案中分词困难及实体种类繁多、歧义等难点,提出基于双向长短期记忆(BiLSTM)网络和条件随机场(CRF)的深度学习混合模型命名实体识别方法。

方法:

基于人工标注的名老中医诊断高血压医案构建BiLSTM-CRF模型进行命名实体识别,根据深度学习模型特点,该模型使用BiLSTM作为特征提取器,使用CRF进行序列标注,通过对语料集进行标注,对医案中疾病、症状、证候、治法和处方五类实体进行命名实体类别识别。

结果:

对整理的435份医案进行序列标注,基于向量构建从而进行命名实体类别识别。经过增加轮次后,综合测试实验结果精确率为81.3%,准确率达到90.13%;在各类别识别中,疾病精确率为73.87%,症状精确率为75.93%,证候精确率为72.33%,治法精确率为68.13%,处方精确率最高达到89.15%。

结论:

利用BiLSTM-CRF模型能够有效实现中医医案命名实体类别识别,有效提高了中医医案的实体识别准确率,为临床诊断提供有效数据支持。

BiLSTM-CRF模型命名实体识别中医医案信息抽取