国产bbaaaaa片,成年美女黄网站色视频免费,成年黄大片,а天堂中文最新一区二区三区,成人精品视频一区二区三区尤物

基于CNN-BLSTM-CRF模型的生物醫(yī)學(xué)命名實(shí)體識(shí)別

摘要

命名實(shí)體識(shí)別是自然語(yǔ)言處理任務(wù)的重要步驟.近年來(lái),不依賴人工特征的神經(jīng)網(wǎng)絡(luò)在新聞等通用領(lǐng)域命名實(shí)體識(shí)別方面表現(xiàn)了很好的性能.然而在生物醫(yī)學(xué)領(lǐng)域,許多實(shí)驗(yàn)表明基于領(lǐng)域知識(shí)的人工特征對(duì)于神經(jīng)網(wǎng)絡(luò)模型的結(jié)果影響很大.因此,如何在不依賴人工特征的情況下獲得較好的生物醫(yī)學(xué)命名實(shí)體識(shí)別性能是有待解決的問(wèn)題.本文提出一種基于CNN-BLSTM-CRF的神經(jīng)網(wǎng)絡(luò)模型.首先利用卷積神經(jīng)網(wǎng)絡(luò)(CNN)訓(xùn)練出單詞的具有形態(tài)特征的字符級(jí)向量,并從大規(guī)模背景語(yǔ)料訓(xùn)練得到具有語(yǔ)義特征信息的詞向量,然后將二者進(jìn)行組合作為輸入,再構(gòu)建適合生物醫(yī)學(xué)命名實(shí)體識(shí)別的BLSTM-CRF深層神經(jīng)網(wǎng)絡(luò)模型.實(shí)驗(yàn)結(jié)果表明,不依賴任何人工特征,本文方法在BiocreativeⅡGM和JNLPBA2004生物醫(yī)學(xué)語(yǔ)料上都達(dá)到了目前最好的結(jié)果,F-值分別為89.09%和74.40%.

相似文獻(xiàn)

  • 中文文獻(xiàn)
  • 外文文獻(xiàn)
  • 專利
獲取原文

客服郵箱:kefu@zhangqiaokeyan.com

京公網(wǎng)安備:11010802029741號(hào) ICP備案號(hào):京ICP備15016152號(hào)-6 六維聯(lián)合信息科技 (北京) 有限公司?版權(quán)所有
  • 客服微信

  • 服務(wù)號(hào)