• 1. 中國醫學科學院/北京協和醫學院醫學信息研究所(北京 100020);
  • 2. 哈爾濱工程大學青島創新發展基地(山東青島 266000);
導出 下載 收藏 掃碼 引用

目的 目前醫學量表資源的加工與組織多集中在文檔層面,不利于用戶從條目層面進行檢索與復用。本文旨在提出一種低資源場景下的醫學量表條目多分類方法,支持細粒度醫學量表資源組織與服務。方法 采用一種基于預訓練語言模型BERT的提示學習分類方法來實現醫學量表條目文本的多分類。首先收集肺癌臨床評估量表,提取功能、領域分類標簽,采用人工標注“功能-領域”組合標簽形成肺癌臨床評估條目小樣本語料集;然后采用提示學習方法,通過將自定義構建的模板格式輸入BERT模型,對模板空缺位置進行預測填充;最后將填充文本映射到標簽,實現對醫學量表中條目文本的多分類。結果 構建的語料包含肺癌臨床評估條目347條,涉及“功能-領域”分類標簽9個;在自制的語料集上,提出的多分類方法的平均準確率達到93%,比次優的GAN-BERT模型性能提高約6%。結論 基于預訓練語言模型BERT的提示學習分類方法能夠在減少醫學量表條目語料構建成本的同時保持較優的性能,在醫學量表條目分類研究與實踐中具有推廣價值。

引用本文: 郝潔, 彭慶龍, 叢山, 李姣, 孫海霞. 基于提示學習的醫學量表問題文本多分類研究. 中國循證醫學雜志, 2024, 24(1): 76-82. doi: 10.7507/1672-2531.202307139 復制

版權信息: ?四川大學華西醫院華西期刊社《中國循證醫學雜志》版權所有,未經授權不得轉載、改編

  • 上一篇

    基于PMC指數模型的我國體醫融合政策量化評價研究
  • 下一篇

    貝葉斯分位數回歸在臨床醫學數據分析的應用與R Studio實踐