• 1. 中國醫學科學院北京協和醫院 胸外科(北京 100010);
  • 2. 中國醫學科學院北京協和醫院 信息中心 (北京 100010);
導出 下載 收藏 掃碼 引用

目的 采用人工智能技術對臨床數據進行結構化和標準化,構建基于人工智能的肺癌數據庫,支持肺癌診治中的大數據深度挖掘,為多樣化的真實世界研究提供高質量的數據支持。方法  依托北京協和醫院胸外科豐富的臨床數據資源,本研究利用機器學習技術,特別是自然語言處理技術,對電子病歷、檢查報告、病理報告等非結構化數據進行自動化處理,轉化為結構化信息。同時,采用數據治理和自動化清洗技術,確保數據的完整性和一致性。結果  截至2024年9月,數據庫共收錄了18 811例患者的數據,涵蓋住院和門診病歷、檢驗檢查報告、病理報告、醫囑信息以及隨訪信息,形成了結構完整、變量豐富的多維數據系統。數據庫的實時查詢和多層次篩選功能使研究人員能夠快速獲取符合特定條件的研究數據,大幅提升了數據處理效率和研究進程。在非小細胞肺癌預后探究的真實世界應用舉例中,通過數據庫實現了對預后影響因素的快速分析。研究表明,腫瘤分期、合并癥情況等因素顯著影響患者生存率。這一應用實例展示了數據庫臨床大數據挖掘應用中的價值。結論  基于人工智能的肺癌數據庫顯著提升了數據管理和分析的整體效率,為臨床大規模研究、回顧性分析以及疾病管理提供了堅實的數據支持。隨著大語言模型和多模態方法進一步應用于臨床,該數據庫的精確性和分析深度將持續增強,為肺癌大數據挖掘及真實世界研究提供更強有力的支撐。

引用本文: 楊麗冰, 郭超, 姜會珍, 馬璉, 李單青. 人工智能輔助肺癌數據庫構建. 中國胸心血管外科臨床雜志, 2025, 32(2): 167-174. doi: 10.7507/1007-4848.202411061 復制

版權信息: ?四川大學華西醫院華西期刊社《中國胸心血管外科臨床雜志》版權所有,未經授權不得轉載、改編

  • 上一篇

    日間乳腺癌保乳術的安全性、經濟效益及社會心理滿意度分析
  • 下一篇

    基礎麻醉聯合局部麻醉應用于多發肺結節術前定位的回顧性隊列研究