引用本文: 葉子, 周凡琳, 饒佳媛, 蘇語, 于凱聰, 王舜堯, 汪曉東, 黃明君. 結直腸癌患者的文化程度對長期預后的影響:基于DACCA的真實世界數據研究. 中國普外基礎與臨床雜志, 2024, 31(4): 427-432. doi: 10.7507/1007-9424.202401006 復制
版權信息: ?四川大學華西醫院華西期刊社《中國普外基礎與臨床雜志》版權所有,未經授權不得轉載、改編
源于真實世界場景的華西腸癌數據庫(Database from Colorectal Cancer,DACCA),為結直腸癌(colorectal cancer,CRC)數據的結構化應用提供了基礎[1-2]。如前系列報道,筆者團隊已經對于數據庫的構建方式和數據庫呈現的基本數據狀態完成了第1板塊(數據構建)和第2板塊(數據研究)的闡述。后續筆者團隊將逐步進行第3板塊(數據庫解讀)和第4板塊(數據庫決策)的展示,即利用DACCA中的數據如何回答在CRC全生命周期流程中的諸多臨床問題。本研究屬于數據庫解讀第一章(人群特征)的第5部分(受教育程度相關系列研究內容)。CRC是全國乃至全球范圍內最常見的消化系統腫瘤之一。近年來,隨著飲食、生活方式、人口結構等因素的改變,我國CRC的發病率和病死率不斷提升[3]。有研究[4]表明,患者的文化程度與CRC的生存率相關,CRC的短期及長期生存率隨著教育程度的降低而降低。因此,進一步探討CRC患者的文化程度與生存率的關系,有利于醫生及時調整治療方案,改善患者預后情況。本研究基于華西DACCA中真實世界大數據進一步探討文化程度與CRC患者生存預后的關系。
1 資料與方法
1.1 數據庫版本
本研究采用2022年9月12日更新版的DACCA中的數據。
1.2 分析目標
本研究按照隨訪數據提示的時間劃分為 1、3、5和10年4個隨訪時間點,分析不同文化程度CRC患者的預后差異,同時對不同病理TNM分期(pathological TNM,pTNM)進行分層分析,分析不同pTNM分期患者中不同文化程度CRC患者的預后差異。
1.3 數據參數的選擇及定義
本研究中選擇的數據參數,包括年齡、性別、文化程度、腫瘤部位、腫瘤性質、pTNM分期、手術日期、隨訪終期和生存狀態。DACCA數據庫編碼體系相關參數的定義詳見既往DACCA數據庫系列文獻[5-7]。
根據研究需要及《中華人民共和國教育法》第十七條規定,將本研究患者的受教育程度分為4類:文盲、初等教育(小學)、中等教育(初中、高中、中專、中職、中技)和高等教育(大學、高職、大專及以上)。生存時間(月)定義為從手術日期至隨訪終期所持續的時間或從手術日期至死亡日期所持續的時間并收集死亡終點原因,本研究中觀察總體生存和疾病特異性生存情況。
1.4 數據篩選方案
根據本次研究需要,筆者團隊以“手術日期”和“文化程度”作為排序條件,對總數據庫的信息進行篩選,并按照下述條件依次進行篩選:① 剔除完全重復數據;② 以“文化程度為空或錯誤”為條件剔除無效數據;③ 以“手術日期、性別為空或錯誤”為條件剔除無效數據;④ 以“隨訪日期”或“生存狀態”為條件剔除“空或錯誤”數據;⑤ 以“pTNM 分期”為條件剔除“空或錯誤”數據;⑥ 提取唯一數據并對數據進行標準化。對剔除后的數據條目進一步核實,以確保無可疑或無效的數據。
1.5 統計學方法
數據分析采用SPSS 26.0統計軟件。計數資料采用“條(%)”描述。計量資料采用 Kolmogorov-Smirnov 檢驗,符合正態分布者用均數±標準差(±s)描述;不符合者采用中位數(median,M)和上下四分位數(P25,P75)描述。采用Kaplan-Meier法繪制生存曲線及計算累積生存率,使用Z檢驗及log-rank檢驗進行比較。檢驗水準α=0.05。
2 結果
2.1 數據總體狀態
根據篩選流程,本研究共篩選出數據3 692條(圖1),其中女1 481條、男2 211條;年齡數據不符合正態分布,年齡17~96歲 [M(P25,P75)=61(51,68)歲]。其中文盲202條,初等教育1 054條,中等教育1 809條,高等教育627條;pTNM分期0期13條,Ⅰ期406條,Ⅱ期1 193條,Ⅲ期1 139條,Ⅳ期941條。腫瘤部位的有效數據3 631條,其中結腸818條,直腸2 813條;腫瘤性質的有效數據3 660條,其中腺癌2 806條,黏液腺癌723條,印戒細胞癌72條,神經內分泌癌31條,鱗狀細胞癌18條,惡性黑色素瘤7條, 平滑肌肉瘤3條。

2.2 不同文化程度CRC患者的基線數據比較
4種文化程度CRC患者的pTNM分期和腫瘤性質比較差異無統計學意義(P>0.05),而性別、年齡及腫瘤部位比較差異有統計學意義(P<0.001),見表1。

2.3 不同文化程度CRC患者的總生存和疾病特異性生存情況比較
本研究結果發現,文盲、初等教育、中等教育及高等教育CRC患者的總生存和疾病特異性生存曲線(圖2a、2b)比較差異均未見有統計學意義(χ2=1.982,P=0.576;χ2=2.618,P=0.454),其1、3、5及10年累積總生存率和疾病特異性生存率結果見表2。從表2可見,不管文化程度如何,1、3年累積總生存率和疾病特異性生存率均超過90%,5年累積總生存率和疾病特異性生存率均超過80%,10年累積總生存率和疾病特異性生存率均超過70%。進一步對不同pTNM分期患者進行分層分析,由于本次研究中pTNM分期為0期(n=13)的亞組中并未出現死亡,故不納入統計。pTNM分期Ⅰ~Ⅳ期各期患者中,不同文化程度CRC患者的總生存曲線(圖3a~3d)和疾病特異性生存曲線(圖3e~3h)比較差異均未見有統計學意義(總生存情況,Ⅰ期:χ2=1.361、P=0.715;Ⅱ期:χ2=3.507、P=0.320;Ⅲ期:χ2=3.144、P=0.370;Ⅳ期:χ2=4.993、P=0.172。疾病特異性生存情況,Ⅰ期:χ2=0.723、P=0.868;Ⅱ期:χ2=3.295、P=0.348;Ⅲ期:χ2=4.767、P=0.190;Ⅳ期:χ2=6.177、P=0.103)。各期CRC患者中不同文化程度患者的1、3、5及10年累積總生存率和疾病特異性生存率結果見表3和表4。從表3和表4可見,無論pTNM分期何分期下的CRC患者1年累積總生存率和疾病特異性生存率均較好(超過90%),對于Ⅰ期CRC患者,除了初等教育患者的10年累積生存率未達90%,其他所有患者的1、3、5及10年累積總生存率和疾病特異性生存率均超過90%,并且觀察到分期為Ⅲ期和Ⅳ期的文盲CRC患者的長期生存(5和10年累積總生存率和疾病特異性生存率)最差。





3 討論
20世紀90年代,國外已有研究者開始探索文化程度與CRC之間的關聯。有研究[8]結果發現,男性最高教育水平與結腸癌風險呈正相關關系。Shaw等[9]的研究表明,在女性CRC患者中,隨教育程度增高死亡率降低;在新西蘭1981–1999年期間的數據發現,所有接受過教育的CRC患者的死亡率均有所下降,具有學歷的女性CRC死亡率下降較沒有學歷的女性更為明顯(死亡率下降分別25%和11%),但對于男性患者這種差異體現在收入上而非受教育程度上。Du等[10]報道,在美國,居住在受教育程度最低的社區的結腸癌患者的3年生存率為57.5%,而四分之一受教育程度最高的患者的3年生存率為65.7%。此外Kim等[11]的研究提示,在受過高等教育的女性中,較高的社區社會經濟地位(包括收入、教育及職業的綜合評分)與結腸癌發病呈負相關(P=0.01)。盡管已有這些研究探討了文化程度對于CRC患者發病或預后有影響,但是也有研究者[12]認為,CRC患者的社會經濟地位(包括收入、教育及職業的綜合評分)與總體死亡率之間幾乎無關 [HR(95%CI)=1.10(0.98,1.23)]。 由于文獻報道的不同研究有不同的結論,本研究團隊基于真實世界大數據進一步對文化程度與CRC患者預后的關系進行了分析,在本研究中也未發現不同文化程度CRC患者術后1、3、5及10年總生存情況和疾病特異性生存情況總體比較差異有統計學意義(P>0.05)。此外,有研究者[13-15]報道,pTNM分期是影響CRC患者預后的重要因素。因此本研究基于pTNM分期進行了分層分析,探討在不同pTNM分期下不同文化程度CRC患者術后預后情況是否有差異,結果發現,無論是哪種分期,在各期分期下不同文化程度CRC患者1、3、5及10年總生存情況和疾病特異性生存情況總體比較均未見差異有統計學意義(P>0.05)。
總之,本研究基于真實世界大數據分析結果提示,總體生存情況和疾病特異性生存情況在不同文化程度(文盲、初等教育、中等教育及高等教育)CRC患者間比較差異未見有統計學意義,而且根據pTNM分期進行分層分析的結果同樣未發現這二者差異有統計學意義,因此其具體變化規律需要結合治療細節或擴大樣本數據進一步分析,以尋求更真實的結果。對本次研究的結論也需要客觀看待,因為本次研究仍存在一定的局限性:本研究納入的患者大部分為中國西南地區患者,這在一定程度上限制了研究結果的普遍性,因此需要擴大取樣區域,選取包括來自其他機構的更多樣化的患者來進一步證實本研究結論;此外,本研究納入患者的性別、年齡及腫瘤部位在不同文化程度患者間的分布情況的差異具有統計學意義,這對本研究的結論是否有影響沒有進行分析,由于此前已有研究[16]結果提示CRC患者預后與年齡因素相關,因此可進一步結合患者性別、年齡、腫瘤部位等因素進行多因素分析,以便更為準確地探討患者文化程度與預后的關系;另外,患者的教育程度通常與其收入、職業、社會環境等因素相關,從而影響患者所能享受的醫療條件及預后。因此,今后可參考其余研究[17-18],利用教育程度、收入及職業的綜合評分即社會經濟地位指標進一步探究文化程度對CRC患者長期預后的影響。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:葉子主要負責數據統計和描述、結果制圖及文章撰寫;周凡琳、饒佳媛、蘇語、于凱聰及王舜堯主要負責數據清洗;汪曉東主要提供數據源及對文章修改;黃明君主要負責文章指導。
倫理聲明:本研究已通過了四川大學華西醫院生物醫學倫理審查委員會的審批[批文編號:2023 年審(669 號)]。
源于真實世界場景的華西腸癌數據庫(Database from Colorectal Cancer,DACCA),為結直腸癌(colorectal cancer,CRC)數據的結構化應用提供了基礎[1-2]。如前系列報道,筆者團隊已經對于數據庫的構建方式和數據庫呈現的基本數據狀態完成了第1板塊(數據構建)和第2板塊(數據研究)的闡述。后續筆者團隊將逐步進行第3板塊(數據庫解讀)和第4板塊(數據庫決策)的展示,即利用DACCA中的數據如何回答在CRC全生命周期流程中的諸多臨床問題。本研究屬于數據庫解讀第一章(人群特征)的第5部分(受教育程度相關系列研究內容)。CRC是全國乃至全球范圍內最常見的消化系統腫瘤之一。近年來,隨著飲食、生活方式、人口結構等因素的改變,我國CRC的發病率和病死率不斷提升[3]。有研究[4]表明,患者的文化程度與CRC的生存率相關,CRC的短期及長期生存率隨著教育程度的降低而降低。因此,進一步探討CRC患者的文化程度與生存率的關系,有利于醫生及時調整治療方案,改善患者預后情況。本研究基于華西DACCA中真實世界大數據進一步探討文化程度與CRC患者生存預后的關系。
1 資料與方法
1.1 數據庫版本
本研究采用2022年9月12日更新版的DACCA中的數據。
1.2 分析目標
本研究按照隨訪數據提示的時間劃分為 1、3、5和10年4個隨訪時間點,分析不同文化程度CRC患者的預后差異,同時對不同病理TNM分期(pathological TNM,pTNM)進行分層分析,分析不同pTNM分期患者中不同文化程度CRC患者的預后差異。
1.3 數據參數的選擇及定義
本研究中選擇的數據參數,包括年齡、性別、文化程度、腫瘤部位、腫瘤性質、pTNM分期、手術日期、隨訪終期和生存狀態。DACCA數據庫編碼體系相關參數的定義詳見既往DACCA數據庫系列文獻[5-7]。
根據研究需要及《中華人民共和國教育法》第十七條規定,將本研究患者的受教育程度分為4類:文盲、初等教育(小學)、中等教育(初中、高中、中專、中職、中技)和高等教育(大學、高職、大專及以上)。生存時間(月)定義為從手術日期至隨訪終期所持續的時間或從手術日期至死亡日期所持續的時間并收集死亡終點原因,本研究中觀察總體生存和疾病特異性生存情況。
1.4 數據篩選方案
根據本次研究需要,筆者團隊以“手術日期”和“文化程度”作為排序條件,對總數據庫的信息進行篩選,并按照下述條件依次進行篩選:① 剔除完全重復數據;② 以“文化程度為空或錯誤”為條件剔除無效數據;③ 以“手術日期、性別為空或錯誤”為條件剔除無效數據;④ 以“隨訪日期”或“生存狀態”為條件剔除“空或錯誤”數據;⑤ 以“pTNM 分期”為條件剔除“空或錯誤”數據;⑥ 提取唯一數據并對數據進行標準化。對剔除后的數據條目進一步核實,以確保無可疑或無效的數據。
1.5 統計學方法
數據分析采用SPSS 26.0統計軟件。計數資料采用“條(%)”描述。計量資料采用 Kolmogorov-Smirnov 檢驗,符合正態分布者用均數±標準差(±s)描述;不符合者采用中位數(median,M)和上下四分位數(P25,P75)描述。采用Kaplan-Meier法繪制生存曲線及計算累積生存率,使用Z檢驗及log-rank檢驗進行比較。檢驗水準α=0.05。
2 結果
2.1 數據總體狀態
根據篩選流程,本研究共篩選出數據3 692條(圖1),其中女1 481條、男2 211條;年齡數據不符合正態分布,年齡17~96歲 [M(P25,P75)=61(51,68)歲]。其中文盲202條,初等教育1 054條,中等教育1 809條,高等教育627條;pTNM分期0期13條,Ⅰ期406條,Ⅱ期1 193條,Ⅲ期1 139條,Ⅳ期941條。腫瘤部位的有效數據3 631條,其中結腸818條,直腸2 813條;腫瘤性質的有效數據3 660條,其中腺癌2 806條,黏液腺癌723條,印戒細胞癌72條,神經內分泌癌31條,鱗狀細胞癌18條,惡性黑色素瘤7條, 平滑肌肉瘤3條。

2.2 不同文化程度CRC患者的基線數據比較
4種文化程度CRC患者的pTNM分期和腫瘤性質比較差異無統計學意義(P>0.05),而性別、年齡及腫瘤部位比較差異有統計學意義(P<0.001),見表1。

2.3 不同文化程度CRC患者的總生存和疾病特異性生存情況比較
本研究結果發現,文盲、初等教育、中等教育及高等教育CRC患者的總生存和疾病特異性生存曲線(圖2a、2b)比較差異均未見有統計學意義(χ2=1.982,P=0.576;χ2=2.618,P=0.454),其1、3、5及10年累積總生存率和疾病特異性生存率結果見表2。從表2可見,不管文化程度如何,1、3年累積總生存率和疾病特異性生存率均超過90%,5年累積總生存率和疾病特異性生存率均超過80%,10年累積總生存率和疾病特異性生存率均超過70%。進一步對不同pTNM分期患者進行分層分析,由于本次研究中pTNM分期為0期(n=13)的亞組中并未出現死亡,故不納入統計。pTNM分期Ⅰ~Ⅳ期各期患者中,不同文化程度CRC患者的總生存曲線(圖3a~3d)和疾病特異性生存曲線(圖3e~3h)比較差異均未見有統計學意義(總生存情況,Ⅰ期:χ2=1.361、P=0.715;Ⅱ期:χ2=3.507、P=0.320;Ⅲ期:χ2=3.144、P=0.370;Ⅳ期:χ2=4.993、P=0.172。疾病特異性生存情況,Ⅰ期:χ2=0.723、P=0.868;Ⅱ期:χ2=3.295、P=0.348;Ⅲ期:χ2=4.767、P=0.190;Ⅳ期:χ2=6.177、P=0.103)。各期CRC患者中不同文化程度患者的1、3、5及10年累積總生存率和疾病特異性生存率結果見表3和表4。從表3和表4可見,無論pTNM分期何分期下的CRC患者1年累積總生存率和疾病特異性生存率均較好(超過90%),對于Ⅰ期CRC患者,除了初等教育患者的10年累積生存率未達90%,其他所有患者的1、3、5及10年累積總生存率和疾病特異性生存率均超過90%,并且觀察到分期為Ⅲ期和Ⅳ期的文盲CRC患者的長期生存(5和10年累積總生存率和疾病特異性生存率)最差。





3 討論
20世紀90年代,國外已有研究者開始探索文化程度與CRC之間的關聯。有研究[8]結果發現,男性最高教育水平與結腸癌風險呈正相關關系。Shaw等[9]的研究表明,在女性CRC患者中,隨教育程度增高死亡率降低;在新西蘭1981–1999年期間的數據發現,所有接受過教育的CRC患者的死亡率均有所下降,具有學歷的女性CRC死亡率下降較沒有學歷的女性更為明顯(死亡率下降分別25%和11%),但對于男性患者這種差異體現在收入上而非受教育程度上。Du等[10]報道,在美國,居住在受教育程度最低的社區的結腸癌患者的3年生存率為57.5%,而四分之一受教育程度最高的患者的3年生存率為65.7%。此外Kim等[11]的研究提示,在受過高等教育的女性中,較高的社區社會經濟地位(包括收入、教育及職業的綜合評分)與結腸癌發病呈負相關(P=0.01)。盡管已有這些研究探討了文化程度對于CRC患者發病或預后有影響,但是也有研究者[12]認為,CRC患者的社會經濟地位(包括收入、教育及職業的綜合評分)與總體死亡率之間幾乎無關 [HR(95%CI)=1.10(0.98,1.23)]。 由于文獻報道的不同研究有不同的結論,本研究團隊基于真實世界大數據進一步對文化程度與CRC患者預后的關系進行了分析,在本研究中也未發現不同文化程度CRC患者術后1、3、5及10年總生存情況和疾病特異性生存情況總體比較差異有統計學意義(P>0.05)。此外,有研究者[13-15]報道,pTNM分期是影響CRC患者預后的重要因素。因此本研究基于pTNM分期進行了分層分析,探討在不同pTNM分期下不同文化程度CRC患者術后預后情況是否有差異,結果發現,無論是哪種分期,在各期分期下不同文化程度CRC患者1、3、5及10年總生存情況和疾病特異性生存情況總體比較均未見差異有統計學意義(P>0.05)。
總之,本研究基于真實世界大數據分析結果提示,總體生存情況和疾病特異性生存情況在不同文化程度(文盲、初等教育、中等教育及高等教育)CRC患者間比較差異未見有統計學意義,而且根據pTNM分期進行分層分析的結果同樣未發現這二者差異有統計學意義,因此其具體變化規律需要結合治療細節或擴大樣本數據進一步分析,以尋求更真實的結果。對本次研究的結論也需要客觀看待,因為本次研究仍存在一定的局限性:本研究納入的患者大部分為中國西南地區患者,這在一定程度上限制了研究結果的普遍性,因此需要擴大取樣區域,選取包括來自其他機構的更多樣化的患者來進一步證實本研究結論;此外,本研究納入患者的性別、年齡及腫瘤部位在不同文化程度患者間的分布情況的差異具有統計學意義,這對本研究的結論是否有影響沒有進行分析,由于此前已有研究[16]結果提示CRC患者預后與年齡因素相關,因此可進一步結合患者性別、年齡、腫瘤部位等因素進行多因素分析,以便更為準確地探討患者文化程度與預后的關系;另外,患者的教育程度通常與其收入、職業、社會環境等因素相關,從而影響患者所能享受的醫療條件及預后。因此,今后可參考其余研究[17-18],利用教育程度、收入及職業的綜合評分即社會經濟地位指標進一步探究文化程度對CRC患者長期預后的影響。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:葉子主要負責數據統計和描述、結果制圖及文章撰寫;周凡琳、饒佳媛、蘇語、于凱聰及王舜堯主要負責數據清洗;汪曉東主要提供數據源及對文章修改;黃明君主要負責文章指導。
倫理聲明:本研究已通過了四川大學華西醫院生物醫學倫理審查委員會的審批[批文編號:2023 年審(669 號)]。