如何準確識別癌癥發生的影響因素并進行早期干預,是目前癌癥防治領域中亟需解決的關鍵問題。孟德爾隨機化(Mendelian randomization,MR)方法使用遺傳變異作為暴露因素的工具變量,可以彌補傳統觀察性研究和臨床試驗的不足。本文系統闡述了MR在癌癥防治研究中的應用現狀,包括癌癥風險因素評估、癌癥治療靶點探索以及藥物的療效和不良反應評價。MR設計方法結合豐富的高位組學數據擴展了癌癥防治研究的范圍和維度,為構建癌癥病因網絡和藥物靶向數據庫提供了一種切實可行的方法,可為癌癥的精準防治提供科學依據。
引用本文: 黃丹琪, 白楊, 王慧琳, 翟靜波, 楊敏, 田金徽, 李江. 孟德爾隨機化方法在癌癥防治研究中的應用現狀與展望. 中國循證醫學雜志, 2024, 24(11): 1352-1359. doi: 10.7507/1672-2531.202405049 復制
版權信息: ?四川大學華西醫院華西期刊社《中國循證醫學雜志》版權所有,未經授權不得轉載、改編
根據全球癌癥統計報告,2022年全球惡性腫瘤新發病例約為2 000萬例,死亡約為970萬例[1]。根據世界衛生組織估計,癌癥是2019年全球多個國家70歲以下人群的第一或第二位死亡原因[2]。面對日益增加的癌癥負擔,如何準確識別癌癥發生的影響因素并進行早期干預,是目前癌癥防治領域中亟需解決的關鍵問題。近年來,全基因組關聯研究(genome-wide association studies,GWAS)發現了諸多與暴露因素和癌癥易感性相關的遺傳變異(genetic variants),如身體質量指數(body mass index,BMI)[3]、血糖特征[4]、癌癥結局[5]等,在一定程度上促使孟德爾隨機化(Mendelian randomization,MR)方法成為癌癥防治領域的研究方法熱點。本文系統闡述了MR在癌癥防治研究中的應用現狀以及在未來癌癥防治研究中的應用前景。
1 MR概述
1.1 MR方法的基本原理
MR方法是工具變量(instrument variables,IVs)分析的延伸應用。在MR方法中,與暴露因素相關的常染色體遺傳變異常被作為IVs,用于評估暴露因素與健康結局的潛在因果關系[6]。MR設計的基本思想是孟德爾第一定律和第二定律,即:親代的遺傳變異隨機分離且自由組合至子代。這個自然隨機化的過程獨立于可能混淆因果推斷的其它因素,避免了混雜偏倚和反向因果偏倚的干擾。MR分析結果反映了個體終生暴露的風險,可以避免傳統觀察性研究中常出現的測量偏倚[6]。因此,MR也被稱為“自然隨機對照試驗”(圖1),為流行病學的因果推斷提供了新的研究思路[7]。

1.2 MR方法的核心假設
MR分析的可靠性依賴于以下3個核心假設(圖2):① 相關性假設:IVs與研究的暴露因素存在穩健的強關聯;② 獨立性假設:IVs與任何已知或未知的混雜因素無關;③ 排他限制假設:IVs與結局無關,僅能通過暴露因素影響結局發生。若三個假設均滿足,MR可提供因果關系的無偏估計。此外,利用IVs估計因果關系仍需滿足額外假設,即:線性關聯、研究因素間不存在統計學交互作用[8]。

虛線:違背路徑;實線:滿足路徑。
1.3 MR方法的優點和局限性
MR方法具有以下優點:① 通過減少混雜偏倚、反向因果偏倚和測量偏倚,獲得最小偏倚條件下的因果關聯估計;② 使用大規模GWAS數據,在短時間內做出因果推斷,無需長期隨訪即可獲得終生暴露對結局的影響,極大地降低了研究成本;③ 臨床試驗一般用于評估可能對健康有益的干預措施的療效,而MR不存在倫理限制,可用于評估可能對人體有害的因素所引起的健康風險。但是,MR也存在一些局限性,可能引起結果估計的偏差,詳見表1。

2 MR方法在癌癥防治研究中的應用
本研究總結了近五年MR方法在癌癥防治研究中的應用進展,主要包括:評估癌癥發生的風險因素、探索潛在的癌癥治療靶點以及預測或評價癌癥藥物的療效和不良反應。
2.1 MR方法在癌癥風險因素研究中的應用
MR方法可為癌癥發生的風險因素推斷提供較為可靠的證據。目前,與癌癥病因相關的MR分析中,病因類型主要包括:行為模式、生理特征、生物標志物、疾病和社會因素。
2.1.1 行為模式
① 吸煙:煙草所致煙霧中含有諸多具有致癌作用的化合物[9]。多項原始或系統評價MR分析表明,吸煙遺傳易感性與肺癌、頭頸癌、食道癌、胃癌、胰腺癌、膀胱癌、腎癌、宮頸癌、卵巢癌以及髓系白血病的發生呈正相關,但與前列腺癌的發生呈負相關[10-13]。② 飲食:咖啡含多種具有抗氧化、抗炎和抗纖維化作用的生物活性物質,如多酚[14]、咖啡因[15]等,可能影響致癌過程。MR分析表明,遺傳預測的咖啡攝入與消化系統癌癥風險呈強相關[OR=1.28,95%CI(1.09,1.51)],尤其是食管癌[OR=2.79,95%CI(1.73,4.50)];但咖啡攝入與卵巢癌風險的關聯性仍存在矛盾,有研究發現是保護因素[OR=0.63,95%CI(0.43,0.93)][16],但也有研究發現是危險因素[OR=3.01,95%CI(1.50,6.04)][13];尚未發現咖啡攝入與乳腺癌的關聯[17]。每天增加50 g的牛奶攝入,可降低結直腸癌發生風險[OR=0.89,95%CI(0.81,0.98)],但會增加絕經前女性乳腺癌[OR=1.12,95%CI(1.03,1.23)]和子宮癌[OR=3.98,95%CI(1.48,10.70)]發生風險,尚未發現牛奶攝入與前列腺癌、膀胱癌存在關聯[18,19]。雖然全球癌癥負擔數據表明,4%的癌癥是由飲酒引起,但MR分析尚未明確飲酒與總體或特定部位癌癥風險存在關聯[20,21]。③ 睡眠:睡眠模式可能對癌癥的發生起關鍵作用。傾向早起者的乳腺癌發生風險[OR=0.95,95%CI(0.93,0.98)]和消化系統腫瘤發生風險[OR=0.94,95%CI(0.90,0.98)]降低,但對肝癌無影響;睡眠時間每增加1小時,可增加19%的乳腺癌發生風險,以及降低54%的肺癌發生風險,但與其它癌種的關聯仍未有強有力的證據證明;失眠癥狀與肺腺癌的發生呈強相關[OR=5.75,95%CI(2.12,15.65)][22-26]。
2.1.2 生理特征
較高的收縮壓和舒張壓與總體癌癥風險無關,但可能是黑色素瘤[收縮壓:OR=1.19,95%CI(1.01,1.40);舒張壓:OR=1.27,95%CI(1.06,1.51)]的病因[27]。較高的空腹胰島素可能使子宮平滑肌瘤發生風險增加15%以及使胰腺癌發生風險增加184%[28,29],但對乳腺癌和前列腺癌無影響[30]。隨著月經初潮年齡增加,子宮平滑肌瘤發生風險[OR=0.84,95%CI(0.80,0.89)]和卵巢癌發生風險[OR=0.81,95%CI(0.67,0.97)]可能降低[28,31]。
終生保持較高水平的內臟脂肪含量可能增加胰腺癌[OR=1.65,95%CI(1.03,2.62)]和肺鱗狀細胞癌[OR=1.47,95%CI(1.20,1.82)]的發生風險[32];BMI主要與消化系統癌癥相關[OR=1.04,95%CI(1.02,1.06)],每增加1 kg/m2體重,食管癌、結直腸癌、胃癌、肝癌和胰腺癌發生風險將增加6%~13%[33,34]。但是,BMI的增加可能是前列腺癌[OR=0.97,95%CI(0.94,0.99)]和基底細胞癌[OR=0.88,95%CI(0.82,0.96)]的保護因素[34,35]。此外,與癌癥發生相關的MR分析中,肥胖指標還包括腰圍、腰臀比(waist-to-hip ratio,WHR)、瘦體重、軀干脂肪量、去脂體重指數和出生體重等[33,34,36,37]。
2.1.3 生物標志物
① 血液代謝物:作為抗氧化劑的維生素C,在清除自由基、免疫防御、某些神經遞質的生物合成和細胞信號通路等方面發揮作用[38,39]。MR分析提示,維生素C可以降低消化系統腫瘤的發生風險,如小腸癌[OR=0.55,95%CI(0.32,0.94)]和結直腸癌[OR=0.84,95%CI(0.73,0.96)],但其它循環抗氧化劑與消化系統癌癥發生風險的關聯證據不強[40-42]。維生素D通過激活維生素D受體發揮作用,該受體可調節正常細胞和癌細胞的生長、分化和凋亡,但并未發現維生素D與結直腸癌、食管癌、胰腺癌、前列腺癌、卵巢癌、乳腺癌、肺癌、神經母細胞瘤、基底細胞癌的發生等存在關聯[43-48]。癌癥相關MR分析所涉及的血液代謝物還包括循環氨基酸[49-51]、循環脂質[52-54]和蛋白質[55,56],且與癌癥風險的關聯性較為復雜。② 炎癥:炎癥反應與癌變過程息息相關,低度炎癥狀態可以通過提供營養信號促進突變和突變細胞增殖[57],還可通過刺激細胞內自由基的生成和累積,直接或間接損害DNA及其蛋白質產物[58,59]。MR分析結果支持炎癥因子對癌癥發生具有促進作用[60,61],如γ-干擾素誘導的單核因子可以增加子宮內膜癌發生風險[OR=3.73,95%CI(1.86,7.47)],T細胞趨化因子可以促進肺癌的發生[OR=1.51,95%CI(1.22,1.87)];但是,有些炎癥因子與癌癥發生呈現出反向關聯[60,61],如巨噬細胞遷移抑制因子(macrophage migration inhibitory factor,MIF)與乳腺癌[OR=0.88,95%CI(0.83,0.94)],白細胞介素-18與肺癌[OR=0.87,95%CI(0.81,0.93)]。腫瘤壞死因子(tumor necrosis factor,TNF)是免疫細胞分泌的促炎因子,可能在癌變的所有階段均有促進作用,包括增殖、血管生成和轉移[62],遺傳預測的TNF水平與總體癌癥[OR=0.54,95%CI(0.42,0.69)]、乳腺癌[OR=0.51,95%CI(0.39,0.67)]、結直腸癌[OR=0.20,95%CI(0.09,0.45)]、子宮內膜癌[OR=0.25,95%CI(0.07,0.94)]和肺癌[OR=0.45,95%CI(0.21,0.94)]發生風險呈負相關[63]。也有研究表明,促炎因子對癌癥發生的影響存在性別差異,如嗜酸性粒細胞趨化因子可以增加男性腎細胞癌風險[OR=2.55,95%CI(1.62,4.01)],但未在女性中發現顯著關聯[64]。③ 端粒:端粒長度(telomere length,TL)隨著人類生理性衰老而縮短。短TL可誘導細胞衰老或凋亡,從而抑制腫瘤發生,但也可通過復雜的染色體重排促進基因組的不穩定性累積,導致癌細胞的形成[65]。長TL反映組織端粒酶活性較高,可以促進癌細胞的增殖過程[66]。目前,多數MR分析結果支持長TL增加癌癥發生風險,如長TL增加肺癌發生風險[OR=2.25,95%CI(1.81,2.78)][67],但也發現TL與部分癌癥發生風險無關,如頭頸癌[OR=0.90,95%CI(0.70,1.05)][68]。此外,也有研究指出TL與癌癥發生風險呈U形關聯,即較長或較短的TL均可能促進致癌進程[69]。④ 其它:腸道菌群是居住在胃腸道的微生物群,與結直腸癌的發生密切相關[70],也可能是其它癌癥的病因之一,包括乳腺癌、肺癌、前列腺癌、膀胱癌、卵巢癌、子宮內膜癌、胃癌、結直腸癌、肝癌[71-74]。激素類生物標志物包括睪酮、雌激素、孕激素、甲狀腺素、性激素結合球蛋白等[75]。有研究表明,高水平睪酮可使前列腺癌發生風險增加17%,但是,可以使胃癌的發生風險降低34%、胰腺癌的發生風險降低41%[76]。
2.1.4 其它疾病
包括癌癥在內的疾病可能影響癌癥的發生和發展。抑郁癥增加乳腺癌風險[OR=1.09,95%CI(1.03,1.15)][77]。甲狀腺功能亢進癥可導致前列腺癌風險下降[OR=0.86,95%CI(0.79,0.94)]和結腸癌風險升高[OR=1.13,95%CI(1.02,1.25)][78]。慢性乙型肝炎病毒感染可能是肝細胞癌和肝外癌癥的風險因素之一,包括肝癌[OR=1.20,95%CI(1.07,1.34)]、宮頸癌[OR=1.57,95%CI(1.29,1.91)]和胃癌[OR=1.12,95%CI(1.05,1.19)][79]。2型糖尿病是胰腺癌、腎癌、子宮癌和宮頸癌的危險因素,以及可能是食管癌和黑色素瘤的保護因素[80]。MR方法也應用于原發性癌癥與繼發性癌癥的關聯研究中,如遺傳預測的雌激素受體陽性乳腺癌增加甲狀腺癌風險[OR=1.14,95%CI(1.01,1.28)][81];原發性肺癌繼發結直腸癌的風險略為增加[82]。
2.1.5 社會因素
研究表明,額外接受3.6年的教育可降低52%的肺癌發生風險[83],較高水平的教育程度可降低36%的食管癌發生風險。教育對癌癥的保護效應可能是通過減少吸煙(14.2%)和降低BMI(15.8%)起到中介效應[84]。
2.2 MR方法在癌癥治療中的應用
目前,MR方法在癌癥治療中的應用主要包括探索癌癥治療靶點以及預測或評價癌癥藥物的療效和不良反應。血漿蛋白是血液的重要成分,參與人體內各種生理過程,如信號傳導、運輸、修復和免疫防御等[85],在癌細胞生長、遷移、侵襲和腫瘤微環境形成中起到重要作用,是多數癌癥藥物的作用靶點[55]。從藥物研發與評價的角度出發,相關蛋白編碼基因區域的變異可作為蛋白靶點藥理作用的IVs。從遺傳角度評估蛋白靶點與癌癥的關聯性以及探索靶點相關的分子機制和信號通路,可以快速評價蛋白靶向藥物的有效性,初步評估毒副作用,以及探索老藥新用的可能性,為癌癥的精準治療提供了新路徑[86]。
一項大型MR研究利用癌癥GWAS數據和蛋白數量性狀位點(protein quantitative trait loci,pQTL)數據,全面構建了前列腺癌、乳腺癌、肺癌、結直腸癌、膀胱癌、卵巢癌、腎癌和胃癌與血漿蛋白的因果網絡,并使用雙向MR、貝葉斯共定位分析(colocalization)和表型掃描(phenotype scanning)技術進行驗證,最終發現了13個前列腺癌、乳腺癌和肺癌的潛在治療靶點[87]。此外,有研究利用高血壓藥物靶點相關變異,發現了遺傳預測的血管緊張素轉換酶抑制劑(angiotension converting enzyme inhibitors,ACEI)在結直腸癌預防中老藥新用的可能性,但仍需謹慎考慮可能的不良反應[88]。
3 應用展望
3.1 在癌癥精準預防方面的應用展望
癌癥的發生、發展往往涉及復雜的病理和生理過程。不同群體的癌癥發生風險因素種類和影響程度也有所差異。隨著高通量分析技術的發展,組學數據日益豐富,包括基因表達數據(基因組學)、甲基化數據(表觀基因組學)、蛋白質數據(蛋白質組學)、轉錄數據(轉錄組學)和代謝物(代謝組學)等。此外,傳統的“假設驅動”MR分析已逐漸擴展為“無假設”全表型MR關聯研究(phenome-wide association MR study,MR-PheWAS),這種方法利用高維組學數據同時進行數百或數千個統計檢驗,以分析單個暴露因素與多個癌癥結局或多個暴露因素與單個癌癥結局的關聯[89]。因此,可將組學數據與兩階段MR、網狀MR、多變量MR和MR-PheWAS等方法結合,從遺傳層面快速繪制針對特定人群的“分子細胞-宏觀因素”癌癥病因網絡,揭示宏觀表型的微觀機制,探索癌癥預防的高效靶點,協助構建預測模型,有助于深入理解癌癥發病機制以及為癌癥精準預防決策提供參考。
3.2 在癌癥精準治療方面的應用展望
臨床試驗是癌癥藥物研發的關鍵環節。但是,癌癥相關的臨床試驗既昂貴又耗時,實施條件和倫理要求較為苛刻。藥企可能面臨著藥物研發失敗的高昂成本壓力[90]。2021年,美國批準的藥物中有三分之二得到了人類遺傳學的證據支持[91]。有研究報道,具有遺傳證據支持的藥物臨床試驗成功率是沒有遺傳證據支持的兩倍[92]。基于MR分析的癌癥靶向藥物研發具備較好的時間優勢和經濟效益。研究者可以基于MR-PheWAS、共定位技術等方法構建大樣本中國人群癌癥藥物靶點篩選數據庫,進而快速識別高效低毒的癌癥藥物治療靶點,探索癌癥治療中的同病異治(同一癌種亞型的不同治療靶點)、異病同治(不同癌種的同一治療靶點),協助構建預后模型,有助于加快藥物研發進程和提高臨床試驗成功率。
4 總結
目前,MR方法已在癌癥防治研究的多個領域中廣泛應用,例如:癌癥風險因素評估、癌癥治療靶點探索以及癌癥藥物的療效和不良反應評價。愈加豐富的高位組學數據和MR設計方法極大地擴展了癌癥防治研究的范圍和維度,為構建癌癥病因網絡和藥物靶向數據庫提供了一種切實可行的方法,可為癌癥的精準防治提供科學依據。
根據全球癌癥統計報告,2022年全球惡性腫瘤新發病例約為2 000萬例,死亡約為970萬例[1]。根據世界衛生組織估計,癌癥是2019年全球多個國家70歲以下人群的第一或第二位死亡原因[2]。面對日益增加的癌癥負擔,如何準確識別癌癥發生的影響因素并進行早期干預,是目前癌癥防治領域中亟需解決的關鍵問題。近年來,全基因組關聯研究(genome-wide association studies,GWAS)發現了諸多與暴露因素和癌癥易感性相關的遺傳變異(genetic variants),如身體質量指數(body mass index,BMI)[3]、血糖特征[4]、癌癥結局[5]等,在一定程度上促使孟德爾隨機化(Mendelian randomization,MR)方法成為癌癥防治領域的研究方法熱點。本文系統闡述了MR在癌癥防治研究中的應用現狀以及在未來癌癥防治研究中的應用前景。
1 MR概述
1.1 MR方法的基本原理
MR方法是工具變量(instrument variables,IVs)分析的延伸應用。在MR方法中,與暴露因素相關的常染色體遺傳變異常被作為IVs,用于評估暴露因素與健康結局的潛在因果關系[6]。MR設計的基本思想是孟德爾第一定律和第二定律,即:親代的遺傳變異隨機分離且自由組合至子代。這個自然隨機化的過程獨立于可能混淆因果推斷的其它因素,避免了混雜偏倚和反向因果偏倚的干擾。MR分析結果反映了個體終生暴露的風險,可以避免傳統觀察性研究中常出現的測量偏倚[6]。因此,MR也被稱為“自然隨機對照試驗”(圖1),為流行病學的因果推斷提供了新的研究思路[7]。

1.2 MR方法的核心假設
MR分析的可靠性依賴于以下3個核心假設(圖2):① 相關性假設:IVs與研究的暴露因素存在穩健的強關聯;② 獨立性假設:IVs與任何已知或未知的混雜因素無關;③ 排他限制假設:IVs與結局無關,僅能通過暴露因素影響結局發生。若三個假設均滿足,MR可提供因果關系的無偏估計。此外,利用IVs估計因果關系仍需滿足額外假設,即:線性關聯、研究因素間不存在統計學交互作用[8]。

虛線:違背路徑;實線:滿足路徑。
1.3 MR方法的優點和局限性
MR方法具有以下優點:① 通過減少混雜偏倚、反向因果偏倚和測量偏倚,獲得最小偏倚條件下的因果關聯估計;② 使用大規模GWAS數據,在短時間內做出因果推斷,無需長期隨訪即可獲得終生暴露對結局的影響,極大地降低了研究成本;③ 臨床試驗一般用于評估可能對健康有益的干預措施的療效,而MR不存在倫理限制,可用于評估可能對人體有害的因素所引起的健康風險。但是,MR也存在一些局限性,可能引起結果估計的偏差,詳見表1。

2 MR方法在癌癥防治研究中的應用
本研究總結了近五年MR方法在癌癥防治研究中的應用進展,主要包括:評估癌癥發生的風險因素、探索潛在的癌癥治療靶點以及預測或評價癌癥藥物的療效和不良反應。
2.1 MR方法在癌癥風險因素研究中的應用
MR方法可為癌癥發生的風險因素推斷提供較為可靠的證據。目前,與癌癥病因相關的MR分析中,病因類型主要包括:行為模式、生理特征、生物標志物、疾病和社會因素。
2.1.1 行為模式
① 吸煙:煙草所致煙霧中含有諸多具有致癌作用的化合物[9]。多項原始或系統評價MR分析表明,吸煙遺傳易感性與肺癌、頭頸癌、食道癌、胃癌、胰腺癌、膀胱癌、腎癌、宮頸癌、卵巢癌以及髓系白血病的發生呈正相關,但與前列腺癌的發生呈負相關[10-13]。② 飲食:咖啡含多種具有抗氧化、抗炎和抗纖維化作用的生物活性物質,如多酚[14]、咖啡因[15]等,可能影響致癌過程。MR分析表明,遺傳預測的咖啡攝入與消化系統癌癥風險呈強相關[OR=1.28,95%CI(1.09,1.51)],尤其是食管癌[OR=2.79,95%CI(1.73,4.50)];但咖啡攝入與卵巢癌風險的關聯性仍存在矛盾,有研究發現是保護因素[OR=0.63,95%CI(0.43,0.93)][16],但也有研究發現是危險因素[OR=3.01,95%CI(1.50,6.04)][13];尚未發現咖啡攝入與乳腺癌的關聯[17]。每天增加50 g的牛奶攝入,可降低結直腸癌發生風險[OR=0.89,95%CI(0.81,0.98)],但會增加絕經前女性乳腺癌[OR=1.12,95%CI(1.03,1.23)]和子宮癌[OR=3.98,95%CI(1.48,10.70)]發生風險,尚未發現牛奶攝入與前列腺癌、膀胱癌存在關聯[18,19]。雖然全球癌癥負擔數據表明,4%的癌癥是由飲酒引起,但MR分析尚未明確飲酒與總體或特定部位癌癥風險存在關聯[20,21]。③ 睡眠:睡眠模式可能對癌癥的發生起關鍵作用。傾向早起者的乳腺癌發生風險[OR=0.95,95%CI(0.93,0.98)]和消化系統腫瘤發生風險[OR=0.94,95%CI(0.90,0.98)]降低,但對肝癌無影響;睡眠時間每增加1小時,可增加19%的乳腺癌發生風險,以及降低54%的肺癌發生風險,但與其它癌種的關聯仍未有強有力的證據證明;失眠癥狀與肺腺癌的發生呈強相關[OR=5.75,95%CI(2.12,15.65)][22-26]。
2.1.2 生理特征
較高的收縮壓和舒張壓與總體癌癥風險無關,但可能是黑色素瘤[收縮壓:OR=1.19,95%CI(1.01,1.40);舒張壓:OR=1.27,95%CI(1.06,1.51)]的病因[27]。較高的空腹胰島素可能使子宮平滑肌瘤發生風險增加15%以及使胰腺癌發生風險增加184%[28,29],但對乳腺癌和前列腺癌無影響[30]。隨著月經初潮年齡增加,子宮平滑肌瘤發生風險[OR=0.84,95%CI(0.80,0.89)]和卵巢癌發生風險[OR=0.81,95%CI(0.67,0.97)]可能降低[28,31]。
終生保持較高水平的內臟脂肪含量可能增加胰腺癌[OR=1.65,95%CI(1.03,2.62)]和肺鱗狀細胞癌[OR=1.47,95%CI(1.20,1.82)]的發生風險[32];BMI主要與消化系統癌癥相關[OR=1.04,95%CI(1.02,1.06)],每增加1 kg/m2體重,食管癌、結直腸癌、胃癌、肝癌和胰腺癌發生風險將增加6%~13%[33,34]。但是,BMI的增加可能是前列腺癌[OR=0.97,95%CI(0.94,0.99)]和基底細胞癌[OR=0.88,95%CI(0.82,0.96)]的保護因素[34,35]。此外,與癌癥發生相關的MR分析中,肥胖指標還包括腰圍、腰臀比(waist-to-hip ratio,WHR)、瘦體重、軀干脂肪量、去脂體重指數和出生體重等[33,34,36,37]。
2.1.3 生物標志物
① 血液代謝物:作為抗氧化劑的維生素C,在清除自由基、免疫防御、某些神經遞質的生物合成和細胞信號通路等方面發揮作用[38,39]。MR分析提示,維生素C可以降低消化系統腫瘤的發生風險,如小腸癌[OR=0.55,95%CI(0.32,0.94)]和結直腸癌[OR=0.84,95%CI(0.73,0.96)],但其它循環抗氧化劑與消化系統癌癥發生風險的關聯證據不強[40-42]。維生素D通過激活維生素D受體發揮作用,該受體可調節正常細胞和癌細胞的生長、分化和凋亡,但并未發現維生素D與結直腸癌、食管癌、胰腺癌、前列腺癌、卵巢癌、乳腺癌、肺癌、神經母細胞瘤、基底細胞癌的發生等存在關聯[43-48]。癌癥相關MR分析所涉及的血液代謝物還包括循環氨基酸[49-51]、循環脂質[52-54]和蛋白質[55,56],且與癌癥風險的關聯性較為復雜。② 炎癥:炎癥反應與癌變過程息息相關,低度炎癥狀態可以通過提供營養信號促進突變和突變細胞增殖[57],還可通過刺激細胞內自由基的生成和累積,直接或間接損害DNA及其蛋白質產物[58,59]。MR分析結果支持炎癥因子對癌癥發生具有促進作用[60,61],如γ-干擾素誘導的單核因子可以增加子宮內膜癌發生風險[OR=3.73,95%CI(1.86,7.47)],T細胞趨化因子可以促進肺癌的發生[OR=1.51,95%CI(1.22,1.87)];但是,有些炎癥因子與癌癥發生呈現出反向關聯[60,61],如巨噬細胞遷移抑制因子(macrophage migration inhibitory factor,MIF)與乳腺癌[OR=0.88,95%CI(0.83,0.94)],白細胞介素-18與肺癌[OR=0.87,95%CI(0.81,0.93)]。腫瘤壞死因子(tumor necrosis factor,TNF)是免疫細胞分泌的促炎因子,可能在癌變的所有階段均有促進作用,包括增殖、血管生成和轉移[62],遺傳預測的TNF水平與總體癌癥[OR=0.54,95%CI(0.42,0.69)]、乳腺癌[OR=0.51,95%CI(0.39,0.67)]、結直腸癌[OR=0.20,95%CI(0.09,0.45)]、子宮內膜癌[OR=0.25,95%CI(0.07,0.94)]和肺癌[OR=0.45,95%CI(0.21,0.94)]發生風險呈負相關[63]。也有研究表明,促炎因子對癌癥發生的影響存在性別差異,如嗜酸性粒細胞趨化因子可以增加男性腎細胞癌風險[OR=2.55,95%CI(1.62,4.01)],但未在女性中發現顯著關聯[64]。③ 端粒:端粒長度(telomere length,TL)隨著人類生理性衰老而縮短。短TL可誘導細胞衰老或凋亡,從而抑制腫瘤發生,但也可通過復雜的染色體重排促進基因組的不穩定性累積,導致癌細胞的形成[65]。長TL反映組織端粒酶活性較高,可以促進癌細胞的增殖過程[66]。目前,多數MR分析結果支持長TL增加癌癥發生風險,如長TL增加肺癌發生風險[OR=2.25,95%CI(1.81,2.78)][67],但也發現TL與部分癌癥發生風險無關,如頭頸癌[OR=0.90,95%CI(0.70,1.05)][68]。此外,也有研究指出TL與癌癥發生風險呈U形關聯,即較長或較短的TL均可能促進致癌進程[69]。④ 其它:腸道菌群是居住在胃腸道的微生物群,與結直腸癌的發生密切相關[70],也可能是其它癌癥的病因之一,包括乳腺癌、肺癌、前列腺癌、膀胱癌、卵巢癌、子宮內膜癌、胃癌、結直腸癌、肝癌[71-74]。激素類生物標志物包括睪酮、雌激素、孕激素、甲狀腺素、性激素結合球蛋白等[75]。有研究表明,高水平睪酮可使前列腺癌發生風險增加17%,但是,可以使胃癌的發生風險降低34%、胰腺癌的發生風險降低41%[76]。
2.1.4 其它疾病
包括癌癥在內的疾病可能影響癌癥的發生和發展。抑郁癥增加乳腺癌風險[OR=1.09,95%CI(1.03,1.15)][77]。甲狀腺功能亢進癥可導致前列腺癌風險下降[OR=0.86,95%CI(0.79,0.94)]和結腸癌風險升高[OR=1.13,95%CI(1.02,1.25)][78]。慢性乙型肝炎病毒感染可能是肝細胞癌和肝外癌癥的風險因素之一,包括肝癌[OR=1.20,95%CI(1.07,1.34)]、宮頸癌[OR=1.57,95%CI(1.29,1.91)]和胃癌[OR=1.12,95%CI(1.05,1.19)][79]。2型糖尿病是胰腺癌、腎癌、子宮癌和宮頸癌的危險因素,以及可能是食管癌和黑色素瘤的保護因素[80]。MR方法也應用于原發性癌癥與繼發性癌癥的關聯研究中,如遺傳預測的雌激素受體陽性乳腺癌增加甲狀腺癌風險[OR=1.14,95%CI(1.01,1.28)][81];原發性肺癌繼發結直腸癌的風險略為增加[82]。
2.1.5 社會因素
研究表明,額外接受3.6年的教育可降低52%的肺癌發生風險[83],較高水平的教育程度可降低36%的食管癌發生風險。教育對癌癥的保護效應可能是通過減少吸煙(14.2%)和降低BMI(15.8%)起到中介效應[84]。
2.2 MR方法在癌癥治療中的應用
目前,MR方法在癌癥治療中的應用主要包括探索癌癥治療靶點以及預測或評價癌癥藥物的療效和不良反應。血漿蛋白是血液的重要成分,參與人體內各種生理過程,如信號傳導、運輸、修復和免疫防御等[85],在癌細胞生長、遷移、侵襲和腫瘤微環境形成中起到重要作用,是多數癌癥藥物的作用靶點[55]。從藥物研發與評價的角度出發,相關蛋白編碼基因區域的變異可作為蛋白靶點藥理作用的IVs。從遺傳角度評估蛋白靶點與癌癥的關聯性以及探索靶點相關的分子機制和信號通路,可以快速評價蛋白靶向藥物的有效性,初步評估毒副作用,以及探索老藥新用的可能性,為癌癥的精準治療提供了新路徑[86]。
一項大型MR研究利用癌癥GWAS數據和蛋白數量性狀位點(protein quantitative trait loci,pQTL)數據,全面構建了前列腺癌、乳腺癌、肺癌、結直腸癌、膀胱癌、卵巢癌、腎癌和胃癌與血漿蛋白的因果網絡,并使用雙向MR、貝葉斯共定位分析(colocalization)和表型掃描(phenotype scanning)技術進行驗證,最終發現了13個前列腺癌、乳腺癌和肺癌的潛在治療靶點[87]。此外,有研究利用高血壓藥物靶點相關變異,發現了遺傳預測的血管緊張素轉換酶抑制劑(angiotension converting enzyme inhibitors,ACEI)在結直腸癌預防中老藥新用的可能性,但仍需謹慎考慮可能的不良反應[88]。
3 應用展望
3.1 在癌癥精準預防方面的應用展望
癌癥的發生、發展往往涉及復雜的病理和生理過程。不同群體的癌癥發生風險因素種類和影響程度也有所差異。隨著高通量分析技術的發展,組學數據日益豐富,包括基因表達數據(基因組學)、甲基化數據(表觀基因組學)、蛋白質數據(蛋白質組學)、轉錄數據(轉錄組學)和代謝物(代謝組學)等。此外,傳統的“假設驅動”MR分析已逐漸擴展為“無假設”全表型MR關聯研究(phenome-wide association MR study,MR-PheWAS),這種方法利用高維組學數據同時進行數百或數千個統計檢驗,以分析單個暴露因素與多個癌癥結局或多個暴露因素與單個癌癥結局的關聯[89]。因此,可將組學數據與兩階段MR、網狀MR、多變量MR和MR-PheWAS等方法結合,從遺傳層面快速繪制針對特定人群的“分子細胞-宏觀因素”癌癥病因網絡,揭示宏觀表型的微觀機制,探索癌癥預防的高效靶點,協助構建預測模型,有助于深入理解癌癥發病機制以及為癌癥精準預防決策提供參考。
3.2 在癌癥精準治療方面的應用展望
臨床試驗是癌癥藥物研發的關鍵環節。但是,癌癥相關的臨床試驗既昂貴又耗時,實施條件和倫理要求較為苛刻。藥企可能面臨著藥物研發失敗的高昂成本壓力[90]。2021年,美國批準的藥物中有三分之二得到了人類遺傳學的證據支持[91]。有研究報道,具有遺傳證據支持的藥物臨床試驗成功率是沒有遺傳證據支持的兩倍[92]。基于MR分析的癌癥靶向藥物研發具備較好的時間優勢和經濟效益。研究者可以基于MR-PheWAS、共定位技術等方法構建大樣本中國人群癌癥藥物靶點篩選數據庫,進而快速識別高效低毒的癌癥藥物治療靶點,探索癌癥治療中的同病異治(同一癌種亞型的不同治療靶點)、異病同治(不同癌種的同一治療靶點),協助構建預后模型,有助于加快藥物研發進程和提高臨床試驗成功率。
4 總結
目前,MR方法已在癌癥防治研究的多個領域中廣泛應用,例如:癌癥風險因素評估、癌癥治療靶點探索以及癌癥藥物的療效和不良反應評價。愈加豐富的高位組學數據和MR設計方法極大地擴展了癌癥防治研究的范圍和維度,為構建癌癥病因網絡和藥物靶向數據庫提供了一種切實可行的方法,可為癌癥的精準防治提供科學依據。