引用本文: 張光文, 成晨, 王世明. 單細胞轉錄組測序及它在乳腺癌腫瘤微環境中的研究進展. 中國普外基礎與臨床雜志, 2024, 31(4): 495-501. doi: 10.7507/1007-9424.202311050 復制
版權信息: ?四川大學華西醫院華西期刊社《中國普外基礎與臨床雜志》版權所有,未經授權不得轉載、改編
2020年乳腺癌已成為全球癌癥發病譜和女性死亡譜首位,嚴重威脅女性健康[1]。乳腺癌的發生和發展與腫瘤微環境(tumor microenvironment,TME)密切相關。因此,進一步了解乳腺癌的發病機制、異質性以及它與TME交互作用對乳腺癌診斷及精準治療至關重要。目前,針對乳腺癌發病機制的研究方法多為傳統批量測序,該方法主要提供腫瘤細胞群體基因表達的平均數量,不能捕捉腫瘤細胞群體中存在的異質性,也無法獲得TME的具體情況。近年來興起的單細胞RNA測序(single-cell RNA sequencing,scRNA-seq)技術能夠通過分離和捕獲單個細胞,獲得個體的轉錄本信息,進而將轉錄本信息映射到單個細胞形成測序文庫,用于評估細胞群體和生物系統基本生物學特性[2];它還可以通過檢測腫瘤組織中細胞表達的差異,分析已知細胞的轉錄本信息或發現新的細胞類型[3]。由于乳腺癌是一類異質性極高的惡性腫瘤,尤其是三陰性乳腺癌(triple-negative breast cancer,TNBC),其TME是一個高度異質的生態系統,它們促進腫瘤的遷移、侵襲、轉移甚至藥物抵抗。因此,了解scRNA-seq和乳腺癌的TME對臨床醫生為患者選擇更有效的個體化治療方案及改善患者的預后至關重要。
1 scRNA-seq技術介紹
1.1 scRNA-seq技術的發展及意義
自1977年測序技術出現以來,測序技術發展迅猛,已經從第1代發展到了第4代。測序技術逐漸成為人類探索基因最有用的工具,測序的樣本逐漸由組織或大量細胞發展至如今的單細胞層面,已開發出許多單細胞測序方法,包括全外顯子組測序、scRNA-seq、全基因組測序、全DNA甲基化測序、轉座酶可接近性核染色質區域測序等[4]。其中scRNA-seq是目前應用最廣泛的單細胞測序方法。2009年Tang等[5]首次報道了在單個細胞中應用高通量測序對轉錄組學進行研究,但該技術只能描繪單個細胞的轉錄組特征,應用范圍有限。為了提高測序效率,目前已建立了一系列scRNA-seq技術,如單細胞標記的逆轉錄測序、RNA轉錄物5′ 端轉換機制測序(switching mechanism at 5′ end of the RNA transcript,Smart-seq)、細胞表達線性擴增測序、Smart-seq2、液滴單細胞RNA測序、索引液滴RNA測序、10×Genology測序、Smart-seq3、dA拖尾法對單個細胞大規模轉錄組分析等[6-9],scRNA-seq技術從最初只能檢測幾個細胞到現在單次實驗可以同時檢測數十萬個細胞,顯著提高了實驗效率。同時,單細胞分離、建庫、測序等環節的改進使得測序成本降低以及所獲有效信息量增加。在近十年里,scRNA-seq已成為生物醫學研究的關鍵,特別是在發育生物學、癌癥、免疫學和神經科學方面[10]。與傳統的轉錄組測序相比,scRNA-seq從分子水平揭示某些細胞亞群的表達、篩查早期疾病、評估臨床病情、闡明藥物作用機制等方面具有較大的優勢[11]。
1.2 scRNA-seq工作流程
scRNA-seq的工作流程包括以下步驟:樣品制備、單細胞分離和捕獲、逆轉錄、cDNA擴增、單細胞文庫制備、RNA測序和數據分析[12]。① 樣品制備,包括目標組織采集及保存。② 單細胞分離和捕獲,即通過物理破壞或化學方法從組織中捕獲高質量單個細胞,從中提取精確的遺傳和生化信息,目前常用的細胞分離方法包括連續稀釋法、顯微操作法、激光顯微切割法、流式細胞法、微孔芯片技術、微流控技術等[13-15]。③ 逆轉錄、cDNA擴增和單細胞文庫制備,此是轉錄組測序的關鍵步驟。一般情況下,由于單細胞中RNA含量低,存在scRNA-seq結果陰性可能,因此進行測序操作前需要對單細胞中的核酸進行擴增,以提高核酸含量以便進行后續實驗分析,其具體方法是,首先將獲取的RNA逆轉錄成cDNA,然后進行擴增形成單細胞RNA文庫。隨著多個測序平臺的發展,轉錄組測序文庫制備技術也呈現出快速、多樣化的發展。因此,了解不同的scRNA-seq文庫制備方法的特點和應用,能夠指導研究者在科學研究中做出適當選擇,更好地進行科學研究和臨床驗證。④ RNA測序,包括第二代高通量測序和第三代高通量測序。第二代高通量測序具有測序成本較低和測序效率較高的特點,而第三代高通量測序基于單分子測序技術,不依賴聚合酶鏈式反應(polymerase chain reaction,PCR)擴增技術,能夠避免PCR擴增產生的誤差。⑤ 數據分析。在單細胞分離和單細胞文庫構建之后,原始測序數據通過Cellranger等處理轉換為基因表達譜以便進行后續數據分析[16],由于數據分析方法復雜多樣,極具挑戰性,因此單獨介紹。
1.3 scRNA-seq數據分析
scRNA-seq數據分析包括上游數據分析和下游數據分析[17]。
上游數據分析包括:數據質量控制、標準化、批量效應和數據集成[17]。① 質量控制,包括確定每個序列的計數數量、基因數量及線粒體基因計數比例[18],其中部分細胞因基因數量少和線粒體基因計數比例高被認為質量不佳而被去除;同時控制環境中的RNA污染也很重要,環境RNA是存在于單細胞溶液中的RNA,在封裝過程中并入油滴中,因此使用用于估計和消除此類污染的方法和工具SoupX測量來自空滴的環境RNA污染后并將它剔除。② 標準化,單細胞數據需要經過不同類型和級別的標準化處理,如總測序計數會改變原始計數,因此基因計數應調整為總計數深度,它是數據分析中必不可少的一步。常用標準化歸一化的方法有SCtransform、SCNorm、BayNorm等[19-21]。③ 批量效應校正和數據集成,經過處理后一般會生成多個數據集,這就需要消除批量效應并進行數據集成,常用方法有Scanorama、Harmony等[22-23]。
下游數據分析包括:細胞類型鑒定、細胞和基因水平的分析[17]。其中細胞和基因水平的分析以細胞類型鑒定為基礎,且通常根據客觀結果及研究者主觀認識決定后續分析方向,因此,此處重點介紹細胞類型鑒定,它包括降維、聚類和細胞注釋。① 降維,通過線性和非線性方法實現,前者最常用的方法是主成分分析,但因它受到線性降維和數據需符合正態分布的限制,不適合運用于scRNA-seq數據集的降維處理。非線性降維方法應用廣泛,能有效避免相關表征的過度擁擠并在重疊區域表示出不同的簇,具體方法包括t分布隨機鄰居嵌入(t-distributed stochastic neighbor embedding,t-SNE)、一致流形逼近與投影(uniform manifold approximation and projection,UMAP)、擴散映射等[24-26],其中t-SNE和UMAP優勢各不相同,t-SNE著重提供數據的維度位置,同時最大限度減少相鄰數據點之間距離的失真;UMAP則能保留更多的全局結構,在運行時間上具有一定優勢,可重復性更高。而在實際應用中往往是t-SNE和UMAP聯合使用。② 聚類是scRNA-seq進行細胞類型鑒定的關鍵步驟,常用方法大多是基于無監督學習的算法,如k均值聚類、分層聚類、基于密度的聚類、社區發現等[27]。③ 注釋是將聚類獲得的簇準確可靠地與相應細胞類型匹配,常通過細胞差異表達基因或標志基因對簇進行注釋。各種聚類和注釋方法不斷進步發展,可指導實驗方案制訂并提供佐證,但無法將它完全替代,因此仍需進一步探索聚類與注釋方法。細胞和基因水平的分析方法包括差異表達、功能富集、細胞比例變化、軌跡分析、基因調控網絡、細胞通訊等[28]。
目前已發展了較多單細胞轉錄組數據集分析方法,單細胞轉錄組數據分析的前景廣闊,但挖掘與探索新的分析方法仍然面臨重大挑戰。總的來說,隨著scRNA-seq數據分析方法與技術的不斷進步,未來能更好地了解各種疾病的發病機制,進而實現個體化治療。
2 乳腺癌的異質性
腫瘤異質性是指在惡性腫瘤發展過程中經過數次分裂增殖后,其子代細胞的基因或分子生物學發生了改變,其生長速度、侵襲能力、對藥物敏感性、預后等方面產生差異[29]。乳腺癌絕大部分患者都有異質性表現,包括病理學、基因組改變、基因表達和TME的異質性,它們共同影響臨床行為和治療反應,因此,了解乳腺癌異質性的起源和機制非常重要。乳腺癌具有多種分子亞型,各種亞型的腫瘤異質性機制存在差異,尤其是TNBC,它是一種預后較差的乳腺癌分型,與激素受體陽性乳腺癌相比,雖然它接受新輔助化療的有效率更高,但仍難以達到病理完全緩解[30],此結果提示,可能存在部分對化療不敏感的TNBC細胞亞群,因此,準確鑒定這些細胞亞群可為TNBC的靶向治療和改善其預后研究奠定基礎。由于scRNA-seq技術可清晰地顯示乳腺癌內部細胞構成、鑒定細胞類型與亞型,可用于研究腫瘤異質性的起源和機制。Karaayvaz等[31]通過對未經治療的原發TNBC進行scRNA-seq證實了原發TNBC的細胞異質性,并通過聚類分析確定了5個不同的細胞簇,其中在上皮細胞簇中循環細胞比例最高,提示增殖能力高且與較差的生存預后有關。除TNBC外,scRNA-seq也可被用于其他乳腺癌亞型的研究。因此,在scRNA-seq技術的指導下,臨床醫生可為不同分子分型的乳腺癌患者選擇更有效的治療方案,改善患者的預后。
3 scRNA-seq在乳腺癌TME中的研究進展
乳腺癌的發生和發展不僅依賴于腫瘤細胞的增殖,還依賴于TME的異質性。乳腺癌TME主要由腫瘤細胞、免疫細胞和間質細胞組成。其中腫瘤浸潤免疫細胞、腫瘤相關成纖維細胞(cancer-associated fibroblasts,CAFs)等微環境成分與腫瘤發展、腫瘤血管形成、腫瘤免疫反應等生物過程相關[32-33],同時這些細胞已被證實在乳腺癌的發生、發展和轉移中起著關鍵的作用。然而對乳腺癌TME的詳細了解在很大程度上仍然是未知的。scRNA-seq技術的出現為探索復雜的乳腺癌TME、進一步促進個體化治療和克服耐藥性提供了技術支持。下面簡要介紹一些應用scRNA-seq技術探索乳腺癌TME異質性的重要研究。
3.1 腫瘤細胞
近年來,針對乳腺癌基因表達譜的研究已經確定了雌激素受體(estrogen receptor,ER)、孕激素受體(progesterone receptor,PR)、人表皮生長因子受體2(HER2)等特異性標志物,用于乳腺癌亞型診斷并指導內分泌治療和靶向治療。然而腫瘤內的異質性可影響甚至限制內分泌和特定靶向治療的反應和臨床效果[34],例如有研究[35]表明,HER2表達在患者治療過程中并不是恒定的,存在ER、HER2陽性患者在經抗HER2靶向治療后再次取病理組織進行免疫組織化學染色檢測時發現轉為ER陽性、HER2陰性的現象,但其機制不明。scRNA-seq技術為從單細胞分辨率下評估乳腺癌的腫瘤異質性、闡明其生物學復雜性提供了一種手段。① scRNA-seq技術可為乳腺癌抗腫瘤治療提供技術支持。根據ER、PR和HER2表達情況,乳腺癌分為Luminal A型、Luminal B型、HER2陽性型及三陰性4種分型[36]。Chung等[37]對11例診斷為4種分型的乳腺癌患者的515個腫瘤細胞進行scRNA-seq分析發現,免疫組織化學染色結果診斷為ER和HER2陽性的腫瘤中因腫瘤異質性導致分離出的絕大部分腫瘤細胞為ER、HER2陽性,但也有少部分為ER陽性、HER2陰性,其原因是由于部分細胞HER2基因低表達和ER分子信號通路的激活。因此scRNA-seq技術可以幫助識別ER和HER2陽性乳腺癌,ER分子信號通路的顯著激活可能獲益于內分泌治療;部分腫瘤細胞HER2基因低表達可能對靶向治療具有抵抗性,因此,選擇合適的治療方案可能能夠顯著改善患者的預后。② scRNA-seq也可用于探索乳腺癌抗腫瘤治療后耐藥細胞亞群,為后續抗腫瘤治療提供指導。例如Wang等[38]應用scRNA-seq技術在乳腺癌細胞周期依賴性蛋白激酶4/6(cyclin-dependent kinase,CDK4/6)抑制劑耐藥腫瘤中發現了一種新的亞型,并且推測這種亞型進行酪氨酸激酶抑制劑聯合免疫檢查點阻斷可能有助于抗腫瘤免疫并逆轉CDK4/6抑制劑的耐藥性。Jang等[39]分析了乳腺癌scRNA-seq數據后發現,具有放射抗性的腫瘤細胞與較高的程序性死亡蛋白配體1(programmed death ligand 1,PD-L1)陽性率和腫瘤突變負荷相關;此外發現,與Luminal型和HER2陽性型乳腺癌相比,TNBC腫瘤細胞表達更高水平的免疫檢查點,此結果提示,放射治療結合免疫檢查點阻斷可有效對抗放射敏感和PD-L1過表達的腫瘤突變負荷較高的TNBC細胞。③ scRNA-seq可用于探索乳腺癌中起重要作用的基因與靶點,以期為乳腺癌綜合治療提供新思路。Zhou等[40]使用scRNA-seq對TNBC患者腫瘤細胞的基因調控網絡進行了全面分析,根據拷貝數變異鑒定出了545個惡性細胞并將它分型,然后通過整合基因共表達和轉錄結合基序的富集來構建每個亞型的基因調控網絡,根據基因的中心性指標確定了多個關鍵基因,其中ETS變體轉錄因子6(ETS variant transcription factor 6,ETV6)在所有亞型中普遍上調,因此ETV6被認為是TNBC發展的關鍵基因,它可以通過調節不同的靶基因在每個亞型中發揮不同的作用。綜上所述,scRNA-seq是一種很有前途的工具,可以用來探索識別乳腺癌細胞與免疫檢查點相關的標志分子或與腫瘤進展相關的基因,為臨床用藥提供指導,并更準確地預測個體藥物治療反應。
3.2 CAFs
CAFs是源自于各種細胞前體的腫瘤基質細胞的高度異質亞群,通常來源于正常駐留組織成纖維細胞、間充質干細胞、脂肪細胞、內皮細胞和周細胞[41-42]。CAFs是乳腺癌TME中最豐富的基質細胞[43]。根據整合素β1、成纖維細胞激活蛋白、平滑肌肌動蛋白等特異性標志物,目前將CAFs分為CAF-S1、CAF-S2、CAF-S3和CAF-S4亞群。隨著乳腺癌的進展,正常的乳腺間質被破壞,正常成纖維細胞減少,腫瘤細胞將成纖維細胞重新編程為CAFs[41]。CAFs依靠其強大的分泌和組織黏附能力分散在腫瘤組織內,促進腫瘤進展,然而它們在腫瘤發生、發展和治療反應中的作用與機制還不清楚。scRNA-seq技術可在單細胞水平揭示CAFs的生物特性,探索相關靶點以及評估藥物治療反應。① scRNA-seq可用于鑒定CAFs并根據相關基因表達情況分群。例如,Puram等[44]通過scRNA-seq分析證明了在乳腺癌中存在CAFs,它們主要參與免疫細胞向腫瘤的募集、誘導腫瘤細胞的上皮-間充質轉化。另外,根據目前已有scRNA-seq相關研究[45-46],CAFs被分為3個功能亞群:炎性CAFs、纖維母細胞性CAFs和細胞外基質性CAFs,它們可以直接或間接地與腫瘤細胞、髓系細胞和T細胞相互作用,促進腫瘤發展。Cords等[47]通過對14例乳腺癌患者的16 000多個間質細胞進行scRNA-seq分析發現了9個不同類型的CAFs,各個CAFs亞群的基因表達情況都與其功能相關,并且在臨床隊列中具有獨立的預后預測能力。② scRNA-seq也可用于尋求新的CAFs相關生物標志物和分子靶點。Li等[48]應用scRNA-seq數據分析篩選出與乳腺癌預后相關的14個特征基因并進行風險評分,風險評分越高的患者表現出腫瘤免疫抑制,它們對化學藥物治療和免疫治療的治療效果不佳,其中微纖維相關蛋白4在外部驗證集和實驗中均與CAFs具有較強的相關性。綜上所述,應用scRNA-seq對CAFs亞群的準確分型和對新靶點的探索為靶向CAFs的藥物開發提供了可能。
3.3 免疫細胞
乳腺癌TME中的免疫細胞包括腫瘤浸潤性淋巴細胞(tumor-infiltrating lymphocytes,TILs)、髓系細胞、自然殺傷(natural killer,NK)細胞等。有研究[49]表明,免疫細胞在腫瘤進展和治療反應中發揮著重要作用;同時有越來越多的證據支持免疫細胞浸潤在乳腺癌的進展中起關鍵作用[50]。目前TILs和髓系細胞已被證實與乳腺癌進展相關且scRNA-seq相關研究進展較多,而NK細胞在乳腺癌中的作用所知甚少且尚未發現scRNA-seq相關研究,因此,這一部分著重介紹TILs和髓系細胞這兩類免疫細胞在乳腺癌中的應用進展。
3.3.1 TILs
TILs包括T細胞、B細胞等。① 乳腺癌TME中T細胞是含量最豐富的免疫細胞,波動范圍大,約占免疫細胞總數的21%~96%[49]。浸潤性乳腺癌中T細胞數量和類型是決定治療和預后的關鍵因素。乳腺癌組織中T細胞類型眾多且存在異質性,隨著CD8+ T細胞向組織駐留記憶表型或耗竭的轉變,調節性T細胞通常占優勢地位;盡管CD4+、CD8+ 等T細胞類型功能異常,仍有部分CD8+ T細胞亞群因可與調節性T細胞和PD-L1+ T細胞相互作用并建立復雜的免疫抑制環境而具有顯著的免疫抑制作用,該CD8+ T細胞亞群的抗炎、耗竭、缺氧和無能基因上調,且其免疫治療靶基因在TILs中差異表達[51]。Azizi等[52]對8例乳腺癌患者的免疫細胞進行了scRNA-seq分析,驗證了腫瘤免疫細胞具有異質性,同時發現腫瘤組織和鄰近病變組織中的T細胞在轉錄組學上具有相似性,與外周循環系統中的T細胞又顯著不同,此結果提示,局部原發腫瘤對T細胞進行了重新編程。Savas等[53]對6 311個T細胞進行scRNA-seq分析后發現了一種新的組織駐留記憶CD8+ T細胞,且證明該細胞中程序性細胞死亡蛋白1、細胞毒性T淋巴細胞相關蛋白4等抑制性受體基因的表達較高,且還表達細胞毒效應蛋白,提示組織駐留記憶CD8+ T細胞可能與免疫監視相關。另外,Guo等[54]對乳腺癌患者的25932個細胞進行scRNA-seq分析發現,T細胞相關標志基因集中表達在與免疫相關的通路中,并以此建立預后模型,該模型有助于預測乳腺癌的預后和對治療的反應。綜上,腫瘤中的T細胞分子是一種有潛力的生物標志物,可用于乳腺癌的預后評估和治療監測,而應用scRNA-seq可進一步探索乳腺癌中T細胞中的標志分子,以期尋求新的治療靶點。② 腫瘤中的B細胞分為7類,即初始B細胞、IgM+CD27+ 記憶B細胞、IgM+CD27- 非典型記憶B細胞、轉換型記憶B細胞、漿細胞、生發中心B細胞和CD14+ 非典型B細胞。在乳腺癌中B細胞可能通過各種途徑促進免疫監視。Lu等[55]應用scRNA-seq對新輔助化療前(998個細胞)和新輔助化療后(1 499個細胞)乳腺癌患者臨床樣本中的B細胞進行分析發現,新輔助化療后出現獨特的誘導共刺激配體陽性B細胞亞群,并且它通過提高調節性 T 細胞的比率來增強抗腫瘤作用。Hu等[56]對乳腺癌中B細胞進行了scRNA-seq分析發現,B細胞可增加腫瘤中B細胞抗原受體的多樣性,主要表現出潛在的免疫原性和抗原提呈活性,并通過各種途徑發揮抗腫瘤作用。因此,應用scRNA-seq可能發現新的B細胞亞群并進一步探索在乳腺癌發生及發展過程中發揮的作用。
3.3.2 髓系細胞
髓系細胞包括腫瘤相關巨噬細胞(tumor-associated macrophage,TAMs)、腫瘤相關中性粒細胞(tumor-associated neutrophils,TANs)和腫瘤相關單核細胞,主要通過免疫抑制和細胞因子分泌促進腫瘤進展且具有異質性[57]。其中TAMs已被證實與乳腺癌相關,因此此處著重介紹TAMs。① TAMs是腫瘤病變中分布最廣泛的髓系細胞群,可分化為促炎癥的M1型或免疫抑制的M2型。Bao等[58]通過對TNBC患者臨床樣本進行scRNA-seq分析發現,CD276、CD163、MS4A6A、 轉化生長因子β誘導蛋白等在M2型TAMs中廣泛表達,表現出M2型級聯分化的特征,并且它們與TAMs具有較強的相關性,有作為預測預后和對免疫治療反應的標志物的潛力。另外,有研究者[59]通過采用scRNA-seq技術確定與M1、M2型TAMs相關的基因研究后認為,將M2型轉化為M1型是刺激免疫反應和提高乳腺癌治療效果的有效措施。Kersten等[60]研究發現,通過耗竭TAMs可啟動腫瘤浸潤CD8+ T細胞的耗竭程序并增強其免疫效應。此外,Wu等[61]對乳腺癌患者臨床樣本進行scRNA-seq分析發現,在脂質代謝基因(脂肪酸結合蛋白5和載脂蛋白E)高表達的腫瘤中存在一種新型脂質相關巨噬細胞,該細胞可通過表達PD-L1和PD-L2對乳腺癌進行免疫調節。綜上,scRNA-seq在單細胞層面可以將TAMs根據功能分為更詳細的細胞亞群,同時可發現新的細胞亞群并探索相關基因與生物標志物,最終為實現臨床轉化提供可能。② TANs已被認為是關鍵的腫瘤浸潤免疫細胞[62]。TANs可以通過驅動血管生成、細胞外基質重塑、轉移和免疫抑制參與腫瘤免疫,也可以通過直接殺死腫瘤細胞和參與抗腫瘤耐藥性來介導抗腫瘤反應[63]。但在乳腺癌中TANs作用所知有限,scRNA-seq相關研究較少。有研究[64]表明,乳腺癌細胞可以通過分泌腫瘤生長因子β細胞因子招募TANs并促進乳腺癌進展。因此scRNA-seq或可以為闡明TANs在乳腺癌中的作用機制提供新思路。③ 腫瘤相關單核細胞在乳腺癌TME中也起著非常關鍵的作用[65]。單核細胞可以分化為骨髓來源抑制細胞、巨噬細胞、樹突狀細胞等。腫瘤相關單核細胞相關scRNA-seq研究較少。因此,scRNA-seq有望用于了解乳腺癌TME中腫瘤相關單核細胞的性質并探索影響其分化的機制。
4 總結與展望
目前單細胞轉錄組學已初步用于乳腺癌TME的研究,但是更深入的技術和分析方法還未完全成熟,而且與乳腺癌發生及發展相關的TME尚未得到充分研究。新的單細胞轉錄組學技術(包括豐富的轉錄組學探索策略、多轉錄組學聯合分析模式以及深度學習網絡結構)也在飛速發展,有助于加深對乳腺癌TME的理解,為充分了解乳腺癌、尋求新的乳腺癌治療手段提供了可供選擇的分析方法。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:張光文提出選題并進行了文章撰寫;張光文和成晨共同進行了文獻檢索和資料收集;王世明對文章進行了審閱和修改。
2020年乳腺癌已成為全球癌癥發病譜和女性死亡譜首位,嚴重威脅女性健康[1]。乳腺癌的發生和發展與腫瘤微環境(tumor microenvironment,TME)密切相關。因此,進一步了解乳腺癌的發病機制、異質性以及它與TME交互作用對乳腺癌診斷及精準治療至關重要。目前,針對乳腺癌發病機制的研究方法多為傳統批量測序,該方法主要提供腫瘤細胞群體基因表達的平均數量,不能捕捉腫瘤細胞群體中存在的異質性,也無法獲得TME的具體情況。近年來興起的單細胞RNA測序(single-cell RNA sequencing,scRNA-seq)技術能夠通過分離和捕獲單個細胞,獲得個體的轉錄本信息,進而將轉錄本信息映射到單個細胞形成測序文庫,用于評估細胞群體和生物系統基本生物學特性[2];它還可以通過檢測腫瘤組織中細胞表達的差異,分析已知細胞的轉錄本信息或發現新的細胞類型[3]。由于乳腺癌是一類異質性極高的惡性腫瘤,尤其是三陰性乳腺癌(triple-negative breast cancer,TNBC),其TME是一個高度異質的生態系統,它們促進腫瘤的遷移、侵襲、轉移甚至藥物抵抗。因此,了解scRNA-seq和乳腺癌的TME對臨床醫生為患者選擇更有效的個體化治療方案及改善患者的預后至關重要。
1 scRNA-seq技術介紹
1.1 scRNA-seq技術的發展及意義
自1977年測序技術出現以來,測序技術發展迅猛,已經從第1代發展到了第4代。測序技術逐漸成為人類探索基因最有用的工具,測序的樣本逐漸由組織或大量細胞發展至如今的單細胞層面,已開發出許多單細胞測序方法,包括全外顯子組測序、scRNA-seq、全基因組測序、全DNA甲基化測序、轉座酶可接近性核染色質區域測序等[4]。其中scRNA-seq是目前應用最廣泛的單細胞測序方法。2009年Tang等[5]首次報道了在單個細胞中應用高通量測序對轉錄組學進行研究,但該技術只能描繪單個細胞的轉錄組特征,應用范圍有限。為了提高測序效率,目前已建立了一系列scRNA-seq技術,如單細胞標記的逆轉錄測序、RNA轉錄物5′ 端轉換機制測序(switching mechanism at 5′ end of the RNA transcript,Smart-seq)、細胞表達線性擴增測序、Smart-seq2、液滴單細胞RNA測序、索引液滴RNA測序、10×Genology測序、Smart-seq3、dA拖尾法對單個細胞大規模轉錄組分析等[6-9],scRNA-seq技術從最初只能檢測幾個細胞到現在單次實驗可以同時檢測數十萬個細胞,顯著提高了實驗效率。同時,單細胞分離、建庫、測序等環節的改進使得測序成本降低以及所獲有效信息量增加。在近十年里,scRNA-seq已成為生物醫學研究的關鍵,特別是在發育生物學、癌癥、免疫學和神經科學方面[10]。與傳統的轉錄組測序相比,scRNA-seq從分子水平揭示某些細胞亞群的表達、篩查早期疾病、評估臨床病情、闡明藥物作用機制等方面具有較大的優勢[11]。
1.2 scRNA-seq工作流程
scRNA-seq的工作流程包括以下步驟:樣品制備、單細胞分離和捕獲、逆轉錄、cDNA擴增、單細胞文庫制備、RNA測序和數據分析[12]。① 樣品制備,包括目標組織采集及保存。② 單細胞分離和捕獲,即通過物理破壞或化學方法從組織中捕獲高質量單個細胞,從中提取精確的遺傳和生化信息,目前常用的細胞分離方法包括連續稀釋法、顯微操作法、激光顯微切割法、流式細胞法、微孔芯片技術、微流控技術等[13-15]。③ 逆轉錄、cDNA擴增和單細胞文庫制備,此是轉錄組測序的關鍵步驟。一般情況下,由于單細胞中RNA含量低,存在scRNA-seq結果陰性可能,因此進行測序操作前需要對單細胞中的核酸進行擴增,以提高核酸含量以便進行后續實驗分析,其具體方法是,首先將獲取的RNA逆轉錄成cDNA,然后進行擴增形成單細胞RNA文庫。隨著多個測序平臺的發展,轉錄組測序文庫制備技術也呈現出快速、多樣化的發展。因此,了解不同的scRNA-seq文庫制備方法的特點和應用,能夠指導研究者在科學研究中做出適當選擇,更好地進行科學研究和臨床驗證。④ RNA測序,包括第二代高通量測序和第三代高通量測序。第二代高通量測序具有測序成本較低和測序效率較高的特點,而第三代高通量測序基于單分子測序技術,不依賴聚合酶鏈式反應(polymerase chain reaction,PCR)擴增技術,能夠避免PCR擴增產生的誤差。⑤ 數據分析。在單細胞分離和單細胞文庫構建之后,原始測序數據通過Cellranger等處理轉換為基因表達譜以便進行后續數據分析[16],由于數據分析方法復雜多樣,極具挑戰性,因此單獨介紹。
1.3 scRNA-seq數據分析
scRNA-seq數據分析包括上游數據分析和下游數據分析[17]。
上游數據分析包括:數據質量控制、標準化、批量效應和數據集成[17]。① 質量控制,包括確定每個序列的計數數量、基因數量及線粒體基因計數比例[18],其中部分細胞因基因數量少和線粒體基因計數比例高被認為質量不佳而被去除;同時控制環境中的RNA污染也很重要,環境RNA是存在于單細胞溶液中的RNA,在封裝過程中并入油滴中,因此使用用于估計和消除此類污染的方法和工具SoupX測量來自空滴的環境RNA污染后并將它剔除。② 標準化,單細胞數據需要經過不同類型和級別的標準化處理,如總測序計數會改變原始計數,因此基因計數應調整為總計數深度,它是數據分析中必不可少的一步。常用標準化歸一化的方法有SCtransform、SCNorm、BayNorm等[19-21]。③ 批量效應校正和數據集成,經過處理后一般會生成多個數據集,這就需要消除批量效應并進行數據集成,常用方法有Scanorama、Harmony等[22-23]。
下游數據分析包括:細胞類型鑒定、細胞和基因水平的分析[17]。其中細胞和基因水平的分析以細胞類型鑒定為基礎,且通常根據客觀結果及研究者主觀認識決定后續分析方向,因此,此處重點介紹細胞類型鑒定,它包括降維、聚類和細胞注釋。① 降維,通過線性和非線性方法實現,前者最常用的方法是主成分分析,但因它受到線性降維和數據需符合正態分布的限制,不適合運用于scRNA-seq數據集的降維處理。非線性降維方法應用廣泛,能有效避免相關表征的過度擁擠并在重疊區域表示出不同的簇,具體方法包括t分布隨機鄰居嵌入(t-distributed stochastic neighbor embedding,t-SNE)、一致流形逼近與投影(uniform manifold approximation and projection,UMAP)、擴散映射等[24-26],其中t-SNE和UMAP優勢各不相同,t-SNE著重提供數據的維度位置,同時最大限度減少相鄰數據點之間距離的失真;UMAP則能保留更多的全局結構,在運行時間上具有一定優勢,可重復性更高。而在實際應用中往往是t-SNE和UMAP聯合使用。② 聚類是scRNA-seq進行細胞類型鑒定的關鍵步驟,常用方法大多是基于無監督學習的算法,如k均值聚類、分層聚類、基于密度的聚類、社區發現等[27]。③ 注釋是將聚類獲得的簇準確可靠地與相應細胞類型匹配,常通過細胞差異表達基因或標志基因對簇進行注釋。各種聚類和注釋方法不斷進步發展,可指導實驗方案制訂并提供佐證,但無法將它完全替代,因此仍需進一步探索聚類與注釋方法。細胞和基因水平的分析方法包括差異表達、功能富集、細胞比例變化、軌跡分析、基因調控網絡、細胞通訊等[28]。
目前已發展了較多單細胞轉錄組數據集分析方法,單細胞轉錄組數據分析的前景廣闊,但挖掘與探索新的分析方法仍然面臨重大挑戰。總的來說,隨著scRNA-seq數據分析方法與技術的不斷進步,未來能更好地了解各種疾病的發病機制,進而實現個體化治療。
2 乳腺癌的異質性
腫瘤異質性是指在惡性腫瘤發展過程中經過數次分裂增殖后,其子代細胞的基因或分子生物學發生了改變,其生長速度、侵襲能力、對藥物敏感性、預后等方面產生差異[29]。乳腺癌絕大部分患者都有異質性表現,包括病理學、基因組改變、基因表達和TME的異質性,它們共同影響臨床行為和治療反應,因此,了解乳腺癌異質性的起源和機制非常重要。乳腺癌具有多種分子亞型,各種亞型的腫瘤異質性機制存在差異,尤其是TNBC,它是一種預后較差的乳腺癌分型,與激素受體陽性乳腺癌相比,雖然它接受新輔助化療的有效率更高,但仍難以達到病理完全緩解[30],此結果提示,可能存在部分對化療不敏感的TNBC細胞亞群,因此,準確鑒定這些細胞亞群可為TNBC的靶向治療和改善其預后研究奠定基礎。由于scRNA-seq技術可清晰地顯示乳腺癌內部細胞構成、鑒定細胞類型與亞型,可用于研究腫瘤異質性的起源和機制。Karaayvaz等[31]通過對未經治療的原發TNBC進行scRNA-seq證實了原發TNBC的細胞異質性,并通過聚類分析確定了5個不同的細胞簇,其中在上皮細胞簇中循環細胞比例最高,提示增殖能力高且與較差的生存預后有關。除TNBC外,scRNA-seq也可被用于其他乳腺癌亞型的研究。因此,在scRNA-seq技術的指導下,臨床醫生可為不同分子分型的乳腺癌患者選擇更有效的治療方案,改善患者的預后。
3 scRNA-seq在乳腺癌TME中的研究進展
乳腺癌的發生和發展不僅依賴于腫瘤細胞的增殖,還依賴于TME的異質性。乳腺癌TME主要由腫瘤細胞、免疫細胞和間質細胞組成。其中腫瘤浸潤免疫細胞、腫瘤相關成纖維細胞(cancer-associated fibroblasts,CAFs)等微環境成分與腫瘤發展、腫瘤血管形成、腫瘤免疫反應等生物過程相關[32-33],同時這些細胞已被證實在乳腺癌的發生、發展和轉移中起著關鍵的作用。然而對乳腺癌TME的詳細了解在很大程度上仍然是未知的。scRNA-seq技術的出現為探索復雜的乳腺癌TME、進一步促進個體化治療和克服耐藥性提供了技術支持。下面簡要介紹一些應用scRNA-seq技術探索乳腺癌TME異質性的重要研究。
3.1 腫瘤細胞
近年來,針對乳腺癌基因表達譜的研究已經確定了雌激素受體(estrogen receptor,ER)、孕激素受體(progesterone receptor,PR)、人表皮生長因子受體2(HER2)等特異性標志物,用于乳腺癌亞型診斷并指導內分泌治療和靶向治療。然而腫瘤內的異質性可影響甚至限制內分泌和特定靶向治療的反應和臨床效果[34],例如有研究[35]表明,HER2表達在患者治療過程中并不是恒定的,存在ER、HER2陽性患者在經抗HER2靶向治療后再次取病理組織進行免疫組織化學染色檢測時發現轉為ER陽性、HER2陰性的現象,但其機制不明。scRNA-seq技術為從單細胞分辨率下評估乳腺癌的腫瘤異質性、闡明其生物學復雜性提供了一種手段。① scRNA-seq技術可為乳腺癌抗腫瘤治療提供技術支持。根據ER、PR和HER2表達情況,乳腺癌分為Luminal A型、Luminal B型、HER2陽性型及三陰性4種分型[36]。Chung等[37]對11例診斷為4種分型的乳腺癌患者的515個腫瘤細胞進行scRNA-seq分析發現,免疫組織化學染色結果診斷為ER和HER2陽性的腫瘤中因腫瘤異質性導致分離出的絕大部分腫瘤細胞為ER、HER2陽性,但也有少部分為ER陽性、HER2陰性,其原因是由于部分細胞HER2基因低表達和ER分子信號通路的激活。因此scRNA-seq技術可以幫助識別ER和HER2陽性乳腺癌,ER分子信號通路的顯著激活可能獲益于內分泌治療;部分腫瘤細胞HER2基因低表達可能對靶向治療具有抵抗性,因此,選擇合適的治療方案可能能夠顯著改善患者的預后。② scRNA-seq也可用于探索乳腺癌抗腫瘤治療后耐藥細胞亞群,為后續抗腫瘤治療提供指導。例如Wang等[38]應用scRNA-seq技術在乳腺癌細胞周期依賴性蛋白激酶4/6(cyclin-dependent kinase,CDK4/6)抑制劑耐藥腫瘤中發現了一種新的亞型,并且推測這種亞型進行酪氨酸激酶抑制劑聯合免疫檢查點阻斷可能有助于抗腫瘤免疫并逆轉CDK4/6抑制劑的耐藥性。Jang等[39]分析了乳腺癌scRNA-seq數據后發現,具有放射抗性的腫瘤細胞與較高的程序性死亡蛋白配體1(programmed death ligand 1,PD-L1)陽性率和腫瘤突變負荷相關;此外發現,與Luminal型和HER2陽性型乳腺癌相比,TNBC腫瘤細胞表達更高水平的免疫檢查點,此結果提示,放射治療結合免疫檢查點阻斷可有效對抗放射敏感和PD-L1過表達的腫瘤突變負荷較高的TNBC細胞。③ scRNA-seq可用于探索乳腺癌中起重要作用的基因與靶點,以期為乳腺癌綜合治療提供新思路。Zhou等[40]使用scRNA-seq對TNBC患者腫瘤細胞的基因調控網絡進行了全面分析,根據拷貝數變異鑒定出了545個惡性細胞并將它分型,然后通過整合基因共表達和轉錄結合基序的富集來構建每個亞型的基因調控網絡,根據基因的中心性指標確定了多個關鍵基因,其中ETS變體轉錄因子6(ETS variant transcription factor 6,ETV6)在所有亞型中普遍上調,因此ETV6被認為是TNBC發展的關鍵基因,它可以通過調節不同的靶基因在每個亞型中發揮不同的作用。綜上所述,scRNA-seq是一種很有前途的工具,可以用來探索識別乳腺癌細胞與免疫檢查點相關的標志分子或與腫瘤進展相關的基因,為臨床用藥提供指導,并更準確地預測個體藥物治療反應。
3.2 CAFs
CAFs是源自于各種細胞前體的腫瘤基質細胞的高度異質亞群,通常來源于正常駐留組織成纖維細胞、間充質干細胞、脂肪細胞、內皮細胞和周細胞[41-42]。CAFs是乳腺癌TME中最豐富的基質細胞[43]。根據整合素β1、成纖維細胞激活蛋白、平滑肌肌動蛋白等特異性標志物,目前將CAFs分為CAF-S1、CAF-S2、CAF-S3和CAF-S4亞群。隨著乳腺癌的進展,正常的乳腺間質被破壞,正常成纖維細胞減少,腫瘤細胞將成纖維細胞重新編程為CAFs[41]。CAFs依靠其強大的分泌和組織黏附能力分散在腫瘤組織內,促進腫瘤進展,然而它們在腫瘤發生、發展和治療反應中的作用與機制還不清楚。scRNA-seq技術可在單細胞水平揭示CAFs的生物特性,探索相關靶點以及評估藥物治療反應。① scRNA-seq可用于鑒定CAFs并根據相關基因表達情況分群。例如,Puram等[44]通過scRNA-seq分析證明了在乳腺癌中存在CAFs,它們主要參與免疫細胞向腫瘤的募集、誘導腫瘤細胞的上皮-間充質轉化。另外,根據目前已有scRNA-seq相關研究[45-46],CAFs被分為3個功能亞群:炎性CAFs、纖維母細胞性CAFs和細胞外基質性CAFs,它們可以直接或間接地與腫瘤細胞、髓系細胞和T細胞相互作用,促進腫瘤發展。Cords等[47]通過對14例乳腺癌患者的16 000多個間質細胞進行scRNA-seq分析發現了9個不同類型的CAFs,各個CAFs亞群的基因表達情況都與其功能相關,并且在臨床隊列中具有獨立的預后預測能力。② scRNA-seq也可用于尋求新的CAFs相關生物標志物和分子靶點。Li等[48]應用scRNA-seq數據分析篩選出與乳腺癌預后相關的14個特征基因并進行風險評分,風險評分越高的患者表現出腫瘤免疫抑制,它們對化學藥物治療和免疫治療的治療效果不佳,其中微纖維相關蛋白4在外部驗證集和實驗中均與CAFs具有較強的相關性。綜上所述,應用scRNA-seq對CAFs亞群的準確分型和對新靶點的探索為靶向CAFs的藥物開發提供了可能。
3.3 免疫細胞
乳腺癌TME中的免疫細胞包括腫瘤浸潤性淋巴細胞(tumor-infiltrating lymphocytes,TILs)、髓系細胞、自然殺傷(natural killer,NK)細胞等。有研究[49]表明,免疫細胞在腫瘤進展和治療反應中發揮著重要作用;同時有越來越多的證據支持免疫細胞浸潤在乳腺癌的進展中起關鍵作用[50]。目前TILs和髓系細胞已被證實與乳腺癌進展相關且scRNA-seq相關研究進展較多,而NK細胞在乳腺癌中的作用所知甚少且尚未發現scRNA-seq相關研究,因此,這一部分著重介紹TILs和髓系細胞這兩類免疫細胞在乳腺癌中的應用進展。
3.3.1 TILs
TILs包括T細胞、B細胞等。① 乳腺癌TME中T細胞是含量最豐富的免疫細胞,波動范圍大,約占免疫細胞總數的21%~96%[49]。浸潤性乳腺癌中T細胞數量和類型是決定治療和預后的關鍵因素。乳腺癌組織中T細胞類型眾多且存在異質性,隨著CD8+ T細胞向組織駐留記憶表型或耗竭的轉變,調節性T細胞通常占優勢地位;盡管CD4+、CD8+ 等T細胞類型功能異常,仍有部分CD8+ T細胞亞群因可與調節性T細胞和PD-L1+ T細胞相互作用并建立復雜的免疫抑制環境而具有顯著的免疫抑制作用,該CD8+ T細胞亞群的抗炎、耗竭、缺氧和無能基因上調,且其免疫治療靶基因在TILs中差異表達[51]。Azizi等[52]對8例乳腺癌患者的免疫細胞進行了scRNA-seq分析,驗證了腫瘤免疫細胞具有異質性,同時發現腫瘤組織和鄰近病變組織中的T細胞在轉錄組學上具有相似性,與外周循環系統中的T細胞又顯著不同,此結果提示,局部原發腫瘤對T細胞進行了重新編程。Savas等[53]對6 311個T細胞進行scRNA-seq分析后發現了一種新的組織駐留記憶CD8+ T細胞,且證明該細胞中程序性細胞死亡蛋白1、細胞毒性T淋巴細胞相關蛋白4等抑制性受體基因的表達較高,且還表達細胞毒效應蛋白,提示組織駐留記憶CD8+ T細胞可能與免疫監視相關。另外,Guo等[54]對乳腺癌患者的25932個細胞進行scRNA-seq分析發現,T細胞相關標志基因集中表達在與免疫相關的通路中,并以此建立預后模型,該模型有助于預測乳腺癌的預后和對治療的反應。綜上,腫瘤中的T細胞分子是一種有潛力的生物標志物,可用于乳腺癌的預后評估和治療監測,而應用scRNA-seq可進一步探索乳腺癌中T細胞中的標志分子,以期尋求新的治療靶點。② 腫瘤中的B細胞分為7類,即初始B細胞、IgM+CD27+ 記憶B細胞、IgM+CD27- 非典型記憶B細胞、轉換型記憶B細胞、漿細胞、生發中心B細胞和CD14+ 非典型B細胞。在乳腺癌中B細胞可能通過各種途徑促進免疫監視。Lu等[55]應用scRNA-seq對新輔助化療前(998個細胞)和新輔助化療后(1 499個細胞)乳腺癌患者臨床樣本中的B細胞進行分析發現,新輔助化療后出現獨特的誘導共刺激配體陽性B細胞亞群,并且它通過提高調節性 T 細胞的比率來增強抗腫瘤作用。Hu等[56]對乳腺癌中B細胞進行了scRNA-seq分析發現,B細胞可增加腫瘤中B細胞抗原受體的多樣性,主要表現出潛在的免疫原性和抗原提呈活性,并通過各種途徑發揮抗腫瘤作用。因此,應用scRNA-seq可能發現新的B細胞亞群并進一步探索在乳腺癌發生及發展過程中發揮的作用。
3.3.2 髓系細胞
髓系細胞包括腫瘤相關巨噬細胞(tumor-associated macrophage,TAMs)、腫瘤相關中性粒細胞(tumor-associated neutrophils,TANs)和腫瘤相關單核細胞,主要通過免疫抑制和細胞因子分泌促進腫瘤進展且具有異質性[57]。其中TAMs已被證實與乳腺癌相關,因此此處著重介紹TAMs。① TAMs是腫瘤病變中分布最廣泛的髓系細胞群,可分化為促炎癥的M1型或免疫抑制的M2型。Bao等[58]通過對TNBC患者臨床樣本進行scRNA-seq分析發現,CD276、CD163、MS4A6A、 轉化生長因子β誘導蛋白等在M2型TAMs中廣泛表達,表現出M2型級聯分化的特征,并且它們與TAMs具有較強的相關性,有作為預測預后和對免疫治療反應的標志物的潛力。另外,有研究者[59]通過采用scRNA-seq技術確定與M1、M2型TAMs相關的基因研究后認為,將M2型轉化為M1型是刺激免疫反應和提高乳腺癌治療效果的有效措施。Kersten等[60]研究發現,通過耗竭TAMs可啟動腫瘤浸潤CD8+ T細胞的耗竭程序并增強其免疫效應。此外,Wu等[61]對乳腺癌患者臨床樣本進行scRNA-seq分析發現,在脂質代謝基因(脂肪酸結合蛋白5和載脂蛋白E)高表達的腫瘤中存在一種新型脂質相關巨噬細胞,該細胞可通過表達PD-L1和PD-L2對乳腺癌進行免疫調節。綜上,scRNA-seq在單細胞層面可以將TAMs根據功能分為更詳細的細胞亞群,同時可發現新的細胞亞群并探索相關基因與生物標志物,最終為實現臨床轉化提供可能。② TANs已被認為是關鍵的腫瘤浸潤免疫細胞[62]。TANs可以通過驅動血管生成、細胞外基質重塑、轉移和免疫抑制參與腫瘤免疫,也可以通過直接殺死腫瘤細胞和參與抗腫瘤耐藥性來介導抗腫瘤反應[63]。但在乳腺癌中TANs作用所知有限,scRNA-seq相關研究較少。有研究[64]表明,乳腺癌細胞可以通過分泌腫瘤生長因子β細胞因子招募TANs并促進乳腺癌進展。因此scRNA-seq或可以為闡明TANs在乳腺癌中的作用機制提供新思路。③ 腫瘤相關單核細胞在乳腺癌TME中也起著非常關鍵的作用[65]。單核細胞可以分化為骨髓來源抑制細胞、巨噬細胞、樹突狀細胞等。腫瘤相關單核細胞相關scRNA-seq研究較少。因此,scRNA-seq有望用于了解乳腺癌TME中腫瘤相關單核細胞的性質并探索影響其分化的機制。
4 總結與展望
目前單細胞轉錄組學已初步用于乳腺癌TME的研究,但是更深入的技術和分析方法還未完全成熟,而且與乳腺癌發生及發展相關的TME尚未得到充分研究。新的單細胞轉錄組學技術(包括豐富的轉錄組學探索策略、多轉錄組學聯合分析模式以及深度學習網絡結構)也在飛速發展,有助于加深對乳腺癌TME的理解,為充分了解乳腺癌、尋求新的乳腺癌治療手段提供了可供選擇的分析方法。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:張光文提出選題并進行了文章撰寫;張光文和成晨共同進行了文獻檢索和資料收集;王世明對文章進行了審閱和修改。