近年來,單分子長讀長測序技術開始應用于臨床遺傳學檢測中。因其測序過程中無需對樣本進行擴增,且具有長讀長測序的特點,故其相較傳統的分子遺傳學檢測技術如一代測序、二代測序、染色體微陣列分析等具有獨特的應用優勢。該文對其在染色體結構異常檢測、單基因遺傳病檢測及單基因病胚胎植入前遺傳學檢測等領域的應用進行分析,同時也對其與傳統分子遺傳學檢測技術相比的應用優勢及局限性,以及該技術在臨床遺傳學檢測中的應用價值和前景進行探討。
引用本文: 任駿, 高夢, 彭翠婷, 劉珊玲. 單分子長讀長測序技術在臨床遺傳學中的應用實踐. 華西醫學, 2025, 40(1): 92-96. doi: 10.7507/1002-0179.202405023 復制
版權信息: ?四川大學華西醫院華西期刊社《華西醫學》版權所有,未經授權不得轉載、改編
隨著分子生物學技術的高速發展,越來越多的基因檢測技術成功應用于臨床。一代測序技術開啟了基因測序的篇章,至今仍為單堿基變異檢測的金標準。但由于其通量低,測序速度慢,限制了其在臨床上對大規模樣本量及高通量檢測中的應用。二代測序技術因測序通量高、成本相對較低等特性,已成為目前臨床基因測序中最常用的技術,例如基于二代測序技術的全外顯子測序及全基因組測序技術。但二代測序技術仍存在讀長短(通常不超過 500 bp,一般為 150 bp),無法準確檢測基因組高度重復序列區域、假基因/高度同源基因、鳥嘌呤/胞嘧啶(guanine / cytosine, GC)含量過低或過高等不足之處。目前,單分子長讀長測序技術,又稱為第三代測序技術,已經逐漸應用于臨床基因檢測,進一步提升了臨床遺傳學檢測技術的檢測范圍及效率。單分子長讀長測序技術相較一代及二代測序技術而言,不需要聚合酶鏈式反應(polymerase chain reaction, PCR)擴增過程,不存在 GC 偏好性,減少了由 PCR 引入的誤差,可實現對單個 DNA 分子進行長讀長實時測序。這些特性決定其在單基因病基因檢測、染色體結構變異檢測及單基因病胚胎植入前遺傳學檢測等領域具有其獨特的應用優勢[1-3]。
因此,本文擬通過單分子長讀長測序技術的臨床應用案例,對其在染色體結構異常、單基因遺傳病檢測及單基因病胚胎植入前遺傳學檢測等領域的應用進行分析,探討單分子長讀長測序在臨床遺傳學檢測中的應用前景。
1 單分子長讀長測序技術原理及實驗流程簡介
目前,臨床上應用的單分子長讀長測序技術檢測平臺主要包括美國太平洋生物公司(pacific biosciences, PacBio)推出的單分子實時(single-molecule real-time, SMRT)及英國牛津納米孔技術公司推出的 Oxford Nanopore,其檢測原理簡介如下。
1.1 PacBio SMRT
PacBio 于 2011 年率先推出 SMRT 測序技術,也被視為首個單分子長讀長測序技術。SMRT 測序技術通過 4 色熒光標記的不同堿基與模板鏈結合配對,通過檢測熒光信號來識別堿基[4],類似于二代測序技術的“邊合成邊測序”原理。在測序過程中,DNA 聚合酶會結合到單個 DNA 分子上。隨著聚合酶結合經熒光標記的互補核苷酸到模板 DNA 鏈上,可對這一過程產生的熒光進行實時檢測,從而讀出 DNA 序列。PacBio SMRT 測序技術還可通過分析同一 DNA 分子的多次讀取數據,識別和校正錯誤,從而生成準確度較高的序列信息。
1.2 Oxford Nanopore
2014 年,英國牛津納米孔技術公司推出納米孔測序技術,可對 DNA 或 RNA 進行測序。納米孔測序技術的原理是先將 DNA 解鏈為單鏈,在馬達蛋白牽引下使 DNA 通過固定在電阻膜上的直徑只有數納米的孔道。具有不同電荷及結構的堿基通過納米孔時導致電阻膜兩側的電流發生變化,從而通過檢測電信號的改變來判斷堿基類型[5]。與 PacBio SMRT 測序技術一樣,納米孔測序的過程也是可以實時檢測的。
1.3 實驗流程
以納米孔測序技術為例,其實驗操作主要包括長片段 DNA 提取、文庫構建、上機測序、數據分析等步驟。首先需進行長片段 DNA 的提取,這也是單分子長讀長測序技術中關鍵的一步,提取 DNA 長度 N50 平均為 10~30 kb,即該組 DNA 序列長度中至少 50%的序列長度大于該數值。隨后進行 DNA 末端修復、測序接頭連接及純化的操作,構建上機文庫。為方便儲存和運輸,芯片內含有儲存液用以保護納米孔蛋白。因此需要在測序前制備預處理液對芯片進行預處理,排出芯片內的儲存液,讓納米孔做好進行測序的準備。最后將文庫加入芯片的樣本孔中進行測序。在測序結束后,收集并導出測序數據,通過軟件對序列進行質量評估和注釋。
2 單分子長讀長測序技術在染色體結構變異檢測中的應用
染色體平衡易位是最常見的染色結構變異。人群中染色體平衡易位攜帶率約為 1/500~1/625[6-7]。在輔助生殖治療周期中,反復植入失敗或復發性流產的患者中染色體平衡易位攜帶率高達 1/20[8]。平衡易位攜帶者一般無明顯的臨床癥狀,但在減數分裂時四射體根據不同的分離模式會產生染色體結構異常或數目不平衡的配子,生育染色體異常后代的風險明顯升高[9-10]。夫婦一方為平衡易位,可表現為生育能力下降、復發流產、死產、出生缺陷等[11-12]。由于平衡易位不涉及遺傳物質明顯的缺失或重復,因此臨床上常規使用的分子遺傳學技術如染色體微陣列分析、拷貝數變異測序(二代測序)等技術通常無法檢出染色體平衡易位。目前臨床常用的檢測平衡易位的遺傳學技術包括 G 顯帶核型分析和熒光原位雜交等。G 顯帶核型分析最大的局限是分辨率低,在顯帶良好的情況下,一般只能識別≥5 Mb 的易位改變。而熒光原位雜交技術僅能對已知懷疑存在變異的區域進行檢測。單分子長讀長測序技術因其可對單個 DNA 分子測序、長測序讀長的特點,可實現“跨越”平衡易位斷點,因而在檢測微小平衡易位及確定易位斷點上具有獨特的優勢。國內外已有文獻報道納米孔測序在檢測平衡性結構變異方面的應用,其優勢在于長讀長和對斷點的直接檢測能力,但其在堿基識別精度上的局限性也被廣泛討論[13-14]。
以四川大學華西第二醫院醫學遺傳科(以下簡稱“我科”)的病例為例。我科通過應用納米孔測序技術精準識別了平衡易位攜帶者的斷點,并驗證了其在堿基水平的檢測能力。該平衡易位攜帶者為男性,臨床診斷為不育,核型為 46,XY,t(4;10)(q21.3;q11.2)。從其外周血中提取長片段 DNA(N50=15 kb),經末端修復和加接頭構建文庫后進行納米孔測序。通過生物信息學分析,推測斷點位于 4 號染色體 chr4:88170281 和 10 號染色體 chr10:56868706,而跨越斷點的序列其中一端比對到 4 號染色體,另一端比對到 10 號染色體。通過在斷點上下游設計特異性引物并進行一代測序技術驗證,發現斷點位置與納米孔測序結果高度一致。值得注意的是,chr10 斷點位置在 2 種技術間存在 7 bp 的差異,以一代測序結果為金標準,提示納米孔測序在單堿基水平的準確性仍有待提高。這種差異主要源于納米孔測序的技術特點。其堿基識別過程是通過將電信號轉換為堿基序列,但信號通常為 4~6 個堿基的綜合表現。由于堿基結構相似及甲基化修飾的影響,可能導致識別偏差。此外,算法對信號值的解讀仍存在改進空間。目前已有研究報道,通過優化算法、改進納米孔性能和多次讀取單分子 DNA,可進一步提高檢測精度[15]。
此外,Madjunkova 等[13]通過納米孔測序技術為 11 對一方攜帶平衡易位的夫婦進行了易位斷點的精確檢測。其中 2 對夫婦是在進行胚胎植入前染色體非整倍體檢測過程中,檢測結果提示可能存在隱匿性平衡易位,進而通過納米孔測序技術對其平衡易位斷點進行了驗證。林典梁教授團隊采用納米孔測序技術對 4 位平衡易位攜帶者的易位斷點信息進行了精確定位,提示單分子納米孔測序技術可作為一種精確定位易位斷點有效方法[14]。
3 單分子長讀長測序分析在單基因遺傳病中的應用
單基因遺傳病是指由 1 對等位基因變異導致的疾病。由于單基因病種類繁多,變異復雜,傳統的檢測方法通常需要根據致病變異的類型來選擇合適的檢測方法,如 PCR 結合一代測序技術檢測點突變、多重連接依賴的探針擴增技術檢測 DMD 基因外顯子缺失變異等。基于二代測序技術的全外顯子測序大大提高了單基因病的檢出效率,但由于二代測序技術本身的限制,其對具有高度同源序列假基因(如 CYP21A2)、動態突變(如 FMR1)等的檢測應用上仍有局限性。
以四川地區常見的單基因遺傳病地中海貧血為例,臨床上通常通過跨越斷裂點 PCR(Gap-PCR)及 PCR-反向點雜交法對中國人群常見地中海貧血基因變異(包括α-珠蛋白基因主要缺失型及點突變,以及β-珠蛋白基因點突變等)進行檢測,可檢出約 95%的基因變異。但常規檢測試劑盒通常不包括對--THAI、HKαα、αααanti4.2、αααanti3.7 等中國人群中相對罕見的地中海貧血基因型檢測引物。因此,該方法存在對罕見地中海貧血基因型漏檢的風險。在臨床上對于該方法檢測陰性,地中海貧血臨床表型較為明確的患者需結合其他基因檢測方法才能進行確診。同時,由于 HBA1 和 HBA2 基因高度同源,二代測序技術對上述幾類罕見地中海貧血基因變異的檢出率亦會受到探針及生信算法影響[16]。因此,就地中海貧血基因檢測而言,傳統檢測方法及二代測序技術的臨床應用均存在一定的局限性。因此,國內多家單位已開展單分子長讀長測序技術在地中海貧血基因檢測中的臨床應用等相關研究[17-18]。
為探究單分子長讀長測序技術在地中海貧血基因檢測中的臨床應用效果,我科對 100 例血常規、血紅蛋白電泳提示高度懷疑地中海貧血的患者同時進行了傳統地中海貧血基因檢測(Gap-PCR 及反向斑點雜交)和單分子長讀長測序技術檢測[19]。其結果顯示,單分子長讀長測序技術額外檢測出與地中海貧血相關的中國人群罕見位點變異(8 例)及結構變異(3 例)[19]。在 100 例高度懷疑地中海貧血患者中,1 例樣本由傳統 Gap-PCR 檢測結果提示為地中海貧血基因 SEA 缺失雜合攜帶,但該病例具有明確的地中海貧血臨床表型,因此可疑合并罕見地中海貧血位點變異或其他未被檢測到的點突變;單分子長讀長測序結果顯示該例樣本檢測出 HBA2 基因 3’UTR 區域存在 c.82G>A、c. 92A>G、c.98T>C 的點突變[19]。已有文獻報道該區域的點突變合并 SEA 雜合缺失,與地中海貧血血紅蛋白 H 病相關[20],符合該病例的臨床表型。
在單分子長讀長測序技術額外檢出的結構變異中,1 例為-α3.7 缺失型,結合一代測序技術驗證該缺失型的斷裂點位于 16 號染色體 chr16:173, 707-177, 518, 3812,為 1 例罕見的-α3.7 亞型(HGVS 命名為-α3.7 亞型Ⅲ)[21]。第 2 例罕見的結構變異為包含 HBA1 及 HBA2 在內的 11.1kb 的缺失型,對應的 HGVS 命名為 NC_000016.9:g.(220831_220860)_(231920_232003)del,該缺失會導致α0 地中海貧血,攜帶者通常臨床表現為小細胞低色素性貧血[22]。該缺失變異同樣容易被傳統檢測方法漏診。第 3 例結構變異為α珠蛋白三聯體變異(基因型為αααanti3.7/αα)。由此可見,對于地中海貧血基因的結構變異檢測,單分子長讀長測序技術可以檢測出傳統檢測方法無法檢出的特殊結構變異,如檢測α珠蛋白三聯體、特殊的片段缺失等,可彌補傳統地中海貧血基因檢測的不足,提高檢出率。
此外,鄔玲仟教授團隊通過單分子長讀長測序技術報道了針對先天性腎上腺皮質增生癥[23]、血友病 A[24]及脆性 X 綜合征[25]等單基因遺傳病新檢測策略。劉俊濤教授團隊采用單分子長讀長測序技術開發了針對法布雷病的檢測方法,并評估了該技術的臨床應用效能[26]。相關研究均提示了該技術在傳統分子遺傳學檢測技術較難攻克的假基因、動態突變相關疾病等方面具有重要的臨床應用價值。
4 單分子長讀長測序技術在單基因病胚胎植入前遺傳學檢測中的應用
單基因病胚胎植入前遺傳學檢測是指在胚胎植入宮腔前對其進行遺傳學檢測,選擇未遺傳變異的胚胎用于移植,避免下一代罹患夫婦相關的單基因遺傳病。由于胚胎植入前遺傳學檢測是對活檢的 5~10 個囊胚滋養外胚層細胞進行檢測,起始樣本量極低(約為 50 pg),在全基因組擴增過程中可能會發生等位基因脫扣而導致誤診。為保證檢測的準確性,在對胚胎直接進行致病變異位點檢測的同時,還需對胚胎進行連鎖分析檢測,結合先證者或家系成員信息構建單體型,判斷其是否遺傳風險染色體。通常情況下,需要根據先證者或患病/攜帶變異的家系成員基因型來構建單體型,區分出家系中哪一條染色體攜帶致病變異。但在新發變異或家系成員不全的遺傳病家系中,由于缺乏先證者或家系成員的基因型信息,因此無法通過常規方法構建單體型及進行連鎖分析,即無法區分致病變異位于 2 條染色體中的哪一條上。對于此類新發變異或家系成員不全的家系而言,單分子長讀長測序因其“單分子”測序的特性,其可對夫婦雙方的 DNA 分子直接進行測序,測序完成時即為一條“單體型”。由此可直接構建單體型及進行連鎖分析,無需通過先證者或家系成員基因型用于推斷攜帶致病變異的單體型和未攜帶致病變異的單體型。因此,單分子長讀長測序技術在單基因病胚胎植入前遺傳學檢測中具有獨特的應用優勢[27]。
我科通過單分子長讀長測序技術為 1 例 PKD1 基因新發變異家系進行了胚胎植入前遺傳學檢測。PKD1 基因變異導致的多囊腎病 1 型是最常見的遺傳性腎病,患者多在成年后雙側腎臟出現囊腫,隨年齡增長,逐漸長大的囊腫壓迫正常腎組織,損害腎臟結構和功能。該病還可引起肝囊腫、心臟瓣膜病、顱內動脈瘤等腎外病變[28-29]。在該病例中,基因檢測發現女方 PKD1 基因存在 c.11526G>C 變異,為與其疾病表型相關的可能致病性變異,該變異導致的多囊腎病 1 型呈常染色體顯性遺傳,有 50%的概率遺傳給下一代;同時,在基因檢測時還發現,女方父母 PKD1 基因上述位點未查見變異,即女方為新發變異,且該夫婦還未曾生育過,其家系中只出現過她 1 例患者,因此無法通過常規手段進行連鎖分析。Peng 等[30]通過納米孔測序方法,在女方外周血 DNA 中檢測到變異位點,同時成功根據變異上下游 1 Mb 范圍內單核苷酸多態性位點區分單體型,即分辨出是哪一條染色體上的等位基因發生了變異,成功完成家系預實驗。該夫婦在輔助生殖治療周期中共獲得 6 枚胚胎進行活檢;隨后,我科通過二代測序技術結合單分子長讀長測序技術,成功為 6 枚胚胎構建單體型并進行連鎖分析,同時對變異位點進行檢測,結合形態學評分,為該夫婦選擇了 1 枚未遺傳女方變異且未發現染色體非整倍體異常的胚胎用于移植;最后該夫婦成功生育 1 名健康女嬰。
此外,已有多個研究團隊報道了單分子長讀長測序技術在胚胎植入前單基因病檢測、染色體結構異常檢測等方面的臨床應用[27, 31-32]。
5 小結
單分子長讀長測序技術因其可對單分子 DNA 進行實時測序、長測序讀長、文庫構建過程無需 PCR 因而不存在 GC 偏好等特點,使其在精確定位染色體平衡易位斷點、對假基因、高度同源序列或重復序列的疾病基因診斷及單基因病胚胎植入前遺傳學檢測等領域有獨特的應用優勢和前景。但其目前仍存在樣本制備難度較大,測序成本較高,測序精度有待提高,測序后數據分析相對復雜等短板,臨床推廣應用也需積累更多的數據后進行評估。遺傳咨詢醫師應在充分了解單分子長讀長測序技術檢測原理,檢測優勢及局限性,充分評估患者病情的情況下進行臨床應用,并向患者告知是否存在可選擇的其他檢測方式及其優劣勢對比。新技術應用于臨床前,需在遵守國家相關法律法規的前提下,建議經醫療機構臨床醫療新技術相關管理委員會、倫理委員會討論通過,并由醫療機構進行監管。隨著單分子長讀長測序技術及生信分析技術的快速發展,相信其未來在臨床遺傳學檢測、分子診斷等相關領域將會有廣闊的應用前景。
利益沖突:所有作者聲明不存在利益沖突。
隨著分子生物學技術的高速發展,越來越多的基因檢測技術成功應用于臨床。一代測序技術開啟了基因測序的篇章,至今仍為單堿基變異檢測的金標準。但由于其通量低,測序速度慢,限制了其在臨床上對大規模樣本量及高通量檢測中的應用。二代測序技術因測序通量高、成本相對較低等特性,已成為目前臨床基因測序中最常用的技術,例如基于二代測序技術的全外顯子測序及全基因組測序技術。但二代測序技術仍存在讀長短(通常不超過 500 bp,一般為 150 bp),無法準確檢測基因組高度重復序列區域、假基因/高度同源基因、鳥嘌呤/胞嘧啶(guanine / cytosine, GC)含量過低或過高等不足之處。目前,單分子長讀長測序技術,又稱為第三代測序技術,已經逐漸應用于臨床基因檢測,進一步提升了臨床遺傳學檢測技術的檢測范圍及效率。單分子長讀長測序技術相較一代及二代測序技術而言,不需要聚合酶鏈式反應(polymerase chain reaction, PCR)擴增過程,不存在 GC 偏好性,減少了由 PCR 引入的誤差,可實現對單個 DNA 分子進行長讀長實時測序。這些特性決定其在單基因病基因檢測、染色體結構變異檢測及單基因病胚胎植入前遺傳學檢測等領域具有其獨特的應用優勢[1-3]。
因此,本文擬通過單分子長讀長測序技術的臨床應用案例,對其在染色體結構異常、單基因遺傳病檢測及單基因病胚胎植入前遺傳學檢測等領域的應用進行分析,探討單分子長讀長測序在臨床遺傳學檢測中的應用前景。
1 單分子長讀長測序技術原理及實驗流程簡介
目前,臨床上應用的單分子長讀長測序技術檢測平臺主要包括美國太平洋生物公司(pacific biosciences, PacBio)推出的單分子實時(single-molecule real-time, SMRT)及英國牛津納米孔技術公司推出的 Oxford Nanopore,其檢測原理簡介如下。
1.1 PacBio SMRT
PacBio 于 2011 年率先推出 SMRT 測序技術,也被視為首個單分子長讀長測序技術。SMRT 測序技術通過 4 色熒光標記的不同堿基與模板鏈結合配對,通過檢測熒光信號來識別堿基[4],類似于二代測序技術的“邊合成邊測序”原理。在測序過程中,DNA 聚合酶會結合到單個 DNA 分子上。隨著聚合酶結合經熒光標記的互補核苷酸到模板 DNA 鏈上,可對這一過程產生的熒光進行實時檢測,從而讀出 DNA 序列。PacBio SMRT 測序技術還可通過分析同一 DNA 分子的多次讀取數據,識別和校正錯誤,從而生成準確度較高的序列信息。
1.2 Oxford Nanopore
2014 年,英國牛津納米孔技術公司推出納米孔測序技術,可對 DNA 或 RNA 進行測序。納米孔測序技術的原理是先將 DNA 解鏈為單鏈,在馬達蛋白牽引下使 DNA 通過固定在電阻膜上的直徑只有數納米的孔道。具有不同電荷及結構的堿基通過納米孔時導致電阻膜兩側的電流發生變化,從而通過檢測電信號的改變來判斷堿基類型[5]。與 PacBio SMRT 測序技術一樣,納米孔測序的過程也是可以實時檢測的。
1.3 實驗流程
以納米孔測序技術為例,其實驗操作主要包括長片段 DNA 提取、文庫構建、上機測序、數據分析等步驟。首先需進行長片段 DNA 的提取,這也是單分子長讀長測序技術中關鍵的一步,提取 DNA 長度 N50 平均為 10~30 kb,即該組 DNA 序列長度中至少 50%的序列長度大于該數值。隨后進行 DNA 末端修復、測序接頭連接及純化的操作,構建上機文庫。為方便儲存和運輸,芯片內含有儲存液用以保護納米孔蛋白。因此需要在測序前制備預處理液對芯片進行預處理,排出芯片內的儲存液,讓納米孔做好進行測序的準備。最后將文庫加入芯片的樣本孔中進行測序。在測序結束后,收集并導出測序數據,通過軟件對序列進行質量評估和注釋。
2 單分子長讀長測序技術在染色體結構變異檢測中的應用
染色體平衡易位是最常見的染色結構變異。人群中染色體平衡易位攜帶率約為 1/500~1/625[6-7]。在輔助生殖治療周期中,反復植入失敗或復發性流產的患者中染色體平衡易位攜帶率高達 1/20[8]。平衡易位攜帶者一般無明顯的臨床癥狀,但在減數分裂時四射體根據不同的分離模式會產生染色體結構異常或數目不平衡的配子,生育染色體異常后代的風險明顯升高[9-10]。夫婦一方為平衡易位,可表現為生育能力下降、復發流產、死產、出生缺陷等[11-12]。由于平衡易位不涉及遺傳物質明顯的缺失或重復,因此臨床上常規使用的分子遺傳學技術如染色體微陣列分析、拷貝數變異測序(二代測序)等技術通常無法檢出染色體平衡易位。目前臨床常用的檢測平衡易位的遺傳學技術包括 G 顯帶核型分析和熒光原位雜交等。G 顯帶核型分析最大的局限是分辨率低,在顯帶良好的情況下,一般只能識別≥5 Mb 的易位改變。而熒光原位雜交技術僅能對已知懷疑存在變異的區域進行檢測。單分子長讀長測序技術因其可對單個 DNA 分子測序、長測序讀長的特點,可實現“跨越”平衡易位斷點,因而在檢測微小平衡易位及確定易位斷點上具有獨特的優勢。國內外已有文獻報道納米孔測序在檢測平衡性結構變異方面的應用,其優勢在于長讀長和對斷點的直接檢測能力,但其在堿基識別精度上的局限性也被廣泛討論[13-14]。
以四川大學華西第二醫院醫學遺傳科(以下簡稱“我科”)的病例為例。我科通過應用納米孔測序技術精準識別了平衡易位攜帶者的斷點,并驗證了其在堿基水平的檢測能力。該平衡易位攜帶者為男性,臨床診斷為不育,核型為 46,XY,t(4;10)(q21.3;q11.2)。從其外周血中提取長片段 DNA(N50=15 kb),經末端修復和加接頭構建文庫后進行納米孔測序。通過生物信息學分析,推測斷點位于 4 號染色體 chr4:88170281 和 10 號染色體 chr10:56868706,而跨越斷點的序列其中一端比對到 4 號染色體,另一端比對到 10 號染色體。通過在斷點上下游設計特異性引物并進行一代測序技術驗證,發現斷點位置與納米孔測序結果高度一致。值得注意的是,chr10 斷點位置在 2 種技術間存在 7 bp 的差異,以一代測序結果為金標準,提示納米孔測序在單堿基水平的準確性仍有待提高。這種差異主要源于納米孔測序的技術特點。其堿基識別過程是通過將電信號轉換為堿基序列,但信號通常為 4~6 個堿基的綜合表現。由于堿基結構相似及甲基化修飾的影響,可能導致識別偏差。此外,算法對信號值的解讀仍存在改進空間。目前已有研究報道,通過優化算法、改進納米孔性能和多次讀取單分子 DNA,可進一步提高檢測精度[15]。
此外,Madjunkova 等[13]通過納米孔測序技術為 11 對一方攜帶平衡易位的夫婦進行了易位斷點的精確檢測。其中 2 對夫婦是在進行胚胎植入前染色體非整倍體檢測過程中,檢測結果提示可能存在隱匿性平衡易位,進而通過納米孔測序技術對其平衡易位斷點進行了驗證。林典梁教授團隊采用納米孔測序技術對 4 位平衡易位攜帶者的易位斷點信息進行了精確定位,提示單分子納米孔測序技術可作為一種精確定位易位斷點有效方法[14]。
3 單分子長讀長測序分析在單基因遺傳病中的應用
單基因遺傳病是指由 1 對等位基因變異導致的疾病。由于單基因病種類繁多,變異復雜,傳統的檢測方法通常需要根據致病變異的類型來選擇合適的檢測方法,如 PCR 結合一代測序技術檢測點突變、多重連接依賴的探針擴增技術檢測 DMD 基因外顯子缺失變異等。基于二代測序技術的全外顯子測序大大提高了單基因病的檢出效率,但由于二代測序技術本身的限制,其對具有高度同源序列假基因(如 CYP21A2)、動態突變(如 FMR1)等的檢測應用上仍有局限性。
以四川地區常見的單基因遺傳病地中海貧血為例,臨床上通常通過跨越斷裂點 PCR(Gap-PCR)及 PCR-反向點雜交法對中國人群常見地中海貧血基因變異(包括α-珠蛋白基因主要缺失型及點突變,以及β-珠蛋白基因點突變等)進行檢測,可檢出約 95%的基因變異。但常規檢測試劑盒通常不包括對--THAI、HKαα、αααanti4.2、αααanti3.7 等中國人群中相對罕見的地中海貧血基因型檢測引物。因此,該方法存在對罕見地中海貧血基因型漏檢的風險。在臨床上對于該方法檢測陰性,地中海貧血臨床表型較為明確的患者需結合其他基因檢測方法才能進行確診。同時,由于 HBA1 和 HBA2 基因高度同源,二代測序技術對上述幾類罕見地中海貧血基因變異的檢出率亦會受到探針及生信算法影響[16]。因此,就地中海貧血基因檢測而言,傳統檢測方法及二代測序技術的臨床應用均存在一定的局限性。因此,國內多家單位已開展單分子長讀長測序技術在地中海貧血基因檢測中的臨床應用等相關研究[17-18]。
為探究單分子長讀長測序技術在地中海貧血基因檢測中的臨床應用效果,我科對 100 例血常規、血紅蛋白電泳提示高度懷疑地中海貧血的患者同時進行了傳統地中海貧血基因檢測(Gap-PCR 及反向斑點雜交)和單分子長讀長測序技術檢測[19]。其結果顯示,單分子長讀長測序技術額外檢測出與地中海貧血相關的中國人群罕見位點變異(8 例)及結構變異(3 例)[19]。在 100 例高度懷疑地中海貧血患者中,1 例樣本由傳統 Gap-PCR 檢測結果提示為地中海貧血基因 SEA 缺失雜合攜帶,但該病例具有明確的地中海貧血臨床表型,因此可疑合并罕見地中海貧血位點變異或其他未被檢測到的點突變;單分子長讀長測序結果顯示該例樣本檢測出 HBA2 基因 3’UTR 區域存在 c.82G>A、c. 92A>G、c.98T>C 的點突變[19]。已有文獻報道該區域的點突變合并 SEA 雜合缺失,與地中海貧血血紅蛋白 H 病相關[20],符合該病例的臨床表型。
在單分子長讀長測序技術額外檢出的結構變異中,1 例為-α3.7 缺失型,結合一代測序技術驗證該缺失型的斷裂點位于 16 號染色體 chr16:173, 707-177, 518, 3812,為 1 例罕見的-α3.7 亞型(HGVS 命名為-α3.7 亞型Ⅲ)[21]。第 2 例罕見的結構變異為包含 HBA1 及 HBA2 在內的 11.1kb 的缺失型,對應的 HGVS 命名為 NC_000016.9:g.(220831_220860)_(231920_232003)del,該缺失會導致α0 地中海貧血,攜帶者通常臨床表現為小細胞低色素性貧血[22]。該缺失變異同樣容易被傳統檢測方法漏診。第 3 例結構變異為α珠蛋白三聯體變異(基因型為αααanti3.7/αα)。由此可見,對于地中海貧血基因的結構變異檢測,單分子長讀長測序技術可以檢測出傳統檢測方法無法檢出的特殊結構變異,如檢測α珠蛋白三聯體、特殊的片段缺失等,可彌補傳統地中海貧血基因檢測的不足,提高檢出率。
此外,鄔玲仟教授團隊通過單分子長讀長測序技術報道了針對先天性腎上腺皮質增生癥[23]、血友病 A[24]及脆性 X 綜合征[25]等單基因遺傳病新檢測策略。劉俊濤教授團隊采用單分子長讀長測序技術開發了針對法布雷病的檢測方法,并評估了該技術的臨床應用效能[26]。相關研究均提示了該技術在傳統分子遺傳學檢測技術較難攻克的假基因、動態突變相關疾病等方面具有重要的臨床應用價值。
4 單分子長讀長測序技術在單基因病胚胎植入前遺傳學檢測中的應用
單基因病胚胎植入前遺傳學檢測是指在胚胎植入宮腔前對其進行遺傳學檢測,選擇未遺傳變異的胚胎用于移植,避免下一代罹患夫婦相關的單基因遺傳病。由于胚胎植入前遺傳學檢測是對活檢的 5~10 個囊胚滋養外胚層細胞進行檢測,起始樣本量極低(約為 50 pg),在全基因組擴增過程中可能會發生等位基因脫扣而導致誤診。為保證檢測的準確性,在對胚胎直接進行致病變異位點檢測的同時,還需對胚胎進行連鎖分析檢測,結合先證者或家系成員信息構建單體型,判斷其是否遺傳風險染色體。通常情況下,需要根據先證者或患病/攜帶變異的家系成員基因型來構建單體型,區分出家系中哪一條染色體攜帶致病變異。但在新發變異或家系成員不全的遺傳病家系中,由于缺乏先證者或家系成員的基因型信息,因此無法通過常規方法構建單體型及進行連鎖分析,即無法區分致病變異位于 2 條染色體中的哪一條上。對于此類新發變異或家系成員不全的家系而言,單分子長讀長測序因其“單分子”測序的特性,其可對夫婦雙方的 DNA 分子直接進行測序,測序完成時即為一條“單體型”。由此可直接構建單體型及進行連鎖分析,無需通過先證者或家系成員基因型用于推斷攜帶致病變異的單體型和未攜帶致病變異的單體型。因此,單分子長讀長測序技術在單基因病胚胎植入前遺傳學檢測中具有獨特的應用優勢[27]。
我科通過單分子長讀長測序技術為 1 例 PKD1 基因新發變異家系進行了胚胎植入前遺傳學檢測。PKD1 基因變異導致的多囊腎病 1 型是最常見的遺傳性腎病,患者多在成年后雙側腎臟出現囊腫,隨年齡增長,逐漸長大的囊腫壓迫正常腎組織,損害腎臟結構和功能。該病還可引起肝囊腫、心臟瓣膜病、顱內動脈瘤等腎外病變[28-29]。在該病例中,基因檢測發現女方 PKD1 基因存在 c.11526G>C 變異,為與其疾病表型相關的可能致病性變異,該變異導致的多囊腎病 1 型呈常染色體顯性遺傳,有 50%的概率遺傳給下一代;同時,在基因檢測時還發現,女方父母 PKD1 基因上述位點未查見變異,即女方為新發變異,且該夫婦還未曾生育過,其家系中只出現過她 1 例患者,因此無法通過常規手段進行連鎖分析。Peng 等[30]通過納米孔測序方法,在女方外周血 DNA 中檢測到變異位點,同時成功根據變異上下游 1 Mb 范圍內單核苷酸多態性位點區分單體型,即分辨出是哪一條染色體上的等位基因發生了變異,成功完成家系預實驗。該夫婦在輔助生殖治療周期中共獲得 6 枚胚胎進行活檢;隨后,我科通過二代測序技術結合單分子長讀長測序技術,成功為 6 枚胚胎構建單體型并進行連鎖分析,同時對變異位點進行檢測,結合形態學評分,為該夫婦選擇了 1 枚未遺傳女方變異且未發現染色體非整倍體異常的胚胎用于移植;最后該夫婦成功生育 1 名健康女嬰。
此外,已有多個研究團隊報道了單分子長讀長測序技術在胚胎植入前單基因病檢測、染色體結構異常檢測等方面的臨床應用[27, 31-32]。
5 小結
單分子長讀長測序技術因其可對單分子 DNA 進行實時測序、長測序讀長、文庫構建過程無需 PCR 因而不存在 GC 偏好等特點,使其在精確定位染色體平衡易位斷點、對假基因、高度同源序列或重復序列的疾病基因診斷及單基因病胚胎植入前遺傳學檢測等領域有獨特的應用優勢和前景。但其目前仍存在樣本制備難度較大,測序成本較高,測序精度有待提高,測序后數據分析相對復雜等短板,臨床推廣應用也需積累更多的數據后進行評估。遺傳咨詢醫師應在充分了解單分子長讀長測序技術檢測原理,檢測優勢及局限性,充分評估患者病情的情況下進行臨床應用,并向患者告知是否存在可選擇的其他檢測方式及其優劣勢對比。新技術應用于臨床前,需在遵守國家相關法律法規的前提下,建議經醫療機構臨床醫療新技術相關管理委員會、倫理委員會討論通過,并由醫療機構進行監管。隨著單分子長讀長測序技術及生信分析技術的快速發展,相信其未來在臨床遺傳學檢測、分子診斷等相關領域將會有廣闊的應用前景。
利益沖突:所有作者聲明不存在利益沖突。