使用長讀長定序在粒線體DNA疾病研究上的優勢

粒線體是細胞中重要的胞器,透過氧化磷酸化過程,將食物中的能量轉化為細胞可用的ATP,並參與細胞內多種代謝過程,因此又被稱為「細胞的能量工廠」。它具有雙層膜結構,外膜平滑,內膜則向內折疊形成皺褶,內膜內包裹的粒線體基質,而基質中含有粒線體自身的DNA(即粒線體DNA,mtDNA)、RNA和核糖體。每個細胞可能都有上百個粒線體,不同細胞所含的粒線體數目不一,差異極大。譬如代謝旺盛的心肌粒線體幾乎佔細胞一半,其次為神經、肌肉、骨骼及內分泌細胞,所以當粒線體能量供應發生問題時,通常也是這些組織器官先發難。另外,值得注意的是,粒線體擁有自身的DNA,可以獨立進行部分蛋白質的合成。(圖一)
圖一: 粒線體剖面圖(資料來源:Animal_mitochondrion_diagram_en.svg)
圖一: 粒線體剖面圖(資料來源:Animal_mitochondrion_diagram_en.svg)

粒線體的遺傳模式是母系遺傳。由於受精過程中,精子的粒線體通常不會進入受精卵,這意味著只有母親的粒線體性狀會遺傳給所有子女,因此也被應用於研究人類演化的領域。此外,粒線體遺傳也不遵循孟德爾遺傳定律,因為每個細胞中含有多個粒線體,而每個粒線體又有多個mtDNA分子,突變的mtDNA可能與正常的mtDNA共存,形成「異質體」(Heteroplasmy)。異質體的存在導致粒線體遺傳的表現型具有多樣性和不確定性,同一家族成員發病的嚴重程度可能差異很大。粒線體DNA(mtDNA)為環狀雙鏈DNA分子結構簡單,但突變率較高容易產生遺傳變異。 
粒線體疾病的種類繁多,影響身體各個系統。其中,Leigh氏症候群、MELAS、MERRF、Kearns-Sayre症候群、CPEO、LHON、Pearson症候群等,都是常見的粒線體疾病。這些疾病的病因、病徵和影響器官各不相同,例如Leigh氏症候群會影響腦部、肌肉及其他器官功能,MELAS會影響粒線體tRNA功能,進而影響蛋白質合成及能量產生,MERRF會影響粒線體蛋白質合成,導致肌肉細胞功能異常。除此之外,如神經退行性疾病(如帕金森氏症和阿茲海默症)、代謝疾病(如糖尿病)以及心血管疾病等,這些疾病的發生通常伴隨著粒線體數量減少或功能異常,導致細胞能量供應不足而致病。而這些粒線體疾病大多與粒線體DNA (mtDNA) 的突變有關。

粒線體DNA特性

  1. 基本結構:是一種小型環狀雙股DNA,長度約為 16,500 個鹼基對 (bp),mtDNA 總共編碼 37 個基因(氧化磷酸化相關的蛋白質基因、tRNA基因、rRNA基因)。
  2.  控制區 (D-Loop):D-Loop 是 mtDNA 唯一的非編碼區域,長度約為 1,200 bp。含有複製起點和轉錄調控序列,是 mtDNA 複製與轉錄的主要調控區域。兩個熱點高突變率區域,其常用於親緣分析與法醫鑑定。
  3. 高突變率:mtDNA 的突變率約是細胞核 DNA 的 10 倍。主要由於缺乏有效的 DNA 修復機制以及暴露於高濃度的活性氧化物質(ROS)。
  4. 多拷貝數:每個細胞中有數百至數千個粒線體,每個粒線體攜帶數個 mtDNA 拷貝。高拷貝數使得 mtDNA 能夠維持粒線體功能,但突變積累會導致異質性 (heteroplasmy)。
  5. 粒線體DNA突變與疾病研究
    • 變異檢測:識別單核苷酸變異(SNVs)、插入/缺失(INDELs)和結構變異
    • 全同質突變 (Homoplasmy): 所有 mtDNA 都為突變型,可能導致表現型更為嚴重,如 Leber 氏遺傳性視神經萎縮症 (LHON)是一種影響視神經的粒線體疾病,患者的 mtDNA 通常存在全同質突變,導致視力喪失。(Middle East Afr J Ophthalmol. 2011 Jan-Mar;18(1):17–23.)。
    • 異質突變 (Heteroplasmy): 當正常與突變型 mtDNA 共存於同一細胞時,突變比例的升高可能導致疾病,如 Leigh 綜合徵和 Melas: 10%–30% 的患者表現為糖尿病,而突變負荷較高的患者(50%–90%)表現為 MELAS。此外,已證實 90%–100% 的極高突變負荷會表現為Leigh disease(Tranah 等人,2018 年)。通常需要 60%–90% 的突變粒線體DNA閾值才能表現出異質體粒線體DNA突變的病理效應(Rossignol et al., 2003 )。
    • 閾值效應 (Threshold effect or mutant load): 當細胞或組織中維持某個比例的 wild-type mtDNA,且表現可補償 mutant mtDNA。組織特異性閾值 (issue-specific threshold), 即能容忍的 mutant mtDNA 比例低,超過比例疾病的表型便會顯現出來。

針對粒線體DNA(mtDNA)的研究,主要仰賴mtDNA定序技術。傳統的Sanger定序雖然成本較低,但其在檢測低頻率異質性突變方面存在侷限性,難以滿足深入研究的需求。隨著科技發展,次世代高通量定序(NGS)成為主流選擇,其中Illumina平台以其高靈敏度,能夠有效檢測異質性和罕見突變,然而,其數據分析需要較高的計算資源。

近年來,第三代高通量定序(TGS)技術,如Oxford Nanopore和PacBio,為mtDNA研究帶來了新的突破。Oxford Nanopore雖然有生成超長讀長的能力,在分析全基因體結構變異方面展現出其優勢,但是其單鹼基準確性相對較低。而PacBio HiFi以其高準確度的長讀長技術,能夠生成完整的單個粒線體基因體序列,特別適用於分析複雜的變異和異質性。這些先進的定序技術,為科學家們深入探索mtDNA的奧秘,提供了強有力的工具。

粒線體DNA全基因體定序: 長片段定序優勢

在林岩等人在2024年發表於BMC Genomics的研究中,為解決傳統短片段定序技術(NGS)在中等大小的結構變異(SV),如300-4000 bp的缺失和重複時,準確度低下的侷限性。採用了PacBio HiFi長讀定序技術結合長距離PCR(LR-PCR),對人類粒線體DNA(mtDNA)的全基因體變異進行了深入分析。這項研究旨在評估該技術在檢測mtDNA單核苷酸變異(SNV)和結構變異(SV)方面的有效性,並與傳統的下一代定序(NGS)方法進行比較,從而為粒線體疾病(MDs)的診斷和研究提供更精確的工具。

表一:受試者資訊[1]
表一:受試者資訊[1]

團隊對34名受試者進行了分析,包括28名粒線體疾病患者和6名健康對照(表一)。通過比較長讀長定序(LRS)和次世代定序(NGS)的結果,研究人員發現,對於比例超過5%的SNV,兩種方法具有相似的檢測效果。然而,LRS在檢測低於5%的SNV方面表現出更高的靈敏度(圖二)。


圖二: 在不同SNV變異佔比(ratio)下,LRS和NGS檢出重疊的SNV佔比。[1]
圖二: 在不同SNV變異佔比(ratio)下,LRS和NGS檢出重疊的SNV佔比。[1]

在檢測比例超過5%的SNV時,PacBio HiFi定序和NGS表現相似,重疊比例接近100%,說明兩者具有高度一致性。但PacBio HiFi定序能更準確地檢測低於5%的SNV,特別是變異比例極低時(<1%),NGS的檢測靈敏度較差。綜合分析表明,LRS在識別低頻SNV方面優於NGS(圖三)。


圖三: 不同SNV變異佔比(ratio)下,LRS和NGS檢出重疊的SNV數量與佔比範例。[1]
圖三: 不同SNV變異佔比(ratio)下,LRS和NGS檢出重疊的SNV數量與佔比範例。[1]

在SV檢測方面,LRS能夠識別出更多的缺失變異,特別是多重缺失和低比例缺失,顯示出其在檢測複雜結構變異方面的優勢(圖四、表二)。

圖四: 患者3至14(P3-P14)讀取深度的統計圓形圖。外圈顯示粒線體基因分布圖;紫色、粉色、橘色和深灰色分別標示粒線體基因、rRNA、tRNA和D-loop區域。中間代表粒線體16,569 bp的座標,內圈的灰色區域表示讀取深度分布,用於觀察結構變異(SV)。[1]
圖四: 患者3至14(P3-P14)讀取深度的統計圓形圖。外圈顯示粒線體基因分布圖;紫色、粉色、橘色和深灰色分別標示粒線體基因、rRNA、tRNA和D-loop區域。中間代表粒線體16,569 bp的座標,內圈的灰色區域表示讀取深度分布,用於觀察結構變異(SV)。[1]


表二: LRS 與 NGS 針對mtDNA定序之結果(與Sanger驗證結果)。[1]
表二: LRS 與 NGS 針對mtDNA定序之結果(與Sanger驗證結果)。[1]

PacBio HiFi定序比NGS在檢測多重結構變異和低比例SV方面更具優勢。在部分患者中,LRS可以檢測到mtDNA缺失,而NGS則無法檢測到(表二)(SANGER驗證)。LRS檢測到的變異比例高於NGS,表明LRS在識別比例較低的SV方面具有相對優勢。

此外,研究還通過對單個肌肉纖維層面的PCR定量分析,驗證了LRS檢測到的SV的病理相關性。結果顯示,LRS能夠準確識別與粒體功能障礙相關的SV(圖五),並通過PCR(圖六)和組織染色(圖七)實驗進一步證實了這些SV的致病性。這表明LRS技術不僅提高了mtDNA變異檢測的準確性,還能夠在單一細胞水平上提供有價值的病理信息。

圖五: 透過病患7(P7)LRS定序結果之Integrative Genomics Viewer (IGV)圖,揭示了與線粒體損傷相關的SV。紅色虛線框框顯示定序深度差異。[1]
圖五: 透過病患7(P7)LRS定序結果之Integrative Genomics Viewer (IGV)圖,揭示了與粒線體損傷相關的SV。紅色虛線框框顯示定序深度差異。[1]


圖六: 對患者7(P7)的兩組肌肉組織樣本DNA (COX +正常 和 COX- 功能缺損),評估NADH 脫氫酶1 (ND1) 基因(3307–4262 bp,刪除片段) 和NADH 脫氫酶 4 (ND4) 基因 (10760–12137 bp,外部片段) 的即時PCR定量分析,評估其刪除比例,結果與LRS定序結果呼應。[1]
圖六: 對患者7(P7)的兩組肌肉組織樣本DNA (COX +正常 和 COX- 功能缺損),評估NADH 脫氫酶1 (ND1) 基因(3307–4262 bp,刪除片段) 和NADH 脫氫酶 4 (ND4) 基因 (10760–12137 bp,外部片段) 的即時PCR定量分析,評估其刪除比例,結果與LRS定序結果呼應。[1]

圖七: 組織染色結果(COX染色: 淡色纖維表示線粒體功能受損 、S/C染色: 藍色纖維反映線粒體內膜的狀態完整)確認粒線體功能異常是mtDNA缺損造成,與LRS和PCR結果吻合。[1]
圖七: 組織染色結果(COX染色: 淡色纖維表示線粒體功能受損 、S/C染色: 藍色纖維反映線粒體內膜的狀態完整)確認粒線體功能異常是mtDNA缺損造成,與LRS和PCR結果吻合。[1]

上述研究透過過比較LRS和NGS技術在粒線體DNA變異檢測方面的表現,突顯了LRS技術在檢測低頻SNV和複雜SV方面的優勢。


另外,為了克服傳統短讀長方法的限制,Pacific Biosciences與System Bioscience共同合作,開發無需擴增且無須進行亞硫酸鹽處理的全長mtDNA定序技術,可同時進行長讀長定序與表觀遺傳分析的定序策略(Shreyasee Chakraborty, 2018)。

此方法的特點就是,通過簡單的均質化方法和差速離心,從組織中分離出粒線體(mitoISO Kit, System Biosciences)。低速離心主要去除細胞碎片和核,而高速離心則沉澱出粒線體部分。隨後,進一步純化出粒線體DNA(mitoDNA Kit, System Biosciences)。最後使用限制性內切酶(FastDigest, Thermo)將粒線體DNA線性化。線性化的粒線體DNA樣本經過BluePippin(Sage Science Inc.)進行大小篩選,以去除13kb以下的短片段後,使用標準的文庫製備流程構建SMRTbell文庫(圖八)。最後以PacBio Sequel System進行定序。

圖八: 粒線體DNA純化與SMRTbell文庫建立流程圖[2]
圖八: 粒線體DNA純化與SMRTbell文庫建立流程圖[2]

其結果展現出以下特點:
  1. 讀長分佈:原始(Raw)與比對到資料庫(mapped)的子讀長(subreads length)呈現約 16 kb 的峰值,這表示定序能夠產生接近完整粒線體 DNA 長度的讀長。(圖九)
  2. 讀取特性:單次通過即可生成全長序列,無需組裝,這大大簡化了數據分析的流程。
  3. 異質性分析:通過模擬 9:1 比例的兩種 mtDNA 變異體混合,並使用 LAA2 進行分析,結果顯示能夠生成全長、準確的變異共識序列(consensus sequences),且分析結果(NumReads)與預期相同。這證明了該方法在檢測異質性方面的準確性和可靠性。(圖十)

圖九: 原始與比對資料庫後的子讀長(Subread)呈現在~16 kb 峰值。顯示粒線體基因組的完整長度序列。[2]
圖九: 原始與比對資料庫後的子讀長(Subread)呈現在~16 kb 峰值。顯示粒線體基因體的完整長度序列。[2]

圖十: LAA2針兩種不同 mtDNA 變異體佔比混合物(in silico mixture),進行分群與定相分析。[2]
圖十: LAA2針兩種不同 mtDNA 變異體佔比混合物(in silico mixture),進行分群與定相分析。[2]

綜合上述資訊,顯示Pacbio HiFi長讀長定序(LRS)技術在針對低頻單核苷酸變異(SNV)和複雜結構變異(SV)的偵測能力優勢,提供了研究者在粒線體疾病研究上的有用工具。

同時為克服傳統短讀長(SRS)技術的限制,Pacbio研究團隊結合了粒線體分離與DNA純化技術,開發出一種無需擴增、無須亞硫酸鹽處理的全長mtDNA定序技術。實現了突變定相與表觀遺傳檢測的需求。

Pacbio長片段定序在粒線體DNA研究上的特點:

1. 全長定序: 產生接近完整mtDNA長度的讀長,無需組裝。 
2. 高準確度: 透過單分子即可生成準確的序列。 
3. 異質性分析:能夠準確檢測mtDNA低頻(<5%)變異體。


此技術的應用,為粒線體基因體研究提供了更精確、更全面的分析工具,在粒線體疾病的診斷和研究具上具有重要價值。


【參考文獻】

  1. Yan Lin, Jiayin Wang, Ran Xu, et al.(2024). HiFi long-read amplicon sequencing for full-spectrum variants of human mtDNA. BMC Genomics 25, 538.
  2. Shreyasee Chakraborty, William Rowell, Jenny Gu, et al. (2018). Mitochondrial DNA Sequencing Using PacBio SMRT Technology.
  3. 張金堅 (2022)粒線體:人體細胞發電站與癌症的進展息息相關, 常春月刊477期。
  4.  何敏夫 (2007) 認識粒線體DNA。中華民國醫檢會報,22:2 2007.06[96.06] 20-24

留言