微生物研究在醫學、農業和環境科學中日益重要,而16S rRNA 基因定序是細菌分類研究的核心技術,其長約 1,500 bp,包含 9 個可變區,記錄了微生物分類群的主要演化差異。以往使用二代定序技術(如 illumina),常針對 16S rRNA 基因的某些可變區域(如 V3-V4,約300 bp)進行擴增與定序,用以研究微生物群落結構,但其短讀長(最長 2 × 300 bp)限制了解析度,通常僅能達到屬(genus)層級,難以區分高度相似的物種(species)。然而,同一屬內的不同物種可能與健康或疾病狀態密切相關,例如鏈球菌屬(Streptococcus)或 Escherichia/Shigella 群中的物種,其 16S rRNA 基因序列高度相似,但可能攜帶不同的毒力因子。
因此,提升分類解析度至物種層級至關重要。第三代定序技術(如 PacBio SMRT)可產出完整 16S rRNA 基因序列(約1,500 bp,涵蓋V1–V9變異區),理論上可大幅提升分類解析度 (圖一) 。2024年刊登在《BMC Genomics》的研究評估了 Illumina 短讀長與 PacBio 長讀長定序在不同類型人類微生物組樣本中的定序表現與分類鑑定效能,以提供更全面的實驗證據,進一步推動微生物研究的精準化與應用化。
首先評估了不同定序平台對細菌組成的影響(圖二),透過比較來自唾液、口腔生物膜(齒齦下牙菌斑)和糞便的樣本,分別使用 Illumina MiSeq 針對 16S rRNA 基因的 V3-V4 高變異區域,和 PacBio Sequel II 針對全長 16S rRNA 基因的V1-V9 區域進行定序。微生物組 DNA 經由通用引子(341F和805R)擴增 V3-V4 區域,並使用 Illumina MiSeq 平台定序;而全長 16S rRNA 則使用 27F 和 1492R 引子,依照 PacBio 標準流程進行擴增。此外,為了評估哪種平台能更準確地代表原始微生物群落,另外準備兩個人工合成(mock)微生物群落進行測試,並分別採用這兩種方法進行定序分析。
在相同的條件下定序結果經品質檢查與過濾後,PacBio 平台平均每個樣本可獲得 12,500 條可註釋序列,而 Illumina 平台的序列數量約為 PacBio 的八倍, PacBio HiFi reads 的平均長度為1,460 bp,顯示其能覆蓋完整16S rRNA基因,提供更完整的分類訊息。研究團隊比較了 Illumina MiSeq(V3-V4區域)與 PacBio Sequel II(V1–V9全長)在9位志願者的唾液、牙齦下菌斑與糞便樣本中微生物群落的表現。在唾液與齒齦下牙菌斑生物膜樣本中,PacBio 平台檢測到的可變序列單元(ASV)數量較多(表一),在糞便樣本中,ASV 數量則相對較少。兩者在「屬」(genus)階層的分類註釋能力相近,Illumina為94.79%,PacBio為95.06%。然而,在「種」(species)階層上,PacBio表現顯著更佳,能成功註釋74.14%的序列,而Illumina僅能註釋55.23%。
![]() |
圖一,電腦模擬結果顯示增加讀長有助於提升分類鑑定的準確性【1】 |
首先評估了不同定序平台對細菌組成的影響(圖二),透過比較來自唾液、口腔生物膜(齒齦下牙菌斑)和糞便的樣本,分別使用 Illumina MiSeq 針對 16S rRNA 基因的 V3-V4 高變異區域,和 PacBio Sequel II 針對全長 16S rRNA 基因的V1-V9 區域進行定序。微生物組 DNA 經由通用引子(341F和805R)擴增 V3-V4 區域,並使用 Illumina MiSeq 平台定序;而全長 16S rRNA 則使用 27F 和 1492R 引子,依照 PacBio 標準流程進行擴增。此外,為了評估哪種平台能更準確地代表原始微生物群落,另外準備兩個人工合成(mock)微生物群落進行測試,並分別採用這兩種方法進行定序分析。
![]() |
圖二、研究中 Illumina 與 PacBio 定序平行比對的實驗流程概述。【2】 |
在相同的條件下定序結果經品質檢查與過濾後,PacBio 平台平均每個樣本可獲得 12,500 條可註釋序列,而 Illumina 平台的序列數量約為 PacBio 的八倍, PacBio HiFi reads 的平均長度為1,460 bp,顯示其能覆蓋完整16S rRNA基因,提供更完整的分類訊息。研究團隊比較了 Illumina MiSeq(V3-V4區域)與 PacBio Sequel II(V1–V9全長)在9位志願者的唾液、牙齦下菌斑與糞便樣本中微生物群落的表現。在唾液與齒齦下牙菌斑生物膜樣本中,PacBio 平台檢測到的可變序列單元(ASV)數量較多(表一),在糞便樣本中,ASV 數量則相對較少。兩者在「屬」(genus)階層的分類註釋能力相近,Illumina為94.79%,PacBio為95.06%。然而,在「種」(species)階層上,PacBio表現顯著更佳,能成功註釋74.14%的序列,而Illumina僅能註釋55.23%。
使用兩組商業標準模擬菌群(mock communities)驗證平台的準確性,結果顯示,PacBio 平台能夠正確鑑定所有五種細菌(圖三),而 Illumina 平台則無法準確鑑定 Actinomyces(放線菌屬)、Fusobacterium(梭桿菌屬)和 Streptococcus(鏈球菌屬)的部分物種。此外,在自製的 Mock 1 樣本中,Illumina 平台還額外檢測到一個低豐度(0.01%)的偽陽性結果,對應於 Pediococcus parvulus,而PacBio平台可更精確地還原模擬菌株的實際組成,在屬與種階層上都具有更高的一致性,相較之下,Illumina會在某些情況下出現誤分群或未能解析特定菌種,特別是在序列相近的菌種(如同屬不同種)之間。
相對豐度分析顯示,在兩個平台上,Neisseria(奈瑟氏菌屬)的檢測比例均高於預期,而 Actinomyces(放線菌屬)則相對低於預期,PacBio 平台在某些物種(如 S. mutans轉糖鏈球菌)上呈現過度檢測的情況,這可能與引子特異性或 PCR 反應條件有關。
研究比較了來自三種不同人體部位(口腔、牙齦下、腸道)的微生物樣本在兩個平台上的分析結果。糞便樣本在兩種定序平台之間物種豐富度(Chao1 指數)呈現顯著差異(p 值 < 0.001),但在唾液和齒齦下牙菌斑樣本中差異不明顯(圖四A左)。而物種多樣性(Shannon 多樣性指數)在兩種定序平台之間的差異並不明顯。(圖四A右)。
為了評估每個樣本與使用不同方法定序的相應樣本的細菌組成的整體相似性,計算了 Bray Curtis 距離與 PCoA 分析(在屬層級呈現),發現樣本根據類型(唾液、齒齦下牙菌斑、糞便)有明顯聚類,而非因定序平台(圖四B),這說明,兩種定序方法在整體結果上具有高度相似性。在分類組成方面,兩種平台均檢測到所有豐度超過 0.1% 的屬,但在物種層級,PacBio 平台能夠鑑定出更多物種,共有唾液中的 17 種物種、齦下牙菌斑生物膜中的 7 種物種和糞便中的 9 種物種僅透過 PacBio 識別出來(圖四C)。
詳細分析在物種層級的註釋數量,唾液樣本中最豐富的屬 Streptococcus(鏈球菌),在Illumina 平台有 93.4% 的序列無法被分配至物種層級(圖五),而 PacBio能進一步準確解析至S. mitis、S. sanguinis、S. oralis等物種,僅有 29.7% 的序列未被註釋。同樣地,在牙齦下生物膜樣本中,Illumina 平台有 32.5% 的 Prevotella 序列無法註釋至物種層級,而 PacBio 僅有 13% 無法註釋。在糞便樣本中,Illumina 平台對於 Faecalibacterium (糞腸球菌屬)的序列有 99.97% 被鑑定為 Faecalibacterium prausnitzii(普拉梭菌),而 PacBio 則達到 100%。在 Bifidobacterium (雙歧桿菌屬)方面,Illumina 平台有 45.8% 的序列無法註釋至物種層級,而 PacBio 則能將所有序列進行物種鑑定。結果表明,在所有三種人類樣本中,PacBio 技術在物種鑑定能力上均有提升,這種能力對於臨床或功能微生物研究極具價值,因為許多菌屬內的物種具有截然不同的致病性或代謝功能。
兩種平台進行 16S rRNA 基因定序後的人類微生物群組成差異,在唾液樣本中,最豐富的細菌屬為 Streptococcus(鏈球菌屬)、Porphyromonas(卟啉單胞菌屬)、Fusobacterium(梭桿菌屬) 與 Prevotella(普雷沃氏菌屬)。同樣地,在齒齦下牙菌斑樣本中,主要菌群包括 Prevotella(普雷沃氏菌屬.)、Porphyromonas(卟啉單胞菌屬)、Streptococcus(鏈球菌屬) 與 Fusobacterium(梭桿菌屬)。在糞便樣本中,最豐富的細菌屬為 Faecalibacterium(糞腸球菌屬)(擬桿菌屬)。
雖然整體菌群的主要結構在兩平台間相似,但在部分菌屬的相對豐度(RA%)上仍觀察到差異。其中Streptococcus 屬在 PacBio 平台的平均相對豐度較 Illumina 平台高(但未達顯著水準),而其他已知的口腔病原菌,如 Fusobacterium、Leptotrichia 和 Treponema,則呈現相對豐度較低的趨勢(p < 0.05,調整後 p 值 > 0.05)(圖六)。綜合來看,兩種技術在複雜微生物組成上的結果相當接近,僅在相對豐度上有些許變異。
相對豐度分析顯示,在兩個平台上,Neisseria(奈瑟氏菌屬)的檢測比例均高於預期,而 Actinomyces(放線菌屬)則相對低於預期,PacBio 平台在某些物種(如 S. mutans轉糖鏈球菌)上呈現過度檢測的情況,這可能與引子特異性或 PCR 反應條件有關。
![]() |
圖三、客製化模擬菌群的物種層級相對豐度 eMock: 代表理論計算的人工合成模擬菌群組成 (I 表示 Illumina 平台,P 表示 PacBio 平台)。【2】 |
研究比較了來自三種不同人體部位(口腔、牙齦下、腸道)的微生物樣本在兩個平台上的分析結果。糞便樣本在兩種定序平台之間物種豐富度(Chao1 指數)呈現顯著差異(p 值 < 0.001),但在唾液和齒齦下牙菌斑樣本中差異不明顯(圖四A左)。而物種多樣性(Shannon 多樣性指數)在兩種定序平台之間的差異並不明顯。(圖四A右)。
為了評估每個樣本與使用不同方法定序的相應樣本的細菌組成的整體相似性,計算了 Bray Curtis 距離與 PCoA 分析(在屬層級呈現),發現樣本根據類型(唾液、齒齦下牙菌斑、糞便)有明顯聚類,而非因定序平台(圖四B),這說明,兩種定序方法在整體結果上具有高度相似性。在分類組成方面,兩種平台均檢測到所有豐度超過 0.1% 的屬,但在物種層級,PacBio 平台能夠鑑定出更多物種,共有唾液中的 17 種物種、齦下牙菌斑生物膜中的 7 種物種和糞便中的 9 種物種僅透過 PacBio 識別出來(圖四C)。
![]() |
圖四、根據定序平台比較樣本間的細菌豐度、多樣性與組成相似性:A左側顯示了 Chao 指數豐富度值;右側顯示了物種多樣性值。B為細菌組成。C表示平台間相同和獨特的物種。【2】 |
詳細分析在物種層級的註釋數量,唾液樣本中最豐富的屬 Streptococcus(鏈球菌),在Illumina 平台有 93.4% 的序列無法被分配至物種層級(圖五),而 PacBio能進一步準確解析至S. mitis、S. sanguinis、S. oralis等物種,僅有 29.7% 的序列未被註釋。同樣地,在牙齦下生物膜樣本中,Illumina 平台有 32.5% 的 Prevotella 序列無法註釋至物種層級,而 PacBio 僅有 13% 無法註釋。在糞便樣本中,Illumina 平台對於 Faecalibacterium (糞腸球菌屬)的序列有 99.97% 被鑑定為 Faecalibacterium prausnitzii(普拉梭菌),而 PacBio 則達到 100%。在 Bifidobacterium (雙歧桿菌屬)方面,Illumina 平台有 45.8% 的序列無法註釋至物種層級,而 PacBio 則能將所有序列進行物種鑑定。結果表明,在所有三種人類樣本中,PacBio 技術在物種鑑定能力上均有提升,這種能力對於臨床或功能微生物研究極具價值,因為許多菌屬內的物種具有截然不同的致病性或代謝功能。
![]() |
圖五、物種層級分類。對各類樣本中最豐富的細菌屬 (genus) 進行物種層級的分類。每個平台上,各物種在其所屬細菌屬中的定序讀數比例。【2】 |
兩種平台進行 16S rRNA 基因定序後的人類微生物群組成差異,在唾液樣本中,最豐富的細菌屬為 Streptococcus(鏈球菌屬)、Porphyromonas(卟啉單胞菌屬)、Fusobacterium(梭桿菌屬) 與 Prevotella(普雷沃氏菌屬)。同樣地,在齒齦下牙菌斑樣本中,主要菌群包括 Prevotella(普雷沃氏菌屬.)、Porphyromonas(卟啉單胞菌屬)、Streptococcus(鏈球菌屬) 與 Fusobacterium(梭桿菌屬)。在糞便樣本中,最豐富的細菌屬為 Faecalibacterium(糞腸球菌屬)(擬桿菌屬)。
雖然整體菌群的主要結構在兩平台間相似,但在部分菌屬的相對豐度(RA%)上仍觀察到差異。其中Streptococcus 屬在 PacBio 平台的平均相對豐度較 Illumina 平台高(但未達顯著水準),而其他已知的口腔病原菌,如 Fusobacterium、Leptotrichia 和 Treponema,則呈現相對豐度較低的趨勢(p < 0.05,調整後 p 值 > 0.05)(圖六)。綜合來看,兩種技術在複雜微生物組成上的結果相當接近,僅在相對豐度上有些許變異。
![]() |
圖六、人類微生物群樣本中,Illumina (I-) 與 PacBio (P-) 進行 16S rRNA 基因定序後的細菌組成差異:兩種技術在複雜微生物組成上的結果相當接近,僅在相對豐度(RA%)上有些許變異。【2】 |
Illumina 和 PacBio 平台在「屬」(genus)階層的分類一致性相當,兩者均能檢測相對豐度至少 0.1% 的所有屬,且整體群落組成主要受樣本來源(部位)而非平台影響,但在物種層級的鑑定準確性上,PacBio 技術具有更高的解析度,有助於區分近緣或序列極為相似的菌種,對於想要了解特定微生物的功能特性或致病潛力的研究具有高度應用價值。
此外,研究發現,不同定序平台在某些物種的相對豐度上可能存在差異,這可能與引子特異性、PCR 條件或讀長相關。在未來的應用中,若研究目標聚焦於微生物群落整體變化的趨勢觀察,Illumina依然是一種可靠的選擇;但若目的是精確鑑定特定菌種或深入探討微生物間的細部差異,PacBio全長定序無疑是一種更具潛力的策略。
【參考文獻】
1. Johnson, J.S., Spakowicz, D.J., Hong, BY. et al. Evaluation of 16S rRNA gene sequencing for species and strain-level microbiome analysis. Nat Commun 10, 5029 (2019). https://www.nature.com/articles/s41467-019-13036-1
2. Buetas, E., Jordán-López, M., López-Roldán, A. et al. Full-length 16S rRNA gene sequencing by PacBio improves taxonomic resolution in human microbiome samples. BMC Genomics 25, 310 (2024). https://doi.org/10.1186/s12864-024-10213-5
此外,研究發現,不同定序平台在某些物種的相對豐度上可能存在差異,這可能與引子特異性、PCR 條件或讀長相關。在未來的應用中,若研究目標聚焦於微生物群落整體變化的趨勢觀察,Illumina依然是一種可靠的選擇;但若目的是精確鑑定特定菌種或深入探討微生物間的細部差異,PacBio全長定序無疑是一種更具潛力的策略。
【參考文獻】
1. Johnson, J.S., Spakowicz, D.J., Hong, BY. et al. Evaluation of 16S rRNA gene sequencing for species and strain-level microbiome analysis. Nat Commun 10, 5029 (2019). https://www.nature.com/articles/s41467-019-13036-1
2. Buetas, E., Jordán-López, M., López-Roldán, A. et al. Full-length 16S rRNA gene sequencing by PacBio improves taxonomic resolution in human microbiome samples. BMC Genomics 25, 310 (2024). https://doi.org/10.1186/s12864-024-10213-5
留言
張貼留言