基因融合 ( gene fusion ) 為癌症突變中的一個重要變異,受限於癌症臨床樣品高降解 ( highly degraded )、微量 ( 1-30% tumor 含量 )、高細胞異質度 ( heterogeneous ) 等特性,加上 RNA 因表現量落差巨大 ( ~10^6 dynamic range ) 及複雜的序列剪接、融合 ( splicing、fusion ),基因融合一直以來多以 DNA 層次來分析,而非以 RNA 轉錄本 ( RNA transcript ) 來進行研究。隨著二代、三代定序技術的成熟,常規 NGS 實驗已能很好的解析 FFPE DNA、RNA 樣品,FFPE DNA 已能順利偵測存量 ~1% 的癌症單點突變 ( point mutation )、微片段突變 ( 30-50% 的外顯子層次 ( exon-level ) 增幅或缺失,而 FFPE RNA 樣品,也因 NGS 成本大幅下降與目標抓取 ( target capture ) 技術進步,得以針對目標基因 ( 如 kinase genes, kinome ) 的外顯子甚至是接合處 ( exon junction ),集中分析數億 ( hundreds of million ) 條 cDNA 片段,由 NGS big data 視角進行 資料-假設複合驅動 ( Data-Hypothesis-Driven ) 研究,搜尋新的剪接、融合現象。
歷史中第一個被發現、也最為人所熟知的基因融合事件,當屬慢性骨髓性白血病 ( chronic myeloid leukemia, CML ) 常出現的 Chr9 與 Chr22 的長端區 ( q-arm ) 區段易位 ( translocation, t ( 9;22 ) ( q34;q11 ) ),該現象產生了 Chr22 變異染色體 - 費城染色體 ( the Philadelphia chromosome,簡稱 Ph ),以及易位斷點 ( breakpoint ) 處生成的 bcr-abl1 ( 舊稱 bcr-abl ) 融合基因 17。( 圖一、二 )
1956 年,年輕科學家 Peter Nowell ( 戴眼鏡者 ) 加入 University of Pennsylvania ( 簡稱 UPenn ) 進行白血病研究,Nowell 對細胞遺傳學一無所知,彼時 UPenn 內也無人對染色體研究感興趣,後來 Nowell 找到在 the Fox Chase Cancer Center 寫人類染色體論文的研究生 David Hungerfold,兩人一起應用當時最新的細胞、染色體製備技術 ( cell、chromosomal preparation ),觀察到 CML 腫瘤細胞存在微小染色體 ( minute chromosome ) 3;隔年 ( 1961 ) 在 Paul Moorhead 的幫助下改善技術後進一步發表發現,此後微小染色體依循染色體標準化委員會 ( the Committee for the Standardization of Chromosomes ) 的規定以發現地命名,定名為費城染色體 ( the Philadelphia chromosome,簡稱 Ph )。
Ph 染色體的來源,則是在 7-10 年後因 quinacrine fluorescence 與 Giemsa banding 新技術開發,由美國科學家 Janet Rowley 於 1973 年鑑定出 Ph 染色體為 Chr9 與 Chr22 的區段易位 ( translocation, t ( 9;22 ) ) 所產生 5。這段時期,除了染色體技術外,mRNA 與 protein 的關係、RNA 的逆轉錄 ( reverse transcription ) 技術、南方墨點法 ( Southern DNA blotting )、分子選殖 ( molecular cloning, or 分子克隆 ) 技術也陸續發展,使得染色體的分析進入基因層次。而 Ph 染色體的進一步細節,則是 1977 年的革命創新 Sanger sequencing ( 一代 DNA 定序 ),以及新興的分子選殖 ( molecular cloning,又稱分子克隆 ) 技術於 1980 年代交會後,得以獲得解析。
Genomics Research History III ( 1980-1990 )
分子生物學在 1980 年代快速進步,目前常用的經典分子生物學技術幾乎都在這個時期出現,也讓 bcr-abl 融合基因被鑑定出來。
1984 年同一團隊利用一段 Ph 的易位斷點區片段 ( the Philadelphia ( Ph' ) translocation breakpoint domain ) 作為探針,釣出 Chr22 上對應的一段 5.8 kb 斷點片段,稱呼它 " breakpoint cluster region " ( bcr ) 10,此時還不知道 bcr 是否為基因。接著該團隊以該 5.8 kb 片段做探針釣出了 cDNA,該 cDNA 存在一個蛋白質的 C-terminal end 部分,再以該 cDNA 作為探針,確定出易位斷點相對於外顯子的位置,顯示易位斷點是發生在內含子 ( intron ),由於該基因與此前分離的其他基因沒有同源性,因此被命名為 bcr 基因,此後使用 abl 和 bcl 的探針分析了 CML 病人的 RNA,證明了嵌合 BCR / ABL mRNA 存在 11。
1986 年,Mes-Masson et al. 利用將數個 cDNA clones 進行定序,拼湊出完整的 Bcr-Abl 編碼序列 ( complete coding sequence ) 12。有了 coding 序列之後,搭配 1983 年發明的 PCR 基因增幅技術,於 1988 年產生針對 fusion RNA 的 RT-PCR 診斷應用 14,至此 Ph 染色體的本質,以及融合處生成的 bcr-abl1 ( 舊稱 bcr-abl ) 融合基因的完整 mRNA 編碼序列,已大致釐清。相對於 mRNA 的完整編碼序列在 1986 年已獲得,因染色體斷點落在富含重複序列 Alu repeat element 的 intron 上,直到 1995 年用霰彈法 ( shotgun strategy ) 定序完成數個易位斷點區的 cosmid 與 plasmid clones 的 DNA 序列,靠著比對各 clones 對應的 cDNA 序列,才將大致的 abl 與 bcr 完整基因定序出來,完成斷點準確定位,而斷點準確定位後也發現不同 CML 病人的 DNA 斷點沒有一致性 15。
Genomics Research History IV ( 1990-2010 )
a. 技術發展帶動了科學的前進
b. 技術突破更正了錯誤的已知,促使新的發現
c. 領域重大發現通常在技術突破後 5-10 年間發生
d. DNA 好取得所以先分析,但因為基因融合的 DNA 斷點處需要克服 repeat elements 與不固定問題,反而斷點精確定位是最晚完成的
e. RNA ( cDNA ) 因在 splicing 過程把 repeat-rich 的 intron 丟掉,而且有較為固定的 exon-exon junction,只要能釣出 RNA 就成功一半
f. 1982-1986 間的 Bcr-Abl 鑑定工作,用到許多 cDNA probe 釣序列、片段定位、序列解析,這與 2022 年使用的 RNA capture + NGS 定序實驗概念一模一樣
下一篇,我們來看 2022 年的現在是如何進行 RNA fusion 研究與診斷 27
