基因體分析計劃

簡介

有人估計在染色體上,只有 3% 左右是真正具有基因的序列,其它的序列可能大多數的序列都是junkDNA。因此,人類基因體計劃在提出之後,生物學家對於要定序的策略產生了兩派意見,有人認為決定所有的染色體序列只會獲得一大堆沒用的資料,若以決定 mRNA 序列為目標,則可以直接找到有功能的序列。另外一派則認為,若直接對染色體定序,可以將許多重複性的步驟自動化,是較有效率的方法,此外,也可以避免誤失掉表現量較少的 mRNA。在考慮各種優缺點之後,最後人類基因體計劃是以染色體全序列定序為主要目標。

但是,據估計染色體全序列可能有 3 X 109 個鹼基對,如果沒有一個有效的方法來找到散布其中的所有基因,就無法發揮序列資料的最大用途。固然可以使用一些電腦軟體來預測基因在染色體上的位置,可是這些軟體是根據現有的知識設計的,碰到未知規則或是例外情況時,很可能會損失資訊,因此以實際實驗結果來輔助基因定位是非常必要的。有人提出以 3未轉譯區域成為基因序列標幟位置(gene-specific sequence-tagged sites) 的策略(Wilcox, et al, 1991)。由於各個不同基因的 3未轉譯區域大多是獨特的,因此用來作為特定基因的標幟是很恰當的選擇,更好的是可以避免 intron 的干擾。但是若以這種方式來進行,就必須要有許多已知基因的序列才行。因此,為了改良這個缺點,另外一組研究人員就提出了利用表現序列標幟來輔助基因定位的概念(Adams, et al, 1991)

- 黃彥華 著

Last updated on 08/30/01