程式: Gapped Blast

BLAST 1.4 搜尋資料庫,若是遇到目標序列有鹼基缺失的情況,它就會把並列序列斷開,分成兩段不同的並列序列。NCBI 所提供的 BLAST 2.0 版,加入了處理 Gap 的能力(Altschul et al, 1997) ,它最大的改進,便是將這些因為有序列有缺失,而使並列區域斷開的情形,加以綜合考慮,若是加入空隙,可以增加並列長度,便合併兩個並列片段。

p97 基因全序列為查詢序列搜尋資料庫時,BLAST 1.42.0 都會找到 EST AA156272,但是序列並列的長度與 xpect 的數值,卻有差別:以 BLAST 2.0 得到的序列並列長度為 547expect 數值為 0 (如圖1 所示);以BLAST 1.4 得到序列並列長度為 530 (480+50)expect 數值為 7.2e-200 (如圖2所示)。很明顯的,BLAST 2.0 對於 EST 資料之中少數缺失鹼基,可以加入空隙,以延長並列區域。如果所需要加入的空隙太多,比如說 EST 含有基因剪接資訊時,BLAST 2.0 才會將並列區域予以斷開,各自成為獨立的序列並列區域,並分別計分。

 
1 BLAST 2.0 可以在序列中加入空隙以延長並序區域  
   
 
2 BLAST 1.4 無法在序列之中加入空隙,因而列出兩段並列區域分成  

40 是以 p97 基因用 BLAST 2.0 搜尋資料庫,所到得和 AA285332 (即是在圖? 之中列出的第一個 UniGene 未收錄的序列)的序列並列部分結果。BLAST 2.0 在進行序列並列之時,在查詢序列的第 2915 鹼基的位置,加入了一個空隙,因此使得接下來的 25 個鹼基之中,產生了 21 個配對;圖41 是以 p97 基因作為詢問序列,以 BLAST 1.4 搜尋資料庫,所到得和 AA285332 的序列並列部分結果。BLAST 1.4 在進行序列並列之時,並不會考慮到空隙的問題,因此在相對的 25 個鹼基之中,只產生了 8 個配對。

 
   

比較兩種新舊版本 BLAST 對同樣序列進行並列的結果之後,可以發現:僅在序列之加入一個空隙,居然可以使得一段看來不太具有意義的序列區段,變得非常有意義。

- 黃彥華 著

[ 運算法 | 參數設定 | 結果分析 | 程式類別 | 個案分析 | 標準分析 ]

Last updated on 11/23/01