結果分析: Blast

如何解讀 Blast 的輸出結果

因為 Blast 採用另一種統計方法,其典型的輸出結果並不需要柱狀圓,但仍包括相似序列的清單與並列分析的結果。在相似序列的清單中的 High score 是這一相似序列中最相似的區域之得分,這是一個與FastA 非常不同之處。在 FastA 中,會插入空隙以連接數個相似區(對角線),因此在最後會列出「一個」最相似的區域。Blast 並不試圖連接各相似的片段,換言之它不允許空隙的存在,所以它會計算每一個相似區的得分,並將此序列中得分最高的片段的分數列出。HSP( High - scoring Segment Pair ) 僅代表一些分較高的片段,它們單獨存在時或許無法通過統計上的測驗,可是數個連在一起,則通過測驗,在清單中的「Smallest sum probability就代表將數 HSP 連在一起之後之統計資料。其中 N 代表所參與的 HSP 的個數,P( N ) 代表在給定條件的搜尋中,找到與 high score 得分相同或更高分的片段的機率。每一個蛋白質的長度不同,即使得分相同,其機率也不相同。在相似序列的排列順序上,並不是根據得分排序,而是根據機率排序,所以有些得分較高的序列反而被排在後面,對蛋白質的比較來說,機率小於 0.02 就被認為是同源的。因為程式預設保留 250 個序列,若被認為有意義的序列超過此數字,程式會自動警告你。如果被認為有意義的序列總數超過 1000,可能是在序列中有一些重覆序列,必須將其濾掉,以免干擾搜尋的結果。

圖1

WARNING: -hspmax 100 was exceeded with 23 of the database sequences, with as
many as 230 HSPs being found at one time.

Smallest
Sum
High Probability
Sequences producing High-scoring Segment Pairs: Score P(N) N
..
SW:TF3A_XENLA ! P03001 xenopus laevis (african clawed fro... 1930 1.2e-268 1
SW:TF3A_XENBO ! P17842 xenopus borealis (kenyan clawed fr... 1564 2.4e-231 2
SW:TF3A_RANPI ! P34695 rana pipiens (northern leopard fro... 1173 2.7e-172 2
SW:TF3A_BUFAM ! P34694 bufo americanus (american toad). t... 741 8.2e-161 3
SP_HUM:Q13097 ! Q13097 homo sapiens (human). dna/rna-bind... 544 4.8e-149 3
SP_HUM:Q92664 ! Q92664 homo sapiens (human). xenopus tran... 537 2.2e-141 3
SP_HUM:Q12963 ! Q12963 homo sapiens (human). transcriptio... 454 5.5e-134 3
SP_OV:P79797 ! P79797 ictalurus punctatus (channel catfis... 510 5.4e-86 2
SW:P43_XENLA ! P25456 xenopus laevis (african clawed frog... 231 2.8e-55 4
SW:P43_XENBO ! P25066 xenopus borealis (kenyan clawed fro... 224 2.5e-52 4
SP_HUM:Q14590 ! Q14590 homo sapiens (human). zinc finger ... 103 1.2e-41 6
SW:ZG3_XENLA ! P18718 xenopus laevis (african clawed frog... 88 1.5e-40 7
SW:ZG8_XENLA ! P18737 xenopus laevis (african clawed frog... 95 3.1e-40 7
SW:ZF64_HUMAN ! P15622 homo sapiens (human). zinc finger ... 81 5.6e-40 7
SW:ZG17_XENLA ! P18713 xenopus laevis (african clawed fro... 81 1.7e-39 7
SW:ZG52_XENLA ! P18727 xenopus laevis (african clawed fro... 74 4.3e-39 7
SW:HKR1_HUMAN ! P10072 homo sapiens (human). kruppel-rela... 91 4.7e-38 7
SW:Z143_HUMAN ! P52747 homo sapiens (human). zinc finger ... 194 2.4e-37 3
SW:ZO26_XENLA ! P18746 xenopus laevis (african clawed fro... 80 3.0e-37 7
SP_RO:Q61776 ! Q61776 mus musculus (mouse). zinc finger p... 86 3.0e-37 7
SP_HUM:Q15914 ! Q15914 homo sapiens (human). zfoc1 (fragm... 101 1.5e-36 6
SW:ZO61_XENLA ! P18750 xenopus laevis (african clawed fro... 90 2.0e-36 7
SW:ZG28_XENLA ! P18716 xenopus laevis (african clawed fro... 95 2.4e-36 7
SW:HF12_HUMAN ! P13683 homo sapiens (human). zinc finger ... 78 4.0e-36 6
SP_HUM:Q99676 ! Q99676 homo sapiens (human). kruppel-rela... 91 5.0e-36 8
SP_RO:Q61898 ! Q61898 mus musculus (mouse). zinc finger p... 86 5.8e-36 8
SP_OV:Q91853 ! Q91853 xenopus laevis (african clawed frog... 186 6.2e-36 3
SP_HUM:Q14584 ! Q14584 homo sapiens (human). zinc finger ... 87 6.3e-36 7

...

SW:MTF1_MOUSE ! Q07243 mus musculus (mouse). transcriptio... 204 4.0e-34 3
SW:ZG7_XENLA ! P18735 xenopus laevis (african clawed frog... 80 5.1e-34 6
SP_RO:P97365 ! P97365 mus musculus (mouse). zfp64. 5/97 75 7.1e-18 6
SP_HUM:Q13106 ! Q13106 homo sapiens (human). zinc finger ... 77 7.5e-18 4
SW:REX1_MOUSE ! P22227 mus musculus (mouse). rex-1 protei... 186 8.5e-18 1
\\End of List

WARNING: Descriptions of 464 database sequences were not reported due to the
limiting value of parameter V = 250.

 

在並列分析結果的部份,BlastFastA 的輸出多很多,因為 Blast 會列出多個相似的區域(圖2),若以尋找模組樣式的目的而言,這可能讓我們看到一些在 FastA 中不會出現的相似區。可是若目的是在尋找親緣關係較遠的序列, Blast 就無法產生具有生物意義的並列結果,因為親緣關係較遠的序列可能有許多插入或刪除的序列,若不加入空隙,在並列分析時就會看到許多相似的片段,而看不出整體的相似性。在FastA 的輸出結果中,可見到 TFIIIAp43 都具有九個鋅指結構,整個結果不到一頁即可印出,可是若看 Blast 輸出中相同的部份則無法一眼看出 TFIIIAp43 間的關係,所看到的是印了近三頁半的相似片段,使用者必須花時間分析,才有可能看到全貌。因此若初步判斷這序列可能有意義,就需另做區域性並列分析。 Blast 在蛋白質分析時,其靈敏度與 FastA 相若,在做核酸分析時則較差。為何 Blast 的速度比 FastA 快,而又不影響靈敏度呢?這必須由其計分方式說起。

圖2 Blast 程式所列出的並列分析結果節錄。

圖3

[ GCG程式 | 參數設定 | 程式類別 | 個案分析 | 標準分析 ]

Last updated on 11/23/01