結果分析: FastA


柱狀圖

相似序列表

序列並列分析

圖1 FastA 的序列並列分析和 BestFit 之輸出完全相同。

在並列分析的部份(圖1)還列出相同(identity) 胺基酸或鹼基的百分比,這是判斷同源性的另一個重要指標。對一個給定的序列而言,假設任何一個位置上的胺基酸或核甘酸皆可獨立突變,經過一段很長的時間後,突變序列和原序列的相似性會達平衡而不再改變。在統計上來說,突變後的序列會與原序列分別有 5% (1/20) 25% (1/4) 的相同序列。當然 5% 25% 只是平均值,若考慮到得分的分佈情形,一個長 50 個胺基酸的序列在 95% 的情形下(兩個標準差),會與一個隨機序列會有 0-11% 的相同序列。序列越長,則標準偏差越小,例如 200 個胺基酸長的蛋白質序列,則有 95% 的機會和一隨機序列有 0-9% 的相同序列。如果考慮插入空隙,則序列比對時的百分比相同之平均值會隨著加入空隙的量增加而上升。若允許隨意加入空隙,則在沒有空隙的區域可能達到 100% 的相同。綜合考慮插入空隙的影響,與統計上分佈的問題,一般認為兩個蛋白序列有 20% 的相同序列時是不能確定是否有同源性的。若是相同序列小於 15% 或大於 25%,則分別代表無,或有同源性。

[ GCG程式 | 運算法 | 參數設定 | 程式類別 | 個案分析 | 標準分析 ]

Last updated on 11/23/01