Profile分析

重要性

在多序列並列分析時,雖然能在 FastA 所找到的相似序列中找出共有序列(consensus sequence),可是 FastA 也找不到像 hemoglobinleghemoglobin 這樣遠親。這是因為維持功能的特定胺基酸或活化區的結構不產生改變時,其他位置上中性突變的累積,就足以使兩個有親緣關係的蛋白質的序列變的很不相同。在 GCG 環境下有一系列有關 Profile 分析的程式,就是為了尋找親緣關係很遠的序列,或是在三級結構上相似的序列而設計的。

什麼是Profile?

使用方法

其中 ProfileMake 能將 PileUp 的輸出檔變為 profile。而 ProfileSearch 可利用所產生的 profile 來搜尋資料庫,這種搜尋方式比 FastA 靈敏,因為在 profile 中的共有序列,並不是根據在各序列中特定胺基酸是否出現在特定的位置而定的,而是根據胺基酸的相似性而定的,此外在比對資料庫序列時,profile 中比較守舊的區域在計分時所佔的比重較大;反之,變異較大的區域在計分時所佔的比重較小。若需將 ProfileSearch 搜尋到的序列做並列分析,則可用 ProfileSegmentsProfileGap 分別做區域性或廣域性的並列分析,前者與 BestFit,後者與 Gap 的分析方法相似。

ProfileScan

可用目前所有的 Profile 來掃瞄你有興趣的序列,這種方法應比使用Motifs 程式分析更靈敏

(圖中有建連結)

 

Last updated on 11/27/01