在圖 0-4中的序列中的前十二個鹼基含兩個不完美的重覆,這兩段序列有九種可能的並列方式(圖1)。
圖1 序列A中不完美的 A. TCGGAT ||| | TCGTAC |
重覆序列之並列分析 D. TCG-GAT ||| | TCGT-AC |
G. TCG-GAT- ||| | TCGT-A-C |
B. TCGGAT- ||| | TCGTA-C |
E. TCGG-AT ||| | TCG-TAC |
H. TCGG-AT- ||| | TCG-TAC- |
C. TCGGA-T ||| | TCGTAC- |
F. TCG-GA-T ||| | TCGT-AC- |
I. TCGG-A-T ||| | TCG-TAC- |
在這九種並列方式中,可以分為允許與不允許誤配兩種情形。在不允許一個鹼基對誤配的情形,又有兩種可能的排列方式(比較圖1,B與C)。因為有兩個可能產生誤配的位置,所以又可組合出許多並列的方式。由這個例子可看出不同的計分方式可能會得到不一樣的結果,例如使用者若覺得在演化的過程中比較容易產生點突變而不易產生插入式突變,可在並列時每加一個空隙,就扣若干分。可是使用者若認為某一種類型的突變不易發生,則可在產生誤配時扣較多的分數。由此可看出並列分析的程式就有如邏輯論證,而使用者的模型則是假設(assumption),如果假設錯誤,即使邏輯正確,也會得到錯誤的答案。多序列並列分析只是根據給定的運算法則,計算出最符合這些法則的結果。如果法則給的不恰當,就不可能把相似或相同的序列完全對齊。例如,在練習 0-3 與範例 0-5 的比較中可看到蛋白質與核酸序列列使用不同的罰分(penalty)方法 ,使用錯誤就不可能得到好的結果。即使使用正確,也不保證就能完全對齊,因此需要人工調整。
Last updated on 08/29/01