簡介 - 程式套組與網路資源的比較

網路資源

使用 Internet 上的資源,最大的好處就是資料庫更新的頻率高。此外資料庫間的連結也做的比較好,例如 Entrez 系統不但可在序列資料庫間連結,更可連到文獻資料庫 PubMed,或是反過來由文獻資料連到序列資料。可是只有資料庫是不夠的,許多全球資訊網的資源還可做序列分析。它們給人的印象是好學易用,而且圖形介面設計精美,讓人賞心悅目,他們的功能可能還比市售的程式更好,所以我們不禁要問,為什麼要學程式套組,而不學網際網路上的資源?

問題是即使像在網路上有「生物工作台(Biology workbench)」這樣受歡迎的序列分析工具,也無法提供像一般程式套組這樣完整的功能。若想完成一些較複雜的工作,就必須連到多個不同的站台去,這時就產生了格式互換的問題。這是因為電腦程式一旦寫出,輸入與輸出的格式就被限制。因此除非經特別的整合,一個電腦程式的輸出檔案可能無法直接輸入另一些電腦程式。而不同的資料庫也有不同的儲存格式,沒有一個電腦程式是能讀取所有資料庫的資料的,這時就產生了格式互換的需求。使用者必須花些精力在處理輸入的格式,初學者若分心去處理這些格式問題,將無法集中心思在解決生物學的問題。即使沒有格式互換的問題,你仍必須先由資料庫中取出序列,存到你的電腦上,再將其傳到另一站台上做分析。在網路通暢時不需花太多時間,可是在使用者多時,分析的速度就受到影響。此外,有一些功能,尤其是以圖形顯示結果的程式,在網路上通常不容易找到。

市售的程式解決這個問題的方式是寫一幾乎含有所有的功能的程式套組,這樣在套組內的所有計算就不會有格式互換的問題。同時,資料庫也附在套組內,所以從查閱資料庫開始,到得到分析結果都不會有格式互換的問題發生。因為每一套組都是這樣設計的,從哪一種套組開始學習其實都可以,重要的是要學的紮實。比較知名的幾種套組包括 IG suiteEMBOSSGCGPC/GENEGeneWorks、VectorNTI、DNAStar。前三者是安裝在工作站電腦上的,可經由網路連線使用,計算能力比較強;後四者則分別是 PCMac 環境下的套組,速度雖然慢但使用較方便且較易使用。

可是沒有一個套組是萬能的,以功能較強的 IG Suite GCG 兩個套組而言,IG Suite 使用起來比 GCG 容易,而且在資料的搜尋、序列之獲取及分子中模組結構之尋找等功能上均比 GCG 好,但是支持援圖形顯示的程式比 GCG 套組少。此外,像 RNA 二級結構分析,親緣關係分析等功能則根本不提供。對於使用熟練的使用者而言, GCG 套組中的程式可利用指令方式執行,因此便於自動化;而 IG Suite 的環境中則必須做互動式之操作,非常耗時。

在另一方面,網路上的序列分析使用的參數預設值(default),並不見得是最佳的條件。因此在分析某些序列時可得到好的結果,應用到其他序列上時可能就不是很理想,這是使用者使用時必須瞭解的。而且因為網路上的資源的提供者,並不提供使用者任何訓練或諮詢服務,有關輸出結果的解讀必須查閱原始文獻,對許多使用者而言,讀這些文獻是非常困難的。相反的,使用套組不但可以調整程式中的參數,以找尋最佳的條件,更提供使用者訓練與諮詢服務。因此若想瞭解如何解讀輸出的結果,程式的前提與使用範圍程式是一個比較好的方法。 對需要做大量分析的人而言,程式套組更優於網路上的資源。因為只要熟悉 UNIX 這作業環境與套組的功能,就可將分析自動化。而網路上的資源為了安全上的考量,通常不讓使用者以指令控制程式的執行,所以無法自動化。此外,有一些分析是網路上的資源不可能做的,例如你若希望用自己的序列搜尋一個自己的資料庫,檢視資料庫中的序列是否含有一個自己發展的模組樣式(pattern) 等。

總之,如果你不是經常做序列分析,或是只用到序列分析中某幾種功能,使用網路資源是一個很好的選擇;可是如果要做較複雜。較深入的分析,或是做經常性的分析,那麼使用程式套組會比使用網路資源方便。

Last updated on 11/26/01