參數設定: 檔名檔案(list file)的產生與應用

在安裝 GCG 的電腦上,每個使用者可用的磁碟空間都有限制,若是每次要做並列分析時都要把序列取回自己的工作子目錄,不但要花時間,而且很容易超出磁碟空間的配額(quota),以至於無法工作。一個最好的辦法就是直接指定資料庫中的序列,甚至分析的範圍,以便讓程式自動去公用的磁碟機取用序列資料。這種紀錄序列檔名字的檔案稱之為「檔名檔案」。

有一些程式可以自動產生檔名檔案,以便做後續分析,例如 StringSearchFastA 的輸出檔案都可作為檔名檔,而不需要使用者自己鍵入。可是有時產生的檔案並不理想,例如用 StringSearch 找出的 TFIIIA 與相關基因序列中,有許多是片段的 exon 序列,在後續的 PileUp 分析時可能造成困擾。若你不想將這些檔名刪除,可在該筆資料前加上「」。所有的 GCG 程式看到驚嘆號後,會自動跳過其後的資料而繼續讀下一行。因此驚嘆號也可被用來在檔案中加註解。

在做多序列並列分析時,有時需要指定每個序列要分析的區域,否則不易得到好的結果。這只需要在檔名之後以BeginEnd來指定範圍,其格式可參考圖1 中所示的 FastA 輸出檔。事實上在執行 FastA 時,在所有的檔名之後還有並列分析的資料,這些資料並不會干擾到其他程式的運作,因為在並列分析的資列前有 "// End of List"的記號。PileUp 讀到雙斜線就不會再繼續向下讀,因此你也可以利用此性質簡化你的工作。若使用者只對後續分析有興趣,只要去掉不想要的序列,即可將 FastA 的輸出檔當成檔名檔來使用。也許你會問,對一個初學者而言,怎麼會知道哪些程式的輸出檔案可以做為檔名檔呢? 這有兩種方法:

  1. 有需要使用檔名檔時,追問這個程式的前一步驟是否可產生檔名檔,因此去查閱前一程式的輔助說明,再做一下測試。
  2. 在學習其他程式時,在線上輔助系統中順便瀏覽一下其他有趣的功能,比如在User's Guide下的Using Sequences就有討論哪些程式可產生檔名檔,要產生時需加何種指令等。

1 FastA 的輸出檔

[ GCG程式 | 參數設定 | 結果分析 | 程式類別 | 個案分析 | 標準分析 ]

Last updated on 11/23/01