Blast 程式可以搜尋安裝 GCG 的主機上的資料庫 (Local) ,而 NetBlast 可搜尋美國生物技術資訊中心 (NCBI) 的資料庫 (Remote)。
範例1 Blast 程式的使用
%blast -bat BLAST searches for sequences similar to a query sequence. The query and the database searched can be either peptide or nucleic acid in any combination. BLAST can search databases on your own computer or databases maintained at the National Center for Biotechnology Information (NCBI) in Bethesda, Maryland, USA. BLAST search with what query sequence? tf3a.pro Search for query in what sequence database: REMOTE 1) nr p Non-redundant GenBank CDS translations+PDB+SwissProt+PIR 2) pdb p PDB protein sequences 3) swissprot p SwissProt sequences 4) yeast p Saccharomyces cerevisiae protein sequences 5) kabat p Kabat Sequences of Proteins of Immunological Interest 6) alu p Translations of Select Alu Repeats from REPBASE 7) month p All new or revised GenBank CDS translation+PDB+SwissProt+P 8) nr n Non-redundant GenBank+EMBL+DDBJ+PDB sequences (but no EST' 9) pdb n PDB nucleotide sequences 10) vector n Vector subset of GenBank 11) yeast n Saccharomyces cerevisiae genomic nucleotide sequences 12) est n Non-redundant Database of GenBank+EMBL+DDBJ EST Division 13) sts n Non-redundant Database of GenBank+EMBL+DDBJ STS Division 14) gss n Genome Survey Sequences 15) mito n Database of mitochondrial sequences, Rel. 1.0, July 1995 16) kabat n Kabat Sequences of Nucleic Acid of Immunological Interest 17) epd n Eukaryotic Promotor Database 18) alu n Select Alu Repeats from REPBASE 19) month n All new or revised GenBank+EMBL+DDBJ+PDB sequences releas Local 20) swissprot p SWISS-PROT 21) pir p Protein Information Resource 22) genembl n GenBank+EMBL 23) est n Expressed Sequence Tags 24) sts n Sequence Tagged Sites 25) gss n Genome Survey Sequences Please choose one (* 1 *): Ignore hits expected to occur by chance more than (* 10.0 *) times? Limit the number of sequences in my output to (* 250 *) ? What should I call the output file (* tf3a.blastp *) ? tf3a.bla |
使用 Blast 時,無法指定查詢序列的範圍,若只想比較查詢序列中某一小段是否出現在資料庫中,就必須切出想分析的區域作為查詢序列,此外,不能像使用 GCG 的其他程式那樣搜尋資料庫的一部份。換言之,表格 3-1與表格 3-2中所列的指定資料庫細目的方法,不能用在 Blast 上。一旦選定範例1中所列之資料庫,就會與該資料庫中所有的序列比對。為節省搜尋的時間,在範例1中所列出的國外資料庫,也包括了一些主要資料庫中的部分序列,例如 yeast、mito 等。這些資料庫是根據使用者的需求,將某一類有趣的序列收集在一起,讓有特殊興趣的使用者更容易找到想要的資訊。
Blast 會根據使用者提供的序列 (即 query) 與指定的資料庫,自動選擇適當的程式來做資料庫搜尋。在這一組程式中,計有 Blastx、Blastp、Blastn、tBlast、tBlastx 等子程式,在表1中列出各子程式之功能:
表1 Blast 之不同子程式的運作原理
程式名 |
查詢序列 |
資料庫 |
備註 |
Blastp | protein | protein | - |
Blastn | nucleotide | nucleotide | - |
Blastx | nucleotide | protein | 轉譯查詢序列 |
Tblastn | protein | nucleotide | 轉譯資料庫序列 |
Tblastx | nucleotide | nucleotide | 轉譯查詢序列與資料庫序列 |
Return to database searching or multiple sequence alignment
[ 運算法 | 參數設定 | 結果分析 | 程式類別 | 個案分析 | 標準分析 ]
Last updated on 11/23/01