BLAST是什么

BLAST(Basic Local Alignment Search Tool)是一套在蛋白質(zhì) 數(shù)據(jù)庫(kù) 或DNA數(shù)據(jù)庫(kù)中進(jìn)行相似性比較的分析工具。BLAST程序能迅速與公開(kāi)數(shù)據(jù)庫(kù)進(jìn)行相似性序列比較。BLAST結(jié)果中的得分是一種對(duì)相似性的統(tǒng)計(jì)說(shuō)明。

BLAST采用一種局部的算法獲得兩個(gè)序列中具有相似性的序列。如果您想進(jìn)一步了解BLAST算法,您可以參考NCBI的BLAST Course,該頁(yè)有BLAST算法的介紹。

BLAST對(duì)一條或多條序列(可以是任何形式的序列)在一個(gè)或多個(gè)核酸或蛋白序列庫(kù)中進(jìn)行比對(duì)。BLAST還能發(fā)現(xiàn)具有缺口的能比對(duì)上的序列。

BLAST是基于Altschul等人在J.Mol.Biol上發(fā)表的方法(J.Mol.Biol.215:403-410(1990)),在序列數(shù)據(jù)庫(kù)中對(duì)查詢(xún)序列進(jìn)行同源性比對(duì)工作。從最初的BLAST發(fā)展到現(xiàn)在NCBI提供的BLAST2.0,已將有缺口的比對(duì)序列也考慮在內(nèi)了。BLAST可處理任何數(shù)量的序列,包括蛋白序列和核算序列;也可選擇多個(gè)數(shù)據(jù)庫(kù)但數(shù)據(jù)庫(kù)必須是同一類(lèi)型的,即要么都是蛋白數(shù)據(jù)庫(kù)要么都是核酸數(shù)據(jù)庫(kù)。所查詢(xún)的序列和調(diào)用的數(shù)據(jù)庫(kù)則可以是任何形式的組合,既可以是核酸序列到蛋白庫(kù)中作查詢(xún),也可以是蛋白序列到蛋白庫(kù)中作查詢(xún),反之亦然。

GCG及EMBOSS等軟件包中包含有五種BLAST:

BLASTP是蛋白序列到蛋白庫(kù)中的一種查詢(xún)。庫(kù)中存在的每條已知序列將逐一地同每條所查序列作一對(duì)一的序列比對(duì)。

BLASTX是核酸序列到蛋白庫(kù)中的一種查詢(xún)。先將核酸序列翻譯成蛋白序列(一條核酸序列會(huì)被翻譯成可能的六條蛋白),再對(duì)每一條作一對(duì)一的蛋白序列比對(duì)。

BLASTN是核酸序列到核酸庫(kù)中的一種查詢(xún)。庫(kù)中存在的每條已知序列都將同所查序列作一對(duì)一地核酸序列比對(duì)。

TBLASTN是蛋白序列到核酸庫(kù)中的一種查詢(xún)。與BLASTX相反,它是將庫(kù)中的核酸序列翻譯成蛋白序列,再同所查序列作蛋白與蛋白的比對(duì)。

TBLASTX是核酸序列到核酸庫(kù)中的一種查詢(xún)。此種查詢(xún)將庫(kù)中的核酸序列和所查的核酸序列都翻譯成蛋白(每條核酸序列會(huì)產(chǎn)生6條可能的蛋白序列),這樣每次比對(duì)會(huì)產(chǎn)生36種比對(duì)陣列。