華為云計算 云知識 BLAST是什么
BLAST是什么

BLAST(Basic Local Alignment Search Tool)是一套在蛋白質(zhì) 數(shù)據(jù)庫 或DNA數(shù)據(jù)庫中進行相似性比較的分析工具。BLAST程序能迅速與公開數(shù)據(jù)庫進行相似性序列比較。BLAST結(jié)果中的得分是一種對相似性的統(tǒng)計說明。

BLAST采用一種局部的算法獲得兩個序列中具有相似性的序列。如果您想進一步了解BLAST算法,您可以參考NCBI的BLAST Course,該頁有BLAST算法的介紹。

BLAST對一條或多條序列(可以是任何形式的序列)在一個或多個核酸或蛋白序列庫中進行比對。BLAST還能發(fā)現(xiàn)具有缺口的能比對上的序列。

BLAST是基于Altschul等人在J.Mol.Biol上發(fā)表的方法(J.Mol.Biol.215:403-410(1990)),在序列數(shù)據(jù)庫中對查詢序列進行同源性比對工作。從最初的BLAST發(fā)展到現(xiàn)在NCBI提供的BLAST2.0,已將有缺口的比對序列也考慮在內(nèi)了。BLAST可處理任何數(shù)量的序列,包括蛋白序列和核算序列;也可選擇多個數(shù)據(jù)庫但數(shù)據(jù)庫必須是同一類型的,即要么都是蛋白數(shù)據(jù)庫要么都是核酸數(shù)據(jù)庫。所查詢的序列和調(diào)用的數(shù)據(jù)庫則可以是任何形式的組合,既可以是核酸序列到蛋白庫中作查詢,也可以是蛋白序列到蛋白庫中作查詢,反之亦然。

GCG及EMBOSS等軟件包中包含有五種BLAST:

BLASTP是蛋白序列到蛋白庫中的一種查詢。庫中存在的每條已知序列將逐一地同每條所查序列作一對一的序列比對。

BLASTX是核酸序列到蛋白庫中的一種查詢。先將核酸序列翻譯成蛋白序列(一條核酸序列會被翻譯成可能的六條蛋白),再對每一條作一對一的蛋白序列比對。

BLASTN是核酸序列到核酸庫中的一種查詢。庫中存在的每條已知序列都將同所查序列作一對一地核酸序列比對。

TBLASTN是蛋白序列到核酸庫中的一種查詢。與BLASTX相反,它是將庫中的核酸序列翻譯成蛋白序列,再同所查序列作蛋白與蛋白的比對。

TBLASTX是核酸序列到核酸庫中的一種查詢。此種查詢將庫中的核酸序列和所查的核酸序列都翻譯成蛋白(每條核酸序列會產(chǎn)生6條可能的蛋白序列),這樣每次比對會產(chǎn)生36種比對陣列。