簡介
gvcftools是用于創(chuàng)建和分析gVCF文件的小型實(shí)用程序包。每個實(shí)用程序的說明如下:
gatk_to_gvcf使用GATK Unified Genotyper修改版的“所有站點(diǎn)”輸出創(chuàng)建gVCF。
trio枚舉父子三重奏的繼承沖突和其他統(tǒng)??計(jì)信息。
twins枚舉兩個樣本之間的基因型沖突和其他統(tǒng)??計(jì)信息,通常是技術(shù)重復(fù)樣本或單卵雙胞胎。
break_blocks將不變gVCF塊分解為指定基bed文件所有區(qū)域中的單獨(dú)位置。
extract_variants從gVCF文件中刪除所有非變量塊,以生成較小的僅變量版本的VCF文件。
merge_variants將多個gVCF文件合并到一個合并的變體VCF輸出中。請注意,這是合并功能的簡單試用實(shí)現(xiàn),并具有相當(dāng)大的限制,例如,如果對任何單個樣本的變體位置進(jìn)行了過濾,則對合并的vcf記錄進(jìn)行過濾。
remove_region刪除bed文件中提供的一組區(qū)域的所有vcf記錄覆蓋率。
set_haploid_region在指定bed文件的所有區(qū)域中將倍性更改為單倍體-為更改區(qū)域中的任何雜合變體添加過濾器。
get_drawn_regions從gVCF創(chuàng)建一個稱為被調(diào)用區(qū)域的bed文件。
配置流程
1.配置編譯環(huán)境
安裝相關(guān)依賴。
yum install zlib-devel bzip2 bzip2-devel-y
2.獲取源碼
獲取“gvcftools-0.17.0”源碼包。
cd/usr/local/src
wget https://github.com/sequencing/gvcftools/archive/v0.17.0.tar.gz-O gvcftools-0.17.0.tar.gz
3.編譯和安裝
1)解壓并進(jìn)入源碼目錄。
tar-zxvf gvcftools-0.17.0.tar.gz
cd gvcftools-0.17.0
2)編譯。
make-j4
3)安裝。
mkdir-p/usr/local/gvcftools
cp-r bin/usr/local/gvcftools
4)配置環(huán)境。
a.修改環(huán)境變量。
vim/etc/profile
在“/etc/profile”文件末尾增加下面代碼:
export PATH=/usr/local/gvcftools/bin:$PATH
b.按“Esc”,輸入“wq!”保存后退出。
c.運(yùn)行下面命令,使修改的環(huán)境變量生效。
source/etc/profile
4.運(yùn)行和驗(yàn)證
查看gvcftools的使用程序。
cd/usr/local/gvcftools/bin
ls
當(dāng)系統(tǒng)回顯類似如下信息時,表示gvcftools安裝成功。
[root ecs bin]#cd/usr/local/gvcftools/bin
[root ecs bin]#ls
break_blocks check_reference extract_variants gatk_to_gvcf getBamAvgChromDepth.pl get_called_regions merge_variants
remove_region set_haploid_region trio twins