華為云計(jì)算 云知識 gvcftools是什么
gvcftools是什么

簡介

gvcftools是用于創(chuàng)建和分析gVCF文件的小型實(shí)用程序包。每個實(shí)用程序的說明如下:

gatk_to_gvcf使用GATK Unified Genotyper修改版的“所有站點(diǎn)”輸出創(chuàng)建gVCF。

trio枚舉父子三重奏的繼承沖突和其他統(tǒng)??計(jì)信息。

twins枚舉兩個樣本之間的基因型沖突和其他統(tǒng)??計(jì)信息,通常是技術(shù)重復(fù)樣本或單卵雙胞胎。

break_blocks將不變gVCF塊分解為指定基bed文件所有區(qū)域中的單獨(dú)位置。

extract_variants從gVCF文件中刪除所有非變量塊,以生成較小的僅變量版本的VCF文件。

merge_variants將多個gVCF文件合并到一個合并的變體VCF輸出中。請注意,這是合并功能的簡單試用實(shí)現(xiàn),并具有相當(dāng)大的限制,例如,如果對任何單個樣本的變體位置進(jìn)行了過濾,則對合并的vcf記錄進(jìn)行過濾。

remove_region刪除bed文件中提供的一組區(qū)域的所有vcf記錄覆蓋率。

set_haploid_region在指定bed文件的所有區(qū)域中將倍性更改為單倍體-為更改區(qū)域中的任何雜合變體添加過濾器。

get_drawn_regions從gVCF創(chuàng)建一個稱為被調(diào)用區(qū)域的bed文件。

配置流程

1.配置編譯環(huán)境

安裝相關(guān)依賴。

yum install zlib-devel bzip2 bzip2-devel-y

2.獲取源碼

獲取“gvcftools-0.17.0”源碼包。

cd/usr/local/src

wget https://github.com/sequencing/gvcftools/archive/v0.17.0.tar.gz-O gvcftools-0.17.0.tar.gz

3.編譯和安裝

1)解壓并進(jìn)入源碼目錄。

tar-zxvf gvcftools-0.17.0.tar.gz

cd gvcftools-0.17.0

2)編譯。

make-j4

3)安裝。

mkdir-p/usr/local/gvcftools

cp-r bin/usr/local/gvcftools

4)配置環(huán)境。

a.修改環(huán)境變量。

vim/etc/profile

在“/etc/profile”文件末尾增加下面代碼:

export PATH=/usr/local/gvcftools/bin:$PATH

b.按“Esc”,輸入“wq!”保存后退出。

c.運(yùn)行下面命令,使修改的環(huán)境變量生效。

source/etc/profile

4.運(yùn)行和驗(yàn)證

查看gvcftools的使用程序。

cd/usr/local/gvcftools/bin

ls

當(dāng)系統(tǒng)回顯類似如下信息時,表示gvcftools安裝成功。

[root ecs bin]#cd/usr/local/gvcftools/bin

[root ecs bin]#ls

break_blocks check_reference extract_variants gatk_to_gvcf getBamAvgChromDepth.pl get_called_regions merge_variants

remove_region set_haploid_region trio twins