華為云計算 云知識 什么是GATK?
什么是GATK?

簡介

GATK全稱Genome Anlysis Toolkit,是一套用于分析基因組的工具箱。主要功能是尋找變異位點和基因分型,用于從sequencing數(shù)據(jù)中進行variant calling,包括SNP、INDEL。

配置流程

1.配置編譯環(huán)境

安裝相關依賴。

yum install-y git git-lfs java-1.8.0-openjdk

2.獲取源碼

獲取GATK最新版本源碼。

cd/usr/local/src

git clone https://github.com/broadinstitute/gatk.git

3.編譯和安裝

1)進入GATK目錄。

cd gatk

2)編譯GATK。

./gradlew shadowJar

編譯完成后會在“build/libs”目錄里面生成“gatk.jar”文件。

4.運行和驗證

測試GATK是否安裝完成。

java-jar build/lib/gatk.jar--version

返回內(nèi)容如下所示,表示安裝已經(jīng)完成。

[root ecs gatk]#java-jar build/lib/gatk.jar--version

The Genome Analysis Toolkit(GATK)v4.1.7.0-27-g3ad0eca-SNAPSHOT

HTSJDK Version:2.22.0

Picard Version:2.22.8