文档首页 > > 移植指南> 移植GATK

移植GATK

分享
更新时间:2020/08/06 GMT+08:00

介绍

简要介绍

GATK全称Genome Anlysis Toolkit,是一套用于分析基因组的工具箱。主要功能是寻找变异位点和基因分型,用于从sequencing数据中进行variant calling,包括SNP、INDEL。

开发语言:Java

一句话描述:分析基因组的工具箱

开源协议:BSD 3-Clause

建议的版本

建议使用最新版本,此处以“gatk-4.1.7.0”版本为例进行说明。

环境要求

云服务器要求

本文以云服务器KC1实例测试,云服务器配置如表1所示。

表1 云服务器配置

项目

说明

规格

kc1.large.2 | 4vCPUs | 8GB

磁盘

系统盘:高IO(40GB)

操作系统要求

操作系统要求如表2所示。

表2 操作系统要求

项目

说明

下载地址

CentOS

7.6

在公共镜像中已提供。

Kernel

4.14.0-115

在公共镜像中已提供。

配置编译环境

安装相关依赖。

yum install -y git git-lfs java-1.8.0-openjdk

获取源码

获取GATK最新版本源码。

cd /usr/local/src

git clone https://github.com/broadinstitute/gatk.git

编译和安装

  1. 并进入GATK目录。

    cd gatk

  2. 编译GATK。

    ./gradlew shadowJar

    编译完成后会在“build/libs”目录里面生成“gatk.jar”文件。

运行和验证

测试GATK是否安装完成。

java -jar build/lib/gatk.jar --version

返回内容如下所示,表示安装已经完成。

[root@ecs gatk]# java -jar build/lib/gatk.jar --version
The Genome Analysis Toolkit (GATK) v4.1.7.0-27-g3ad0eca-SNAPSHOT
HTSJDK Version: 2.22.0
Picard Version: 2.22.8
分享:

    相关文档

    相关产品

文档是否有解决您的问题?

提交成功!非常感谢您的反馈,我们会继续努力做到更好!
反馈提交失败,请稍后再试!

*必选

请至少选择或填写一项反馈信息

字符长度不能超过200

提交反馈 取消

如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨

智能客服提问云社区提问