文档首页 > > 移植指南> 移植SpeedSeq> 移植指导

移植指导

分享
更新时间:2020/08/31 GMT+08:00

介绍

简要介绍

SpeedSeq是一个快速基因组分析和注释的灵活框架,发表在Nature Method(http://www.nature.com/nmeth/journal/vaop/ncurrent/full/nmeth.3505.html)上,封装了大量基因组分析的软件,比如比对软件BWA,calling SNP软件freebayes,SV鉴定软件lumpy等。

开发语言:C

一句话描述:快速基因组分析和解析的框架

开源协议:MIT

建议的版本

根据实际需要选择版本,本文档以“speedseq 0.1.2”为例进行说明。

环境要求

云服务器要求

本文以云服务器KC1实例测试,云服务器配置如表1所示。

表1 云服务器配置

项目

说明

规格

kc1.large.2 | 4vCPUs | 8GB

磁盘

系统盘:高IO(40GB)

操作系统要求

操作系统要求如表2所示。

表2 操作系统要求

项目

说明

下载地址

CentOS

7.6

在公共镜像中已提供。

Kernel

4.14.0-115

在公共镜像中已提供。

配置编译环境

  1. 安装相关依赖。

    yum install -y gcc gcc-c++ make cmake python2 python2-numpy scipy gawk zlib zlib-devel bzip bzip2-devel xz-devel ncurses-devel

  2. 安装HTSlib。

    1. 获取“htslib-1.10.2”源码包。

      cd /usr/local/src

      wget https://github.com/samtools/htslib/releases/download/1.10.2/htslib-1.10.2.tar.bz2

    2. 解压并进入源码目录。

      tar -jxvf htslib-1.10.2.tar.bz2

      cd htslib-1.10.2

    3. 配置生成Makefile。

      ./configure

    4. 编译安装。

      make -j4

      make install

  3. 安装cython

    pip install cython

  4. 安装pysam。

    pip install pysam

获取源码

获取“speedseq最新版”源码包。

cd /usr/local/src

git clone --recursive https://github.com/hall-lab/speedseq.git

编译和安装

  1. 进入SpeedSeq目录。

    cd /usr/local/src/speedseq

  2. 下载“sse2neon.h”文件。

    wget https://github.com/jratcliff63367/sse2neon/archive/master.zip

    unzip master.zip

    mv ./sse2neon-master/SSE2NEON.h ./sse2neon-master/sse2neon.h

    cp ./sse2neon-master/sse2neon.h ./src/bwa

  3. 修改“ksw.c”程序中引用的头文件,注释掉“#include <emmintrin.h>”,增加“#include "sse2neon.h"”,修改完成后,保存退出。

    vim ./src/bwa/ksw.c

    //#include <emmintrin.h>
    #include "sse2neon.h"

  4. 编译SpeedSeq。

    make -j4

  5. 生成的SpeedSeq工具加入环境变量。

    1. 编辑“/etc/profile”

      vim /etc/profile

      在文件末尾加入如下内容:
      export PATH="$PATH:/usr/local/src/speedseq/bin"
    2. “Esc”,输入“wq!”退出。
    3. 环境变量生效。

      source /etc/profile

运行和验证

执行如下命令,查看SpeedSeq版本。

speedseq

回显信息如下,则表示SpeedSeq安装成功。

Program: speedseq
Version: 0.1.2
Author: Colby Chiang (cc2qe@virginia.edu)

usage:    speedseq <command> [options]
command:  align    align FASTQ files with BWA-MEM
          var      call SNV and indel variants with FreeBayes
          somatic  call somatic SNV and idel variants in a tumor/nomal pair with FreeBayes
          sv       call SVs with LUMPY
          realign  realign from a coordinate sorted BAM file
options:  -h       show this message
          ...      ...         
分享:

    相关文档

    相关产品

文档是否有解决您的问题?

提交成功!非常感谢您的反馈,我们会继续努力做到更好!
反馈提交失败,请稍后再试!

*必选

请至少选择或填写一项反馈信息

字符长度不能超过200

提交反馈 取消

如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨

智能客服提问云社区提问