更新时间:2024-11-05 GMT+08:00
分享

创建应用

  1. 登录医疗智能体平台,进入项目并选择工具 > 应用页签,单击“新建应用”

    图1 新建应用

  2. 依据“应用参数说明表”依次创建搭建NGS流程所需的应用。

    图2 填充应用内容

    对于测序得到的大量数据,如果需要批量执行NGS分析,可以选取以下任意一种方式进行批量执行:

    • 方式一:对于输入参数,打开“并发”开关,在启动作业时,每个参数可以设置多个参数值,自动生成多个作业并发执行。并发执行的作业数为设置的参数值个数的乘积。

      例如,存在输入参数a和输入参数b,在启动作业时,分别给参数a设置了2个参数值,给参数b设置了2个参数值。那么,系统将自动生成4个作业并发执行。

    • 方式二:参考批量执行NGS分析操作。

  3. 参数确认无误后,单击“立即创建”,创建应用。
表1 fastp、bwa_samtools应用参数说明

应用名称和版本

  • 应用名称:fastp
  • 版本:0.20.1
  • 应用名称:bwa_samtools
  • 版本:0.7.17

镜像和启动命令

  • 镜像:fastp:0.20.1
  • 启动命令:
    fastp --fix_mgi_id -w 16 -i ${fastq-file1} -I ${fastq-file2} -o ${fq-file1} -O ${fq-file2} -j ${json-file} -h ${html-file}
  • 镜像:bwa_samtools:0.7.17-1.10
  • 启动命令:
    bwa mem -t 32 -M -R '@RG\tID:${sample-id}\tPL:${seq-platform}\tPU:${sample-id}\tSM:${sample-id}\tLB:${sample-id}' ${ref-file} ${fq-file1} ${fq-file2} | samtools sort -@32 -m 3G -o ${sorted-bam} && samtools index ${sorted-bam} && samtools flagstat ${sorted-bam} -@10 > ${flagstat-file}

CPU、内存和GPU

  • CPU架构:X86
  • CPU需求:0.1
  • Memory:0.1
  • GPU类型:无
  • GPU需求:0
  • CPU架构:X86
  • CPU需求:16
  • Memory:10
  • GPU类型:无
  • GPU需求:0

输入参数

  • 参数1
    • 参数名称:fastq-file1
    • 数据类型:File
    • 必传:是
  • 参数2
    • 参数名称:fastq-file2
    • 数据类型:File
    • 必传:是
  • 参数1
    • 参数名称:sample-id
    • 数据类型:String
    • 必传:是
  • 参数2
    • 参数名称:seq-platform
    • 数据类型:String
    • 必传:是
  • 参数3
    • 参数名称:fq-file1
    • 数据类型:File
    • 必传:是
  • 参数4
    • 参数名称:fq-file2
    • 数据类型:File
    • 必传:是
  • 参数5
    • 参数名称:ref-file
    • 数据类型:File
    • 必传:是

输出参数

  • 参数1
    • 参数名称:fq-file1
    • 数据类型:File
    • 必传:是
    • 默认值:/fastp_1.fq.gz
  • 参数2
    • 参数名称:fq-file2
    • 数据类型:File
    • 必传:是
    • 默认值:/fastp_2.fq.gz
  • 参数3
    • 参数名称:json-file
    • 数据类型:File
    • 必传:是
    • 默认值:/fastp.json
  • 参数4
    • 参数名称:html-file
    • 数据类型:File
    • 必传:是
    • 默认值:/fastp.html
  • 参数1
    • 参数名称:sorted-bam
    • 数据类型:File
    • 必传:是
    • 默认值:/bwa-mem.sorted.bam
  • 参数2
    • 参数名称:flagstat-file
    • 数据类型:File
    • 必传:是
    • 默认值:/samtools-flagstat.txt
表2 qualimap-bamqc、picard-insertsize应用参数说明

应用名称和版本

  • 应用名称:qualimap-bamqc
  • 版本:2.0.0
  • 应用名称:picard-insertsize
  • 版本:2.23.3

镜像和启动命令

  • 镜像:qualimap-bamqc:2.0.0
  • 启动命令:
    qualimap bamqc -bam ${bam-file} -outdir ${out-dir} -nt 8 --java-mem-size=80G
  • 镜像:picard-insertsize:2.23.3
  • 启动命令:
    java -jar /usr/picard/picard.jar CollectInsertSizeMetrics I=${bam-file} R=${ref-file} O=${insertsize-txt} H=${insertsize-pdf}

CPU、内存和GPU

  • CPU架构:X86
  • CPU需求:0.1
  • Memory:0.2
  • GPU类型:无
  • GPU需求:0
  • CPU架构:X86
  • CPU需求:0.1
  • Memory:0.1
  • GPU类型:无
  • GPU需求:0

输入参数

  • 参数名称:bam-file
  • 数据类型:File
  • 必传:是
  • 参数1
    • 参数名称:bam-file
    • 数据类型:File
    • 必传:是
  • 参数2
    • 参数名称:ref-file
    • 数据类型:File
    • 必传:是

输出参数

  • 参数名称:out-dir
  • 数据类型:Directory
  • 必传:是
  • 默认值:/bamqc
  • 参数1
    • 参数名称:insertsize-txt
    • 数据类型:File
    • 必传:是
    • 默认值:/picard-insertsize.txt
  • 参数2
    • 参数名称:insertsize-pdf
    • 数据类型:File
    • 必传:是
    • 默认值:/picard-insertsize.pdf
表3 gatk-markduplicates、gatk-bqsr应用参数说明

应用名称和版本

  • 应用名称:gatk-markduplicates
  • 版本:4.1.9.0
  • 应用名称:gatk-bqsr
  • 版本:4.1.9.0

镜像和启动命令

  • 镜像:gatk-markduplicates:4.1.9.0
  • 启动命令:
    gatk MarkDuplicates --CREATE_INDEX --TMP_DIR ${out-dir} -I ${bam-file} -M ${matrics-file} -O ${markduped-bam}
  • 镜像:gatk-bqsr:4.1.9.0
  • 启动命令:
    gatk BaseRecalibrator -R ${ref-file} -I ${markduped-bam} --known-sites ${know-site1} --known-sites ${know-site2} --known-sites ${know-site3} -O ${recal-table}

CPU、内存和GPU

  • CPU架构:X86
  • CPU需求:3
  • Memory:0.2
  • GPU类型:无
  • GPU需求:0
  • CPU架构:X86
  • CPU需求:3
  • Memory:0.2
  • GPU类型:无
  • GPU需求:0

输入参数

  • 参数名称:bam-file
  • 数据类型:File
  • 必传:是
  • 参数1
    • 参数名称:ref-file
    • 数据类型:File
    • 必传:是
  • 参数2
    • 参数名称:markduped-bam
    • 数据类型:File
    • 必传:是
  • 参数3
    • 参数名称:know-site1
    • 数据类型:File
    • 必传:是
  • 参数4
    • 参数名称:know-site2
    • 数据类型:File
    • 必传:是
  • 参数5
    • 参数名称:know-site3
    • 数据类型:File
    • 必传:是

输出参数

  • 参数1
    • 参数名称:out-dir
    • 数据类型:Directory
    • 必传:是
    • 默认值:/gatk4-tmp
  • 参数2
    • 参数名称:matrics-file
    • 数据类型:File
    • 必传:是
    • 默认值:/markduplicats.matrics
  • 参数3
    • 参数名称:markduped-bam
    • 数据类型:File
    • 必传:是
    • 默认值:/gatk4-markduped.bam
  • 参数名称:recal-table
  • 数据类型:File
  • 必传:是
  • 默认值:/gatk4-bqsr-recal.table
表4 gatk-applybqsr、gatk-haplotypecaller应用参数说明

应用名称和版本

  • 应用名称:gatk-applybqsr
  • 版本:4.1.9.0
  • 应用名称:gatk-haplotypecaller
  • 版本:4.1.9.0

镜像和启动命令

  • 镜像:gatk-applybqsr:4.1.9.0
  • 启动命令:
    gatk ApplyBQSR --bqsr-recal-file ${recal-table} --create-output-bam-index -R ${ref-file} -I ${markduped-bam} -O ${bqsr-bam}
  • 镜像:gatk-haplotypecaller:4.1.9.0
  • 启动命令:
    cd ${out-dir} && parallel -j 4 --xapply "gatk HaplotypeCaller -ERC GVCF -R ${ref-file} --pcr-indel-model NONE --tmp-dir ${out-dir} -I ${bqsr-bam} -O tmp_{1}.HC.vcf.gz --native-pair-hmm-threads 4 -L {1} " ::: `head -n-1 ${contig-file} | cut -f1`

CPU、内存和GPU

  • CPU架构:X86
  • CPU需求:3
  • Memory:0.2
  • GPU类型:无
  • GPU需求:0
  • CPU架构:X86
  • CPU需求:3
  • Memory:5
  • GPU类型:无
  • GPU需求:0

输入参数

  • 参数1
    • 参数名称:ref-file
    • 数据类型:File
    • 必传:是
  • 参数2
    • 参数名称:markduped-bam
    • 数据类型:File
    • 必传:是
  • 参数3
    • 参数名称:recal-table
    • 数据类型:File
    • 必传:是
  • 参数1
    • 参数名称:ref-file
    • 数据类型:File
    • 必传:是
  • 参数2
    • 参数名称:bqsr-bam
    • 数据类型:File
    • 必传:是
  • 参数3
    • 参数名称:contig-file
    • 数据类型:File
    • 必传:是

输出参数

  • 参数名称:bqsr-bam
  • 数据类型:File
  • 必传:是
  • 默认值:/gatk4-bqsr.bam
  • 参数名称:out-dir
  • 数据类型:Directory
  • 必传:是
  • 默认值:/gatk4
表5 gatk-mergevcfs、discvrseq-variantqc应用参数说明

应用名称和版本

  • 应用名称:gatk-mergevcfs
  • 版本4.1.9.0
  • 应用名称:discvrseq-variantqc
  • 版本:1.17

镜像和启动命令

  • 镜像:gatk-mergevcfs:4.1.9.0
  • 启动命令:
    cd ${in-dir} && ls -R tmp*.vcf.gz > vcf.list && gatk MergeVcfs --TMP_DIR ${in-dir} -I vcf.list -O ${vcf-file} && rm -rf ./*
  • 镜像:discvrseq-variantqc:1.17
  • 启动命令:
    java -jar /DISCVRSeq.jar VariantQC --maxContigs `grep '>' ${ref-file} | wc -l` --rawData ${json-file} --output ${html-file} --reference ${ref-file} --variant ${variants-file}

CPU、内存和GPU

  • CPU架构:X86
  • CPU需求:0.5
  • Memory:10
  • GPU类型:无
  • GPU需求:0
  • CPU架构:X86
  • CPU需求:0.1
  • Memory:0.2
  • GPU类型:无
  • GPU需求:0

输入参数

  • 参数名称:in-dir
  • 数据类型:Directory
  • 必传:是
  • 参数1
    • 参数名称:ref-file
    • 数据类型:File
    • 必传:是
  • 参数2
    • 参数名称:variants-file
    • 数据类型:File
    • 必传:是

输出参数

  • 参数名称:vcf-file
  • 数据类型:File
  • 必传:是
  • 默认值:/gatk4-HC.vcf.gz
  • 参数1
    • 参数名称:json-file
    • 数据类型:File
    • 必传:是
    • 默认值:/gatk4-VariantQC.json
  • 参数2
    • 参数名称:html-file
    • 数据类型:File
    • 必传:是
    • 默认值:/gatk4-VariantQC.html

相关文档