更新时间:2024-08-08 GMT+08:00
分享

资产市场简介

资产市场是在EIHealth平台的基础上构建的开发者生态社区,提供镜像、数据、应用和流程的内容共享。提供安全、开放的资产共享和使用,加速基因、药物、临床应用的开发与落地,保障开发生态链上各参与方高效地实现各自的商业价值。

订阅资产

资产市场提供官方发布的镜像、数据、应用、流程资产。您可以查看各类资产的详细介绍和使用方法,并订阅资产至项目中使用。

  1. 单击所需的资产名称,查看资产的详细信息。
  2. 单击界面右侧“订阅”图标,订阅资产。
    图1 订阅资产
  3. 订阅的资产将显示在您的项目中。对于不使用的资产,您可以通过“删除”操作,取消资产订阅。
    • 订阅的流程、应用类资产,将显示在“项目管理 > 工具”页面的列表中,以“[资产市场]”进行标记。
    • 订阅的镜像类资产,将显示在“项目管理 > 镜像”页面的列表中,以“[资产市场]”进行标记。
    • 订阅的数据类资产,将显示在“项目管理 > 数据”页面。

收藏资产

资产市场提供了官方发布的镜像、数据、应用、流程资产,您可以进入资产页,单击右上角的图标,收藏资产,将与业务相关的资产放置收藏列表中,如下图所示,方便后期的查找和使用。对于已收藏的资产,可单击心形图标,取消收藏。

图2 收藏资产

公共资产列表

表1 资产列表

分类

资产名称

说明

镜像

image-stitching

针对TB级3D鼠脑稀疏标记成像数据的全自动拼接软件,减少数据分析50%的错误率,节省20%的时间,助力脑科学研究的效率提升。

AutoGenome

AutoGenome为Notebook镜像,是一个利用AutoML等技术帮助科研工作者在基因组学数据上端到端实现深度学习网络搜索,训练,评估,预测和解释的工具包。

数据

人基因组数据

GRch38-reference数据集为人类基因参考基因组,广泛用于人类基因组分析中,如WGS、callvariants 等。数据集总大小约 13GB。

NGS大数据集

NA24385-raw数据集为NGS流程测试数据集,作为该流程的原始输入。数据集总大小约 186.2GB。

NGS小数据集

NA12878-small数据集为NGS流程测试数据集,作为该流程的原始输入。数据集总大小约 216MB。

docking summary测试数据

配体文件:小分子化合物SMILES结构式文件。

受体文件:蛋白3D结构PDB文件。

RNA-Seq测试数据及参考基因组数据集

RNA-Seq-Dataset数据集包含RNA-Seq分析流程的测试数据(fastq)和流程包含软件STAR依赖的参考基因组。

流程

Variant Calling Based On NGS

二代基因组测序即Next Generation Sequencing (NGS)是一种基于边合成边测序的方式。NGS在保持了测序高准确度的同时,大幅的提高了测序速度。目前NGS已经普遍的应用于全基因组测序、全外显子测序、转录组测序、表观遗传学等领域。

该流程以NGS得到的fastq作为输入,通过质控,比对,得到比对后的bam文件,及对fastq和bam文件的质控报告。

Docking Summary

对一组小分子化合物配体和一组蛋白受体进行分子对接,汇总分子对接结果,用于可视化展示。

该流程主要完成的功能包括:整合分子对接结果,生成结合能矩阵、整合受体与分子对接产生的配体构象,进行可视化展示、对配体分子进行注释,包括:DrugBank编号、分类、化学式、XLOGP3、TPSA、靶点、Csp3比例、分子量、可旋转键数目。

RNA-Seq Analysis Based on STAR

二代基因组测序即Next Generation Sequencing (NGS)是一种基于边合成边测序的方式。NGS在保持了测序高准确度的同时,大幅的提高了测序速度。目前NGS已经普遍的应用于全基因组测序、全外显子测序、转录组测序和表观遗传学等领域。

该流程以NGS得到的fastq作为输入,通过质控,比对等步骤,输出针对fastq的qc报告,输出STAR比对得到的bam文件。

MetaGenome Kraken2 pipeline

宏基因组 ( Metagenome)(也称微生物环境基因组Microbial Environmental Genome,或元基因组)是由 Handelsman 等1998年提出的新名词,其定义为“the genomes of the total microbiota found in nature”,即环境中全部微小生物遗传物质的总和。它包含了可培养的和未可培养的微生物的基因,目前主要指环境样品中的细菌和真菌的基因组总和。宏基因组学(或元基因组学,metagenomics)是一种以环境样品中的微生物群体基因组为研究对象,以功能基因筛选和/或测序分析为研究手段,以微生物多样性、种群结构、进化关系、功能活性、相互协作关系及与环境之间的关系为研究目的的新的微生物研究方法。一般包括从环境样品中提取基因组DNA, 进行高通量测序分析,或克隆DNA到合适的载体,导入宿主菌体,筛选目的转化子等工作。

该流程主要基于Kraken2构建,跟进数据库进行物种注释。

RNA Cufflinks transcriptome analysis process

二代基因组测序即Next Generation Sequencing (NGS)是一种基于边合成边测序的方式。NGS在保持了测序高准确度的同时,大幅的提高了测序速度。目前NGS已经普遍的应用于全基因组测序、全外显子测序、转录组测序和表观遗传学等领域。

该流程以NGS得到的SRA文件作为输入,通过拆分reads、fastqc质控、tophat2比对,然后 Cufflinks 利用Tophat比对的结果(alignments)来组装转录本,估计这些转录本的丰度,并且检测样本间的差异表达及可变剪接。

RNA Hisat2-Stringtie analysis process

二代基因组测序即Next Generation Sequencing (NGS)是一种基于边合成边测序的方式。NGS在保持了测序高准确度的同时,大幅的提高了测序速度。目前NGS已经普遍的应用于全基因组测序、全外显子测序、转录组测序和表观遗传学等领域。

该流程以NGS得到的fast.gz文件作为输入,流程去接头、比对、转录组表达定量等步骤。

Human NGS data CNV detection

部分癌症患者会出现基因的大片段增删突变,甚至染色体水平上的缺失或扩增性突变,因此Copy Number Variation(CNV)可以作为检测是否患癌的指标。本流程使用患者的NGS测序数据,进行CNV变异筛查,进而判断取样者是否有患癌风险。

该流程以CNVkit为核心,基于输入的fastq,以hg38人基因组数据生成的参考基因拷贝数分布为参考基线,能够自动的完成输入数据的比对排序,以及拷贝数分布计算,并输出可视化图表以供查看。

我的发布

“资产市场>我的发布”中可以查看该用户所有发布资产的情况。对于发布成功的资产,可以在“组织共享”中查看和订阅。

  • 对于发布成功的资产,可以进行下线操作,下线后已经订阅的资产将不可使用。
    图3 下线资产
  • 对于发布失败或者下线的资产,可以进行编辑,删除,发布等操作。
  • 在“我的发布”中,只能下线发布账号发布的资产。管理员可以下线“组织共享”中发布的所有资产。
  • 发布资产前,需要先设置商标。详细可参考商标设置

相关文档