更新时间:2024-12-13 GMT+08:00
分享

分子属性预测

基于盘古药物分子大模型,预测化合物ADMET相关的80多种成药属性,有些属性的预测值会给出置信区间,更好地辅助分子设计。

  1. 单击“分子属性预测”功能卡片,进入配置页面。
    图1 小分子配置页面
  2. 在配置页面输入分子信息,及配置相关参数。
    • 输入方式:支持绘制分子、选择文件、手动输入。
      • 绘制分子:只能绘制一个分子,能够输入分子的SMILES。
      • 选择文件:选择分子文件,最多支持100万个小分子,且分子文件大小不超过2GB。支持SDF、MOL2、PDB、SMI格式。文件来源包括数据中心和示例数据。
      • 手动输入:输入小分子SMILES表达式。最多支持输入1000行,每行最多输入512个字符,SMILES不支持输入空格或者中文。
    • 选择基模型:选择基模型,此参数只有专业版支持。基模型列表见AI建模
    • 选择属性模型:选择AI模型。如果需要创建模型,可参考AI模型。此参数只有专业版支持。一次最多可以选10个模型属性。属性模型的基模型必须与上一步所选择的基模型一致。
    • 输出小分子表征:是否输出小分子表征文件,小分子表征文件可以用作训练模型使用,默认是不输出。
    • 作业名称:设置作业名称。长度为5~64个字符,仅可以使用字母、数字、下划线“_”、中划线“-”和空格,首位只能以数字或字母开头。
    • 标签:设置任务标签。
    • 功能调用消耗:20000个小分子记一次功能调用。

    引用外部桶时,需要确保所引用的数据不超过45层级的目录。

  3. 配置完成后,单击“提交”。

    提交成功后,可以在“作业中心”查看执行结果。

  4. 查看运行结果。

    可以单击“下载”,下载分子属性预测结果信息。单击“操作”列的“查看”,查看分子信息。分子属性预测对应的下游分析为分子优化和合成路径,通过单击“下游分析”可以进行创建。

    单击,可以收藏该分子属性预测结果,收藏后的结果可在收藏夹页直接查看。

    下载操作将会产生流量费用,具体可参考计费说明

    图2 查看结果(1)
  5. 分子属性预测结果支持以卡片视图的形式进行查看,参考图3,在卡片视图中:
    • 单击右上方的选择下拉框,可以选择分子的排序方式,将分子按照所选的排序方式进行展示。
      图3 查看运行结果(2)
      图4 排序方式
    • 单击每个分子卡片右上方的,可以收藏该分子属性预测结果,收藏后的结果可在收藏夹页直接查看。
    • 单击每个分子卡片右上方的,可以选择“查看详情”、“下游分析””。
      • 查看详情:单击查看详情,跳转至分子列表页进行查看。
      • 下游分析:分子优化对应的下游分析为分子优化、分子搜索和合成路径规划,单击“确定”即可创建。
    • 每个分子卡片上会展示相应分子序号与对应的参数QED、SaScore
      • QED:代表分子的成药性。
      • SaScore:代表合成可及性分数,旨在评估分子的合成难易程度。

聚类分析

目前分子属性预测返回的结果小分子数较多,无法进行批量分析,通过一些聚类的辅助方式能更好的选择分子。从每个类里挑选出一两个分子进行后续分析和验证,提高分析的效率和分析质量。也可以通过聚类找出一些关键的骨架,来进行下游分析或者优化等。

  1. 在输出结果页面左上角单击“聚类分析”后,系统开始进行分析,同时显示“聚类分析中”。
    图5 聚类分析
  2. 待聚类分析完成后,单击“查看聚类结果”。进入聚类结果页。
    图6 查看聚类结果
  3. 在聚类结果页面,可以查看每个聚类的分子数量等信息。
  4. 单击某个聚类的操作列的“查看详情”,即可进入聚类详情页面,聚类详情页支持以卡片、列表以及3D的形式查看。默认展示卡片页面,用户可自行进行切换。
    • 每个结果页面只用进行一次聚类分析操作。
    • 聚类结果是存成文件,如果文件被删或者获取不到的话会有警告, 聚类结果不存在。此时可以单击“重新聚类分析”。
    • 如果聚类失败,根据提示失败原因解决问题后,可单击“重新聚类分析”。

相关参数

分子属性预测的具体参数请参考相关参数

相关文档