分子属性预测
基于盘古药物分子大模型,预测化合物ADMET相关的80多种成药属性,有些属性的预测值会给出置信区间,更好地辅助分子设计。
- 单击“分子属性预测”功能卡片,进入配置页面。
图1 小分子配置页面
- 在配置页面输入分子信息,及配置相关参数。
- 输入方式:支持绘制分子、选择文件、手动输入。
- 绘制分子:只能绘制一个分子,能够输入分子的SMILES。
- 选择文件:选择分子文件,最多支持100万个小分子,且分子文件大小不超过2GB。支持SDF、MOL2、PDB、SMI格式。文件来源包括数据中心和示例数据。
- 手动输入:输入小分子SMILES表达式。最多支持输入1000行,每行最多输入512个字符,SMILES不支持输入空格或者中文。
- 选择基模型:选择基模型,此参数只有专业版支持。基模型列表见AI建模。
- 选择属性模型:选择AI模型。如果需要创建模型,可参考AI模型。此参数只有专业版支持。一次最多可以选10个模型属性。属性模型的基模型必须与上一步所选择的基模型一致。
- 输出小分子表征:是否输出小分子表征文件,小分子表征文件可以用作训练模型使用,默认是不输出。
- 作业名称:设置作业名称。长度为5~64个字符,仅可以使用字母、数字、下划线“_”、中划线“-”和空格,首位只能以数字或字母开头。
- 标签:设置任务标签。
- 功能调用消耗:20000个小分子记一次功能调用。
引用外部桶时,需要确保所引用的数据不超过45层级的目录。
- 输入方式:支持绘制分子、选择文件、手动输入。
- 配置完成后,单击“提交”。
- 查看运行结果。
可以单击“下载”,下载分子属性预测结果信息。单击“操作”列的“查看”,查看分子信息。分子属性预测对应的下游分析为分子优化和合成路径,通过单击“下游分析”可以进行创建。
单击,可以收藏该分子属性预测结果,收藏后的结果可在收藏夹页直接查看。
下载操作将会产生流量费用,具体可参考计费说明。
图2 查看结果(1)
- 分子属性预测结果支持以卡片视图的形式进行查看,参考图3,在卡片视图中:
- 单击右上方的选择下拉框,可以选择分子的排序方式,将分子按照所选的排序方式进行展示。
图4 排序方式
- 单击每个分子卡片右上方的,可以收藏该分子属性预测结果,收藏后的结果可在收藏夹页直接查看。
- 单击每个分子卡片右上方的,可以选择“查看详情”、“下游分析””。
- 查看详情:单击查看详情,跳转至分子列表页进行查看。
- 下游分析:分子优化对应的下游分析为分子优化、分子搜索和合成路径规划,单击“确定”即可创建。
- 每个分子卡片上会展示相应分子序号与对应的参数QED、SaScore
- QED:代表分子的成药性。
- SaScore:代表合成可及性分数,旨在评估分子的合成难易程度。
- 单击右上方的选择下拉框,可以选择分子的排序方式,将分子按照所选的排序方式进行展示。
聚类分析
目前分子属性预测返回的结果小分子数较多,无法进行批量分析,通过一些聚类的辅助方式能更好的选择分子。从每个类里挑选出一两个分子进行后续分析和验证,提高分析的效率和分析质量。也可以通过聚类找出一些关键的骨架,来进行下游分析或者优化等。
- 在输出结果页面左上角单击“聚类分析”后,系统开始进行分析,同时显示“聚类分析中”。
图5 聚类分析
- 待聚类分析完成后,单击“查看聚类结果”。进入聚类结果页。
图6 查看聚类结果
- 在聚类结果页面,可以查看每个聚类的分子数量等信息。
- 单击某个聚类的操作列的“查看详情”,即可进入聚类详情页面,聚类详情页支持以卡片、列表以及3D的形式查看。默认展示卡片页面,用户可自行进行切换。
- 每个结果页面只用进行一次聚类分析操作。
- 聚类结果是存成文件,如果文件被删或者获取不到的话会有警告, 聚类结果不存在。此时可以单击“重新聚类分析”。
- 如果聚类失败,根据提示失败原因解决问题后,可单击“重新聚类分析”。
相关参数
分子属性预测的具体参数请参考相关参数。