天然产物科学数据库
CAS-SIOC Scientific Database of Natural Product

数据库简介
Introduction

天然产物科学数据库由中科院上海有机所化学科学数据中心开发建设,收录了超过20万天然产物数据,数据内容包括天然产物化合物标识、化学结构、名称、类型、计算预测类药性质、来源生物信息、参考文献等。 其中,天然产物化合物标识数据包括SRN、CASRN、InchiKey,化学结构数据包括分子式、元素组成、Mol、SMILES、Inchi,名称数据包括中英文俗名、系统命名、半系统命名等; 天然产物类型为生物体产生天然产物的生物合成或代谢通路类型,包括生物碱(Alkaloids)、氨基酸(Amino acids)、肽类(Peptides)、脂肪酸(Fatty acids)、聚酮(Polyketides)、碳水化合物(Carbohydrates)、萜类化合物(Terpenoids)、苯丙素类(Phenylpropanoids)等; 计算预测类药性质数据包括分子量(Molecular Weight)、环数(Number of Rings)、芳香环数(Number of Aromatic Rings)、氢键供体数(Number of H-Bond Donors)、氢键受体数(Number of H-Bond Acceptors)、可旋转键数(Number of Rotatable Bonds)、脂水分配系数(Mol LogP)、定量类药性评估(QED)、人工合成难度(Synthetic Accessibility)等; 天然产物来源包括植物源天然产物(Botanical Natural Products)、动物源天然产物(Zoological Natural Products)、细菌源天然产物(Bacterial Natural Products)、真菌源天然产物(Fungal Natural Products)、海洋源天然产物(Marine Natural Products)、人源天然产物(Human Natural Products)、病毒源天然产物(Viral Natural Products), 来源生物信息包括来源生物物种名称、中英文通用名称、科学命名、物种类别、产地、取用部位、提取组分、分离方法、鉴定方法、物种目录信息等; 参考文献数据包括标题、作者、单位、摘要、来源期刊/书籍、出版时间、原文链接等。

数据库数据来源于海量天然产物研究文献文本挖掘和人工标引分析,天然化合物中英文名称使用自主开发的深度神经网络模型翻译生成:

Tingjun Xu et al. Neural machine translation of chemical nomenclature between English and Chinese. Journal of cheminformatics 2020, 12, 50. DOI: 10.1186/s13321-020-00457-0

数据库应用案例(Cases Studies):

Tingjun Xu et al. NAFLDkb: A Knowledge Base and Platform for Drug Development against Nonalcoholic Fatty Liver Disease. Journal of Chemical Information and Modeling. 2023. DOI:
10.1021/acs.jcim.3c00395

Tingjun Xu et al. Computational Analysis of Naturally Occurring Aristolochic Acid Analogues and Their Biological Sources. Biomolecules. 2021, 11, 1344. DOI:
10.3390/biom11091344

Tingjun Xu et al. Virtual Screening for Reactive Natural Products and Their Probable Artifacts of Solvolysis and Oxidation. Biomolecules. 2020, 10, 1486. DOI:
10.3390/biom10111486

数据库数据仅供科学研究和学习交流参考,请勿用于商业用途或复制转发!The database can be used for noncommercial purposes under the condition of proper citation.

如您在使用过程中遇到任何问题,或寻求科研合作,请联系我们: xutingjun@sioc.ac.cn,021-54925249。

项目支持:中国科学院网络安全与信息化专项-应用示范项目-特色数据库( CAS-WX2021SF-0307)
Supported By The Informatization Plan of Chinese Academy of Sciences(Grant number: CAS-WX2021SF-0307)

研究论文(Publication):
Tingjun Xu et al. NPBS database: a chemical data resource with relational data between natural products and biological sources. Database 2020, baaa102. DOI: 10.1093/database/baaa102

授权发明专利: 从研究文献中提取天然产物数据信息的方法及系统(201911006389X)

计算机软件著作权: 天然产物数据信息文本挖掘系统(2020SR1243993);天然产物化学成份数据分析标引系统(2023SR1495497);天然产物特色科学数据库在线服务平台(2023SR1287365)