Skip to content

Carrie-HuYY/TCM-VOTER

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

55 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

TCM-VOTER (中药网络药理学数据库)

TCM-VOTER (Traditional Chinese Medicine - Visualization - Omics and Text driven Target Enrichment and Research): 一个聚焦于网络结构,基于组学与文本挖掘的靶标富集与药理学研究工具

从网络药理学和中医理论视角出发,构建"辩证-方剂-中药-成分-靶点"网络,同时开发多种分析功能的网络药理学数据库。

简介

安装

requirements

requirement包括(Python版本需要≥3.9,其余没有强制要求)

pandas~=1.3.5
rdkit~=2023.3.2
tqdm~=4.67.1
pyecharts~=2.0.7
numpy~=1.21.6

pip安装

可以使用pip安装TCM-VOTER

pip install TCM-VOTER

使用

TCM-VOTER函数

from_SD需要两个个必需形参SearchType:可以用来判断检索的类型(详见下表);SearchName:可以用于检索的内容,如果是0那就输入某种方剂名, 具体数据可见数据集

SearchType 0 1 2 3 4
Source 辩证 方剂 中药 成分 靶点
from TCM-VOTER import main

main.TCM_VOTER(SearchType,
               SearchName,
               score=990,
               DiseaseName="cough",
               target_max_number=70,
               report_number=0,
               interaction_number=0,
               out_graph=True,
               out_for_cytoscape=True,
               out_for_excel=True,
               research_status_test=True, 
               safety_research=True,
               re=True,
               path='results/'
                    )

from_SD的可选形参有:

  • score: int类型,Chemical_Protein_Links数据集中仅combined_score大于等于score的记录会被筛选出,默认为990;
  • DiseaseName:str类型,可用于在pubmed文献中检索靶点同该疾病的对应关系,即是否同时出现过用于研究价值评定,默认为cough
  • target_max_number:int类型,筛选出来的靶点数量最大值,默认为70
  • report_number:int类型,要求至少出现报道过的次数,默认为0
  • interaction_number:int类型,存在相互作用的蛋白数量,即最少应该和几个差异表达蛋白列表中的蛋白相互作用,默认为0
  • out_graph: boolean类型,是否输出基于ECharts的html格式的网络可视化图,默认为False
  • out_for_cytoscape: boolean类型,是否输出用于Cytoscape绘图的文件,默认为False
  • our_for_excel: boolean类型,是否将结果输出到excel中,默认为True
  • research_status_test: boolean类型,是否将得到的靶点进行研究价值评定,默认为False
  • safety_research: boolean类型,是否对得到的靶点进行安全性研究,默认为False
  • re: boolean类型,是否返回原始分析结果(辩证、复方、中药、化合物(中药成分)、蛋白(靶点)及其连接信息), 默认为True。若re为True,则函数将返回运行结果sd、sd_formula_links.xlsx, formula、formula_tcm_links、tcm、tcm_chem_links、chem、 chem_protein_links和proteins,它们均为pd.DataFrame类型,分别存储了辩证信息、辩证-复方连接信息, 复方信息、复方-中药连接信息、中药信息、中药-化合物(中药成分)连接信息、化合物(中药成分)信息、 化合物(中药成分)-蛋白(靶点)连接信息和蛋白(靶点)信息;
  • path: str类型,存放结果的路径,默认为results/。若无此路径,将自动建立相应的目录。

结果展示

out_graph

out_graph提供了两种可交互的可视化方案,范例1范例2

out_for_cytoscape

out_for_cytoscape给出了可以直接用于cytoscape绘图的两个文件,type.csvnetwork.csv,其中格式分别如下:

type.csv

Key Attribute
glucose Chemicals
glucose Chemicals

network.csv

SourceNode TargetNode
testosterone NR3C4
testosterone SHBG
testosterone IGFBP3

out_for_excel

将分析结果导出为名为results.xlsx的Excel文件,并按数据类别分别存储在不同的工作表(sheet)中, 包括:辩证分型数据、方剂信息、中药成分、有效成分及作用靶点等五个数据表。

research_status_test

从中药网络药理学(TCM-NP)中筛选出已有FDA批准或临床试验药物的靶点, 排除无对应药物的候选蛋白,最后给出药物推荐表格,以及两种可视化方案: 图1图2

safety_research

根据网药各节点的毒理学信息,生成一份毒性报表,主要包含毒性程度、 功效、毒性效应(中英文)的信息

Star History

Star History Chart

注意

1.关于Python版本

由于在 Python 3.9 之前的版本中,tuple[...]list[...] 这样的类型注解语法不被支持。 Python 3.9 引入了原生的类型注解支持(PEP 585), 但在早期版本中,需要使用 typing 模块中的 Tuple、List 等类型. 所以需要Python≥3.9,如果<3.9的话, 可将compute.py函数中修改如下:

from typing import Tuple, Union

def score(weights: Union[dict, None] = None) -> Tuple[pd.DataFrame, pd.DataFrame, pd.DataFrame]:
    # 函数逻辑
    pass

2.关于数据下载

整体大小为9个G,由于百度网盘限制,所以拆分成三个压缩包,解压后放data/文件夹即可

下载链接1

下载链接2

About

TCM-VOER:一个聚焦于网络结构,基于组学与文本挖掘的靶标富集与药理学研究工具

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors