-
Notifications
You must be signed in to change notification settings - Fork 32
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
gseapy-python版的富集分析 #6030
Comments
gseapy-python版的富集分析 by 生信星球
本文比较长,长到需要一个目录 ORA 1.输入数据之基因 2.输入数据之基因集合
3.完成富集分析 4.可视化 GSEA 1.输入数据之预排序的基因 2.输入数据之基因集合 3.完成GSEA分析 4.可视化 富集分析分为超几何分布检验(ORA)和基因集富集分析(GSEA)。R语言有clusterprofiler包可以做富集,python是用gseapy。这个包功能强大,既支持两种富集分析,还支持基因集gmt的直接获取。 ORA1.输入数据之基因就是要一组基因,这组基因是怎么来的都可以,比如是单细胞筛选的marker基因,芯片和转录组的差异基因等。至于格式,不只是支持列表,还支持各种其他格式:param gene_list: str, list, tuple, series, dataframe. Also support input txt file with one gene id per row. 下面的gene_list是用作示例的一组基因。来自limma差异分析的结果。如需示例数据请在【生信星球】聊天框回复【1022gseapy】
2.输入数据之基因集合gene_sets参数,也支持很多格式: str, list, tuple of Enrichr Library name(s).or custom defined gene_sets (dict, or gmt file). 2.1 可以是预设的基因集合名称KEGG_2021_Human是来自 https://maayanlab.cloud/Enrichr/#libraries 的基因集合名称之一;这些名称也可以用gp.get_library_name()获取
2.2 可以是来自msigdb网站的gmt
列出都有哪些版本文件夹
列出该文件夹下都有哪些基因集合
可以自由的选择啦! 2.3也可以是完全自定义的基因集合写成字典格式即可,形如:dict: gene_sets={'A':['gene1', 'gene2',...], 'B':['gene2', 'gene4',...], ...} 3.完成富集分析
完成富集后,生成了pdf和txt文件,里面分别是条带图和富集结果文件。
4.可视化条带图和气泡图
GSEA1.输入数据之预排序的基因
注意,是全部的基因而不是只要差异基因 2.输入数据之基因集合同前面超几何分布检验的要求↑这里只写一个gmt
3.完成GSEA分析
这个结果就不是那么直观了,比较复杂:
为了方便阅读,可以把结果转换成一个数据框
4.可视化
|
https://mp.weixin.qq.com/s/rv_zi_de1lPNPHdrEot4FA
The text was updated successfully, but these errors were encountered: