-
Notifications
You must be signed in to change notification settings - Fork 32
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
基于单细胞和整体RNA测序的氧化应激反应生物标志物的卵巢癌研究(文章复现)3.单细胞分析 #5840
Comments
基于单细胞和整体RNA测序的氧化应激反应生物标志物的卵巢癌研究(文章复现)3.单细胞分析 by R 学习践行者
单细胞测序数据分析流程: 使用“Seurat” R 包对单细胞测序数据进行了分析。分析主要包括以下步骤:构建对象、数据标准化、数据降维聚类和识别标记基因。使用CreateSeuratObject构建Seurat对象。将最小细胞数设为3,最小特征数设为200,并首次对基因和细胞进行过滤。以下阈值用于再次过滤细胞:特征数为(200,6000),计数数为(300,40000),过表达double_cutoff值为0.15,线粒体基因比例< 30%,红细胞读取比例< 20%。选择前2000个高变基因作为主成分分析(PCA)的输入。通过ElbowPlot函数确定前15个主成分(PCs)为后续分析的重要主成分。 由于单细胞测序数据来自多个数据集,因此使用“harmony” R 包进行批次校正,以消除干扰下游分析的批次效应。调试后并参考原始贡献中的聚类结果,使用FindClusters算法以分辨率0.5识别肿瘤细胞子集。 统一流形近似与投影(UMAP)是一种基于黎曼几何生成数据理论框架的降维流行学习技术。UMAP在处理高通量和高维数据(如单细胞测序)时保留了更多的全局结构,性能优越,扩展性更好。使用UMAP对PCA获得的数据进一步降维。使用DimPlot函数将细胞类型划分为低维空间并进行可视化。使用FeaturePlot、DotPlot、DoHeatmap和VlnPlot函数可视化肿瘤细胞的表达、分布景观和特征基因。使用DotPlot函数可视化每个细胞亚群中与特定氧化应激反应相关的标记基因。选择|avg_log2FC| > 3的簇标记基因和氧化应激反应因子的交集基因中的顶级基因进行映射显示。 1.创建Seurat对象
前7行是基本信息,不是表达数据,所以需要整理一下。
2.质控
1)筛选线粒体基因百分比(percent.mt < 5):
2)筛选基因特征数(nFeature_RNA < 6200):
3)筛选RNA计数(nCount_RNA < 18000):
4)筛选核糖体蛋白基因百分比(percent.rp < 15):
5)筛选血红蛋白基因百分比(percent.hb < 1):
ElbowPlot函数绘制主成分分析(PCA)中的“肘部图”。肘部图用于确定在降维分析中选择多少个主成分是合适的。 在肘部图中,x轴表示主成分的数量,y轴表示每个主成分的标准差。通常,我们选择曲线开始变得平坦的点作为主成分的数量,即“肘部”位置。这个位置显示了添加更多主成分对解释数据变异的重要性开始减弱的点。
下面这段代码用来寻找并保存所有簇(cluster)的标志基因,并从中挑选出每个簇中表达水平最高的两个基因。
5.注释亚群 手动注释
7.1 marker基因
|
小提琴优化 |
https://mp.weixin.qq.com/s/oi4M6UetEjepu83ux8jR9A
The text was updated successfully, but these errors were encountered: