栏目分类

热点资讯

西野翔

你的位置:伪娘 > 西野翔 > av视频 Nature Protocol丨clusterProfiler, 快速表征多组学数据

av视频 Nature Protocol丨clusterProfiler, 快速表征多组学数据

发布日期:2024-08-06 06:51    点击次数:176

av视频 Nature Protocol丨clusterProfiler, 快速表征多组学数据

av视频

讨论先容

讨论配景

Background

跟着多组学分析的出现,寻找生物流程和疾病中的互异基因组,敷陈疾病的机制,以及服气潜在的调理靶点,都越来越离不开多维富集分析软件。

clusterProfiler是一个用于态状和讲明组学数据的软件包。功能富集不错通过分析过度表征或基因集富集来杀青。该软件撑持使用各式数据库,如基因本色论[GO]和京都基因和基因组百科全书[KEGG]。它不错用于讨论特定的基因或聚集与特定的生物学功能、通路或分类之间的关联。

该分析是通过计较进行的,同样在基因转录、卵白质抒发或其他大畛域生物信息学数据等筹商讨论顶用到。

功能富集分析的两种最常见的方法:

ORA:过度表征分析,是一种主要用于预界说基因列表的方法,真正验中的显耀互异抒发基因(DEGs)。ORA决定了哪些功能或通路在通盘这个词基因组或参考聚汇聚出现的频率比预期的更高,得出最相宜分析且具有实质性影响的基因。

GSEA:基因集富集分析,不错评估通盘这个词基因抒发谱,以服气一个基因集的显耀性名次。在这种情况下,一组基因可能是与特定的生化道路筹商的基因聚集,也可能是与特定的生理功能、疾病流程或药理响应筹商的基因聚集。GSEA识别的是基因聚集的步履。

当今ORA和GSEA被等闲使用,很多软件平台主要汇聚于对传统的道路进行富集评估。

图1|clusterProfiler空洞

讨论观念

Objectives

clusterProfiler是一个通用的器具,它集成了GSEA和ORA方法,允许用户定制数据库和凝视,提供了更等闲的讲明范围,促进了从单细胞类型到细菌代谢组,以至转录因子分析等新兴领域的讨论。

这篇著述旨在通过三个具体的例子,对这一器具的不同应用场景进行全面的分析:

1.比拟不同疾病的功能概况。

2.非方法生物中的转录因子分析。

3.来自单细胞转录组数据的自动细胞类型凝视。

讨论方法

讨论亮点

1、敷陈微生物群、代谢物和疾病之间复杂的相互筹商

2、服气植物耐寒道路中活性转录因子

3、单细胞转录组学凝视细胞类型

试验贪图

Experimental design

在这三个例子中,主要使用clusterProfiler的ORA(三个例子中均使用)和GSEA算法(在第二个例子中使用)探索卑劣生物通路调控和细胞类型识别。

ORA算法的全体念念路

采用某个列表中感好奇赞佩的特色进行后续分析,如基因或代谢物;采用一个合适的凝视数据库,如GO或KEGG通路数据库;使用clusterProfiler提供的富集功能,如GO富集或KEGG富集,使用ORA算法进行分析。

GSEA算法的全体念念路

赢得一系列具有生物学真谛的特征,如折叠变化值、T统计量或矫正的P值排序等特征;应用clusterProfiler中的gseKEGG、gseGO或GSEA等功能进行GSEA分析;对于波及多个组的场景,不错使用其他函数进行比拟分析。

GSEA或ORA的采用av视频

Tips

在采用这两种富集方法时,同样会字据输入数据的特征和分析观念来作念出决议。

对于输入数据,ORA算法只需要一系列感好奇赞佩的基因,其中可能包括同源基因、单细胞记号基因或来自免疫千里淀相互作用的卵白质;GSEA需要一个完满的、经过排序的基因列表,比如按log2倍变化排序的基因列表等。

对于分析观念,ORA罗致Fisher精准磨砺来查验一组基因是否彰着存在于一组基因中,这是富集分析中的一种典型方法;GSEA评估一个基因集是否倾向于集结在名次列表的顶部或底部,以服气该基因集在特定条目下是否被激活或阻挠。GSEA的上风在于它大致发现奥秘而一致的通路,而不单是是基因的上归拢下调。

讨论发现

基本信息态状

1、比拟不同疾病的功能概况

2、非方法生物中的转录因子分析

3、从单细胞转录组数据中赢得细胞类型凝视

一、比拟不同疾病的功能概况

比拟不同亚型IBD的功能谱

在疾病讨论中,攀附多组学数据是真切意会生物系统的复杂性和访问疾病原因的重要。宏基因组学主要汇聚于微生物的遗传因素,而代谢组学则汇聚于宿主-微生物相互作用的代谢最终产物。

使用宏基因组预处理的KEGG基因丰采信息和代谢组预处理的代谢物特征丰采表。其中包括56例对照样本,76例溃疡性结肠炎(UC)患者和88例克罗恩病(CD)患者。基于此数据,进行功能富集分析,旨在识别在炎性肠病(IBD)的两种亚型中被侵扰的共同的和突出的的生物通路和功能亚群。

代谢组学和宏基因组上游数据预处理(供参考):

宏基因组学部分:使用fastp73对原始reads进行径手质料截至;使用Bowtie2与东说念主类基因组进行比对,去除宿主(东说念主类)DNA;使用MetaPhlAn2进行分类,保留相对丰采升迁0.1%的物种;使用HUMAnN2进行功能分析,通过KEGG KO号或EC号来整理基因丰采。

代谢组学部分:样品代谢物一般罗致液相色谱-串联质谱技巧进行分析,包括极性代谢物、脂质、游离脂肪酸和胆汁酸。每种技巧都罗致了高机灵度的质谱仪,大致检测已知和未知的代谢物。原始液相色谱-串联质谱数据处理,包括降噪、峰值检测、同位素聚类检测、保留时辰对皆和代谢物识别,不错使用Genedata Expressionist software。

图2|比拟不同亚型IBD的功能谱

主要讨论肠说念微生物群基因(a)和肠说念代谢物(b)

二、非方法生物中的转录因子分析

筹商转录因子功能特征

现时,非方法生物一经被等闲的基因编目数据库凝视,从而对细胞系统生物学有了更明晰的意会。该部分态状了一个分析非方法生物的方法框架。使用毛竹(PE)的转录组测序数据集,波及到一个有益的GSEA植物转录因子数据库的计谋整合。该部分讨论观念汇聚在服气不同发育时辰起作用的转录调控因子,旨在进一步解码它们在冷顺应响应中的功能含义。

应用低温条目下的原始基因丰采抒发表,其中行名为基因名,列名为样真名。探讨毛竹(PE)在阴凉条目下可能存在的基因转录调控机制,从PlantTFDB53中下载了毛竹的转录因子眷属列表和基因GO凝视表。用户不错字据我方的数据和实验贪图,替换该转录因子列表和功能凝视表。

转录组数据的预处理:

①对测序reads的质料截至,包括评估测序reads的质料,去除低质料的reads等。此设施同样使用的软件包括FastQC、Trimmomatic或fastp73。

②比对和定量,使用Tophat78、STAR79、Bowtie274或HISAT2等器具将算帐后的reads映射到参考基因组或转录组等

③用cuffquant、RSEM、featureCounts或HTSeq等器具来量化转录本。在这些设施之后,基于对皆恶果,用户赢得一个基因抒发计数表,用于分析。

图3|在竹子中参与耐寒转录因子的生物学功能特征

三、单细胞转录组数据中细胞类型凝视

识别细胞类型

单细胞测序方法以较高精度探索细胞内在的异质性。这一部分使用到MSigDB47(用于凝视的基因数据库)的C8基因集,并与clusterProfiler协同集成。

这一部分使用到外周血单个核细胞(PBMCs)的单细胞数据,MSigDB47(用于凝视的基因数据库)的C8基因集,并与clusterProfiler协同集成。

①使用Seurat进行上游数据阅读和初步分析,包括线粒体基因的去除、数据法式化、高度可变基因的识别、主因素分析(PCA)、UMAP降维和聚类分析。

②使用RunMCA分析和GetGroupGeneSet,通过CelliD60从每个细胞簇中索求前20个特征基因。

③使用clusterProfiler的比拟集群和聚集,为每个集群履行单位GSEA。

④字据MSigDB数据库中的细胞类型基因集,按照富集进程对每个细胞簇进行细胞类型凝视。(用户也不错使用他们孤苦蚁集的可靠的细胞类型基因集列表进行凝视)

小萝莉穴

图4|在单细胞水平上识别细胞类型。

(a).用已知细胞类型(通过典型记号匹配);(b).预测细胞类型(通过聚类分析赢得)

讨论筹商

讨论局限性

1、软件使用在很猛进程上依赖于大家凝视资源,采用的数据库决定着恶果的精准度

2、数据可能包含假阳性或不够全面,数据诚然直不雅,但会存在偏差

3、软件得出恶果很快,但需要有明晰、全面的分析念念路,对用户常识储备量具有挑战性

算计

PROSPECT

在大数据期间,需要借助软件快速分析。通过对分析软件的熟识掌抓,不错促进软件的革新和分析策略的发展,拓宽异日的讨论视线。

clusterProfiler集成各式的功能、彭胀凝视数据库端口、合并扶持软件包何况简化了数据分析和可视化流程,其在科学界的影响力和实用性都将箝制增强。

参考文件

[1] Xu S, Hu E, Cai Y, et al. Xie Z, Luo X, Zhan L, Tang W, Wang Q, Liu B, Wang R, Xie W, Wu T, Xie L, Yu G. Using clusterProfiler to characterize multiomics data. Nat Protoc. 2024 Jul 17.

INSTITUTION

南边医科大学

南边医科大学(Southern Medical University),为广东省东说念主民政府、国度卫糊口生委和老师部共建高校,是位于广东省广州市的一所要点大学。学校是广东省首批5所省属高水平大学要点修复高校中惟一的医学院校、中国首批“部委省”共建医科高校、首批八年制临床医学专科(本博连读)的8所高校之一。

END

案牍 | 小果子

排版 | 小果子

审核 | 小果子

发布|姜笑南

RECRUIT

脸色咱们,获取人命科学

学界前沿|促进更多的学术沟通与互助

业界前沿|促进更快的居品革新与应用

政策前沿|促进更好的处置本质与发展

咱们期待你的加入av视频



Powered by 伪娘 @2013-2022 RSS地图 HTML地图

Copyright Powered by站群 © 2013-2024 版权所有