打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
重磅综述(IF:54.908)|Nat. Biotechnol.:分子组织生物学的空间架构
生科云网址:https://www.bioincloud.tech/
编译:微科盟-三金,编辑:微科盟Emma、江舜尧。
微科盟原创微文,欢迎转发转载。
导读
目前,分析RNA和蛋白质表达的空间分辨方式的方法正在迅速发展,使全面表征健康或疾病中细胞和组织成为可能。最大限度地利用这些技术获得的生物学研究成果,既要清楚地阐明组织空间分析中关键的生物学问题,更重要的是要开发必要的计算工具来解决这些问题。分析工具的开发人员要决定需要考虑的每个细胞的内在分子特征,以及如何将细胞形状和形态特征纳入分析。此外,比较不同长度尺度的不同组织样本的最佳方法还在探寻。将这些生物学问题和相关的计算算法分成不同长度的类别,从而表征需要解决的共同问题,将促进空间转录组学和蛋白质组学的进一步进展。
论文ID
原名:Spatial components of molecular tissue biology译名:分子组织生物学的空间架构期刊:Nature BiotechnologyIF:54.908
发表时间:2022.02通讯作者:AvivRegev;Fabian J. Theis
通讯作者单位:美国麻省理工学院 & 哈佛大学Broad研究所 & 德国环境健康研究中心计算生物学研究所 & 德国慕尼黑工业大学数学系
主要内容
多细胞生物的功能取决于组织中细胞之间相互作用的平衡,这是复杂、结构化和动态的细胞生态系统。在健康个体中,组织通过多个细胞的联合作用来维持体内平衡,并在不同的实质细胞和辅助细胞类型之间进行动态分工。在疾病个体中,功能障碍通常跨越多种类型的细胞,并伴随组织的组成、结构和组织的变化。因为细胞和分子在不同尺度的组织学模式中的组织方式通常反映了它们的联合功能,因而破译组织结构和功能之间的关系是组织生物学和病理学的基石。
近年来,空间分子分析方法有了显著的发展,这些方法在分辨率、规模和分子多通路联用方面各不相同。这些方法可以捕获不同长度范围内的各种信息:从MERFISH2或SeqFISH3等技术中的单分子分辨率到空间转录组学等基于点的协议中跨越平均数十微米的细胞。不同方法在获得的分子特征的数量上也有所不同:从数十种荧光原位杂交(FISH)、循环免疫荧光(CyCIF)和成像质谱流式细胞术(IMC)到数百或数千种基于探针的空间转录组学方法(MERFISH2或 SeqFISH3)或成像质谱,以及数以万计的基于点的空间转录组学,例如Slide-Seq、Visium、DBiT-seq和高清空间转录组学(HDST)。这些例子显示了当前空间技术的一个关键特征:它们在分辨率、流量和多路联用方面是多种多样的,因此应该用于解决不同类别的问题。
计算方法是从此类数据中提取模式的关键,对于旨在考虑手头的特定生物学问题以及不同测量方法的独特特征和局限性将特别强大。这里,我们回顾了由他们解决的生物学组织的空间分子分析的计算方法以及能够测量相关参数的空间方法。我们将特别关注不同长度尺度对实验方法带来的挑战,并强调可用于此类研究的分析方法类型。我们将“长度尺度”定义为生物过程发生的空间背景:短程长度尺度包括直接的细胞间相互作用,而远程长度尺度包括整个个体,例如氧气或代谢物(图1)。此外,我们强调与目前用于分析单细胞、基于解离的方法的计算方法在概念上的重叠和区别,以展示基于单细胞分析方法的研究如何可以通过空间方法进行补充,反之亦然。我们希望这个概念和方法路线图将有助于推动组织生物学中关键生物学问题的新计算方法的开发,为寻求应用方法的生物学家提供指导,并帮助提高细胞和组织生物学的概念。
图1 空间剖析分析中变异的组成部分
a,来自空间技术的分子谱需要基于解离的分析,例如基因表达和基于样本的协变量,还需要额外的分析,例如亚细胞变异、细胞形态、空间环境和空间坐标中的多模态测量。在图中,我们强调了这些系统如何产生远程和短程效应,在模拟空间维度的分子变化时应该考虑这些效应。b,对几种生物学现象的研究,例如发育中的形态发生阶段、T细胞细胞毒活性和肿瘤微环境,可以极大地受益于空间技术的使用。在该图中,我们还区分了必须从数据中揭示的观察变量(实线)和潜在变量(生物过程,虚线)。最后,空间技术的分辨率也不同,应在目标背景下加以考虑。
1.细胞和组织生物学的长度尺度变化建模
生物学的一个长期目标是了解组织结构如何与组织生理学功能相关联。在以细胞为中心的模型中,组织结构可以通过区分细胞的不同特性(或变量)来描述(图1a)。其中一些成分可以看作是因变量,我们可以用它来测量细胞之间的变化,而另一些可以看作是自变量,我们可以用它来解释观察到的变化。在分离的单细胞分析数据中,细胞表型可以根据因变量来描述,例如整体基因表达、蛋白质表达或染色质可及性。这些因变量是自变量的函数,例如样本协变量、分析技术或测序批次。细胞变异的空间模型通过结合额外的因变量(例如分子的亚细胞空间分布和细胞形态)和自变量(例如细胞的空间环境、因果模型和表征学习的新公式的方向)来扩展该模型。值得注意的是,以细胞作为“生成”组织的自变量的互补观点在生物学上同样具有说服力,但这不是我们的重点。
我们区分了空间环境(“依赖类别”)中对细胞状态的两个主要影响:直接细胞-细胞通信和组织环境(图1)。这些依赖类别在跨组织的方差分解中表现为高频和低频模式,其中模式的频率反映了统计依赖背后的生化现象的长度尺度。高频模式可以在同一组织内多次出现,但仅限于细胞的直接邻域,并且通常对应于细胞间的通信。低频模式可以代表全局过程,例如组织个体发育的发育梯度或氧气可用性梯度和其他生理特征。在诸如肿瘤的病理环境中,低频成分可能与代谢梯度相关的信号有关,而高频成分可能与T细胞细胞毒性有关(图1b)。我们期望如生物学中那样在不同规模内嵌套。例如,在一个细胞内,我们期望局部模式(分子复合物和液-液相分离的“无膜”组织)、中间模式(细胞器)和全局模式(上皮细胞的梯度)。下面,我们通过细胞生物学和组织生物学现象对空间效应和模型进行分层。
2.细胞生物学反映在细胞和亚细胞分辨率的空间变化中
原位细胞生物学主要通过基于显微镜的技术进行研究,通常是通过可视化有限数量的蛋白质或RNAs,而单细胞图谱以前所未有的规模表征了细胞状态和类型的分子特征及其潜在的电路和分离样本的分子细节。空间分子分析提供了统一细胞生物学和分子生物学这两个领域的可能性,从而促进了我们对两个核心领域的理解:细胞状态内在变化和细胞状态外在效应。
以亚细胞分辨率收集的分子信息通过分子丰度和整个细胞的分子分布来表征细胞状态:亚细胞特征还可以扩展细胞状态空间,并且可以解开在无监督分析中基于细胞水平分子特征无法区分的细胞状态(图1a)。只有通过亚细胞分辨的分子特征才能解开的现象包括表皮生长因子信号传导对细胞周期以及细胞核和中枢神经系统转录组的影响。在实践中,如果精度为像素级的分子谱可用,则可以根据细胞器特性(例如,细胞核大小)和分子在整个细胞中的分布特征(包括它们的协方差结构)来定义细胞表型(以定义复合物、无膜隔室)等等。可以依据细胞的亚细胞特征对其功能状态进行预测,其中蛋白质和mRNA在细胞中的分布暗示细胞器或通路活动。
空间分析还用于通过物理接触、通过紧密连接和突触的化合物交换以及旁分泌或自分泌信号传导在细胞邻域中以短尺度(µm)发生细胞间通讯的影响。尽管单细胞分析方法已被用于捕获一些直接的细胞间相互作用,但组织中的许多通信模式目前只能通过空间协议直接观察。相邻细胞之间的这些相互作用有可能解释在基于解离的协议中观察到的细胞类型内的变化。例如,可以根据细胞的邻域了解激活的免疫细胞状态,并对应在单细胞RNA测序(scRNA-seq)数据中观察到的变化。仔细考虑用于探测细胞间通讯的实验技术很重要,因为这种推断既取决于测量的分子特征,也取决于是否实现了真正的单细胞分辨率(图1b、c和框1)。
从分子谱数据推断细胞间通讯(一种功能特征)已通过统计关联方法解决,这些方法通常通过先前的知识注释或通过样本间的协变模式将细胞类型相互关联。空间邻域提供了同时发生的分子和结构表型的有力证据,因此在任何组织生物学模型中都应标识为强预兆。有关细胞间通信的信息还允许开发因果推理框架,其中由空间邻域中的细胞间通信产生的细胞状态依赖性的方向模型可用于产生因果和机械假设。例如,因果推理框架可以解释T细胞对肿瘤细胞的影响,或者肿瘤微环境的代谢状态如何重塑免疫细胞的蛋白质表达。微环境中这些外在影响的因果解释模型需要细胞之间的依赖关系,并且违反了在许多scRNA-seq分析中以细胞为中心的(内在)基因表达模型中常用的独立性假设。将细胞的空间邻近度编码为空间图有望成为此类细胞间依赖性模型的前兆。
最后,具有高分辨率结果的最新进展,通过在细胞培养物或组织中的大量扰动下观察细胞生物学和分子特征,无论是光学还是通过单细胞分析,都为了解和测试这种因果模型开辟了道路。使用空间信息进行大规模扰动建模的正交方法是在系统的空间受限区域中选择性地原位扰动细胞(例如,通过动物模型中的光激活),以观察扰动对细胞通讯和组织结构的影响。
框1说明空间分子分析技术在分辨率和多通路联用方面有所不同。因此,应该通过建模方法来考虑技术的能力。在这里,我们展示了如何根据它们能够捕获的分子实体以及它们能够描绘的分辨率(以及因此长度尺度)将技术组合在一起。转录组:基于点的空间条码微阵列,可捕获转录组范围的基因表达谱:低分辨率(空间转录组学、Visium、Slide-seqV1)和高分辨率(HDST、Slide-seqV2)。带有条码寡核苷酸的原位转录组图谱:高通量(MERFISH、seqFISH、NanoString)、低通量(SCRINSHOT (CARTANA)、Barista-seq、osmFISH)、原位合成测序(STARMAP)等。
蛋白质:IMC(基质辅助激光解吸/电离-飞行时间、多路离子束成像-飞行时间)和多路 IHC(4i、cyCIF、CODEX、Immuno-SABER)。
代谢物:成像质谱。
一些涵盖了空间分子分析的实验技术
3.在超细胞长度尺度的空间变化中反映组织生物学
破译组织的新兴特性、不同尺度的组织的模块化功能、多细胞单元以及它们在疾病中的失调需要具有更大视野的空间技术以及可以识别功能单元和结构的计算方法。
这些“组织模块”由在组织中发挥特定功能的循环细胞群落组成,它们在空间上组织起来执行该功能,并且可能以不同的组分出现在不同的部位。这种结构以不同的长度尺度出现,因此在大小和细胞组成方面可能有很大不同。例如,淋巴结中的生发中心和肾脏中的肾小球都可以被视为组织模块,尽管它们在大小和功能方面结构非常不同。
组织模块由表征组织区域的表型定义,而不是以细胞或样品为中心的表型,后者通常是基于解离的数据模型的焦点。显然,用于识别组织级模块的模型需要分子谱以及空间分辨率。然而,在这些模型中很难考虑空间长度尺度。首先,随着长度尺度和推定结构数量的增加,组织模块越来越难以确定,因为相关的生物过程可能相互交错或与其他同时发生的特征相互交错。其次,实验方法的分辨率通常会随着视场尺寸的增加而降低(例如,当以高分辨率对大体积进行成像时,成像时间非常漫长),因此发现大小结构的潜力通常是反相关的。第三,长度尺度与功能结构或细胞群落之间的关系在不同组织中会有所不同:大脑的刻板分层组织不同于胰腺的球状结构或肺的树状结构。在一个器官中工作的跨长度尺度模型可能对另一个器官没有用。
代谢和形态发生梯度传达有关发育过程以及环境差异的信息,例如氧气或营养物质的可用性、激素浓度、代谢物浓度或物理压力。在不严格要求单细胞分辨率的前提下它们大多数可以用当前的空间技术进行分析。此外,可以通过空间分子技术结合形态学特征推断生物物理力,例如细胞外基质的刚度及其与细胞膜的相互作用,或特定组织中的细胞密度。生物物理组织特征从发育到癌症生物学都与许多生物系统相关,并出现在多个长度尺度上。将这些表型观察与空间组学分析的分子变化相结合,有可能解释机械生物学的分子决定因素。
通过空间方差分解和其他无监督技术对组织范围的现象进行建模。考虑空间邻近性或形态相似性的聚类方法也可用于发现超越分子相似性的组织模型。无监督表示学习已经非常成功并广泛用于scRNA-seq分析。高级表示学习方法可以改进无监督模型,并提供有前途的工具来将空间模式直接与组织特性相关联。这些包括基于图像的深度学习中的既定方法,可以处理缺乏足够信息标签的问题,例如无监督、自我监督和多任务学习。这些技术将越来越多地用于从图像中联合建模细胞的外在特征,如邻域密度和形态,以及内在特征,如表达谱,从而学习一种联合潜在表示,该表示对来自两种模式的信息进行编码。空间分子谱分析的原始版本是以生物学为中心的表征学习,可以直接在图像结构数据上进行。但这忽略了已有的强有力的知识,即细胞是组织中的离散功能单元。为了利用这些信息,我们可以将组织表示为细胞(节点)及其邻近度(边缘)的空间图。图像和图形的表示学习依赖于非常不同的模型类:基于图形的模型通常具有可解释性优势,因为它们是在细胞的可解释输入空间而不是像素上定义的,类似于用细胞-细胞捕获细胞的“社交网络”沟通和更大的联系。然而,跨图的信息聚合并不简单,这对表示大规模效应构成了限制,并且可能如图像中所示是组织的一些连续性。
无论此类组织模块是通过无监督方法还是注释来识别,都需要方法来协调它们并在样本和个体之间连贯地连接它们以验证模式发现。这种验证需要一个共同的坐标框架,用于跨器官和个体的分子变异,其中组织模块可以跨样本注册。
4.细胞命运决策的组织级模型
单细胞基因组解决的一个关键问题是细胞谱系图的推断:将细胞从一个或多个快照排列成跨越分子状态空间的连续转换,从而解释细胞命运决策以及定义哪些细胞是通过细胞分裂事件与共享谱系相关。当前的空间剖析技术面临着与仅观察生物过程快照相同问题,但它们捕获了影响细胞命运决定、细胞谱系和细胞分化的大量辅助信息;鉴于在许多情况下组织中细胞的运动受限,因而物理上的接近通常反映了相关性(例如,肠隐窝中的干细胞与其绒毛中的后代之间),以及细胞分化对相邻细胞和形态发生梯度外部信号的依赖性(例如,基质细胞和隐窝中的干细胞之间)。
对单细胞谱的分析增强了我们对细胞命运决定和细胞分化的理解。为基于解离的数据开发的方法可以直接应用于空间数据,从而在关联空间提供轨迹可视化。此外,空间数据集允许细胞命运推断方法不仅可以插入分子细胞状态空间,还可以插入空间坐标,从而有可能解决以前隐藏的细胞命运的细微差异(图2)。从因果建模的角度来看,分支事件可以用空间背景来解释;特别是可以推断影响发育过程的旁分泌信号,很容易从细胞内在的分化观点转移到更全面的组织观点。形态发生因子定位在大尺度上受到严格调控的发育过程,例如在果蝇胚胎中,可以通过另外考虑短尺度上的细胞间相互作用和其他空间效应来建模。总体而言,细胞命运决策的空间背景有助于解开细胞分化和发育过程的内在和外在影响。
为了确定细胞谱系,将空间分子信息与谱系追踪技术整合到工程模型和天然人体组织中的努力也可以促进新建模方法的发展,以解开空间对谱系形成的贡献。例如,最近的一项在大脑类器官中的研究使用谱系条码实验表明,细胞克隆在发育过程中具有很强的区域化能力,并在特定的大脑区域积累。另一项研究开发了一种适用于空间成像技术的谱系条码系统,例如多通路联用FISH,并将其应用于果蝇大脑,观察到不同克隆之间的基因表达相似性与空间接近度无关,而是来自同一谱系的细胞(即,同一克隆的成员)在空间近端时的表达相似性高于来自相距较远的同一谱系的细胞。有了这些数据,谱系追踪不仅可以用来验证提出的谱系关系,还可以用来约束推理模型和推断细胞身份的内在和外在因素。
从单细胞轮廓推断轨迹领域的一项关键创新是发现与状态空间中的速度(RNA速度)相关的分子状态。同样,RNA速度可以直接原位测量。例如,MERFISH 可以通过区分特定转录物的核内浓度和细胞质浓度来确定RNA速度。这些状态空间速度可以再次与生物变化轴耦合。在空间分子谱系中,可以用迁移细胞的空间速度来扩展分子状态空间速度。总而言之,这些例子突出了将单细胞基因组学开发的概念直接转化、扩展或重新表述为空间分子分析的机会。
图2 新维度的轨迹推断
空间数据允许将从转录组推断的轨迹放置在关联空间中。它还开辟了利用额外空间信息推断轨迹的分析方法。
5.疾病的空间特征
大多数疾病过程涉及整个组织的复杂生态系统,因此组织学是病理学表征和疾病定义的基石。单细胞分析的进展突出了与疾病发作、进展或对治疗的反应相关的细胞状态、组成和相互作用的异常,并开始描绘它们之间的协调变化。空间信息可以补充这些特征,解释在基于解离的协议中观察到的变化,解开组织结构的额外变化,并将它们与组织病理学的丰富遗产联系起来,这是生物医学研究和患者护理的基础。此外,疾病和治疗标签为组织(例如组织模块)的紧急特性提供了强有力的指标,并有助于它们的发现。
疾病状态的空间维度需要组织尺度的紊乱细胞群落和短程扰动的细胞间通信,因此需要定制模型来捕捉相关长度尺度的影响。最近的几项研究在癌症、心肌梗塞和神经退行性疾病等多种疾病中采用了这种方法。例如,最近的一项研究报告了结直肠癌中T细胞的免疫细胞分布特征,这些特征至少对于广泛的细胞类别而言在成分水平上没有表现出来。具体来说,T细胞聚集与核心肿瘤表型相关,而T细胞数量与此无关。另一项研究将空间转录组学应用于前列腺癌肿瘤的活检,并将癌症病灶确定为多细胞亚组织区室,通常无法通过典型的组织病理学分析来识别。一项针对乳腺癌组织的广泛多中心研究表明,IMC鉴定的细胞群落如何解释样本间和样本内的变异,以及定义与患者生存密切相关的癌症亚型。这些群落是新发现的组织模块,具有特征性的细胞类型富集和假定的细胞间相互作用。对同一胰腺癌肿瘤的scRNA-seq和空间转录组学的综合分析显示,应激反应癌细胞和炎性成纤维细胞共定位形成癌症特异性细胞邻域。这些研究也与非肿瘤病理学相关。例如,来自阿尔茨海默病小鼠模型的脑切片的空间转录组学和基于FISH 的测量显示,在对淀粉样斑块的细胞反应中存在局部的多细胞相互作用。这些例子展示了空间信息如何既可以解释新的疾病特征,又可以突出将紊乱的细胞状态与患病组织联系起来的潜在因果机制。
6.挑战分析和当前途径
到目前为止,我们已经描述了如何将变异的空间分量映射到细胞和组织生物学问题,并强调了一些解开分子变异空间分量的建模方法。接下来,我们描述了已经提出的方法和分析策略,以及在处理、表示、集成和分析方面处理空间分子数据的实际问题。可用的解决方案和仍需解决的开放挑战仍是重点。
7.图像处理、分割、坐标配准和数据结构
与基于解离的协议相比,大多数空间方法需要通过分割或反卷积将测量的分子映射到其细胞起源的计算映射。由于空间技术(分辨率、多路复用和模态)的高度多样性以及组织之间的差异,基于分割的方法可能需要针对手头的数据进行微调。将图像的每个像素分配给感兴趣标签(例如血管、基质或结缔组织)的语义分割方法提供了一种正交方法来通过形态特征注释组织区域。它们的表示可用于下游任务,例如与分子数据集成。分割方法的基准和评估,以及将它们集成到处理程序中,可以帮助决策核与细胞质分割、不同分割算法和分割辅助膜染色的实验设计。对于基于成像的空间技术,已经出现了替代的无分割方法。此类方法通常基于最大似然估计和图形表示学习,旨在基于分子探针的空间聚合来寻找伪细胞。当实验设置阻碍强大的基于分割的方法时,它们提供了一种可行的替代方案。
除了与分割细胞相关的分子图谱外,图像还传达了有关细胞面积、形态和种群密度的宝贵统计数据,有助于揭示组织样本的组织架构原理和高阶结构。图像分析技术也适用于将多个组织样本注册到一个共同的坐标框架。例如,已经在空间分子数据的背景下提出了利用卷积神经网络进行特征提取和样本映射的方法。此外,为了构建复杂组织和器官的3D分子图,图像配准和拼接等技术将是必不可少的。
一个关键的计算问题涉及数据表示:空间维度可以保持为矢量坐标或转换为图形,而图像信息(例如提取的特征和分割掩蔽)应该易于访问并直接与观察结果相关联。大多数用于(空间)单细胞分析的现有软件应在其现有框架中适应与分段细胞相关的此类数据类型。由于缺少数据处理基础设施和算法方法(图3a 和表1),在以细胞为中心的工作流程中,图像结构化数据的高效和灵活集成通常仍然很困难。
图3 空间分子数据的分析挑战和机遇
a,图像处理、分割、配准和数据结构:空间分子数据多种多样,需要针对处理和数据基础设施量身定制的解决方案。b,去卷积和数据整合:基于点的技术需要去卷积分析来估计点内细胞组成的比例。集成方法也可用于将已知的细胞表型映射到空间数据。c,多模态:形状和形态特征的整合,以及额外的分子谱改善细胞状态识别和组织表型。d,空间可变基因:旨在寻找空间可变分子特征的回归框架是理解细胞状态和组织组织的关键。e,细胞邻域:组织坐标是理解空间社区和细胞通信的关键,图抽象是数据的合适表示。f,空间功率分析:了解样本和个体的组织水平效应需要考虑空间分布的功率分析。表1概述了空间单细胞分析的任务和方法。
表1 空间单细胞分析的挑战和当前解决方案
数据分析程序中的任务大致可分为预处理、集成和空间可变特征识别。对于分析的每个步骤,我们概述了文献中存在的任务和建议的解决方案。
8.整合方式
一些空间方法以分辨率为代价捕获丰富的分子信息,但计算分析可通过将空间数据与显微镜数据或已使用基于解离的方法确定的单细胞轮廓相结合来用于反卷积和映射。例如,HDST、Slide-seq和空间转录组学/Visium等基于点的协议从跨越多于(或少于)一个细胞的区域捕获RNA或蛋白,而不考虑细胞边界。当像素点小于平均细胞时,计算分析可以如HDST中那样通过聚类揭示细胞身份,并且可以通过在明场显微镜(基于FISH的协议和IMC)中定义的分割掩膜对像素点进行分组来实现。如果像素点大于一个细胞(例如,Visium),反卷积方法可以将斑点中测量的转录组与组织中存在的细胞谱联系起来(图3b和表1)。与将空间观察明确建模为细胞聚合的反卷积方法相比,已开发出标签投影方法以将scRNA-seq实验中确定的细胞状态映射到较低分辨率的空间数据。这些方法通过多种比对技术将细胞类型标签从scRNA-seq转移到现场转录组学。新方法应包括空间组学数据提供的附加信息,例如从成像数据中得出的形态特征和从空间坐标计算的空间相邻图。此类附加信息可能包括对空间中细胞类型比例的平滑约束或源自细胞壁龛成像数据的形态相似性。通过空间转录组学方法收集的组织学染色对于此类映射非常宝贵,它可用于导出每个点阵列下的核密度,以及基于形态学的细胞变异性方面的其他限制。例如,最近的一种方法考虑了来自组织的细胞核密度,并采用概率框架来分配细胞类型比例。
第二个挑战在于特征空间映射:基于探针的方案,如FISH和IMC产生的特征要少得多,并且在蛋白质测量的情况下,它也与scRNA-seq模式不同,已经提出了几种方法,用于通过从单细胞参考中学习基于相关性的表示来映射稀疏空间数据中未观察到的基因表达谱。除了特征插补,多种工具专注于将单细胞转录组映射到空间坐标系,使用空间数据作为参考图。
最近,出现了主要基于scRNA-seq数据重建细胞空间排列的新方法,几乎没有或没有空间分辨实验数据。他们仅依靠几个标记来执行映射,基于基因表达空间中的相似性与空间距离相关的假设,并且这种趋势在定义的邻域中是单调的。虽然无参考方法已应用于具有强烈定型组织的生物系统,但尚不清楚它们如何显示无序空间异质性、黑白相间样式和扰动状态,例如人体器官和疾病。从一些空间数据中学习这种模式,包括细胞间相互作用的性质,可以帮助我们找到为无参考映射如通过受体配体相互作用等引入额外约束的方法。将细胞状态映射到空间坐标是一个具有挑战性的问题,我们希望它仍然是其他空间分子数据活跃的研究领域。
最后,将分子和细胞信息与图像的非分子特征整合在一起,可以更好地定义细胞及其组织关系(图3c和表1)。图像分析技术和深度学习方法可以从成像数据中收集更多信息,包括细胞面积、形态和种群密度的显示或潜在表示。这些可以帮助提高不同任务的性能,例如癌细胞分类和以更高分辨率绘制分子计数。捕获成像和分子特征的多模态表示学习可以增强我们对细胞(和邻域)的定义,并允许训练模型从另一种模态中生成一种模态。在配对数据上,这些模型可以联合学习,但应该跨模式分别编码变异源,增强可解释性和生物学发现。当模型从非耦合的、单独的数据模式(例如,显微镜图像和scRNA-seq配置文件的集合)中学习时,联合测量提供了用于测试预测的验证数据。不相交的数据源很可能在数据集大小方面超过联合测量(例如,用于成像的H&E组织切片和用于分子数据的单细胞图谱)。对于这些在不同样本上测量的不同数据类型的非常大的数据集,可以使用(自我)监督方法(例如对比学习)进行预训练和迁移学习。然后可以将学习的表示与可解释的线性方法进行事后集成。此类模型还可以与高分辨率成像工作相结合,例如最近提出的高分辨率细胞图。我们预测迁移学习的努力将广泛用于丰富遗留数据(仅以一种方式测量)和促进未来的研究。
9.空间可变特征和细胞邻域
尽管scRNA-seq告诉我们基因表达在单个细胞、细胞类型和不同实验条件之间是如何不同的,但空间方法为基因表达调控的分析增加了另一个维度。已经提出了几种方法来鉴定靶标组织中的空间变异基因(图3d和表1)。这些方法在使用的假设和模型类别方面差异很大。它们可以大致分为基于高斯过程的框架、使用隐马尔可夫随机场的方法和基于图的方法。这些方法检测空间变异性的能力和灵敏度取决于实验技术和样品特征,因此必须根据手头的数据仔细选择。目前,由于底层算法的多样性,量化空间变异性的指标仍然非常混杂,未来需要对这个问题进行分层。此外,应扩展已建立的方法,例如跨条件的差异表达分析,以考虑样本空间依赖性的变化,以及对数据的潜在空间方差分量进行建模。我们预计,从空间统计领域借鉴的技术也将有助于对分子变异的空间成分进行建模,特别是考虑到组织结构的不同观点:从直接的细胞间相互作用到更大规模的相互作用,例如旁分泌通信到代谢梯度。
空间技术也将有助于研究细胞邻域和细胞间通信(图3e)。很少有方法旨在估计空间环境中的细胞类型邻域富集,并从空间图结构推断细胞相互作用和信号基因。这些方法之间的建模现象差异很大,并且都需要在未来进行分层。
10.空间功效分析
功效分析使研究人员能够确定观察感兴趣的效果所需的样本量。在空间分子数据的背景下,这种影响不仅受样品变化的影响,还受其在样品中的空间坐标的影响。这在空间系统中特别重要,因为实际可达到的样本大小(图像大小或图像数量)在很大程度上取决于所选的实验协议。为清楚起见,我们建议将问题分为两个子挑战:以基因为中心和以细胞为中心的功率分析(图3f)。
“以基因为中心”的功率分析需要进行功率计算,以在组织中找到显著的空间可变基因。在这种情况下,每个基因都被单独考虑并可以基于组织样本的非随机区域中基因变异性的估计效应大小来执行功率计算。最近使用合成数据集进行的综合功效分析评估了几种依赖于不同测试统计数据的方法。多个混杂的空间表达趋势的叠加,例如高频和低频模式(图1b),使趋势发现进一步复杂化。值得注意的是,要求一种算法来识别表达对空间坐标的任何依赖性通常是一个过于笼统的问题,而用户可能对寻找某种形状的模式感兴趣,例如肿瘤中的径向对称性。这种基于模式的趋势发现以前曾在空间变量基因检测中进行过尝试,但可能会受到可以被框定为模式的假设的限制。
“以细胞为中心”的功率分析涉及组织结构的特征,例如细胞邻域、细胞群落和组织组成。例如,观察细胞邻域的特定富集的最佳样本量(细胞总数)取决于参与细胞类型的频率和所需的显著性阈值。此外,大规模组织特征通常直接对应于图像,因此样本大小是获得的图像数量,并在图像数量和大小之间进行权衡。这个问题已经在基于解离的测定的背景下进行了研究,但尚未针对空间分子数据进行探索。
讨论
空间分析有望将高维单细胞组学数据集的变化与组织中可解释的生物学现象联系起来。这些空间依赖性存在于截然不同的长度尺度上,并对应于在组织水平上具有不同含义的细胞生物学效应。本文中我们考虑了可以在这些长度尺度上建模的效果,并结合提供相关测量的现有空间剖析方法制定了一个路线图,用于根据潜在分子现象的长度尺度对空间数据中的依赖关系进行建模。我们还对空间分子数据的当前处理和分析方法进行了分类。如不同的应用设置所强调的,例如疾病的空间特征,空间变异模型可以解决以前隐藏的细胞状态和组织表型。因此,空间剖面研究的基于模型的实验设计不仅受到分辨率的限制,而且也是分辨率、截面大小和样本大小之间的相互妥协。
数据分析目前仍然存在许多瓶颈,因为整合从空间到非空间的数据以及在不同分辨率和不同分析物的空间分析之间整合的机会尚未完全实现。在细胞分割、图像处理以及在图像中观察到的组织结构与测量的分子谱的关系方面,图像结构化数据的分析仍然存在主要挑战。随着空间模型从程序转移到端到端模型,考虑根据特定长度尺度建模处理成像数据的新方法可以缓解数据处理瓶颈。另一方面,长度尺度特定和跨长度尺度空间变化的数学模型才刚刚开始出现。最终,我们将找到剩余的分析和实验问题的解决方案,从而允许创建单细胞解析和空间感知的组织图谱。
原文链接:
https://pubmed.ncbi.nlm.nih.gov/35132261/
----------微科盟更多推荐----------
科研 |大连医科:苦参黄素在动物模型中可减轻帕金森病(国人佳作)
上海交大系统全面综述|单细胞蛋白质分析的前景(国人佳作)
如果需要原文pdf,请扫描文末二维码领取
蛋白质组长期接受科研文章/经验投稿,期待与您交流更多蛋白质组学问题
(联系多组学老师即可投稿&申请入群)
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
2018年新技术:空间转录组学技术
「学术爆款」空间转录组学开启新时代,巨大商业期待下的巨头与新锐图鉴
10x Genomics完成最新收购计划,拓展“空间基因组学”业务
Nature重磅:2022年最新“颠覆性技术”引领高分文章发表新趋势,再登Nature顶刊!
Nature观点 | NIH人类生物分子图谱计划:从细胞水平上看人体
清华大学生命学院杨雪瑞课题组开发深度学习工具DeepLinc,使用单细胞空间转录组数据构建细胞互作网络
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服