门户分为三个版块:数据集,分析,可视化。
(i)“数据集”模块提供了在TCPA中策划的样本和蛋白质标记的详细信息,以及用于数据下载的树状视图界面; “摘要”模块中查看样本信息,如数据来源,癌症类型,样本数量和抗体数量。而且,通过点击每个数据集的“显示”按钮,用户可以获得关于如何处理和规范数据的更详细的信息。通过“下载”模块,在树视图菜单中选择感兴趣的数据集。对于每个数据集,网站提供level 3和level 4数据,level 3数据代表来自独立批次的归一化数据,level 4数据代表多个批次的合并数据。这些数据已经预压缩在一个zip文件中。在分析单个批次中生成的数据方面,level 3和level 4数据是相同的;当分批分析数据时应该使用level 4数据。下载并解压缩数据后,用户可以在同一文件夹中找到数据集元数据以及RPPA数据矩阵。“我的蛋白质”模块提供了关于评估的每个蛋白质标记物的详细信息,从而可以获得相应的基因,验证状态,抗体来源和目录号。该模块还可以显示不同癌症类型的蛋白表达水平。
(ii)“分析”模块使用户能够执行各种常见的以蛋白质为中心的分析,包括相关性,差异表达,患者存活和药物敏感性分析;对于“相关分析”,用户可以检查两种蛋白质的表达水平是否相互关联。通过这个模块,用户可以选择癌症类型/谱系的RPPA数据集,并在表格视图中获得所有的成对相关性。前两列显示蛋白质对,其次是相关系数和相应的P值。此外,通过单击加号,可以将散点图中的数据可视化。另一个有用的分析是“差异表达”。对于患者肿瘤样品,用户可以确定哪种蛋白在任何两种肿瘤类型或亚型之间差异最大。对于癌细胞系,用户可以鉴定哪些蛋白质在具有和不具有突变基因的细胞系之间差异表达。另外,患者队列应用包含“生存分析”的独特模块,细胞系应用包含“蛋白质 - 药物分析”的独特模块。这两个模块可用于识别潜在的预后和预测性蛋白质标记。可以使用“蛋白质 - 药物分析”来评估哪种药物与该蛋白质相关。
(iii)“可视化”模块允许用户交互式地检查全局RPPA数据模式。TCPA提供了两个创新的可视化模块,用于探索RPPA数据集的全局模式。一个是“网络”可视化,其中蛋白质标记是节点,交互是连接两个节点的彩色边缘。另一个模块是“NG-CHM”可视化。这种动态的交互式热图模块使用户能够直观地检查每种癌症类型或细胞系谱系的全局蛋白表达模式。
下图为癌症蛋白质组图谱概述:
参考文献:
Li,J., et al., Explore, Visualize, and Analyze Functional Cancer Proteomic DataUsing the Cancer Proteome Atlas. Cancer Res., 2017. 77(21): p. e51-e54.
联系客服