打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
SCI——生信分析类文章的构建过程(二)

往期回顾:SCI——生信分析类文章的构建过程(一)

3.生信分析的操作流程

How to do

注:首先确定一个想要研究的疾病,比如结肠癌,然后找到一个能够契合的热点,比如铁死亡,最后到公共数据库TCGA检索相关基因数据,运用统计学手段进行基因筛选,缩减目标基因数量,最后通过动物实验或临床试验进行验证。

1.数据获取:
从公共数据库(如TCGA、 NCBI、Ensembl 等)获取原始数据。

2.数据预处理:
对原始数据进行质量控制、格式转换等操作,以便后续分析。
 
3.数据对齐(或者映射):
将测序数据与参考基因组或转录组进行对齐(运用PCR技术比对基因)。
 
4.特征提取:
根据对齐结果,识别出具有生物学意义的特征,如基因表达量、突变位点、结构变异等。
 
5.数据分析与解释:
应用统计和计算方法对提取出的特征进行分析,以解答具体的生物学问题(如基因富集分析、差异表达基因分析、聚类分析等)。

  • 基因富集分析包括GO富集和KEGG富集;
  • 统计学选用合适的R语言包即可(根据个人需求在网站可以免费下载)
  • (这里提供一个免费的常用R包:The Comprehensive R Archive Network)
 
6.可视化与报告:
将分析结果以图表、表格等形式进行整理,并撰写相应的报告或论文。
 
7.集成与模型构建:
在某些复杂的分析中,可能需要将多种数据类型或多个数据集进行集成,以建立更为全面和准确的生物学模型。

数据库

①癌症基因组图谱(The cancer genome atlas,TCGA)由美国癌症研究所创立的数据库,主要收录人类癌症的测序数据及临床样本信息。

TCGA数据库包括四个等级,即level1、level2、level3、level43级和4级为为处理后的标准化数据,对外开放,可自由下载;1级和2级为原始数据,只有申请到特点权限才能下载。

官方网址:

https://www.cancer.gov/ccg/research/genome-sequencing/tcga

GDC data portal:

https://portal.gdc.cancer.gov/

②美国国家生物技术信息中心(National Center for Biotechnology Information,NCBINucleotide(核苷酸序列数据库)、 Genome(基因组数据库)、Structure(结构数据库或称分子模型数据库)、Taxonomy(生物学门类数据库)、 PopSet几个子库组成。

初衷是为了给分子生物学家提供一个信息储存和处理的系统,建有GenBank核酸序列数据库,提供众多功能强大的数据检索与分析工具。

网络版入口:https://www.ncbi.nlm.nih.gov/

③Ensembl数据库是脊椎动物基因组的基因组浏览器和注释平台,支持比较基因组的研究,进化,序列变异和转录调控。用户可以浏览特定基因或区域的信息,比较基因组,可视化变异信息,研究基因进化等。

Ensembl基因组数据库旨在为遗传学家,分子生物学家和其他研究我们自己的物种和其他脊椎动物和模式生物的基因组的研究人员提供集中资源。

官网入口:https://asia.ensembl.org/index.html


END

往期精彩回顾
(点击下方蓝色文字即可进入对应内容合集)

中基学

中医藏象——心包络

中诊学

中医“寒”的汇总小结

中药学

解表药(发散风寒药)+清热剂思维导图回顾

方剂学

方剂学——理中汤、小建中汤

中内学

中内肝胆病——积聚、鼓胀

针灸学

针灸学——特定穴(上)

考研复试

天津中医药大学一附属中西医结合导师介绍·上篇(专硕)

其他

笔记——眼科小知识


别忘了点

分享、

收藏、

在看、

点赞

哦!

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
LncRNA 引物设计-十年资深qPCR引物设计经验分享及常用LncRNA数据库介绍
ensemble和ucsc的一些区别
十分钟了解基因那些事儿~~
lncRNA信息数据挖掘之实操视频教程
GEO数据库简介
一文解决TCGA任意肿瘤的差异lncRNA,miRNA,mRNA
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服