打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
破解Miseq测序文件的秘密~失败

之前笔者做实验踩过一次大坑,差点测序数据全军覆没

详情可见《测序数据挽救大作战 之 illumina重拆分方案》

虽然说是成功抢救回了数据,可也让我对Miseq的测序文件产生了极大的好奇。

Illumina测序过程到底产生了哪些文件?它们彼此间的关联是什么?如果发生了意外,我们可使用哪些数据来挽救实验数据呢?

一番研究后,笔者发现测序仪中的BCL文件是所有文件的核心所在。

为啥呢?让我来慢慢说~

首先,BCL文件是什么?

BCL文件又被称为per-cycle BCL basecall file,是illumina测序过程中产生的文件,是由拍照产生的图片转化而来,测序完成后可由程序转化为fastq文件。

So,BCL文件为什么重要?

划重点,BCL文件可以转化为fastq,是测序更底层的原始文件,只要有了BCL文件,即使数据拆分错误,测序实验出问题都不用怕,只要有BCL文件存在,我们就可以重新拆分数据提取fastq。

其次,BCL文件在哪里?

我们要知道,每次跑测序反应,测序仪都会自动的生成一个以时间开头的新的文件夹,如下图所示

每个文件夹下,保存的就是该次测序反应所有相关的文件啦。

我们打开文件看一下,里面有啥呢?

好多东西。。。哪里是我们的测序数据啊?

别慌,我们的测序数据就藏在"Data\Intensities\BaseCalls"文件夹下呢

那我们刚才说的同样很重要的BCL文件在 哪里呢?

在L001路径下,如下图所示

在这里C值代表了Cycle,也就是一个反应循环。换言之C1.1文件夹下包含了测序仪第一个测序循环里的所有产生的数据。

而每个测序循环所产生的测序数据(测序仪咔咔咔咔拍的照片),就是按照BCL文件保存的

因为包含的信息太多,所以会把内容切分成多个bcl文件保存。

第三,BCL文件怎么转化为Fastq?

有两种方式,我们可以利用测序仪自带的Local Run Manager操作转化,也可以通过llumina提供的命令行工具转化。这两种方式,之前的帖子都各自有介绍,就不重述啦~~

测序数据挽救大作战 之 illumina重拆分方案

记一次紧张害怕转危为安的测序实验

第四,BCL文件怎么查看或运用?

这点也是笔者失败的地方~ 笔者发现BCL文件是用二进制的方法存储信息的,里面具体如何代表每个cluster的ATCG情况并未找到相关文档介绍,想继续拆解BCL文件实在是让人挠头呢~

有了解的小伙伴可以分享破解经验吗?

或者有团队有意向一起研究一下吗?

长按关注

公众号名称:微微悦明

科学的乐趣是获得新知识的喜悦~

高通量测序、大数据病原微生物检测和监测健康大数据行业资讯记录与分享

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
这些年的Illumina测序仪,未来在哪里?
转录组入门(3):了解fastq测序数据
illumina不愧是二代测序无冕之王
如果想了解NGS测序原理,那么首推
扩增子分析解读2提取barcode 质控及样品拆分 切除扩增引物
GATK推荐的序列存储格式-uBAM
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服