全长转录组测序
技术简介
基于Pacbio单分子实时测序技术(Single Molecule Real-Time Sequencing,SMRT),借助其超长读长优势,无需组装,直接获得从5’末端到3’PolyA尾的高质量的全长转录本信息。利用全长转录组测序,可获取全长mRNA序列,对基因异构体、可变剪切、融合基因进行准确鉴定。
技术路线
送样建议
浓度 (Qubit) | 总量 | 完整性及纯度 | |
Total RNA | ≥300 ng/μL | ≥10 μg | RIN≥8.0,28S/18S≥1.3;基线平整,5S峰正常;OD260/280≥1.8,OD260/230≥1.8 |
测序策略 | 数据量 | 周期 | |
三代全长转录组测序 | PacBio RS II | 15G data | 95 个自然日 |
案例分析
全长转录组测序揭秘玉米转录组的复杂性[1]
研究背景
玉米(Zea mays)是全球重要的农作物,也是研究植物转录组代谢通路的遗传模型。玉米基因组序列于2009年公布,后续利用EST和RNA-Seq转录组数据对其基因注释进行了补充。然而RNA-Seq中,短读长无法提供转录本全长序列,限制了可变剪接形式的鉴定等。
研究方法
采集玉米自交系B73不同发育阶段的6个组织(根、花粉、胚芽、胚乳、幼雌穗、幼雄穗),提取mRNA,构建6种插入片段文库(<1, 1–2, 2–3, 3–5, 4–6 和>5 kb),进行全长转录组测序和二代RNA-Seq测序(每个样品三个重复)。
图1. 新鉴定LncRNA分析
研究结果
测序得到的全长转录本序列,其中有94.2%能够比对到玉米RefGen_v3参考基因组上。经聚类分析得到了来自53个家族(RefGen_v3总共57个)的新的isoform,对应26,943个基因,转录因子5,423个,其中155个与生长激素应答功能相关。而鉴定的878个候选LncRNA中,867个(平均读长为1.1kb)为新发现的LncRNA,具有结构和组织特异性。进一步对isoform、lncRNA和non-lncRNA区域进行甲基化分析,发现non-lncRNA genes具有相对较高的CG甲基化水平,而lncRNAs具有相对较高的CHG甲基化水平,这些甲基化水平可能与玉米不同组织中基因的不同表达水平有关。
研究结论
PacBio超长读长无需组装即可得到全长转录组信息,相比于Illumina短读长组装的isoform而言,更能直接准确地获得isoform信息,有助于解密玉米转录组复杂的基因表达信息。
参考文献
[1]. Wang B, Tseng E, Regulski M, et al. Unveiling the complexity of the maize transcriptome by single-molecule long-read sequencing[J]. Nature Communications, 2016, 7:11708.
全国免费热线:400-6700-360 闽ICP备19023500号 闽公网安备 35010202001014号