Pacific Biosciences公司近日宣布了其单分子实时(SMRT)DNA测序平台的软件升级。SMRT Analysis 2.2提供了增强的功能,支持两项新的应用:Iso-Seq™全长转录本/异构体测序以及人类白细胞抗原(HLA)单体型定相。
mRNA转录异构体的研究一直是个挑战,因为高通量测序技术的读长普遍较短。然而,PacBio RS II测序仪经过升级,平均读长达5,000 bp,最长读长超过20,000 bp。这实现了全长的转录本测序,以及基因选择性剪接的鉴定。因此,研究新基因和异构体不再是难题。
之前,斯坦福大学的Steve Quake和Thomas Südhof教授以及霍华休斯医学研究所(HHMI)的研究人员一起,利用SMRT测序来鉴定编码neurexin的基因。这个基因参与了人类大脑中细胞之间关联的形成。由于存在大量的剪接异构体,这些基因很难研究。利用PacBio的long-read测序,研究人员鉴定出neurexin基因家族的数百个不同异构体,突出了这些基因产物的复杂性,同时也为了解neurexin的功能打下基础。
Iso-Seq也可用于转录组范围的研究,从而改善参考基因组中的基因注释。跨越全长转录本的长序列read将不再需要RNA-seq的组装步骤,带来更完整的基因模型和更全面的基因注释。
斯坦福大学的Michael Snyder实验室曾在去年十月发表文章,证明了PacBio的long-read测序在评估人类基因组中转录区域上的作用(详细内容看这里)。Snyder博士评论道:“全长转录组测序实现了整个转录组的分析,包括破译复杂的转录本和发现新的转录本。PacBio测序在这一点上做得很好。”
第二个新的应用是HLA单体型定相(HLA haplotype phasing)。HLA位点上的一组基因对免疫系统功能至关重要。对人类而言,HLA基因呈现高度多态性。研究已发现了数千个等位基因,且新的等位基因数量还在不断增加。过去,HLA多态性的准确定相需要几个实验,费用高昂。PacBio测序所提供的长read非常适合准确的基因分型,带来了明确的等位基因定相。
PacBio的SMRT Analysis 2.2产生了共有序列,可导入第三方软件中进行HLA分析。这个数据已经成功被Conexio Genomics的Assign MPS序列分析软件所使用。
Conexio Genomics的CEO David Sayer认为:“PacBio的分析流程独立产生了杂合样品中每个等位基因的共有序列,包括非编码区。利用我们的序列分析软件分析时,这个数据产生了完全定相的HLA基因型。分析不仅简单,也很快速。”