牛津纳米孔Oxford Nanopore公司在刚刚过去的年度London Calling大会上发布技术更新,公司CTO Clive Brown展示了其在纳米孔平台上开发蛋白质测序的早期验证结果。

ONT公司进军蛋白测序,这一点也不意外,事实上这也是其在追求的“anything”,对不同分析物都能进行测序/测定。ONT公司在去年IPO时把蛋白测序定为其长期发展的目标之一,意味着未来五到十年会重点发展的方向。然而,最近ONT公司明显在蛋白测序方面更加活跃,过去一段时间内发布了不少跟蛋白测序开发相关的职位,此次Clive在主场展示其重要验证结果,可见ONT在蛋白测序上明显提速了。

注:ONT此次更新蛋白测序,打得有点意外,似乎为了提升市值,也是绞尽脑汁。从今年2月份开始建设者就在构思“蛋白+测序”系列文章,希望6月份开始陆续发布,点击关注“我是建设者”或者加入“基数健造”大本营,敬请留意。

蛋白测序,不管从哪个角度角度上说,都很难。用纳米孔测序蛋白更是挑战不小,与四碱基的核酸相比,蛋白的氨基酸种类多出好几倍,更别说可能的庞大的序列组合了;与核酸的稳定负电性质不同,氨基酸的多样性意味着其并不稳定带电,于是就很难自然穿过纳米孔;此外蛋白质的复杂三级折叠结构及翻译后修饰等,都是要解决的棘手问题。但对于ONT来说,已经实现了成功的核酸测序商业化,自然也不会放过蛋白这个类别,再说蛋白组学本身就是比基因组学更有想象力的大市场。

纳米孔蛋白测序的复杂性


Clive早在2019年的用户大会NCM上就展示了开发的蛋白测序的早期概念,但仅限于想法,并未展示太多数据。有趣的是,对比可以发现,ONT在蛋白测序的技术路线上发生了明显转变。

Clive在2019年NCM用户大会上展示的蛋白测序早期路线


事实上,ONT考虑蛋白测序的时间可能更早。ONT的紧密合作伙伴UCSC的Mark Akeson小组早在2013年就发表文章提出利用MspA纳米孔用于蛋白测序的想法,通过使用蛋白去折叠酶ClpX识别结合特定的信号肽,诱导相连的氨基酸短链穿孔,通过特征电信号进行测序。这实际上就是Clive在2019年展示的技术路线:通过ClpX/P蛋白去折叠酶复合体来控制肽链穿孔测序。除了需要开发合适的纳米孔和相应的马达蛋白之外,直接读取肽链就更需要训练能够识别复杂氨基酸squiggle信号的新算法,也就是所谓的amnio calling(氨基调用识别)。

然而,ONT似乎没有继续选择这条路线前进,而是采用了完全不同的方式来实现蛋白测序,这一次是通过DNA-肽偶联方法,其中肽被束缚在双链DNA分子上被牵引穿孔。这样做的好处就是可以直接利用DNA测序的蛋白孔、DNA解旋酶马达,以及相应的基础设施。当DNA-肽偶联物穿过孔时,它会产生DNA和肽信号;而在初期概念验证阶段,ONT每次只嵌入两个相同氨基酸,产生独特的特定氨基酸信号谱,类似于其开发DNA纳米孔测序的早期工作思路(只改变核苷酸均聚物中的单个DNA碱基,然后再上升到kmer水平产生特征信号)。Clive的展示中可以看到ONT尝试为20种不同氨基酸都构建squiggle特征谱,以此为基础搭建氨基识别的机制。


Clive在2022年LC大会上展示的纳米孔蛋白测序更新路线


如果关注这个领域可以看到,在过去的一两年内,已经有几个不同的课题组在纳米孔蛋白测序领域发表了重要的论文(也包括我们国内的课题组),其中DNA-肽偶联的方法被最多开发。特别是荷兰代尔夫特理工大学的Cees Dekker小组在2021年发表的《科学》论文中详细介绍了这样的方法,利用MspA纳米孔可以在单个氨基酸分辨率水平实现蛋白质测序,并已申请了涵盖该方法的专利。不知道ONT是否也从Cees Dekker这里授权了相应的专利?

在这篇Science文章中,同一个蛋白分子可以被重复读取多次,可获得极低错误率的测序结果。与此相似,Clive也明确表示后续开发将着重于Outy读取模式,实现序列多次重读,实现共识序列的高准确率。

即便以此技术路线为主导,可以想象,ONT接下来将需要投入大量的时间精力来进一步优化化学体系、获取更好的蛋白质信号、并开发更强大的分析算法来真正实现未知肽的氨基识别测序。

Clive设想的理想操作是,生物样本中复杂的蛋白质混合物不需要进行分离,直接用蛋白酶(如胰蛋白酶)消化,然后转化为DNA-肽结合物进行测序。这样可以实现长肽或重叠肽的直接测序,这就是蛋白质的鸟枪法测序。最终,ONT的目标是大家能够在现有的ONT DNA/RNA测序平台上对蛋白质进行测序,不需要额外的硬件,同样的去中心化。

这是一个艰难的美好前景,或许还需要三年、五年、十年,但ONT已经响亮清晰地提出了这个主张。

举报/反馈

基数健造

71获赞 41粉丝
测序、数据、基因检测
关注
0
0
收藏
分享