发布时间:2019-03-01
2019年3月1日,《科学》发表了一篇名为《胞嘧啶单碱基编辑会导致大量单核苷酸突变的脱靶》的研究论文,该研究由中国科学院神经科学研究所(中国科学院脑科学与智能技术卓越创新中心)、上海脑科学与类脑研究中心、神经科学国家重点实验室、中国科学院灵长类神经生物学重点实验室杨辉研究组与中国科学院上海营养与健康研究所隶属的计算生物学研究所(中国科学院-马普学会计算生物学伙伴研究所)、斯坦福大学遗传学系以及中国农业科学院深圳农业基因组研究所合作完成。该研究建立了一种被命名为GOTI(Genome-wide Off-target analysis by Two-cell embryo Injection)的新型脱靶检测技术,并使用该技术发现: 近年来兴起的单碱基编辑技术有可能导致大量无法预测的脱靶,因而存在严重的安全风险。此研究显著提高了基因编辑技术脱靶检测的敏感性,并且可以在不借助于任何脱靶位点预测技术的情况下发现之前的脱靶检测手段无法发现的完全随机的脱靶位点,为基因编辑工具的安全性评估带来了突破性的新工具,有望成为新的行业检测标准。
CRISPR/Cas9是广泛关注的新一代基因编辑工具,自从2012年被发明以来,它一直以其高效性和特异性备受世人的期待,学术界普遍认为基于CRISPR/Cas9及其衍生工具的临床技术将为人类的健康做出巨大贡献。然而值得注意的是,CRISPR/Cas9从问世以来,其脱靶风险一直备受关注,如果将CRISPR/Cas9及其衍生工具用于临床的话,脱靶效应可能会引起包括癌症在内的很多种副作用。在此之前,人们推出过多种检测脱靶的方案。以前的方法或者依赖于计算机软件预测,或者依赖于高通量测序检测DSB产生,还有体外检测的方法。这些方法都存在一些局限性,不能高灵敏性检测到脱靶突变,尤其是单核苷酸突变。因此关于CRISPR/Cas9及其衍生工具的真实脱靶率一直存在争议。因此一种能够突破之前限制的脱靶检测技术,将会成为CRISPR/Cas9及其衍生工具是否能最终走上临床的关键。人们迫切希望可以找到一种既能够不依赖于脱靶位点预测,又能有足够信噪比的精密脱靶检测手段。
因此,如果要提升检测脱靶效应的精度,就必须彻底颠覆原有的脱靶检测手段。首先,为了实现不借助于脱靶位点预测,这就要求必须找到非常严格的对照组来确定基因突变的位点;同时为了检测不依赖于sgRNA的随机突变,最好使用基于单细胞全基因组测序。为了实现以上目标,杨辉研究组与合作者建立了一种名叫“GOTI”的脱靶检测技术。研究者们在小鼠受精卵分裂到二细胞期的时候,编辑一个卵裂球,并使用红色荧光蛋白将其标记。小鼠胚胎发育到14.5天时,将整个小鼠胚胎消化成为单细胞,利用流式细胞分选技术基于红色荧光蛋白,分选出基因编辑细胞和没有基因编辑细胞,再进行全基因组测序比较两组差异。这样就避免了单细胞体外扩增带来的噪音问题。而且由于实验组和对照组来自同一枚受精卵,理论上基因背景完全一致,因此直接比对两组细胞的基因组,其中的差异基本就可以认为是基因编辑工具造成的。
在杨辉实验室全体成员与合作单位的共同努力下,GOTI系统被成功建立了起来。借助于这个系统,团队成员先是检测了最经典的CRISPR/Cas9系统。结果发现,设计良好的CRISPR/Cas9并没有明显的脱靶效应,这个结果结束了之前对于CRISPR/Cas9脱靶率的争议。然而团队还检测了另一个同样被给予厚望的CRISPR/Cas9衍生技术BE3,这个系统可以精确引入点突变,在之前的研究中从未发现过有明显的脱靶问题。然而在GOTI的检测下发现,BE3存在非常严重的脱靶,而且这些脱靶大多出现在传统脱靶预测认为不太可能出现脱靶的位点,因此之前方法一直没有发现其脱靶问题。团队分析后认为,这些脱靶位点有部分出现在抑癌基因上,因此经典版本的BE3有着很大的隐患,目前不适合作为临床技术。研究团队的这些重要发现,证实了以BE3为代表的部分基因编辑技术存在无法预测的脱靶风险,让世人重新审视了这些新兴技术的风险。更重要的是,此工作建立了一种在精度、广度和准确性上远超越之前的基因编辑脱靶检测技术,有望由此开发精度更高、安全性更大的新一代基因编辑工具,建立行业的新标准。
该项工作由中科院神经所博士后左二伟(现任中国农业科学院深圳农业基因组研究所研究员),计算生物学所博士研究生孙怡迪,计算生物学所研究员魏武,中国农业科学院深圳农业基因组研究所助理研究员袁堂龙等科研人员,在中科院神经所杨辉研究员, 计算生物学所李亦学研究员,斯坦福大学Lars M. Steinmetz教授的共同指导下完成,课题组的其他成员积极参与,并得到了神经所流式分选平台、动物平台、基因编辑平台的大力协助,是众多课题组通力合作的重要成果。
图1 GOTI技术的原理及实验流程:(A) 实验流程. (B) 脱靶位点数目比较。Cre-, Cas9-, BE3- and ABE7.10组分别有14+/-12 (SEM, n=2),12+/-4 (SEM, n=11),283+/-32 (SEM, n=6)和10 +/- 5 (SEM, n = 4)个SNVs。(C) 突变类型的分布比较. 每个格子中的数字表示该种突变类型占全部突变的比例 (D) 脱靶SNVs富集在基因组中的转录区域。(E) Genes 包含脱靶位点的基因在细胞胚胎中有更高的表达量。