CRISPR/Cas9与基因组编辑:分子生物学的新年代

发展有效和可靠的活细胞基因组精确的靶向编辑技术是生化研究的长期目标。最近,基于多年对基因功能操控的尝试,包括同源重组(homologous recombination)和RNA干扰(RNAi),基于酿脓链球菌(Streptococcus pyogenes)的CRISPR(clustered regularly interspaced short palindromic repeats,成簇规律间隔的短回文重复序列)位点相关的蛋白核酸酶(Cas9)发展的新工具产生了令人兴奋的进展。

Cas9的生物学功能

CRISPR及相关的基因(Cas)是细菌和古细菌(archaea)免疫系统的必要成分,能够帮助他们排除外源入侵的遗传物质如病毒。CRISPR重复序列最初发现于1980年代的大肠杆菌1,但直到2007年Barrangou及其同事才发现其真正的功能。他们发现在噬热链球菌(S. thermophilus)中通过整合感染性病毒的基因组片段到CRISPR位点,其能获得对噬菌体的抗性2

目前发现了大约三种CRISPR相关的机制,其中类型II研究最为广泛。在类型II里,从病毒或者质粒入侵的DNA被剪切成小片段整合到CRISPR位点,形成一系列约20 bp的重复。然后,该位点的转录本形成小RNAs(CRISPR RNA,crRNA)来指导效应器(effector)的核酸内切酶通过序列互补对靶标DNA的操作(图1)。

bacterial adaptive immunity
图1 细菌的Cas9适应性免疫系统(类型II)

通过敲除和挽救实验,Cas9蛋白被认为是一些CRISPR免疫机制(特别是类型II)的关键角色扮演者。在类型II中,仅需一个Cas9蛋白便可以完成基因沉默,其作用包括参与crRNA的形成与靶标DNA的破坏。其中,RuvC-like的核酸酶结构域和HNH-like的结构域是Cas9功能得以实现的关键。

在破坏外源DNA片段的过程中,HNH结构域剪切互补链,而RuvC结构域剪切非互补的链。Cas9双链核酸内切酶的激活同时需要2-5 nts的保守PAM序列(protospacer-associated motif),且PAM的位置刚好在被剪切互补序列的后面,中间无间隔。这也意味着,即使有全长的互补序列,没有PAM的存在,Cas9也不会起作用。

Cas9和CRISPR是分子生物学的新工具

CRISPR核酸酶系统类型II的简单体系,如仅包括3个必须的成分(Cas9蛋白,crRNA和trRNA),使得其成为基因组编辑技术的有效工具。这一潜力首先在2012年被Doudna和Charpentier实验室发现3。他们进一步将crRNA和trRNA整合成一个sgRNA(synthetic single guide RNA),从而进一步简化了成分组成。

目前,Cas9相关的基因组编辑技术发展了3种不同的方法(图2)。第一种是所谓的自然型Cas9系统。其能定点剪切双链DNA,形成双链破坏修复机制(the double strand break, DSB)的激活。DSBs可以被细胞非同源末端片段连接途径(the cellular Non-Homologous End Joining, NHEJ pathway)修复,从而形成插入/缺失(indels)干扰目标位点。另外,如果外源修复片段具有同源性,则DSB可以被同源性修复途径(the homology-directed repair pathway, HDR)修复,从而形成同源片段的精确替换。

Cong和其同事进一步提升了Cas9的精确性4,即发展了Cas9DA的突变体,仅具有切口酶(nickase)的活性。这也意味着其剪切一条DNA链而不激活NHEJ途径。同时,当提供同源修复模板时,DNA修复仅通过高保真的HDR途径进行,导致减少的插入缺失突变。通过设计相关邻近DNA切口的Cas9复合体,Cas9DA系统可进一步提升位点特异性。

第三种是一种核酸酶缺陷Cas9系统(dCas9)。HNH结构域的H840A突变体与RuvC结构域的D10A图变体能够不具有剪切活性,但不妨碍DNA的绑定。因此,该系统可用于定精确的靶标定位而不形成剪切。另外,通过整合不同的效应器结构域,dCas9可用于基因沉默或者激活工具。进一步,其可用于可视化工具,例如Chen和同事利用整合增强型荧光蛋白(Enhanced Green Fluorescent Protein, EGFP)的dCas9系统来发现重复DNA序列(利用一个sgRNA)或者非重复位点(利用多个sgRNAs)。

CRISPR/Cas9 system applications
图2 CRISPR/Cas9系统的应用

定点编辑效率

基因组编辑的有效性是衡量一个技术的关键指标。研究表明,在zebrafish和植物中,Cas9系统具有高于70%的效率,而干细胞中则在2-5%。在非靶标突变体的排除中,广泛应用的方法是T7核酸内切酶I突变体探测系统(图3)。

t7 endonuclease i targeting efficiency assay
图3 T7核酸内切酶I突变体筛查系统

另外一个重要的参数就是非靶标的突变(off-target mutations)。这些突变可能在那些与目标位点仅有少数核苷酸不同的位点出现,同时也邻近PAM序列。Cas9系统可以忍耐最多5
base的protospacer区域的错配或者一个PAM序列的碱基不同。非靶标突变通常很难探测,需要整基因组测序来排除。

最近的研究通过去除gRNA末端或者增加额外的gg到gRNA的5末端可以降低非靶标突变的概率,同时,其他的方法还包括使用成对的切口酶。一些发展的生物信息学的工具如CRISPR Design Tool和ZiFiT Targeter等也可以促进潜在的CRISPR位点的识别5


  1. Ishino, Y., et al. (1987) J. Bacteriol. 169, 5429–5433. 
  2. Barrangou, R., et al. (2007). Science, 315, 1709–1712. 
  3. Jinek, M., et al. (2012) Science, 337, 816–821. 
  4. Cong L., et al. (2013) Science, 339, 819–823. 
  5. CRISPR/Cas9 and Targeted Genome Editing: A new era in molecular biology 

除非特别声明,文章均为牛会飞的博客原创,遵循署名-非商业使用-相同方式共享授权协议
转载请注明出处: https://blogfei.com/crisprcaa9-and-genomic-editing/

暂无评论