工程化和表征蛋白质可能既耗时又麻烦,这促使人们开发通用型 CRISPR-Cas 酶1–4 ,以实现多样化的基因组编辑应用。然而,这类酶存在一些问题,比如脱靶编辑风险增加3,5,6 。为了实现 Cas9 酶的可扩展重编程,研究人员将高通量蛋白质工程与机器学习(ML)相结合,开发出更适合特定靶点的定制编辑器。通过基于结构 / 功能的饱和诱变和细菌筛选,研究人员获得了近 1000 种工程化的化脓性链球菌 Cas9(SpCas9)酶,并对它们的原间隔序列邻近基序7 (PAM)需求进行了表征,以此训练一个将氨基酸序列与 PAM 特异性联系起来的神经网络。利用由此产生的 PAM 机器学习算法(PAMmla)预测 6400 万种 SpCas9 酶的 PAM,研究人员鉴定出了高效且特异的酶,这些酶在人类细胞中作为核酸酶和碱基编辑器的性能优于基于进化和工程化的 SpCas9 酶,同时还降低了脱靶效应。一种计算机模拟定向进化方法可实现用户导向的 Cas9 酶设计,包括在人类细胞和小鼠中对 RHO P23H 等位基因进行等位基因选择性靶向。总之,PAMmla 将机器学习和蛋白质工程相结合,整理出了具有不同 PAM 需求的 SpCas9 酶目录,推动了在各种应用中使用高效且安全的定制 Cas9 酶,而非通用型酶。

提问-留言

Please enter your name.sad
Please enter a comment.

Sign up for D.C. Diagnosis
newsletter

A weekly insider's guide to the politics and policies of health care.