首页  专利技术  其他产品的制造及其应用技术

用于转座货物核苷酸序列的系统和方法与流程

2026-03-06 11:40:02 128次浏览
用于转座货物核苷酸序列的系统和方法与流程


背景技术:

1、cas酶以及其相关的成簇规则间隔短回文重复序列(crispr)向导核糖核酸(rna)似乎是原核免疫系统的普遍存在(约45%的细菌,约84%的古菌)的组分,用于通过crispr-rna导向的核酸切割来保护此类微生物免受非自身核酸,如传染性病毒和质粒的侵害。虽然编码crispr rna元件的脱氧核糖核酸(dna)元件在结构和长度上可能相对保守,但其crispr相关(cas)蛋白是高度多样化的,含有多种核酸相互作用结构域。虽然早在1987年就观察到crispr dna元件,但crispr/cas复合物的可编程核酸内切酶切割能力直到最近才被认识到,从而引起重组crispr/cas系统在各种dna操纵和基因编辑应用中的使用。


技术实现思路

1、在一些方面,本公开提供了一种用于将货物核苷酸序列转座到靶核酸位点中的系统,所述系统包括:第一双链核酸,所述第一双链核酸包括所述货物核苷酸序列,其中所述货物核苷酸序列被配置成与重组酶或转座酶复合物相互作用;cas效应子复合物,所述cas效应子复合物包括2类ii型cas效应子和至少一个被配置成与所述靶核酸位点杂交的工程化向导多核苷酸;以及所述重组酶或转座酶复合物,其中所述重组酶或转座酶复合物被配置成将所述货物核苷酸序列募集到所述靶核酸位点。在一些实施例中,所述重组酶或转座酶复合物与所述cas效应子复合物非共价地结合。在一些实施例中,所述重组酶或转座酶复合物与所述cas效应子复合物共价地连接。在一些实施例中,所述重组酶或转座酶复合物在单个多肽中与所述cas效应子复合物融合。在一些实施例中,所述货物核苷酸序列侧接有左侧转座酶识别序列和右侧转座酶识别序列。在一些实施例中,所述系统进一步包括包含所述靶核酸位点的第二双链核酸。在一些实施例中,所述系统进一步包括邻近所述靶核酸位点的与所述cas效应子复合物相容的pam序列。在一些实施例中,所述pam序列位于所述靶核酸位点的3'。在一些实施例中,所述重组酶或转座酶复合物是tn7型转座酶复合物。在一些实施例中,所述工程化向导多核苷酸被配置成与所述2类ii型cas效应子结合。在一些实施例中,所述2类ii型cas效应子包括包含与seq id no:1或其变体具有至少约80%同一性的序列的多肽。在一些实施例中,所述重组酶或转座酶复合物包括至少一个、至少两个、至少三个或四个包括与seq id no:2-5中的任一者或其变体具有至少80%同一性的序列的多肽。在一些实施例中,所述工程化向导多核苷酸包括包含与seq id no:12或其变体具有至少80%同一性的至少60-80个连续核苷酸的序列。在一些实施例中,所述工程化向导多核苷酸包括与seq id no:11或其变体具有至少80%同一性的序列。在一些实施例中,所述左侧重组酶序列包括与seq id no:17-18中的任一者或其变体具有至少80%同一性的序列。在一些实施例中,所述右侧重组酶序列包括与seq id no:19或其变体具有至少80%同一性的序列。在一些实施例中,所述2类ii型cas效应子和所述重组酶或转座酶复合物由包括少于约10千碱基的多核苷酸序列编码。

2、在一些方面,本公开提供了一种用于将货物核苷酸序列转座到包括靶核苷酸序列的靶核酸位点中的方法,所述方法包括在细胞内表达本文所描述的任何方面或实施例的系统或将本文所描述的任何方面或实施例的系统引入到细胞中。

3、在一些方面,本公开提供了一种用于将货物核苷酸序列转座到靶核酸位点中的系统,所述系统包括:第一双链核酸,所述第一双链核酸包括被配置成与tn7型转座酶复合物相互作用的货物核苷酸序列;cas效应子复合物,所述cas效应子复合物包括2类v型cas效应子和工程化向导多核苷酸,所述工程化向导多核苷酸被配置成与所述靶核苷酸序列杂交;以及tn7型转座酶复合物,所述tn7型转座酶复合物被配置成与所述cas效应子复合物结合,其中所述tn7型转座酶复合物包括tnsa亚基。在一些实施例中,所述转座酶复合物与所述cas效应子复合物非共价地结合。在一些实施例中,所述转座酶复合物与所述cas效应子复合物共价地连接。在一些实施例中,所述转座酶复合物在单个多肽中与所述cas效应子复合物融合。在一些实施例中,所述2类v型cas效应子不是cas12k效应子。在一些实施例中,所述货物核苷酸序列侧接有左侧转座酶识别序列和右侧转座酶识别序列。在一些实施例中,所述系统进一步包括包含所述靶核酸位点的第二双链核酸。在一些实施例中,所述系统进一步包括邻近所述靶核酸位点的与所述cas效应子复合物相容的pam序列。在一些实施例中,所述pam序列位于所述靶核酸位点的5'。在一些实施例中,所述工程化向导多核苷酸被配置成与所述2类v型cas效应子结合。在一些实施例中,所述tnsa亚基包括具有与seq id no:7或其变体具有至少80%同一性的序列的多肽。在一些实施例中,所述tn7型转座酶复合物包括至少一个、至少两个或三个包括与seq id no:8-10中的任一者或其变体具有至少约80%同一性的序列的多肽。在一些实施例中,所述工程化向导多核苷酸包括包含与seq id no:13-16中的任一者或其变体具有至少80%同一性的至少约46-80个连续核苷酸的序列。在一些实施例中,所述左侧重组酶序列包括与seq id no:20或其变体具有至少约80%同一性的序列。在一些实施例中,所述右侧重组酶序列包括与seq id no:21或其变体具有至少约80%同一性的序列。在一些实施例中,所述2类v型cas效应子不是cas12k效应子。在一些实施例中,所述2类v型cas效应子和所述tn7型转座酶复合物由包括少于约10千碱基的多核苷酸序列编码。

4、在一些方面,本公开提供了一种用于将货物核苷酸序列转座到包括靶核苷酸序列的靶核酸位点中的方法,所述方法包括在细胞内表达本文所描述的任何方面或实施例中的任一种的系统或将本文所描述的方面或实施例中的任一种的系统引入到细胞中。

5、在一些方面,本公开提供了一种用于将货物核苷酸序列转座到靶核酸位点中的方法,所述方法包括使包括所述货物核苷酸序列的第一双链核酸与以下接触:cas效应子复合物,所述cas效应子复合物包括2类ii型cas效应子和至少一个被配置成与所述靶核酸位点杂交的工程化向导多核苷酸;重组酶或转座酶复合物,所述重组酶或转座酶复合物被配置成将所述货物核苷酸募集到所述靶核酸位点;以及第二双链核酸,所述第二双链核酸包括所述靶核酸位点。在一些实施例中,所述重组酶或转座酶复合物与所述cas效应子复合物非共价地结合。在一些实施例中,所述重组酶或转座酶复合物与所述cas效应子复合物共价地连接。在一些实施例中,所述重组酶或转座酶复合物在单个多肽中与所述cas效应子复合物融合。在一些实施例中,所述货物核苷酸序列侧接有左侧转座酶识别序列和右侧转座酶识别序列。在一些实施例中,所述靶核酸进一步包括邻近所述靶核酸位点的与所述cas效应子复合物相容的pam序列。在一些实施例中,所述pam序列位于所述靶核酸位点的3'。在一些实施例中,所述重组酶或转座酶复合物是tn7型转座酶复合物。在一些实施例中,所述工程化向导多核苷酸被配置成与所述2类ii型cas效应子结合。在一些实施例中,所述2类ii型cas效应子包括包含与seq id no:1或其变体具有至少约80%同一性的序列的多肽。在一些实施例中,所述重组酶或转座酶复合物包括至少一个、至少两个、至少三个或四个包括与seqid no:2-5中的任一者或其变体具有至少80%同一性的序列的多肽。在一些实施例中,所述工程化向导多核苷酸包括包含与seq id no:12或其变体具有至少80%同一性的至少60-80个连续核苷酸的序列。在一些实施例中,所述工程化向导多核苷酸包括与seq id no:11或其变体具有至少80%同一性的序列。在一些实施例中,所述左侧重组酶序列包括与seq idno:17-18中的任一者或其变体具有至少80%同一性的序列。在一些实施例中,所述右侧重组酶序列包括与seq id no:19或其变体具有至少80%同一性的序列。在一些实施例中,所述2类ii型cas效应子和所述tn7型转座酶复合物由包括少于约10千碱基的多核苷酸序列编码。

6、在一些方面,本公开提供了一种用于将货物核苷酸序列转座到靶核酸位点中的方法,所述方法包括使包括所述货物核苷酸序列的第一双链核酸与以下接触:cas效应子复合物,所述cas效应子复合物包括2类v型cas效应子和至少一个工程化向导多核苷酸,所述至少一个工程化向导多核苷酸被配置成与所述靶核苷酸序列杂交;tn7型转座酶复合物,所述tn7型转座酶复合物被配置成与所述cas效应子复合物结合,其中所述tn7型转座酶复合物包括tnsa亚基;以及第二双链核酸,所述第二双链核酸包括所述靶核酸位点。在一些实施例中,所述转座酶复合物与所述cas效应子复合物非共价地结合。在一些实施例中,所述转座酶复合物与所述cas效应子复合物共价地连接。在一些实施例中,所述转座酶复合物在单个多肽中与所述cas效应子复合物融合。在一些实施例中,所述货物核苷酸序列侧接有左侧转座酶识别序列和右侧转座酶识别序列。在一些实施例中,所述靶核酸位点进一步包括邻近所述靶核酸位点的与所述cas效应子复合物相容的pam序列。在一些实施例中,所述pam序列位于所述靶核酸位点的3'。在一些实施例中,所述工程化向导多核苷酸被配置成与所述2类v型cas效应子结合。在一些实施例中,所述tnsa亚基包括具有与seq id no:7或其变体具有至少80%同一性的序列的多肽。在一些实施例中,所述tn7型转座酶复合物包括至少一个、至少两个或三个包括与seq id no:8-10中的任一者或其变体具有至少约80%同一性的序列的多肽。在一些实施例中,所述工程化向导多核苷酸包括包含与seq id no:13-16中的任一者或其变体具有至少80%同一性的至少约46-80个连续核苷酸的序列。在一些实施例中,所述左侧重组酶序列包括与seq id no:20或其变体具有至少约80%同一性的序列。在一些实施例中,所述右侧重组酶序列包括与seq id no:21或其变体具有至少约80%同一性的序列。在一些实施例中,所述2类v型cas效应子不是cas12k效应子。在一些实施例中,所述2类v型cas效应子和所述tn7型转座酶复合物由包括少于约10千碱基的多核苷酸序列编码。

7、在一些方面,本公开提供了一种用于将货物核苷酸序列转座到靶核酸位点中的系统,所述系统包括:第一双链核酸,所述第一双链核酸包括被配置成与tn7型转座酶复合物相互作用的货物核苷酸序列;cas效应子复合物,所述cas效应子复合物包括1类i-f型cas效应子和工程化向导多核苷酸,所述工程化向导多核苷酸被配置成与所述靶核苷酸序列杂交;以及tn7型转座酶复合物,所述tn7型转座酶复合物被配置成与所述cas效应子复合物结合,其中所述tn7型转座酶复合物包括tnsa亚基。在一些实施例中,所述转座酶复合物与所述cas效应子复合物非共价地结合。在一些实施例中,所述转座酶复合物与所述cas效应子复合物共价地连接。在一些实施例中,所述转座酶复合物在单个多肽中与所述cas效应子复合物融合。在一些实施例中,所述货物核苷酸序列侧接有左侧转座酶识别序列和右侧转座酶识别序列。在一些实施例中,所述系统进一步包括包含所述靶核酸位点的第二双链核酸。在一些实施例中,所述系统进一步包括邻近所述靶核酸位点的与所述cas效应子复合物相容的pam序列。在一些实施例中,所述pam序列位于所述靶核酸位点的3'。在一些实施例中,所述pam序列位于所述靶核酸位点的5'。在一些实施例中,所述工程化向导多核苷酸被配置成与所述1类i-f型cas效应子结合。在一些实施例中,所述1类i-f型cas效应子包括包含与seq id no:41-43和48-50中的任一者或其变体具有至少80%同一性的序列的多肽。在一些实施例中,所述tn7型转座酶复合物包括至少一个、至少两个或三个包括与seq id no:44-46和51-53中的任一者或其变体具有至少80%同一性的序列的多肽。

8、在一些方面,本公开提供了一种用于将货物核苷酸序列转座到包括靶核苷酸序列的靶核酸位点中的方法,所述方法包括在细胞内表达本文所描述的方面或实施例中的任一种的系统或将本文所描述的方面或实施例中的任一种的系统引入到细胞中。

9、在一些方面,本公开提供了一种用于将货物核苷酸序列转座到靶核酸位点中的系统,所述系统包括:第一双链核酸,所述第一双链核酸包括被配置成与tn7型转座酶复合物相互作用的货物核苷酸序列;cas效应子复合物,所述cas效应子复合物包括2类v型cas效应子和工程化向导多核苷酸,所述工程化向导多核苷酸被配置成与所述靶核苷酸序列杂交;以及tn7型转座酶复合物,所述tn7型转座酶复合物被配置成与所述cas效应子复合物结合,其中所述tn7型转座酶复合物包括tnsb、tnsc和tniq组分,其中:(a)所述2类v型cas效应子包括具有与seq id no:22、26、30、34、55-89、104、147、264-304和660-689中的任一者或其变体具有至少80%序列同一性的序列的多肽;或者(b)所述tn7型转座酶复合物包括与seqid no:23-25、27-29、31-33、35-37、101-103、105-107、148-150、305-343和345-347中的任一者或其变体具有至少80%序列同一性的序列的tnsb、tnsc或tniq组分。在一些实施例中,所述转座酶复合物与所述cas效应子复合物非共价地结合。在一些实施例中,所述转座酶复合物与所述cas效应子复合物共价地连接。在一些实施例中,所述转座酶复合物在单个多肽中与所述cas效应子复合物融合。在一些实施例中,所述2类v型cas效应子包括包含与seqid no:22、26、30、34、55-89、104、147、264-304和660-689中的任一者或其变体具有至少80%序列同一性的序列的多肽。在一些实施例中,所述tn7型转座酶复合物包括包含与seqid no:23-25、27-29、31-33、35-37、101-103、105-107、148-150、305-343和345-347中的任一者或其变体具有至少80%序列同一性的序列的tnsb、tnsc或tniq组分。在一些实施例中,所述2类v型cas效应子是cas12k效应子。在一些实施例中,所述货物核苷酸序列侧接有左侧转座酶识别序列和右侧转座酶识别序列。在一些实施例中,所述系统进一步包括包含所述靶核酸位点的第二双链核酸。在一些实施例中,所述系统进一步包括邻近所述靶核酸位点的与所述cas效应子复合物相容的pam序列。在一些实施例中,所述pam序列位于所述靶核酸位点的5'。在一些实施例中,所述pam序列包括5'-ngtn-3'或5'-ngtt-3'。在一些实施例中,所述工程化向导多核苷酸被配置成与所述2类v型cas效应子结合。在一些实施例中,所述tnsb、tnsc和tniq组分包括具有分别与seq id no:23-25、27-29、31-33、35-37、101-103、105-107、148-150、305-343或345-347中的任一者具有至少80%同一性的序列的多肽。在一些实施例中,所述工程化向导多核苷酸包括包含与seq id no:90、91、92、93、117、151、156-181或209-234中的任一者具有至少80%同一性的至少约46-80个连续核苷酸的序列。在一些实施例中,所述工程化向导多核苷酸包括与seq id no:111-114、201-206、255、262、256、209、257、263、258、210、348或350-353中的任一者或其变体具有至少80%序列同一性的序列。在一些实施例中,所述左侧重组酶序列包括与seq id no:123、125、127、129、131、133、153、354-358、461、463、465和467中的任一者或其变体具有至少80%同一性的序列。在一些实施例中,所述右侧重组酶序列包括与seq id no:124、126、128、130、132、154、155、359-363、462、464、466和468中的任一者或其变体具有至少80%同一性的序列。在一些实施例中,所述2类v型cas效应子和所述tn7型转座酶复合物由包括少于约10千碱基的多核苷酸序列编码。在一些实施例中:(a)所述2类v型cas效应子包括与seq id no:22或其变体具有至少80%序列同一性的序列;(b)所述左侧重组酶序列包括与seq id no:125或其变体具有至少80%序列同一性的序列;(c)所述右侧重组酶序列包括与seq id no:126或155或其变体具有至少80%同一性的序列;(d)所述工程化向导多核苷酸:(i)包括与seq id no:90的至少约46-60个核苷酸具有至少80%序列同一性的序列;或者(ii)包括与seq id no:94、112或202中的任一者的非简并核苷酸具有至少80%序列同一性的序列;或(e)所述tnsb、tnsc和tniq组分包括与seq id no:23-25中的任一者或其变体具有至少80%序列同一性的序列。在一些实施例中:(a)所述2类v型cas效应子包括与seq id no:26或其变体具有至少80%序列同一性的序列;(b)所述左侧重组酶序列包括与seq id no:127或其变体具有至少80%序列同一性的序列;(c)所述右侧重组酶序列包括与seq id no:128或其变体具有至少880%同一性的序列;(d)所述工程化向导多核苷酸:(i)包括与seq id no:91、156或209中的任一者的至少约46-60个核苷酸具有至少80%序列同一性的序列;或者(ii)包括与seqid no:95、113或203中的任一者的非简并核苷酸具有至少80%序列同一性的序列;或(e)所述tnsb、tnsc和tniq组分包括与seq id no:27-29中的任一者或其变体具有至少80%序列同一性的序列。在一些实施例中:(a)所述2类v型cas效应子包括与seq id no:60或其变体具有至少80%序列同一性的序列;(b)所述左侧重组酶序列包括与seq id no:131或其变体具有至少80%序列同一性的序列;(c)所述右侧重组酶序列包括与seq id no:132或其变体具有至少80%同一性的序列;(d)所述工程化向导多核苷酸:(i)包括与seq id no:117、161或214中的任一者的至少约46-60个核苷酸具有至少80%序列同一性的序列;或者(ii)包括与seq id no:119的非简并核苷酸具有至少80%序列同一性的序列;或(e)所述tnsb、tnsc和tniq组分包括与seq id no:101-103中的任一者或其变体具有至少80%序列同一性的序列。在一些实施例中:(a)所述2类v型cas效应子包括与seq id no:147或其变体具有至少80%序列同一性的序列;(b)所述左侧重组酶序列包括与seq id no:153或其变体具有至少80%序列同一性的序列;(c)所述右侧重组酶序列包括与seq id no:154或其变体具有至少880%同一性的序列;(d)所述工程化向导多核苷酸:(i)包括与seq id no:151、181或234中的任一者的至少约46-60个核苷酸具有至少80%序列同一性的序列;或者(ii)包括与seqid no:152或254的非简并核苷酸具有至少80%序列同一性的序列;或(e)所述tnsb、tnsc和tniq组分包括与seq id no:148-150中的任一者或其变体具有至少80%序列同一性的序列。在一些实施例中:(a)所述2类v型cas效应子包括与seq id no:34或其变体具有至少80%序列同一性的序列;(b)所述左侧重组酶序列包括与seq id no:129或其变体具有至少80%序列同一性的序列;(c)所述右侧重组酶序列包括与seq id no:130或其变体具有至少880%同一性的序列;(d)所述工程化向导多核苷酸:(i)包括与seq id no:93、157或210中的任一者的至少约46-60个核苷酸具有至少80%序列同一性的序列;或者(ii)包括与seqid no:97、114或204中的任一者的非简并核苷酸具有至少80%序列同一性的序列;或(e)所述tnsb、tnsc和tniq组分包括与seq id no:148-150中的任一者或其变体具有至少80%序列同一性的序列。在一些实施例中:(a)所述2类v型cas效应子包括与seq id no:30或其变体具有至少80%序列同一性的序列;(b)所述左侧重组酶序列包括与seq id no:123或其变体具有至少80%序列同一性的序列;(c)所述右侧重组酶序列包括与seq id no:124或其变体具有至少80%同一性的序列;(d)所述工程化向导多核苷酸:(i)包括与seq id no:92的至少约46-80个核苷酸具有至少80%序列同一性的序列;或者(ii)包括与seq id no:111或201的非简并核苷酸具有至少80%同一性的序列;或(e)所述tnsb、tnsc和tniq组分包括与seq id no:31、32和33中的任一者或其变体具有至少80%同一性的序列;(f)所述pam序列包括5'-ngtn-3'或5'-ngtt-3'。

10、在一些方面,本公开提供了一种用于将货物核苷酸序列转座到靶核酸位点中的系统,所述系统包括:第一双链核酸,所述第一双链核酸包括被配置成与tn7型转座酶复合物相互作用的货物核苷酸序列;cas效应子复合物,所述cas效应子复合物包括2类v型cas效应子和工程化向导多核苷酸,所述工程化向导多核苷酸被配置成与所述靶核苷酸序列杂交;以及tn7型转座酶复合物,所述tn7型转座酶复合物被配置成与所述cas效应子复合物结合,其中所述tn7型转座酶复合物包括tnsb和tnsc组分但不包括tnsa和/或tniq组分。在一些实施例中,所述转座酶复合物与所述cas效应子复合物非共价地结合。在一些实施例中,所述转座酶复合物与所述cas效应子复合物共价地连接。在一些实施例中,所述转座酶复合物在单个多肽中与所述cas效应子复合物融合。在一些实施例中,所述tn7型转座酶复合物包括具有与seq id no:39-40、109-110和344中的任一者具有至少80%序列同一性的测序的多肽。在一些实施例中,所述tnsb组分包括包含与seq id no:40或109具有至少80%序列同一性的序列的多肽。在一些实施例中,所述tnsc组分包括包含与seq id no:39或110具有至少80%序列同一性的序列的多肽。在一些实施例中,所述2类v型cas效应子是cas12k效应子。在一些实施例中,所述2类v型cas效应子包括与seq id no:38或seq id no:108具有至少80%序列同一性的序列。在一些实施例中,所述货物核苷酸序列侧接有左侧转座酶识别序列和右侧转座酶识别序列。在一些实施例中,所述系统进一步包括包含所述靶核酸位点的第二双链核酸。在一些实施例中,包括所述靶核酸位点的所述双链核酸或所述系统位于细胞内。在一些实施例中,所述系统进一步包括邻近所述靶核酸位点的与所述cas效应子复合物相容的pam序列。在一些实施例中,所述pam序列位于所述靶核酸位点的5'。在一些实施例中,所述工程化向导多核苷酸被配置成与所述2类v型cas效应子结合。在一些实施例中,所述tnsb和tnsc组分包括具有分别与seq id no:40和39或109和110具有至少80%同一性的序列。在一些实施例中,所述工程化向导多核苷酸包括包含与seq id no:118、182、183、235和236中的任一者或其变体具有至少80%同一性的至少约46-80个连续核苷酸的序列。在一些实施例中,所述工程化向导多核苷酸包括与seq id no:115、116、205、206、261、235、260或236中的任一者或其变体的非简并核苷酸具有至少80%同一性的序列。在一些实施例中,所述左侧重组酶序列包括与seq id no:134具有至少80%同一性的序列。在一些实施例中,所述右侧重组酶序列包括与seq id no:135或其变体具有至少约80%同一性的序列。在一些实施例中,所述2类v型cas效应子和所述tn7型转座酶复合物由包括少于约10千碱基的多核苷酸序列编码。在一些实施例中,(a)所述2类v型cas效应子包括与seq id no:38或其变体具有至少80%序列同一性的序列;(b)所述左侧重组酶序列包括与seq id no:134或其变体具有至少80%序列同一性的序列;(c)所述右侧重组酶序列包括与seq id no:135或其变体具有至少80%同一性的序列;(d)所述工程化向导多核苷酸:(i)包括与seq id no:182或235的至少约46-80个核苷酸具有至少80%序列同一性的序列;或者(ii)包括与seq id no:98、115-116或205-206和493的非简并核苷酸具有至少80%同一性的序列;或(e)所述tnsb和tnsc组分包括与seq id no:40和39中的任一者或其变体具有至少80%同一性的序列的多肽。

11、在一些方面,本公开提供了一种工程化核酸酶系统,所述工程化核酸酶系统包括:核酸内切酶,所述核酸内切酶包括ruvc结构域和hnh结构域,其中所述核酸内切酶源自未培养的微生物,其中所述核酸内切酶是2类ii型核酸内切酶,所述2类ii型核酸内切酶包括与seq id no:1或其变体具有至少80%同一性的序列;(b)工程化向导多核苷酸,其中所述工程化向导多核苷酸被配置成与所述核酸内切酶形成复合物,并且所述工程化向导多核苷酸包括被配置成与靶核酸序列杂交的间隔子序列。在一些实施例中,所述工程化向导多核苷酸包括与seq id no:12或其变体具有至少80%同一性的至少60-80个连续核苷酸。在一些实施例中,所述工程化向导多核苷酸包括与seq id no:11或其变体具有至少80%同一性的序列。

12、在一些方面,本公开提供了一种工程化核酸酶系统,所述工程化核酸酶系统包括:包括ruvc结构域的核酸内切酶,其中所述核酸内切酶源自未培养的微生物,并且其中所述核酸内切酶是与seq id no:5具有至少80%同一性的2类v型核酸内切酶;工程化向导多核苷酸,其中所述工程化向导多核苷酸被配置成与所述核酸内切酶形成复合物,并且所述工程化向导rna包括被配置成与靶核酸序列杂交的间隔子序列。在一些实施例中,所述工程化向导多核苷酸包括包含与seq id no:13-16中的任一者或其变体具有至少80%同一性的至少约46-80个连续核苷酸的序列。

13、在一些方面,本公开提供了一种工程化核酸酶系统,所述工程化核酸酶系统包括:核酸内切酶,所述核酸内切酶包括ruvc结构域,其中所述核酸内切酶源自未培养的微生物,并且其中所述核酸内切酶是与seq id no:22、26、30、34、55-89、104、147、264-304和660-689中的任一者或其变体具有至少80%同一性的2类v型核酸内切酶;以及工程化向导多核苷酸,其中所述工程化向导多核苷酸被配置成与所述核酸内切酶形成复合物,并且所述工程化向导rna包括被配置成与靶核酸序列杂交的间隔子序列。在一些实施例中,所述工程化向导多核苷酸包括包含与seq id no:90-93、117、151、156-181、209-234、417-460和715-739中的任一者或其变体具有至少80%同一性的至少约46-80个连续核苷酸的序列。在一些实施例中,所述工程化向导多核苷酸包括与seq id no:111-114、201-206、255、262、256、209、257、263、258、210、348或350-353中的任一者或其变体的非简并核苷酸具有至少80%序列同一性的序列。

14、在一些方面,本公开提供了一种工程化核酸酶系统,所述工程化核酸酶系统包括:包括ruvc结构域的核酸内切酶,其中所述核酸内切酶源自未培养的微生物,并且其中所述核酸内切酶是与seq id no:38或seq id no:108或其变体具有至少80%同一性的2类v-k型核酸内切酶;以及工程化向导多核苷酸,其中所述工程化向导多核苷酸被配置成与所述核酸内切酶形成复合物,并且所述工程化向导rna包括被配置成与靶核酸序列杂交的间隔子序列。在一些实施例中,所述工程化向导多核苷酸包括包含与seq id no:118、182、183、235和236中的任一者或其变体具有至少80%同一性的至少约46-80个连续核苷酸的序列。在一些实施例中,所述工程化向导多核苷酸包括与seq id no:111-114、201-206、255、262、256、209、257、263、258、210、115、116、205、206、261、235、260、236、348或350-353中的任一者或其变体的非简并核苷酸具有至少80%同一性的序列。

15、在一些方面,本公开提供了一种工程化核酸酶系统,所述工程化核酸酶系统包括:i类i-f型cas核酸内切酶,所述i类i-f型cas核酸内切酶包括至少一种包括与seq id no:41-43和48-50中的任一者或其变体具有至少80%同一性的序列的cas6、cas7或cas8多肽;以及工程化向导rna,其中所述工程化向导rna被配置成与所述核酸内切酶形成复合物,并且所述工程化向导rna包括被配置成与靶核酸序列杂交的间隔子序列。在一些实施例中,所述工程化向导多核苷酸包括与seq id no:121、122、207和208中的任一者的非简并核苷酸具有至少80%同一性的序列。

16、在一些方面,本公开提供了一种用于将货物核苷酸序列转座到靶核酸中的靶核酸位点中的系统,所述系统包括:cas效应子复合物,所述cas效应子复合物包括2类ii型cas效应子、小原核核糖体蛋白亚基s15和被配置成与靶核酸位点杂交的工程化向导多核苷酸;重组酶或转座酶复合物,所述重组酶或转座酶复合物被配置成与所述cas效应子复合物结合;以及双链核酸,所述双链核酸被配置成与所述重组酶或转座酶复合物相互作用并包括货物核苷酸序列。

17、在一些实施例中,cas效应子复合物与重组酶或转座酶复合物非共价地结合。在一些实施例中,cas效应子复合物与重组酶或转座酶复合物共价地连接。在一些实施例中,cas效应子复合物与重组酶或转座酶复合物融合。在一些实施例中,货物核苷酸序列侧接有由重组酶或转座酶复合物识别的左侧转座酶识别序列和右侧转座酶识别序列。在一些实施例中,左侧重组酶序列包括与seq id no:17-18中的任一者具有至少80%同一性的序列。在一些实施例中,右侧重组酶序列包括与seq id no:19具有至少80%同一性的序列。

18、在一些实施例中,靶核酸包括与cas效应子复合物相容的pam序列。在一些实施例中,pam序列位于距靶核酸位点约50个至约70个碱基对处。在一些实施例中,pam序列位于靶核酸位点的3'。在一些实施例中,pam序列位于靶核酸位点的5'。

19、在一些实施例中,2类ii型cas效应子不是cas12k效应子。在一些实施例中,2类ii型cas效应子包括包含与seq id no:1具有至少80%同一性的序列的多肽。在一些实施例中,2类ii型cas效应子包括包含与seq id no:1具有至少90%同一性的序列的多肽。在一些实施例中,2类ii型cas效应子包括包含seq id no:1的序列的多肽。在一些实施例中,重组酶或转座酶复合物包括至少一种包括与seq id no:2-5中的任一者具有至少80%同一性的序列的多肽。在一些实施例中,重组酶或转座酶复合物包括至少一种包括与seq id no:2-5中的任一者具有至少90%同一性的序列的多肽。在一些实施例中,重组酶或转座酶复合物包括至少一种包括seq id no:2-5中的任一者的序列的多肽。

20、在一些实施例下,工程化向导多核苷酸包括包含与seq id no:12具有至少80%同一性的至少约46-80个连续核苷酸的序列。在一些实施例下,工程化向导多核苷酸包括与seq id no:11具有至少80%序列同一性的序列。

21、在一些实施例中,小原核核糖体蛋白亚基s15包括与seq id no:494-659中的任一者中的任一者具有至少80%序列同一性的序列。在一些实施例中,2类ii型cas效应子和重组酶或转座酶复合物由包括少于约10千碱基的多核苷酸序列编码。

22、在一些方面,本公开提供了一种用于将货物核苷酸序列转座到靶核酸中的靶核酸位点中的系统,所述系统包括:cas效应子复合物,所述cas效应子复合物包括2类v型cas效应子、小原核核糖体蛋白亚基s15和被配置成与靶核酸位点杂交的工程化向导多核苷酸;tn7型转座酶复合物,所述tn7型转座酶复合物被配置成与所述cas效应子复合物结合并包括tnsa、tnsb、tnsc和tniq组分;以及双链核酸,所述双链核酸被配置成与tn7型转座酶复合物相互作用并包括货物核苷酸序列。

23、在一些实施例中,cas效应子复合物与tn7型转座酶复合物非共价地结合。在一些实施例中,cas效应子复合物与tn7型转座酶复合物共价地连接。在一些实施例中,cas效应子复合物与tn7型转座酶复合物融合。在一些实施例中,货物核苷酸序列侧接有由重组酶或转座酶复合物识别的左侧转座酶识别序列和右侧转座酶识别序列。在一些实施例中,左侧重组酶序列包括与seq id no:20中的任一者具有至少80%同一性的序列。在一些实施例中,右侧重组酶序列包括与seq id no:21具有至少80%同一性的序列。

24、在一些实施例中,靶核酸包括与cas效应子复合物相容的pam序列。在一些实施例中,pam序列位于距靶核酸位点约50个至约70个碱基对处。在一些实施例中,pam序列位于靶核酸位点的3'。在一些实施例中,pam序列位于靶核酸位点的5'。

25、在一些实施例中,2类v型cas效应子不是cas12k效应子。在一些实施例中,tnsa组分包括包含与seq id no:7具有至少80%同一性的序列的多肽。在一些实施例中,tn7型转座酶复合物包括至少一种包括与seq id no:8-10中的任一者具有至少80%同一性的序列的多肽。

26、在一些实施例中,工程化向导多核苷酸包括包含与seq id no:13-16中的任一者具有至少80%同一性的至少约46-80个连续核苷酸的序列。在一些实施例中,小原核核糖体蛋白亚基s15包括与seq id no:494-659中的任一者中的任一者具有至少80%序列同一性的序列。

27、在一些实施例中,2类ii型cas效应子和重组酶或转座酶复合物由包括少于约10千碱基的多核苷酸序列编码。

28、在一些方面,本公开提供了一种用于将货物核苷酸序列转座到靶核酸中的靶核酸位点中的系统,所述系统包括:cas效应子复合物,所述cas效应子复合物包括1类i-f型cas效应子、小原核核糖体蛋白亚基s15和被配置成与靶核酸位点杂交的工程化向导多核苷酸;tn7型转座酶复合物,所述tn7型转座酶复合物被配置成与所述cas效应子复合物结合并包括tnsa、tnsb、tnsc和tniq组分;以及双链核酸,所述双链核酸被配置成与tn7型转座酶复合物相互作用并包括货物核苷酸序列。

29、在一些实施例中,cas效应子复合物与tn7型转座酶复合物非共价地结合。在一些实施例中,cas效应子复合物与tn7型转座酶复合物共价地连接。在一些实施例中,cas效应子复合物与tn7型转座酶复合物融合。在一些实施例中,货物核苷酸序列侧接有由重组酶或转座酶复合物识别的左侧转座酶识别序列和右侧转座酶识别序列。在一些实施例中,左侧重组酶序列包括与seq id no:136和138中的任一者具有至少80%同一性的序列。在一些实施例中,右侧重组酶序列包括与seq id no:137和139具有至少80%同一性的序列。

30、在一些实施例中,靶核酸包括与cas效应子复合物相容的pam序列。在一些实施例中,pam序列位于距靶核酸位点约50个至约70个碱基对处。在一些实施例中,pam序列位于靶核酸位点的3'。在一些实施例中,pam序列位于靶核酸位点的5'。

31、在一些实施例中,1类i-f型cas效应子包括包含与seq id no:41-43和48-50中的任一者具有至少80%同一性的序列的多肽。在一些实施例中,1类i-f型cas效应子包括包含与seq id no:41-43和48-50中的任一者具有至少90%同一性的序列的多肽。在一些实施例中,1类i-f型cas效应子包括包含seq id no:41-43和48-50中的任一者的序列的多肽。在一些实施例中,tn7型转座酶复合物包括至少一种包括与seq id no:44-47和51-54中的任一者具有至少80%同一性的序列的多肽。在一些实施例中,tn7型转座酶复合物包括至少一种包括与seq id no:44-47和51-54中的任一者具有至少90%同一性的序列的多肽。在一些实施例中,tn7型转座酶复合物包括至少一种包括seq id no:44-47和51-54中的任一者的序列的多肽。在一些实施例中,小原核核糖体蛋白亚基s15包括与seq id no:494-659中的任一者中的任一者具有至少80%序列同一性的序列。在一些实施例中,2类ii型cas效应子和重组酶或转座酶复合物由包括少于约10千碱基的多核苷酸序列编码。

32、在一些方面,本公开提供了一种用于将货物核苷酸序列转座到靶核酸中的靶核酸位点中的系统,所述系统包括:cas效应子复合物,所述cas效应子复合物被配置成与靶核酸位点杂交并包括:i)2类v型cas效应子,所述2类v型cas效应子包括具有与seq id no:22、26、30、34、55-89、104、147、264-304和660-689中的任一者具有至少80%序列同一性的序列的多肽;以及ii)工程化向导多核苷酸,所述工程化向导多核苷酸包括与seq id no:90-93、111-114、117、151、156-181、201-204、209-234、255-258、262、263、348、350-353、417-460、491-492和715-739中的任一者具有至少80%序列同一性的序列;tn7型转座酶复合物,所述tn7型转座酶复合物被配置成与cas效应子复合物结合并包括tnsb、tnsc和tniq组分,所述tnsb、tnsc或tniq组分包括与seq id no:23-25、27-29、31-33、35-37、101-103、105-107、148-150、305-343和345-347中的任一者具有至少80%同一性的序列;以及双链核酸,所述双链核酸被配置成与tn7型转座酶复合物相互作用并且以5'至3'的顺序包括:i)左侧重组酶序列,所述左侧重组酶序列包括与seq id no:123、125、127、129、131、133、153、354-358、461、463、465和467中的任一者具有至少80%序列同一性的序列;ii)货物核苷酸序列;以及iii)右侧重组酶序列,所述右侧重组酶序列包括与seq id no:124、126、128、130、132、154、155、359-363、462、464、466和468中的任一者具有至少80%同一性的序列。

33、在一些方面,本公开提供了一种用于将货物核苷酸序列转座到靶核酸位点中的系统,所述系统包括:cas效应子复合物,所述cas效应子复合物被配置成与靶核酸位点杂交并包括:i)2类v型cas效应子,所述2类v型cas效应子包括具有与seq id no:22具有至少80%序列同一性的序列的多肽;以及ii)工程化向导多核苷酸,所述工程化向导多核苷酸包括与seq id no:90、112和202中的任一者具有至少80%序列同一性的序列;tn7型转座酶复合物,所述tn7型转座酶复合物被配置成与cas效应子复合物结合并包括tnsb、tnsc和tniq组分,所述tnsb、tnsc或tniq组分包括与seq id no:23-25中的任一者具有至少80%同一性的序列;以及双链核酸,所述双链核酸被配置成与tn7型转座酶复合物相互作用并且以5'至3'顺序包括:i)左侧重组酶序列,所述左侧重组酶序列包括与seq id no:125具有至少80%同一性的序列;ii)货物核苷酸序列;以及iii)右侧重组酶序列,所述右侧重组酶序列包括与seq id no:126和155中的任一者具有至少80%同一性的序列。

34、在一些方面,本公开提供了一种用于将货物核苷酸序列转座到靶核酸的靶核酸位点中的系统,所述系统包括:cas效应子复合物,所述cas效应子复合物被配置成与靶核酸位点杂交并包括:i)2类v型cas效应子,所述2类v型cas效应子包括具有与seq id no:26具有至少80%序列同一性的序列的多肽;以及ii)工程化向导多核苷酸,所述工程化向导多核苷酸包括与seq id no:91、113、156、203和209中的任一者具有至少80%序列同一性的序列;tn7型转座酶复合物,所述tn7型转座酶复合物被配置成与cas效应子复合物结合并包括tnsb、tnsc和tniq组分,所述tnsb、tnsc或tniq组分包括与seq id no:27-29中的任一者具有至少80%同一性的序列;以及双链核酸,所述双链核酸被配置成与tn7型转座酶复合物相互作用并且以5'至3'顺序包括:i)左侧重组酶序列,所述左侧重组酶序列包括与seq idno:127具有至少80%序列同一性的序列;ii)货物核苷酸序列;以及iii)右侧重组酶序列,所述右侧重组酶序列包括与seq id no:128具有至少80%同一性的序列。

35、在一些方面,本公开提供了一种用于将货物核苷酸序列转座到靶核酸的靶核酸位点中的系统,所述系统包括:cas效应子复合物,所述cas效应子复合物被配置成与靶核酸位点杂交并包括:i)2类v型cas效应子,所述2类v型cas效应子包括具有与seq id no:60具有至少80%序列同一性的序列的多肽;以及ii)工程化向导多核苷酸,所述工程化向导多核苷酸包括与seq id no:117、119、161和214中的任一者具有至少80%序列同一性的序列;tn7型转座酶复合物,所述tn7型转座酶复合物被配置成与cas效应子复合物结合并包括tnsb、tnsc和tniq组分,所述tnsb、tnsc或tniq组分包括与seq id no:101-103中的任一者具有至少80%同一性的序列;以及双链核酸,所述双链核酸被配置成与tn7型转座酶复合物相互作用并且以5'至3'顺序包括:i)左侧重组酶序列,所述左侧重组酶序列包括与seq id no:131具有至少80%序列同一性的序列;ii)货物核苷酸序列;以及iii)右侧重组酶序列,所述右侧重组酶序列包括与seq id no:132具有至少80%同一性的序列。

36、在一些方面,本公开提供了一种用于将货物核苷酸序列转座到靶核酸的靶核酸位点中的系统,所述系统包括:cas效应子复合物,所述cas效应子复合物被配置成与靶核酸位点杂交并包括:i)2类v型cas效应子,所述2类v型cas效应子包括具有与seq id no:147具有至少80%序列同一性的序列的多肽;以及ii)工程化向导多核苷酸,所述工程化向导多核苷酸包括与seq id no:151、181和234中的任一者具有至少80%序列同一性的序列;tn7型转座酶复合物,所述tn7型转座酶复合物被配置成与cas效应子复合物结合并包括tnsb、tnsc和tniq组分,所述tnsb、tnsc或tniq组分包括与seq id no:148-150中的任一者具有至少80%同一性的序列;以及双链核酸,所述双链核酸被配置成与tn7型转座酶复合物相互作用并且以5'至3'顺序包括:i)左侧重组酶序列,所述左侧重组酶序列包括与seq id no:153具有至少80%序列同一性的序列;ii)货物核苷酸序列;以及iii)右侧重组酶序列,所述右侧重组酶序列包括与seq id no:154具有至少80%同一性的序列。

37、在一些方面,本公开提供了一种用于将货物核苷酸序列转座到靶核酸位点中的系统,所述系统包括:cas效应子复合物,所述cas效应子复合物被配置成与靶核酸中的靶核酸位点杂交并包括:i)2类v型cas效应子,所述2类v型cas效应子包括具有与seq id no:34具有至少80%序列同一性的序列的多肽;以及ii)工程化向导多核苷酸,所述工程化向导多核苷酸包括与seq id no:93、114、157、204和210中的任一者具有至少80%序列同一性的序列;tn7型转座酶复合物,所述tn7型转座酶复合物被配置成与cas效应子复合物结合并包括tnsb、tnsc和tniq组分,所述tnsb、tnsc或tniq组分包括与seq id no:148-150中的任一者具有至少80%同一性的序列;以及双链核酸,所述双链核酸被配置成与tn7型转座酶复合物相互作用并且以5'至3'顺序包括:i)左侧重组酶序列,所述左侧重组酶序列包括与seq idno:129具有至少80%序列同一性的序列;ii)货物核苷酸序列;以及iii)右侧重组酶序列,所述右侧重组酶序列包括与seq id no:130具有至少80%同一性的序列。

38、在一些方面,本公开提供了一种用于将货物核苷酸序列转座到靶核酸的靶核酸位点中的系统,所述系统包括:cas效应子复合物,所述cas效应子复合物被配置成与靶核酸位点杂交并包括:i)2类v型cas效应子,所述2类v型cas效应子包括具有与seq id no:30具有至少80%序列同一性的序列的多肽;以及ii)工程化向导多核苷酸,所述工程化向导多核苷酸包括与seq id no:92、111和201中的任一者具有至少80%序列同一性的序列;tn7型转座酶复合物,所述tn7型转座酶复合物被配置成与cas效应子复合物结合并包括tnsb、tnsc和tniq组分,所述tnsb、tnsc或tniq组分包括与seq id no:31-33中的任一者具有至少80%同一性的序列;以及双链核酸,所述双链核酸被配置成与tn7型转座酶复合物相互作用并且以5'至3'顺序包括:i)左侧重组酶序列,所述左侧重组酶序列包括与seq id no:123具有至少80%序列同一性的序列;ii)货物核苷酸序列;以及iii)右侧重组酶序列,所述右侧重组酶序列包括与seq id no:124具有至少80%同一性的序列。

39、在一些方面,本公开提供了一种用于将货物核苷酸序列转座到靶核酸的靶核酸位点中的系统,所述系统包括:cas效应子复合物,所述cas效应子复合物被配置成与靶核酸位点杂交并包括:i)2类v型cas效应子,所述2类v型cas效应子包括具有与seq id no:38具有至少80%序列同一性的序列的多肽;以及ii)工程化向导多核苷酸,所述工程化向导多核苷酸包括与seq id no:98、115-116、182、205-206、235和493中的任一者具有至少80%序列同一性的序列;tn7型转座酶复合物,所述tn7型转座酶复合物被配置成与cas效应子复合物结合并包括tnsb、tnsc和tniq组分,所述tnsb、tnsc或tniq组分包括与seq id no:39和40中的任一者具有至少80%同一性的序列;以及双链核酸,所述双链核酸被配置成与tn7型转座酶复合物相互作用并且以5'至3'顺序包括:i)左侧重组酶序列,所述左侧重组酶序列包括与seq id no:134具有至少80%序列同一性的序列;ii)货物核苷酸序列;以及iii)右侧重组酶序列,所述右侧重组酶序列包括与seq id no:135具有至少80%同一性的序列。

40、在一些实施例中,2类v型cas效应子是cas12k效应子。在一些实施例中,靶核酸包括与cas效应子复合物相容的pam序列。在一些实施例中,pam序列位于靶核酸位点的5'。在一些实施例中,pam序列包括5'-ngtn-3'或5'-ngtt-3'。

41、在一些实施例中,cas效应子复合物进一步包括小原核核糖体蛋白亚基s15。在一些实施例中,小原核核糖体蛋白亚基s15包括与seq id no:494-659中的任一者具有至少80%序列同一性的序列。在一些实施例中,2类v型cas效应子和tn7型转座酶复合物由包括少于约10千碱基的多核苷酸序列编码。

42、在一些方面,本公开提供了一种用于将货物核苷酸序列转座到靶核酸中的靶核酸位点中的系统,所述系统包括:cas效应子复合物,所述cas效应子复合物包括2类v型cas效应子、小原核核糖体蛋白亚基s15和被配置成与靶核酸位点杂交的工程化向导多核苷酸;tn7型转座酶复合物,所述tn7型转座酶复合物被配置成与所述cas效应子复合物结合并包括tnsb和tnsc组分但不包括tnsa和/或tniq组分;以及双链核酸,所述双链核酸被配置成与tn7型转座酶复合物相互作用并包括货物核苷酸序列。

43、在一些实施例中,cas效应子复合物与tn7型转座酶复合物非共价地结合。在一些实施例中,cas效应子复合物与tn7型转座酶复合物共价地连接。在一些实施例中,cas效应子复合物与tn7型转座酶复合物融合。在一些实施例中,货物核苷酸序列侧接有由重组酶或转座酶复合物识别的左侧转座酶识别序列和右侧转座酶识别序列。在一些实施例中,左侧重组酶序列包括与seq id no:134中的任一者具有至少80%同一性的序列。在一些实施例中,右侧重组酶序列包括与seq id no:135具有至少80%同一性的序列。

44、在一些实施例中,靶核酸包括与cas效应子复合物相容的pam序列。在一些实施例中,pam序列位于距靶核酸位点约50个至约70个碱基对处。在一些实施例中,pam序列位于靶核酸位点的3'。在一些实施例中,pam序列位于靶核酸位点的5'。

45、在一些实施例中,2类v型cas效应子是cas12k效应子。在一些实施例中,2类v型cas效应子包括包含与seq id no:38和108中的任一者具有至少80%同一性的序列的多肽。在一些实施例,2类v型cas效应子包括包含与seq id no:38和108中的任一者具有至少90%同一性的序列的多肽。在一些实施例中,2类v型cas效应子包括包含seq id no:38和108中的任一者的序列的多肽。在一些实施例中,tnsb亚基包括包含与seq id no:40或109具有至少80%序列同一性的序列的多肽。在一些实施例中,tnsc亚基包括包含与seq id no:39或110具有至少80%序列同一性的序列的多肽。在一些实施例中,tn7型转座酶复合物包括至少一种包括与seq id no:39-40、109-110和344中的任一者具有至少80%同一性的序列的多肽。在一些实施例中,工程化向导多核苷酸包括与seq id no:115、116、205、206、261、235、260和236中的任一者具有至少80%同一性的序列。在一些实施例中,工程化向导多核苷酸包括包含与seq id no:118、182、183、235和236中的任一者具有至少80%同一性的至少约46-80个连续核苷酸的序列。

46、在一些实施例中,小原核核糖体蛋白亚基s15包括与seq id no:494-659中的任一者具有至少80%序列同一性的序列。在一些实施例中,2类ii型cas效应子和重组酶或转座酶复合物由包括少于约10千碱基的多核苷酸序列编码。

47、在一些方面,本公开提供了一种用于将货物核苷酸序列转座到靶核酸中的靶核酸位点中的系统,所述系统包括:cas效应子复合物,所述cas效应子复合物包括2类ii型cas效应子、小原核核糖体蛋白亚基s15和工程化向导多核苷酸,所述工程化向导多核苷酸能够与靶核酸杂交;重组酶或转座酶复合物,所述重组酶或转座酶复合物与所述cas效应子复合物可操作地连接;以及双链核酸,所述双链核酸以5'至3'顺序包括:i)左侧重组酶识别序列;ii)货物核苷酸序列;以及iii)右侧重组酶识别序列,所述左侧重组酶识别序列和所述右侧重组酶识别序列能够由所述重组酶或转座酶复合物识别。

48、在一些方面,本公开提供了一种用于将货物核苷酸序列转座到靶核酸中的靶核酸位点中的系统,所述系统包括:cas效应子复合物,所述cas效应子复合物包括2类v型cas效应子、小原核核糖体蛋白亚基s15和工程化向导多核苷酸,所述工程化向导多核苷酸能够与靶核酸杂交;tn7型转座酶复合物,所述tn7型转座酶复合物与所述cas效应子复合物可操作地连接并包括tnsa、tnsb、tnsc和tniq组分;以及双链核酸,所述双链核酸以5'至3'顺序包括:i)左侧重组酶识别序列;ii)货物核苷酸序列;以及iii)右侧重组酶识别序列,其中所述左侧重组酶识别序列和所述右侧重组酶识别序列能够由所述tn7型转座酶复合物识别。

49、在一些方面,本公开提供了一种用于将货物核苷酸序列转座到靶核酸中的靶核酸位点中的系统,所述系统包括:cas效应子复合物,所述cas效应子复合物包括1类i-f型cas效应子、小原核核糖体蛋白亚基s15和工程化向导多核苷酸,所述工程化向导多核苷酸能够与靶核酸杂交;tn7型转座酶复合物,所述tn7型转座酶复合物与所述cas效应子复合物可操作地连接并包括tnsa、tnsb、tnsc和tniq组分;以及双链核酸,所述双链核酸以5'至3'顺序包括:i)左侧重组酶识别序列;ii)货物核苷酸序列;以及iii)右侧重组酶识别序列,所述左侧重组酶识别序列和所述右侧重组酶识别序列能够由所述tn7型转座酶复合物识别。

50、在一些方面,本公开提供了一种工程化核酸酶系统,所述工程化核酸酶系统包括:核酸内切酶,所述核酸内切酶包括ruvc结构域和hnh结构域,其中所述核酸内切酶源自未培养的微生物,其中所述核酸内切酶是2类ii型核酸内切酶,所述2类ii型核酸内切酶包括与seq id no:1具有至少80%同一性的序列;以及工程化向导多核苷酸,其中所述工程化向导rna被配置成与所述核酸内切酶形成复合物,并且所述工程化向导rna包括被配置成与靶核酸序列杂交的间隔子序列。在一些实施例中,工程化向导多核苷酸包括与seq id no:12具有至少80%同一性的至少约60-80个连续核苷酸。在一些实施例下,工程化向导多核苷酸包括与seq id no:11具有至少80%同一性的序列。

51、在一些方面,本公开提供了一种工程化核酸酶系统,所述工程化核酸酶系统包括:包括ruvc结构域的核酸内切酶,其中所述核酸内切酶源自未培养的微生物,并且其中所述核酸内切酶是与seq id no:6具有至少80%同一性的2类v型核酸内切酶;以及工程化向导rna,其中所述工程化向导rna被配置成与所述核酸内切酶形成复合物,并且所述工程化向导rna包括被配置成与靶核酸序列杂交的间隔子序列。在一些实施例中,工程化向导多核苷酸包括包含与seq id no:13-16中的任一者具有至少80%同一性的至少约46-80个连续核苷酸的序列。

52、在一些方面,本公开提供了一种工程化核酸酶系统,所述工程化核酸酶系统包括:包括ruvc结构域的核酸内切酶,其中所述核酸内切酶源自未培养的微生物,并且其中所述核酸内切酶是与seq id no:22、26、30、34、55-89、104、147、264-304和660-689中的任一者具有至少80%同一性的2类v-k型核酸内切酶;以及工程化向导rna,其中所述工程化向导rna被配置成与所述核酸内切酶形成复合物,并且所述工程化向导rna包括间隔子序列,所述间隔子序列被配置成与靶核酸序列杂交。在一些实施例中,工程化向导多核苷酸包括包含与seq id no:90-93、117、151、156-181、209-234、417-460和715-739中的任一者具有至少80%同一性的至少约46-80个连续核苷酸的序列。在一些实施例中,工程化向导多核苷酸包括与seq id no:111-114、201-206、209、210、255-258、262、263、348、350-353和473-492中的任一者具有至少80%序列同一性的序列。

53、在一些方面,本公开提供了一种工程化核酸酶系统,所述工程化核酸酶系统包括:包括ruvc结构域的核酸内切酶,其中所述核酸内切酶源自未培养的微生物,并且其中所述核酸内切酶是与seq id no:38或seq id no:108具有至少80%同一性的2类v-k型核酸内切酶;以及工程化向导rna,其中所述工程化向导rna被配置成与所述核酸内切酶形成复合物,并且所述工程化向导rna包括被配置成与靶核酸序列杂交的间隔子序列。在一些实施例中,工程化向导多核苷酸包括包含与seq id no:118、182、183、235和236中的任一者具有至少80%同一性的至少约46-80个连续核苷酸的序列。在一些实施例中,工程化向导多核苷酸包括与seq id no:111-114、115、116、201-206、209、210、235、236、255-258、260-263、348和350-353中的任一者具有至少80%同一性的序列。

54、在一些方面,本公开提供了一种工程化核酸酶系统,所述工程化核酸酶系统包括:1类i-f型cas核酸内切酶,所述i类i-f型cas核酸内切酶包括至少一种包括与seq id no:41-43和48-50中的任一者具有至少80%同一性的序列的cas6、cas7或cas8多肽;以及工程化向导rna,其中所述工程化向导rna被配置成与所述核酸内切酶形成复合物,并且所述工程化向导rna包括间隔子序列,所述间隔子序列被配置成与靶核酸序列杂交。在一些实施例中,工程化向导多核苷酸包括与seq id no:121、122、207和208中的任一者具有至少80%同一性的序列。

55、在一些方面,本公开提供了一种用于将货物核苷酸序列转座到靶核酸位点中的方法,所述方法包括将本公开的系统引入到细胞。

56、在一些方面,本公开提供了一种细胞,其包括本公开的系统。在一些实施例中,细胞是真核细胞。在一些实施例中,细胞是哺乳动物细胞。在一些实施例中,细胞是永生化细胞。在一些实施例中,细胞是昆虫细胞。在一些实施例中,细胞是酵母细胞。在一些实施例中,细胞是植物细胞。在一些实施例中,细胞是真菌细胞。在一些实施例中,细胞是原核细胞。在一些实施例中,细胞是a549、hek-293、hek-293t、bhk、cho、hela、mrc5、sf9、cos-1、cos-7、vero、bsc 1、bsc 40、bmt 10、wi38、hela、saos、c2c12、l细胞、ht1080、hepg2、huh7、k562、原代细胞或其衍生物。在一些实施例中,细胞是工程化细胞。在一些实施例中,细胞是稳定细胞。

57、对于本领域技术人员而言,通过以下具体实施方式,本公开的另外的方面和优点将变得显而易见,其中仅示出和描述了本公开的说明性实施例。如将认识到,本公开能够具有其它并且不同的实施例,并且其若干细节能够在各种明显的方面进行修改,所有这些都不脱离本公开。因此,附图和说明书将在本质上被视为是说明性的而非限制性的。

文档序号 : 【 40281953 】

技术研发人员:布莱恩·C·托马斯,克利斯多佛·布朗,丹妮拉·S·A·戈尔茨曼,克里斯蒂娜·诺埃尔·布特弗尔德,利萨·亚历山大,詹森·刘,格雷戈里·J·科斯特,克里斯汀·罗马诺
技术所有人:宏基因组学公司

备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
布莱恩·C·托马斯克利斯多佛·布朗丹妮拉·S·A·戈尔茨曼克里斯蒂娜·诺埃尔·布特弗尔德利萨·亚历山大詹森·刘格雷戈里·J·科斯特克里斯汀·罗马诺
乙型肝炎病毒(HBV)表达的调节的制作方法 细胞表面受体的表位工程的制作方法
相关内容