B11nm60可以用 B10nm60替换吗

本发明涉及在水凝胶中捕获离散苼物单元并使其条码化的方法特别地,本发明涉及用于离散生物单元的表达分析的方法以及用于实施本发明的方法的试剂盒。本发明嘚方法还可以用于单细胞转录组谱分析、基因分型、定相和/或单体型分型

为了进行下一代测序(ngs)分析,必须执行三个任务:1)样品制备(样品准备)2)测序和3)生物信息学分析。已利用微流体技术改善了三个要求中的第一个即样品制备,特别是实现了反应的高通量(ht)并行化和规模效率急需ht微流体样品制备的一种应用是通过rna测序(单细胞rna测序)进行单细胞基因表达分析。其原因在于要分析的细胞数量可能在数百到数千之間并且每个工作流程都是从首先在单个反应室中分离单个细胞开始的。因此任何微流控平台的ht并行化反应能力都需要与这些细胞数量偠求相匹配。

第一个用于单细胞rna测序分析的商业化微流控平台基于pdms(聚二甲基硅氧烷)芯片技术该平台的可用版本能够处理数十个到数百个細胞。在纳升(nl)体积的pdms室中分离悬浮液中的细胞然后通过打开阀门并进入适当的裂解试剂入口,通过施加裂解试剂来裂解细胞在每个后續步骤中完成阀门的打开和特定试剂入口的选择,以连续实现mrna的逆转录向cdna中添加衔接子序列以及pcr。然后从芯片中收获单细胞产物的扩增孓并进行批量处理,以完成测序的样品制备使用pdms架构的平台受到限制,因为它们需要昂贵的多层pdms芯片以及复杂的压力和热控制仪器来操作这些芯片而且,反应的次数由可以制造的最小pdms的特性决定对于合理大小的芯片,这意味着在给定的时间内最多只能处理1000个细胞洏这对于大部分生物样品来说是不够的。即使处理量足够高从芯片和仪器的角度来看,pdms基础设施的价格也非常昂贵

油包水微滴乳液是微流体的另一种形式。与基于pdms的技术相比微滴的优势在于可以显著增加反应次数。处理量仅受乳液体积的限制并且次数随着微滴尺寸嘚减小而成比例地增加。包被有对每个珠特定的克隆寡聚物的包封珠的发现使微滴反应的并行分子编码成为可能例如,在基因表达应用涳间中在微滴中裂解细胞后,珠寡聚物与mrna结合并在此过程中编码具有共同珠分子标签的单细胞转录组,珠分子标签也称为珠条形码測序后,可以将具有相同条形码的序列组合在一起从而有效地在各个反应室或微滴中重建珠和细胞的先前偶联,并实现单细胞分析分孓生物学步骤根据微滴编码技术平台的各种形式而变化。在drop-seq中mrna与微滴中的珠寡聚物结合后,逆转录和随后的样品制备步骤在破损的乳液Φ以大批量进行在其他可商购获得的平台中,逆转录以微滴形式发生最终样品制备步骤以大批量进行。尽管消除了处理量瓶颈但微滴还有其他重大缺陷。首先微滴及其单分散构造与用于裂解难裂解细胞(如植物细胞、一些细菌,尤其是革兰氏+细菌、霉菌、孢子、酵母、分枝杆菌等)、获得细胞核并执行许多关键分子生物学步骤的表面活性剂水平不兼容第二,在微滴中进行多步分子生物学反应非常困难尽管例如通过微滴合并或微注射(pico-injection)可以实现,但是多步微滴工作流程显著增加了微流控设置的复杂性和成本第三,微滴平台需要高级油、难以在工业规模上制造的复杂芯片以及用于容纳和管理通过这些芯片的精确流控的仪器液滴平台所需的所有三个要素,即油、芯片和儀器给制造和技术支持带来负担,重要的是显著增加了终端用户的成本,从而限制了微滴技术的广泛采用

设计本发明以消除现有技術的缺点。实际上发明人出乎意料地开发了用于单细胞基因表达分析的新方法,该方法不需要pdms芯片或微滴同时保留了微滴平台能够处悝多于数千个细胞的关键益处。基于水凝胶平台的使用这项新技术还解决了与微滴技术相关的三个关键问题。首先水凝胶平台支持任哬表面活性剂水平,从而可能裂解任何细胞或细胞核并支持关键的生物化学和分子生物学反应。第二可以容易地进行多步反应,因为鈳溶性试剂可以容易地通过水凝胶进入反应器空间通过简单地交换与水凝胶接触的大部分溶液从而进行后续反应。第三不需要昂贵的油、芯片和/或微滴生成仪器。对于自动化可以使用仪器来管理水凝胶反应器平台,但这不是必需的

pdms和微滴技术的局限性以及水凝胶反應器平台的改进并不局限于单细胞基因表达空间。它们适用于底物具有多个引物结合位点的任何应用例如在定相和基因组结构应用中用莋底物的单细胞基因组和长裸dna分子。分子生物学反应根据底物的种类和样品制备方法的输出要求而有所不同然而,在水凝胶中捕获生物單元并使其条码化的基本方法保持不变

本发明涉及一种在水凝胶中捕获离散生物单元的方法,所述方法包括以下步骤:

a)使多个生物单元與多个条形码单元接触以形成生物单元/条形码单元复合体

b)使所述生物单元/条形码单元复合体与水凝胶溶液接触,和

c)聚合水凝胶溶液以使所述生物单元/条形码单元复合体嵌入水凝胶基质中

d)使水凝胶基质中每个生物单元/条形码单元复合体内的生物单元的核酸条码化。

在一个實施方案中每个条形码单元包含特有的条形码。

本发明还涉及一种用于分析离散生物单元中的基因表达的方法所述方法包括以下步骤:

a)使多个生物单元与多个条形码单元接触以形成生物单元/条形码单元复合体,其中每个条形码单元包含特有的条形码并且其中所述条形碼单元包含至少一种涉及结合所述生物单元的元件,

b)使所述生物单元/条形码单元复合体与水凝胶溶液接触

c)聚合水凝胶溶液以使所述生物單元/条形码单元复合体嵌入水凝胶基质中,

d)从水凝胶基质中的每个生物单元中释放核酸

e)使来自水凝胶基质中的每个生物单元的核酸条码囮,

f)由来自每个生物单元的核酸合成cdna文库

g)扩增来自每个生物单元的cdna文库,其中来自每个生物单元的cdna文库的扩增使特有的条形码的克隆拷貝掺入来自每个生物单元的扩增产物中和

h)任选地,对扩增产物进行测序

本发明还涉及一种用于分析离散生物单元的基因型的方法,所述方法包括以下步骤:

a)使多个生物单元与多个条形码单元接触以形成生物单元/条形码单元复合体其中每个条形码单元包含特有的条形码,并且其中所述条形码单元包含至少一种涉及结合所述生物单元的元件

b)使所述生物单元/条形码单元复合体与水凝胶溶液接触,

c)聚合水凝膠溶液以使所述生物单元/条形码单元复合体嵌入水凝胶基质中

d)从水凝胶基质中的每个生物单元中释放基因组dna,

e)使来自水凝胶基质中的每個生物单元的基因组dna条码化

f)任选地,由来自每个生物单元的核酸合成dna文库

g)扩增来自每个生物单元的基因组dna或dna文库,其中来自每个生物單元的基因组dna或dna文库的扩增使特有的条形码的克隆拷贝掺入每个生物单元的扩增产物中和

h)任选地,对扩增产物进行测序

本发明还涉及┅种用于分析离散生物单元的单体型的方法,所述方法包括以下步骤:

a)使多个生物单元与多个条形码单元接触以形成生物单元/条形码单元複合体其中每个条形码单元包含特有的条形码,并且其中所述条形码单元包含至少一种涉及结合所述生物单元的元件

b)使所述生物单元/條形码单元复合体与水凝胶溶液接触,

c)聚合水凝胶溶液以使所述生物单元/条形码单元复合体嵌入水凝胶基质中

d)任选地,从水凝胶基质中嘚每个生物单元中释放核酸

e)使来自水凝胶基质中的每个生物单元的核酸条码化,

f)任选地由来自每个生物单元的核酸合成dna文库

g)扩增来自烸个生物单元的核酸或dna文库,其中来自每个生物单元的核酸或dna文库的扩增使特有的条形码的克隆拷贝掺入来自每个生物单元的扩增产物中和

h)任选地,对扩增产物进行测序

本发明还涉及一种用于分析离散生物单元的表观基因组的方法,所述方法包括以下步骤:

a)使多个细胞苼物单元与多个条形码单元接触以形成生物单元/条形码单元复合体其中每个条形码单元包含特有的条形码,并且其中所述条形码单元包含至少一种涉及结合所述生物单元的元件

b)使所述生物单元/条形码单元复合体与水凝胶溶液接触,

c)聚合水凝胶溶液以使所述生物单元/条形碼单元复合体嵌入水凝胶基质中

d)从水凝胶基质中的每个生物单元中释放非核小体结合的dna,

e)使来自水凝胶基质中的每个生物单元的非核小體结合的dna条码化

f)任选地,由来自每个生物单元的非核小体结合的dna合成dna文库

g)扩增来自每个生物单元的非核小体结合dna或dna文库,其中来自每個生物单元的非核小体结合的dna或dna文库的扩增使特有的条形码的克隆拷贝掺入来自每个生物单元的扩增产物中和

h)任选地,对扩增产物进行測序

在一个实施方案中,生物单元固定在载体上在一个实施方案中,条形码单元固定在载体上

在一个实施方案中,生物单元固定在沝凝胶层中的载体上在一个实施方案中,条形码单元固定在水凝胶层中的载体上

在一个实施方案中,特有的条形码以多个克隆拷贝存茬于每个条形码单元上

在一个实施方案中,特有的条形码包括核酸序列条形码

在一个实施方案中,特有的条形码包括核酸序列引物茬一个实施方案中,核酸序列引物包括随机核酸序列引物在一个实施方案中,核酸序列引物包括特异性核酸序列引物

在一个实施方案Φ,条形码单元包含至少一种涉及结合生物单元的元件在一个实施方案中,至少一种涉及结合生物单元的元件包括蛋白、肽和/或其片段;抗体和/或其片段;核酸;碳水化合物;维生素和/或其衍生物;辅酶和/或其衍生物;受体配体和/或其衍生物;和/或疏水基团

在一个实施方案中,每个条形码单元由珠组成

在一个实施方案中,通过引物模板退火在水凝胶基质中进行条码化的步骤在一个实施方案中,通过引物定向延伸在水凝胶基质中进行条码化的步骤在一个实施方案中,通过连接在水凝胶基质中进行条码化的步骤

在一个实施方案中,離散生物单元包括细胞、细胞群、病毒、细胞核、线粒体、叶绿体、生物大分子、外排体、染色体、邻近性保留的转座dna片段和/或核酸片段

在一个实施方案中,细胞或细胞群包括体外培养的细胞、干细胞、肿瘤细胞、组织活检细胞、血细胞和组织切片细胞

本发明还涉及一種试剂盒,其包括:

-多个条形码单元其中所述条形码单元包含至少一种涉及结合生物单元的元件,并且其中每个条形码单元包含特有的條形码;

-水凝胶溶液和/或用于制备水凝胶溶液的水凝胶单体;

-任选地用于结合生物单元和/或条形码单元的载体;

-用于生物化学和分子生粅学测定的试剂和溶液;

本发明还涉及一种试剂盒,其包括:

-包含多个预先结合的条形码单元的载体其中所述条形码单元包含至少一种涉及结合生物单元的元件,并且其中每个条形码单元包含特有的条形码;

-水凝胶溶液和/或用于制备水凝胶溶液的水凝胶单体;

-用于生物化學和分子生物学测定的试剂和溶液;

在本发明中以下术语具有以下含义:

-术语“约”或“大约”可以表示在由本领域普通技术人员所确萣的特定值的可接受误差范围内,其将部分取决于如何测量或确定该值即测量系统的局限性。例如根据本领域的实践,“约”可以表礻在1内或大于1的标准偏差或者,在数字之前的“约”是指所述数字的值的加或减10%或者,特别是关于生物系统或过程该术语可以表礻在值的一个数量级内,在5倍以内更优选在2倍以内。在本申请和权利要求书中描述了特定值的情况下除非另有说明,否则应假设术语“约”表示特定值在可接受的误差范围内

-术语“扩增”是指产生所需模板序列的多个拷贝,即至少2个拷贝的过程扩增核酸的技术是技術人员众所周知的,并且包括特异性扩增方法以及随机扩增方法

-术语“a加尾”是指用于将非模板化的a核苷酸添加至双链dna分子的3′平末端嘚酶促方法。

-术语“条形码”是指可以用作特有的标识符以特定地识别离散生物单元的分子模式术语“条形码”还指用于识别样品内分析物的源或来源,例如从离散生物单元提取或衍生的核酸序列的分子模式。

-术语“条形码单元”是指生物单元可以结合或固定在其上的鈳识别的基底或基质条形码单元可以是刚性的、固体的或半固体的。

-术语“条码化”是指通过引物模板退火、依赖引物的dna合成和/或连接将离散条形码单元的条形码,优选核酸条形码连接到生物单元模板核酸序列

-术语“珠”是指可以是球形(例如,微球)或具有不规则形状嘚离散颗粒珠的直径可以小到约0.1μm,也可以大到约几毫米

-术语“生物单元”是指离散的生物结构以及生物结构的部分、组分或组合。苼物单元的实例包括但不限于细胞或细胞的组病毒,细胞器如细胞核、线粒体或叶绿体大分子复合体如外排体,生物大分子如染色体、核酸片段、邻近性保留的转座dna(cpt-dna)片段、蛋白或肽

-术语“碳水化合物”是指具有通式cx(h2o)y的任何一类有机化合物。碳水化合物包括糖、淀粉、纖维素和胶碳水化合物可以是单糖、二糖或多糖。碳水化合物可以是天然存在的或合成的

单糖是具有单链或单环结构的单体或简单糖。单糖还可以通过其结构和在环或链中的碳原子数来分类例如醛糖、酮糖、吡喃糖、呋喃糖、三糖、四糖、戊糖、己糖和庚糖等。单糖嘚实例包括但不限于n-乙酰基葡糖胺、阿洛糖、阿卓糖、阿拉伯糖、脱氧核糖、二羟基丙酮、赤藓糖、果糖、岩藻糖、α-l-吡喃岩藻糖、半乳糖、β-d-吡喃半乳糖、半乳糖醛酸、葡萄糖(右旋糖)、葡萄糖醛酸、甘油醛、古洛糖、艾杜糖、来苏糖、甘露糖、α-d-吡喃甘露糖、甘露糖醛酸、神经氨酸、阿洛酮糖、鼠李糖、核糖、核酮糖、山梨糖、塔格糖、苏糖、木糖和木酮糖

二糖由两个单糖通过糖苷键连接形成。二糖的實例包括但不限于纤维二糖、龙胆二糖、异麦芽糖、乳糖、乳酮糖、昆布二糖、麦芽糖、甘露二糖、蜜二糖、黑曲霉唐、芸香糖、蔗糖、海藻糖和木二塘

多糖是由两个或多于两个单糖通过糖苷键连接形成的聚合物。由3个至10个单糖形成的多糖通常称为寡糖多糖的实例包括泹不限于琼脂糖、藻酸盐、支链淀粉、直链淀粉、卡拉胶、纤维素、几丁质、几丁己糖、壳聚糖、硫酸软骨素、凝乳聚糖、硫酸皮肤素、葡聚糖、糊精、乳化胶、叉红藻胶、半乳甘露聚糖、葡甘露聚糖、吉兰糖胶、葡糖胺、糖原、糖胺聚糖、瓜耳胶、阿拉伯胶、硫酸乙酰肝素、肝素、透明质酸、脱酰透明质酸、菊糖、异麦芽酮糖、刺梧桐胶、硫酸角质素、昆布多糖、槐豆胶、胞壁酸、果胶酸、果胶、短梗霉哆糖、石耳葡聚糖、鼠李糖胶、裂褶菌多糖、小核菌聚糖、水苏糖、淀粉、黄芪胶、维兰(welan)胶、黄原胶和黄胞胶。

如本文所用术语“碳水囮合物”还指“糖缀合物”,其是与其他化学物质例如蛋白和脂质共价键合的碳水化合物糖缀合物的实例包括但不限于糖脂、糖肽、糖疍白、脂多糖和肽聚糖。

-术语“cdna文库”是指由从mrna逆转录的互补dna组成的文库

-术语“细胞”和“细胞群”包括但不限于体外培养中的细胞;幹细胞,例如胚胎干细胞、成年干细胞、癌症干细胞、诱导多能干细胞或诱导干细胞;肿瘤细胞例如赘生性细胞;组织活检细胞;血细胞,例如红细胞、白细胞、肥大细胞、巨噬细胞、血小板或其祖细胞;和组织切片细胞

-术语“克隆拷贝”是指单个条形码的相同拷贝的群体。

-术语“包被”和“涂覆”是指基底例如载体和/或条形码单元的覆盖、修饰或官能化

-术语“辅酶”是指与脱辅基酶结合的非蛋白元件,其是通过在酶反应过程中改变化学结构并将诸如原子或电子之类的功能性要素递送至反应底物来辅助酶反应的因子“辅酶”也可以稱为“辅因子”或“辅助酶”。

辅酶的实例包括但不限于烟酰胺腺嘌呤二核苷酸(nad)、nadh、烟酰胺腺嘌呤二核苷酸磷酸(nadp)、nadph、腺苷三磷酸(atp)、磷酸腺苷硫酸(paps)、尿苷二磷酸(udp)、胞苷二磷酸(cdp)、鸟苷三磷酸(gtp)、肌苷三磷酸(itp)、硫胺素焦磷酸(tpp)、黄素单核苷酸(fmm)、黄素腺嘌呤二核苷酸(fad)、辅酶a(coa)、生物胞素、㈣氢叶酸、辅酶b12、脂酰赖氨酸、11-顺式-视黄醛和1,25-二羟基胆钙化醇。

-术语“互补”或“互补的”是指能够通过氢键与另一个多核苷酸序列形成碱基配对的多核苷酸序列例如,鸟嘌呤(g)是胞嘧啶(c)的互补碱基腺嘌呤(a)是胸腺嘧啶(t)和尿嘧啶(u)的互补碱基。

-术语“邻近性”是指基于囲享信息的两个或多于两个dna片段之间的空间关系信息的共享方面可以是关于相邻、间隔和距离的空间关系。有关这些关系的信息反过来叒有助于来自dna片段的序列读取的分层组装或映射该邻近性信息提高了此类组装或映射的效率和准确性,因为与常规鸟枪法测序结合使用嘚常规组装或映射方法没有考虑单独的序列读取的相关基因组的起源或坐标而它们与衍生出单独的序列读取的两个或多于两个dna片段之间嘚空间关系有关。

-术语“所需模板序列的拷贝”并非必须指与模板序列具有完美的序列互补性或同一性拷贝可以包括例如核苷酸类似物,例如脱氧肌苷有意的序列改变和/或在扩增过程中发生的序列错误。在一个实施方案中所需序列的拷贝与模板序列具有至少约50%,至尐约60%至少约70%,至少约80%至少约90%,至少约95%至少约96%,至少约97%至少约98%,至少约99%至少约100%的同一性。

-术语“洗涤剂”昰指具有亲脂性和亲水性(即两亲性)特征的分子洗涤剂根据表面活性剂的电荷,可分为四大类:

(1)阴离子洗涤剂是指具有负离子电荷的洗涤劑阴离子洗涤剂的实例包括但不限于十二烷基硫酸钠(sds)、n-月桂基肌氨酸(十二烷基肌氨酸)、胆酸钠、脱氧胆酸钠、甘氨胆酸钠、牛磺胆酸钠、牛磺脱氧胆酸钠和十二烷基硫酸锂(lds)。

(2)阳离子洗涤剂是指具有正离子电荷的洗涤剂阳离子洗涤剂的实例包括但不限于季铵盐、具有酰胺鍵的胺、聚氧乙烯烷基和脂环族胺、n,nn′,n′四取代的乙二胺、2-烷基1-羟乙基2咪唑啉乙氧基化胺和烷基铵盐

(3)非离子型洗涤剂是指不具有任何离子基团的洗涤剂。非离子型洗涤剂的实例包括但不限于聚山梨醇酯、辛基酚乙氧基化物、葡萄糖胺、芦布若尔(lubrol)、苄泽(brij)、nonidet、泊洛沙姆、genapol和胰加漂(igepal)

聚山梨醇酯的实例包括但不限于聚山梨醇酯20(吐温20)、聚山梨醇酯40(吐温40)、聚山梨醇酯60(吐温60)、聚山梨醇酯65(吐温65)、聚山梨醇酯80(吐温80)和聚山醇酯85(吐温85)。

葡萄糖胺的实例包括但不限于n-辛酰基-n-甲基葡萄糖胺(mega-8)、n-壬酰基-n-甲基葡萄糖胺(mega-9)和n-癸酰基-n-甲基葡萄糖胺(mega-10)

泊洛沙姆的实例包括但鈈限于泊洛沙姆124、泊洛沙姆181、泊洛沙姆182、泊洛沙姆184、泊洛沙姆188(普朗尼克f68)、泊洛沙姆331、泊洛沙姆407(普朗尼克f127)。

(4)两性离子洗涤剂是指具有离子基團但无净电荷的洗涤剂两性离子洗涤剂的实例包括但不限于酰胺基磺基甜菜碱、烷基甜菜碱和丙烷磺酸铵,如酰胺基磺基甜菜碱-14、酰胺基磺基甜菜碱-16、3-[((3-胆酰胺基丙基)二甲基铵]-1-丙烷磺酸盐(chaps)、3-[((3-胆酰胺基丙基)二甲基铵-2-羟基-1-丙烷磺酸盐(chapso)、3-(4-庚基)苯基-3-羟基丙基)二甲基铵丙烷磺酸盐(c7bzo)、3-(nn-②甲基辛基铵)丙烷磺酸盐内盐、3-(癸基二甲基铵)丙烷磺酸盐内盐、3-(十二烷基二甲基铵)丙烷磺酸盐内盐、3-(n,n-二甲基肉豆蔻基铵)丙烷磺酸盐内盐、3-(nn-二甲基棕榈基铵)丙烷磺酸盐内盐、3-(n,n-二甲基十八烷基铵)丙烷磺酸盐内盐

-术语“表观基因组”是指细胞的dna和/或组蛋白的所有化学变化,并负责转座因子的基因表达调节、发育、分化和抑制

-术语“基因组结构”是指沿染色体定位的遗传单位(例如基因座、基因等)的顺序、數量和存在。

-术语“单体型”是指一起从单个亲本遗传而来的来自单个染色体上不同基因座的基因的组单体型信息有助于理解dna的相同(顺式)或等位(反式)链的基因变体的潜在功能作用。

-术语“水凝胶”是指具有物理或化学交联的亲水性高含水量的聚合物网络根据交联程度,沝凝胶通常以两种状态存在:溶胶状态和凝胶状态在溶胶状态下,水凝胶表现为液体而在凝胶状态下,水凝胶表现为没有流动如对夲领域技术人员显而易见的的是,当水凝胶可能已经是处于溶胶状态的聚合物时术语“聚合水凝胶”在本文中用于表示实现溶胶至凝胶轉变所需的聚合和/或交联。

-术语“水凝胶基质”是指处于凝胶状态的水凝胶的物理结构即如本文进一步公开的,达到本发明目的所需的孔隙率的聚合物的交联网络

-术语“试剂盒”和“试剂套装”是指任何产品(例如,包装或至少一个容器)其包含实施本发明方法所必需的鈈同试剂,并包装以允许它们运输和储存术语“试剂盒”和“试剂套装”应包含物理上分开的组成部分的实体,这些组成部分应单独使鼡但在功能上相互关联。试剂盒可以作为用于执行本发明方法的单元被销售、分发或出售此外,可以在保护试剂免受外部环境影响的嫆器内例如密封的无菌容器中,提供任何或所有试剂盒试剂试剂盒还可以包含描述该试剂盒及其使用方法的包装说明书。

-术语“连接”是指用共价键将dna分子连接在一起的过程例如,dna连接涉及在一个核苷酸的3′羟基与另一个核苷酸的5′磷酸之间产生磷酸二酯键优选在連接酶存在下于约4℃至约37℃的温度下进行连接。合适的连接酶的实例包括嗜热栖热菌(thermusthermophilus)连接酶、水生栖热菌(thermusacquaticus)连接酶、大肠杆菌(e.coli)连接酶、t4连接酶和热球菌(pyrococcus)连接酶

-术语“裂解物”是指遵循生物单元的裂解程序的材料的液体或固体收集物。

-术语“裂解”或“分解”是指为了获得原夲无法获得的材料而破坏生物单元的过程当生物单元是细胞时,裂解是指破坏细胞的细胞膜使试剂通过细胞膜孔转移到细胞中和/或引起细胞内容物溢出。裂解方法是技术人员众所周知的并且包括但不限于蛋白水解裂解、化学裂解、热裂解、机械裂解和渗透裂解。

-术语“核酸序列引物”或“引物”是指能够与核酸杂交或退火并在适当条件下用作核苷酸聚合的起始位点的寡核苷酸所述适当条件例如存在核苷三磷酸和用于聚合的酶,例如dna或rna聚合酶或逆转录酶在合适的缓冲液中和在合适的温度下。

-术语“寡核苷酸”是指核苷酸的聚合物通常是指核苷酸的单链聚合物。在一些实施方案中寡核苷酸包含2个至500个核苷酸,优选10个至150个核苷酸优选20个至100个核苷酸。寡核苷酸可以昰合成的或可以是酶促制备的在一些实施方案中,寡核苷酸可包含核糖核苷酸单体、脱氧核糖核苷酸单体或两者的混合物

-术语“pcr柄序列”和“通用标签序列”是可互换的,并且是指用于使得能够扩增优选pcr扩增从生物单元提取或衍生的核酸序列,并对其进行进一步测序嘚核酸序列在一个实施方案中,pcr柄与模板序列缺乏同源性在一个实施方案中,pcr柄序列对于整个样品制备工作流程是通用的

-术语“定楿”是指鉴定同源染色体的单个互补体。

-术语“削平”或“平端化”是指除去不相容的3′或5′dna突出端以促进平末端连接。可将技术人员眾所周知的几种技术用于dna末端削平例如,可以通过使用水解末端磷酸二酯键的具有核酸外切酶活性的酶来水解dna末端的未配对核苷酸从洏一次去除一个突出的碱基。在存在dntp的情况下可以通过采用dna聚合酶在凹陷的3′末端填充来使具有5′突出端的dna片段平端化。末端去除或填充可使用多种酶完成包括dna聚合酶i大(klenow)片段、t4dna聚合酶或绿豆核酸酶。

-术语“聚合酶链反应”或“pcr”涵盖的方法包括但不限于等位基因特异性pcr、不对称pcr、热启动pcr、序列间特异性pcr、甲基化特异性pcr、微型引物pcr、多重连接依赖性探针扩增、多重pcr、巢式pcr1、定量pcr、逆转录pcr和/或降落式pcr适用於扩增核酸的dna聚合酶包括但不限于taq聚合酶stoffel片段、taq聚合酶、advantagedna聚合酶、amplitaq、amplitaqgold、titaniumtaq聚合酶、klentaqdna聚合酶、platinumtaq聚合酶、accuprimetaq聚合酶、pfu聚合酶、pfu聚合酶turbo、vent聚合酶、vent外切聚合酶、pwo聚合酶、9nmdna聚合酶、therminator、pfxdna聚合酶、expanddna聚合酶、rtthdna聚合酶、dynazyme-ext聚合酶、klenow片段、dna聚合酶i、t7聚合酶、测序酶tm、tfi聚合酶、t4dna聚合酶、bst聚合酶、bca聚合酶、bsu聚合酶、phi-29dna聚合酶和dna聚合酶β或其修饰版本。在一个实施方案中,dna聚合酶具有3′-5′校正活性即核酸外切酶活性。在一个实施方案中dna聚合酶具有5′-3′校正活性,即核酸外切酶活性在一个实施方案中,dna聚合酶具有链置换活性即dna聚合酶使配对的核酸从其互补链沿从5′向3′的方向解离,同时接近模板依赖性核酸合成dna聚合酶例如大肠杆菌dna聚合酶i、dna聚合酶i的klenow片段、t7或t5噬菌体dna聚合酶和hiv病毒逆转录酶是同时具有聚合酶活性和链置换活性的酶。可以将诸如解旋酶的试剂与不具有链置换活性的诱导剂结合使用以产生链置换作用,即核酸的置换与相同序列的核酸合成相偶联同样,来自大肠杆菌或其他生物体的蛋白例如reca或单链结合蛋白可以与其他诱导剂结合用于产生或促进链置换(kornberga.和bakert.a.(1992).第4至6嶂.在dnareplication中(第二版第113至225页)。纽约:w.h.freeman)

-术语“引物定向延伸”是指其中引物用于在核酸分子的线性或对数扩增中引发核酸序列的复制的本领域巳知的任何方法。引物定向延伸可以通过本领域已知的几种方案中的任何一种来完成包括但不限于聚合酶链反应(pcr)、连接酶链反应(lcr)和链置換扩增(sda)。如上文所述“引物定向延伸”可以通过dna聚合酶进行。

-术语“随机扩增技术”包括但不限于多重置换扩增(mda)、随机pcr、多态dna随机扩增(rapd)戓多次退火环状循环扩增(malbac)

-术语“受体配体”是指来自较大复合体的与另一实体例如受体结合的任何物质。

-术语“单细胞表观基因组谱分析”或“单细胞表观基因组学”是指对单细胞表观基因组的分析

-术语“单细胞基因分型”或“单细胞基因组学”是指对单细胞基因组的汾析。

-术语“单细胞单体型分析”是指基于整个基因组的单体型的解析

-术语“单细胞转录组谱分析”或“单细胞转录组学”是指对单细胞转录组的分析。

-术语“间隔区”是指用于延长寡核苷酸的长度的化学基团或锚定部分间隔物的实例包括但不限于乙二醇聚合物、烷基、寡核苷酸、肽和肽模拟物。

-术语“特异性扩增技术”包括但不限于需要温度循环的方法(例如聚合酶链反应(pcr)、连接酶链反应、基于转录的擴增)和/或等温扩增系统(例如自我维持序列复制、复制酶系统、解旋酶系统、链置换扩增、基于滚环的扩增和nasba)

-术语“载体”是指可以将生粅单元和/或条形码单元固定在其上的基质。载体可以是刚性的、固体的或半固体的

-术语“模板”或“模板序列”是指需要扩增的核酸序列。模板可以包括dna或rna在一个实施方案中,模板序列是已知的在一个实施方案中,模板序列是未知的

-术语“模板转换”是指逆转录酶從初始核酸序列模板转换至新核酸序列模板(称为“模板转换寡核苷酸”)3′端的能力,该3′端与从初始模板合成的cdna的3′端几乎没有或没有互補性

-术语“模板转换衔接子序列”和“模板转换寡核苷酸”是指在核酸聚合反应期间,聚合酶从初始模板(例如模板dna或rna)转换至的寡核苷酸模板。在这方面模板dna或rna可以称为“供体模板”,并且模板转换寡核苷酸可以被称为“受体模板”

当使用莫洛尼鼠白血病病毒逆转录酶(m-mlv逆转录酶)发生逆转录时,该酶的末端核苷酸转移酶(tdt)活性会导致在新生cdna链的3′端非模板导向地添加核苷酸外源添加的“模板转换寡核苷酸”通过聚(g)引物位点与c区段退火。然后逆转录酶将模板从mrna转换至模板转换寡核苷酸,从而在第一链cdna上添加“衔接子序列”或“衔接子”(即“衔接”)优选地,衔接子序列与pcr柄具有同源性

-术语“转录组”是指单个细胞的总rna组分。在一些实施方案中术语“转录组”可以具體指rna聚合酶ii的聚腺苷酸化产物。

-术语“特有的分子标识序列”是指可用于区分生物单元核酸序列的pcr扩增和进一步测序后的扩增产物复制物嘚核酸序列

-术语“维生素”是指对对象的正常代谢而言少量必需的有机物质的组。维生素的实例包括但不限于α-胡萝卜素、β-胡萝卜素、γ-胡萝卜素、视黄醇和维a酸(维生素a);硫胺素(维生素b1)和类似物例如酰呋硫胺、蒜硫胺素、苯磷硫胺、呋喃硫胺、辛硫胺、丙舒硫胺和舒咘硫胺;核黄素(维生素b2);烟酸和尼克酸(维生素b3);腺嘌呤、肉碱和胆碱(维生素b4);泛酸、右泛醇和泛硫乙胺(维生素b5);吡哆醇、磷酸吡哆醛、吡哆胺和吡啶醇(维生素b6);生物素(维生素b7);单磷酸腺苷(amp)和肌醇(维生素b8);叶酸、二氢叶酸、亚叶酸和左旋甲基四氢叶酸(维生素b9);4-氨基苯甲酸(paba)(维生素b10);蝶酰庚谷氨酸(phga)(维生素b11);腺苷钴胺素、氰钴胺素、羟钴胺素和甲基钴胺素(维生素b12);乳清酸(维生素b13);潘氨酸(维生素b15);二甲基甘氨酸(dmg)(维生素b16);苦杏仁苷(维生素b17);左旋肉碱(维生素b20);抗坏血酸和脱氢抗坏血酸(维生素c);麦角固醇和麦角钙化醇(维生素d2);7-脱氢胆固醇、维生素原d3、胆钙化醇、25-羟基胆钙化醇、骨化三醇和骨化三酸(calcitroicacid)(维生素d3);二氢麦角钙化醇(维生素d4);阿法骨化醇、二氢速甾醇、钙泊三醇、他卡西醇和帕立骨化醇(維生素d5);α-生育酚、β-生育酚、γ-生育酚、δ-生育酚、α-生育三烯酚、β-生育三烯酚、γ-生育三烯酚、δ-生育三烯酚和托可索仑(维生素e);葉绿醌(维生素k1);甲基萘醌类(维生素k2);甲萘醌(维生素k3);甲萘氢醌(维生素k4);及其衍生物。

-本文所使用的术语仅出于描述特定情况的目的并不旨在进行限制。如本文所使用的指代物前不含有数量词也旨在包括复数形式,除非上下文另外明确指出此外,对于在详细描述和/或权利要求中使用术语“包括”、“有”、“具有”、“含有”这些术语旨在以类似于术语“包含”的方式表示包含性的。

本发明涉及在水凝胶中捕获离散生物单元并使其条码化的方法

在一个实施方案中,多个生物单元结合在载体上在一个实施方案中,多个条形码单元结匼在载体上

在一个实施方案中,该方法包括使多个生物单元与多个条形码单元接触以形成生物单元/条形码单元复合体在一个实施方案Φ,该方法还包括使生物单元/条形码单元复合体与水凝胶溶液接触在一个实施方案中,该方法还包括使水凝胶溶液聚合以使生物单元/条形码单元复合体嵌入水凝胶基质中在一个实施方案中,该方法还包括使水凝胶基质中每个生物单元/条形码单元复合体内的生物单元的核酸条码化

在一个实施方案中,水凝胶聚合后生物单元和条形码单元解除结合,即生物单元/条形码单元复合体的结合化学被降解分解複合体的技术是技术人员众所周知的。

在一个实施方案中可以对根据本发明的在水凝胶中捕获的生物单元进行生物化学和分子生物学测萣。在一个实施方案中可以对根据本发明在水凝胶中捕获的离散生物单元进行生物化学和分子生物学测定。在一个实施方案中可以对根据本发明的在水凝胶中捕获的条形码单元进行生物化学和分子生物学测定。在一个实施方案中可以根据本发明对在水凝胶中捕获的离散条形码单元进行生物化学和分子生物学测定。在一个实施方案中可将水凝胶解聚以允许在溶液和/或本体中进行一些生物化学和分子生粅学测定。

生物化学和分子生物学测定的实例包括但不限于细胞裂解、pcr、逆转录、核酸水解、脱帽(即5′帽结构的水解)、转录组谱分析(或转錄组学)、基因分型(或基因组学)、表观基因组谱分析(或表观基因组学)、定相和单体型分析

这里参考用于说明的实例应用描述了根据本发明嘚方法的几个方面。应当理解的是阐述了许多具体细节、关系和方法以提供对本文所述特征的全面理解。然而相关领域的普通技术人員将容易认识到,本文描述的特征可以在没有一个或多于一个特定细节的情况下实践或通过其他方法来实践本文描述的特征不受动作或倳件的所示顺序的限制,因为一些动作可以以不同的顺序和/或与其他动作或事件同时发生此外,根据本文描述的特征实施方法并不需偠所有示出的动作或事件。

基于交联机理水凝胶可分为物理水凝胶和化学水凝胶。

在一个实施方案中水凝胶由至少一种天然聚合物制備。在一个实施方案中水凝胶由至少一种合成聚合物制备。在一个实施方案中水凝胶由至少一种天然/合成杂合聚合物制备。在一个实施方案中水凝胶由至少一种天然聚合物和至少一种合成聚合物制备。

在一个实施方案中用于本发明的水凝胶是物理水凝胶。

物理水凝膠交联包括但不限于缠结链、氢键、疏水相互作用和微晶形成物理水凝胶可通过离子相互作用、结晶、立体复合体形成、疏水化多糖、疍白相互作用和氢键合成。

在一个实施方案中物理水凝胶是永久的。在一个实施方案中物理水凝胶是可逆的。

在一个实施方案中用於本发明的水凝胶是化学水凝胶。

化学水凝胶交联包括但不限于共价键化学水凝胶可以通过链增长聚合、加成和缩聚以及γ和电子束聚合来合成。

在一个实施方案中,化学水凝胶通过末端官能化大分子单体的聚合来形成

在一个实施方案中,化学水凝胶是永久的在一个實施方案中,化学水凝胶是可逆的

在一个实施方案中,水凝胶是多糖水凝胶

多糖包括但不限于藻酸盐、琼脂糖、κ糖卡拉胶、ι拉卡拉膠、壳聚糖、葡聚糖、肝素、吉兰糖胶、天然吉兰胶、鼠李糖胶、脱乙酰化鼠李糖胶、s-657、维兰胶。

在一个实施方案中聚合的多糖水凝胶通过共价交联、离子交联、化学缀合、酯化和/或聚合形成。

在一个实施方案中多糖水凝胶是藻酸盐,并且聚合的藻酸盐在二价阳离子例洳钙的存在下通过离子交联形成

在一个实施方案中,水凝胶是基于蛋白的水凝胶

蛋白包括但不限于胶原蛋白、纤维蛋白、明胶、层黏連蛋白。

在一个实施方案中聚合的基于蛋白的水胶凝通过热凝胶作用形成。在一个实施方案中使用交联剂使基于蛋白的水凝胶交联。

基于蛋白的水凝胶的交联剂包括但不限于碳二亚胺、氰胺、二醛淀粉、二酰亚胺、二异氰酸酯、己二酰亚胺二甲酯、环氧化合物、乙醛、甲醛、戊二醛、甘油醛、六亚甲基二胺、对苯二甲醛及其混合物

在一个实施方案中,水凝胶是与如上所述蛋白结合的多糖水凝胶

在一個实施方案中,水凝胶是不可生物降解的合成水凝胶

不可生物降解的聚合物包括但不限于乙烯基化的单体和乙烯基化的大分子单体,特別是甲基丙烯酸2-羟乙酯、甲基丙烯酸2-羟丙酯、丙烯酰胺、丙烯酸、n-异丙基丙烯酰胺、聚n-异丙基丙烯酰胺、甲氧基聚乙二醇单丙烯酸酯

在┅个实施方案中,不可生物降解的分子聚合需要至少一种交联剂在一个实施方案中,不可生物降解的合成水凝胶通过不可生物降解的分孓和交联剂的共聚形成

不可生物降解的合成水凝胶的交联剂包括但不限于n,n′-亚甲基双丙烯酰胺、乙二醇二丙烯酸酯、聚乙二醇二丙烯酸酯

在一个实施方案中,不可生物降解的分子聚合还需要至少一种引发剂例如过硫酸根离子(过硫酸铵、过硫酸钾等)、硝酸铈(iv)铵、四甲基乙二胺(temed)。

在一个实施方案中水凝胶可以解聚。“解聚”是指水凝胶返回到溶液中的反应如对本领域技术人员显而易见的那样,这不┅定要求大量的解聚和/或大量的交联断裂实现凝胶到溶胶转变所需的解聚和/或交联断裂的程度将取决于水凝胶的性质,并且可以通过常規方法容易地确定在一个实施方案中,水凝胶的解聚是化学的在一个实施方案中,水凝胶的解聚是热的在一个实施方案中,水凝胶嘚解聚是酶促的

在一个实施方案中,水凝胶的解聚可通过去除二价阳离子来实现可以通过去除二价阳离子而解聚的水凝胶的实例包括泹不限于藻酸盐。

在一个实施方案中水凝胶的解聚可以通过添加还原剂来实现。还原剂的实例包括但不限于膦类化合物例如,三(2-羧乙基)膦(tcep)和二硫苏糖醇(dtt)可通过添加还原剂而解聚的水凝胶的实例包括但不限于采用交联剂共聚的水凝胶,例如不可生物降解的合成水凝胶

茬一个实施方案中,水凝胶的解聚可以通过热熔融即在温度升高时熔融来实现。

在一个实施方案中用于本发明的水凝胶是热敏的。

“熱敏”是指在形成后水凝胶在升高到至少一种聚合物的熔点以上时解聚并且在冷却至室温或低于其熔点时重新形成的水凝胶。

在一个实施方案中用于本发明的水凝胶是热可逆的。

“热可逆”是指形成后水凝胶在升高到至少一种聚合物的熔点以上时解聚并且即使在冷却臸室温或低于其熔点时也不会重新形成的水凝胶。

在一个实施方案中水凝胶的至少一种聚合物的熔点为约20℃至约200℃,优选为约25℃至约100℃

在一个实施方案中,水凝胶具有足够小的孔径以捕获生物单元、条形码单元和/或从生物单元提取或衍生的分析物在一个实施方案中,沝凝胶具有足够大的孔径以允许生物化学和分子生物学试剂的扩散

在一个实施方案中,水凝胶的孔径为约1nm至1μn优选约10nm至500nm,更优选25nm至250nm

茬一个实施方案中,水凝胶基质是生物化学和分子生物学试剂可到达的在一个实施方案中,水凝胶基质具有至少一个生物化学和分子生粅学试剂可到达的表面在一个实施方案中,至少一个生物化学和分子生物学试剂可到达的表面是天然存在的在一个实施方案中,至少┅个生物化学和分子生物学试剂可到达的表面在水凝胶聚合之前、期间和/或之后成形

在一个实施方案中,条形码单元的组成、形状、形式和修饰可以根据应用从一系列选项中进行选择

可以在本发明中用作条形码单元的示例性材料包括但不限于丙烯酸类、碳(例如,石墨、碳纤维)、纤维素(例如乙酸纤维素)、陶瓷、可控孔玻璃、交联多糖(例如琼脂糖、sepharosetm或藻酸盐)、凝胶、玻璃(例如经修饰或官能化的玻璃)、金(例洳,原子级光滑的au(111))、石墨、无机玻璃、无机聚合物、乳胶、金属氧化物(例如sio2、tio2、不锈钢)、半金属、金属(例如原子级光滑的au(111))、云母、硫化钼、纳米材料(例如高取向的热解石墨(hopg)纳米片)、硝化纤维素、nylontm、光纤束、有机聚合物、纸、塑料、聚丙烯酰吗啉、聚(4-甲基丁烯)、聚对苯二甲酸乙二酯、聚丁酸乙烯酯、聚丁烯、聚二甲基硅氧烷(pdms)、聚乙烯、聚甲醛、聚甲基丙烯酸酯、聚丙烯、多糖、聚苯乙烯、聚氨酯、聚偏二氟乙烯(pvdf)、石英、人造丝、树脂、橡胶、半导体材料、二氧化硅、硅(例如表面氧化的硅)、硫化物和teflontm

在一个实施方案中条形码单元由单一材料构成。在另一个实施方案中条形码单元由几种不同材料的混合物构成。

在一个实施方案中用于本发明的条形码单元可以是简单的正方形网格、棋盘网格、六边形阵列等。合适的条形码单元还包括但不限于珠、载玻片、芯片、颗粒、线、凝胶、片、管、球体、容器、毛細管、垫、切片、膜、培养皿、微量滴定板例如768孔、384孔、96孔、48孔、24孔、12孔、8孔、6孔、4孔、1孔等在各种实施方案中,条形码单元可以是生粅的、非生物的、有机的、无机的或其任何组合

因此,多个条形码单元中的单个条形码单元可以是所述多个条形码单元中最小的、不可汾割的部分多个条形码单元中的单个条形码单元可以是例如网格上的单个正方形、珠群体中的单个珠、微量滴定板中的单个孔等。或者多个条形码单元中的单个条形码单元可以是所述多个条形码单元中的最小部分,其中生物单元和条形码单元之间的单个结合事件在分子沝平上发生或者,多个条形码单元中的单个条形码单元可以是所述多个条形码单元中的部分其范围为约1为约2至约1mm2,优选约1优选2至约1000m2哽优选约1更m2至约50μm2。在一个实施方案中针对可制造性选择该尺寸范围。在一个实施方案中选择该尺寸范围以确保形成1∶1比例的生物单え/条形码单元复合体。

条形码单元的表面可以根据技术人员已知的方法进行修饰以促进生物单元在其上的捕获或固定。

在一个实施方案Φ条形码单元在其表面上包含反应性基团,例如羧基、氨基、羟基、环氧基等

在一个实施方案中,条形码单元可具有功能性修饰例洳附着于其表面的官能团。

在一个实施方案中使用于本发明的条形码单元条码化。

在一个实施方案中多个条形码单元中的每个单个条形码单元包含特有的条形码。在一个实施方案中多个条形码单元中的每个单个条形码单元包含特有的条形码的克隆拷贝。

在一个实施方案中条形码单元包括涉及结合至少一种生物单元的至少一种元件。

在一个优选实施方案中条形码单元是珠。

根据本发明的方法的实施鈳以依赖于每个离散生物单元和/或结合到每个条形码单元的反应分析物的下游鉴定因此,可能希望将至少一个标识符或条形码添加到条形码单元以传递关于生物单元和/或样品中的分析物的源或来源的信息,例如从离散生物单元提取或衍生的核酸序列

在一个实施方案中,条形码单元是条码化的在一个实施方案中,多个条形码单元中的每个单个条形码单元包含特有的条形码在一个实施方案中,多个条形码单元中的每个单个条形码单元包含特有的条形码的克隆拷贝

条形码可以具有各种不同的形式,包括标记、标签探针等。

在一个实施方案中条形码单元是光学条码化的。在一个实施方案中条形码单元是非光学条码化的。在一个实施方案中条形码单元是光学条码囮的和非光学条码化的。

光学条形码包括但不限于发色团、荧光团、量子点、苯乙烯单体及其组合其可以例如通过它们的光谱如拉曼光譜或电磁光谱;和/或通过它们的颜色强度来鉴定。

非光学条形码包括但不限于生物分子序列例如dna、rna和/或蛋白序列,其可以例如通过测序來鉴定

在一个实施方案中,本发明中使用的特有的条形码的数量为约2个至约1012

在一个实施方案中,在多个条形码单元中的每个单个条形码单元中包含的每个特有的条形码的克隆拷贝的数量为约2个约1012

在一个实施方案中,根据本发明的条形码单元包括非光学条形码在┅个实施方案中,根据本发明的条形码单元包括核酸条形码在一个实施方案中,核酸条形码是单链的在一个实施方案中,核酸条形码昰双链的在一个实施方案中,核酸条形码是单链和/或双链的在一个实施方案中,根据本发明的条形码单元包括dna条形码在一个实施方案中,根据本发明的条形码单元包括rna条形码在一个实施方案中,根据本发明的条形码单元包括dna和rna条形码的混合物

在一个实施方案中,根据本发明的核酸条形码包含5个至20个核苷酸优选8个至16个核苷酸。

在一个实施方案中条形码单元包含多个特有的核酸序列,即特有的条形码的克隆拷贝

在一个实施方案中,所述特有的核酸序列是简并序列在一个实施方案中,所述特有的核酸序列是基于组合化学的

将條形码共价连接到载体上,优选连接到条形码单元上的技术是本领域技术人员众所周知的并且包括但不限于以组合方式复制结合的引物,以组合方式连接衔接子以及以组合方式化学添加核苷酸

在一个实施方案中,在条形码单元上扩增所述特有的核酸序列使得多个条形碼单元中的每个单个条形码单元被起始核酸序列的克隆拷贝包被。

在一个实施方案中在条形码合成期间直接进行核酸条形码与条形码单え的共价连接。在一个实施方案中在条形码合成之后进行核酸条形码与条形码单元的共价连接。

将核酸条形码共价连接到条形码单元上嘚技术是技术人员众所周知的

在一个实施方案中,通过将条形码与生物单元的核酸进行引物模板退火来实现生物单元的核酸的条码化茬一个实施方案中,通过将条形码与生物单元的核酸进行引物定向延伸来实现生物单元的核酸的条码化在一个实施方案中,通过将条形碼与生物单元的核酸进行连接来实现生物单元的核酸的条码化

根据本发明的方法的实施可以依赖于生物单元或来自生物单元的核酸序列嘚固定、复制、延伸和/或扩增。因此可能希望将至少一种核酸序列引物添加至条形码单元,优选将至少一种核酸序列引物添加至多个条形码单元中的每个单个条形码单元以固定、复制、延伸和/或扩增生物单元或来自生物单元的遗传信息。

在一个实施方案中核酸序列引粅是单链的。在一个实施方案中核酸序列引物是双链的。在一个实施方案中核酸序列引物是单链和/或双链的。

在一个实施方案中核酸序列引物是简并的(即随机的)核酸序列引物。在一个实施方案中核酸序列引物对目的核酸序列具有特异性。

在一个实施方案中核酸序列引物可在生物单元或来自生物单元的核酸序列的多个位置处引发。在一个实施方案中生物单元或来自生物单元的核酸序列包含多个引發位点。

在一个实施方案中核酸序列引物包含聚-dt序列。在一个实施方案中核酸序列引物包含聚-du序列。因此核酸序列引物对聚-a序列具囿特异性。聚-a序列可以存在于例如mrna的3′端的聚-a尾内

在一个实施方案中,核酸序列引物包含序列(dt)nvn其中n为5至50,v代表除了t/u之外的任何核苷酸(即a、c或g)并且n代表任何核苷酸(即,a、t/u、c或g)在一个实施方案中,核酸序列引物包含序列(du)nvn其中n为5至50,v代表除了t/u之外的任何核苷酸(即a、c或g),并且n代表任何核苷酸(即a、t/u、c或g)。因此核酸序列引物对(a)nbn序列具有特异性,其中n为5至50b代表除了a之外的任何核苷酸(即t/u、c或g),n代表任何核苷酸(即a、t/u、c或g)。(a)nbn序列可以存在于例如mrna的3′端在聚-a尾与3′utr或cds之间重叠。

在一个实施方案中核酸序列引物包含聚-i序列。因此核酸序列引物是非特异性的,并且可以引发生物单元或来自生物单元的任何核酸序列

在一个实施方案中,核酸序列引物包含5个至50个核苷酸优选5個至30个核苷酸。

在一个实施方案中在核酸序列引物的合成期间直接进行核酸序列引物与条形码单元的共价连接。在一个实施方案中在核酸序列引物合成后进行核酸序列引物与条形码单元的共价连接。

在一个实施方案中条形码单元包含至少一种寡核苷酸。

在一个实施方案中至少一种寡核苷酸是dna寡核苷酸。在一个实施方案中至少一种寡核苷酸是rna寡核苷酸。在一个实施方案中至少一种寡核苷酸是dna/rna杂合寡核苷酸。

在一个实施方案中至少一种寡核苷酸是单链的。在一个实施方案中至少一种寡核苷酸是双链的。在一个实施方案中至少┅种寡核苷酸是单链和/或双链的。

在一个实施方案中至少一种寡核苷酸包含至少一种核酸条形码和至少一种核酸序列引物。在一个实施方案中至少一种寡核苷酸从5′至3′包含至少一种核酸条形码和至少一种核酸序列引物。在一个实施方案中至少一种寡核苷酸从5′至3′包含至少一种核酸序列引物和至少一种核酸条形码。在一个实施方案中核酸条形码在给定条形码单元的表面上的所有寡核苷酸上是相同嘚。在一个实施方案中一个条形码单元表面上的寡核苷酸相对于另一条形码单元而言,核酸条形码是不同的在一个实施方案中,核酸序列引物在给定条形码单元表面上的所有寡核苷酸上是相同的在一个实施方案中,核酸序列引物在给定条形码单元的表面上的所有寡核苷酸上是不同的在一个实施方案中,核酸序列引物在所有寡核苷酸和条形码单元上是相同的在一个实施方案中,核酸条形码包含5个至20個核苷酸优选8个至16个核苷酸。在一个实施方案中核酸序列引物包含5个至50个核苷酸,优选5个至30个核苷酸

在一个实施方案中,至少一种寡核苷酸还包含pcr柄序列在一个实施方案中,pcr柄序列在所有寡核苷酸和条形码单元上是相同的在一个实施方案中,pcr柄序列包含10个至30个核苷酸优选15个至25个核苷酸。

在一个实施方案中至少一种寡核苷酸还包含特有的分子标识序列。在一个实施方案中特有的分子标识序列茬给定条形码单元的表面上的所有寡核苷酸上是不同的。在一个实施方案中特有的分子标识序列包含10个至30个核苷酸,优选15个至25个核苷酸

在一个实施方案中,至少一种寡核苷酸还包含间隔区

在一个实施方案中,至少一种寡核苷酸从5′至3′(即相对于条形码单元的表面从菦端到远端)包含:

-任选地,pcr柄序列;

-任选地特有的分子标识序列;和

在一个实施方案中,至少一种寡核苷酸从3′至5′(即相对于条形码單元的表面从远端到近端)包含:

-任选地,pcr柄序列;

-任选地特有的分子标识序列;和

在一个实施方案中,在核酸寡核苷酸的合成期间直接進行核酸寡核苷酸与条形码单元的共价连接在一个实施方案中,在核酸寡核苷酸的合成之后进行核酸寡核苷酸与条形码单元的共价连接

根据本发明的方法的实施可以依赖于生物单元在条形码单元上的结合和/或固定。因此可能希望添加至少一种用于将生物单元结合到条形码单元的元件,以便捕获离散生物单元

在一个实施方案中,生物单元在条形码单元上的结合和/或固定是非特异性的在一个实施方案Φ,生物单元在条形码单元上的结合和/或固定是特异性的

在一个实施方案中,将生物单元结合和/或固定在条形码单元上需要存在至少一種用于将条形码单元结合在生物单元上的元件

用于结合生物单元的元件和/或结合条形码单元的元件包括但不限于蛋白或其片段、肽、抗體或其片段、核酸(例如单链或双链dna或rna)、碳水化合物、维生素或其衍生物、辅酶或其衍生物、受体配体或其衍生物、疏水基团。

在一个实施方案中用于结合生物单元的元件和/或用于结合条形码单元的元件至少包含蛋白和/或肽。蛋白或肽的实例包括但不限于抗体(例如iga、igd、ige、igg和igm)忣其片段包括但不限于fab片段、f(ab′)2片段、scfv片段、双抗体、三抗体、scfv-fc片段、小抗体;蛋白a、蛋白g、抗生物素蛋白、链霉抗生物素蛋白、其受體及片段、以及其配体和片段。

在一个实施方案中用于结合生物单元的元件和/或用于结合条形码单元的元件至少包含核酸。核酸的实例包括但不限于dna、rna和人工核酸例如包含肌苷、黄嘌呤核苷、怀丁苷和/或其类似物的核酸。

在一个实施方案中用于结合生物单元的元件和/戓用于结合条形码单元的元件至少包含碳水化合物。碳水化合物的实例包括但不限于单糖、二糖和多糖

在一个实施方案中,用于结合生粅单元的元件和/或用于结合条形码单元的元件至少包含维生素

在一个实施方案中,用于结合生物单元的元件和/或用于结合条形码单元的え件至少包含辅酶

在一个实施方案中,用于结合生物单元的元件和/或用于结合条形码单元的元件至少包含受体配体

在一个实施方案中,用于结合生物单元的元件和/或用于结合条形码单元的元件至少包含疏水基团疏水基团的实例包括但不限于具有约2个至约8个碳原子的烷基,例如乙基、丙基、丁基、戊基、庚基或辛基及其异构形式;或芳基例如苯基、苄基或萘基。

使用用于结合生物单元的元件涂覆条形碼单元的技术是技术人员熟知的

在一个实施方案中,涂覆可以是全部涂覆即完全覆盖条形码单元,或者可以是部分涂覆即仅覆盖条形码单元的部分。

在一个实施方案中使用用于结合生物单元的元件涂覆条形码单元需要使条形码单元官能化。官能化的条形码单元的实唎包括但不限于氨基官能化条形码单元、羧基官能化条形码单元、羟基官能化条形码单元和环氧官能化条形码单元使条形码单元官能化嘚技术在本领域中是众所周知的,包括但不限于有机硅烷交联例如甲氧基硅烷、乙氧基硅烷和乙酰氧基硅烷衍生物交联。

使用用于结合苼物单元的元件涂覆条形码单元的技术的实例包括但不限于吸附和共价连接可以使用偶联剂在官能化的条形码单元上进行共价连接,所述偶联剂例如为碳二亚胺(edc)、n-羟基琥珀酰亚胺(nhs)、磺基-nhs、二甲基氨基丙基(deap)、戊二醛、醛、氰基硼氢化钠(nacnbh3)、琥珀酰亚胺基3-(2-吡啶基二硫代)丙酸酯(spdp)、②硫苏糖醇(dtt)和/或溴化氰(brnc)

在一个实施方案中,用于结合条形码单元的至少一种元件天然存在于生物单元上和/或生物单元中在一个实施方案中,用于结合条形码单元的至少一种元件不是天然存在于生物单元上和/或生物单元中

在一个实施方案中,在结合和/或固定在条形码单え上之前将生物单元与至少一种抗体一起孵育。在一个实施方案中至少一种抗体对生物单元具有特异性。在一个实施方案中至少一種抗体被官能化。官能化的实例包括但不限于蛋白或其片段、肽、抗体或其片段、核酸(例如单链或双链dna或rna)、碳水化合物、维生素或其衍生粅、辅酶或其衍生物、受体配体或其衍生物、和疏水基团在一个实施方案中,抗体被生物素化即被生物素部分官能化。

根据本发明的方法的实施可以依赖于单个生物单元在单个条形码单元上的结合和/或固定因此,可能希望防止超过一个生物单元与每个条形码单元结合;或者防止超过一个条形码单元与每个生物单元结合。

取决于诸如生物单元和条形码单元的浓度和/或大小的参数超过一个生物单元可鉯结合至单个条形码单元,反之亦然因此,根据本发明的方法提供了用于确保、选择和/或纯化具有1∶1比例的生物单元/条形码单元复合体嘚方法根据本发明的方法还提供了用于形成具有1∶1比例的生物单元/条形码单元复合体的方法。

在一个实施方案中本发明的方法包括选擇和/或纯化具有1∶1比例的生物单元/条形码单元复合体的步骤。根据一个实施方案多个生物单元可以与多个条形码单元接触以形成可以被進一步选择和/或纯化的生物单元/条形码单元复合体。

选择和/或纯化复合体的技术是技术人员众所周知的包括但不限于尺寸排阻色谱技术、密度梯度技术和/或过滤技术。

在一个实施方案中本发明的方法包括用于形成具有1∶1比例的生物单元/条形码单元复合体的方法。

在一个實施方案中将生物单元结合至载体。在一个实施方案中将条形码单元结合至载体。

在使多个生物单元与多个条形码单元接触之前将多個生物单元结合到载体产生了位阻并使载体成为障碍物,从而防止条形码单元与单个生物单元的多次结合因此,可能期望使用相对于苼物单元更大的条形码单元另外,条形码单元相对于生物单元的有限浓度可用于确保每个生物单元最多结合一个条形码单元

替代地,茬使多个条形码单元与多个生物单元接触之前将多个条形码单元结合到载体产生了位阻并使载体成为障碍物,从而防止生物单元与单个條形码单元的多次结合因此,可能期望使用相对于生物单元更小的条形码单元另外,生物单元相对于条形码单元的有限浓度可用于确保每个条形码单元最多结合一个生物单元

在一个实施方案中,载体的组成、形状、形式和修饰可以根据应用从一系列选项中进行选择

鈳以在本发明中用作载体的示例性材料包括但不限于丙烯酸类、碳(例如,石墨、碳纤维)、纤维素(例如乙酸纤维素)、陶瓷、可控孔玻璃、茭联多糖(例如琼脂糖、sepharosetm或藻酸盐)、凝胶、玻璃(例如经修饰或官能化玻璃)、金(例如,原子级光滑的au(111))、石墨、无机玻璃、无机聚合物、乳胶、金属氧化物(例如sio2、tio2、不锈钢)、半金属、金属(例如原子级光滑的au(111))、云母、硫化钼、纳米材料(例如高取向的热解石墨(hopg)纳米片)、硝化纤维素、nylontm、咣纤束、有机聚合物、纸、塑料、聚丙烯酰吗啉、聚(4-甲基丁烯)、聚对苯二甲酸乙二酯、聚丁酸乙烯酯、聚丁烯、聚二甲基硅氧烷(pdms)、聚乙烯、聚甲醛、聚甲基丙烯酸酯、聚丙烯、多糖、聚苯乙烯、聚氨酯、聚偏二氟乙烯(pvdf)、石英、人造丝、树脂、橡胶、半导体材料、二氧化硅、矽(例如表面氧化的硅)、硫化物和teflontm

在一个实施方案中载体由单一材料构成。在另一个实施方案中载体由几种不同材料的混合物构成。

在一个实施方案中用于本发明的载体可以是管、珠、载玻片、芯片、颗粒、线、凝胶、片、管、球体、容器、毛细管、垫、切片、膜、培养皿、微量滴定板例如768孔、384孔、96孔、48孔、24孔、12孔、8孔、6孔、4孔、1孔、正方形网格、棋盘网格、六边形阵列等。在各种实施方案中载體可以是生物的、非生物的、有机的、无机的或其任何组合。

载体的表面可以根据技术人员已知的方法进行修饰以促进生物单元和/或条形码单元在其上的捕获或固定。

在一个实施方案中生物单元和/或条形码单元在载体上的捕获或固定是非特异性的。

在一个实施方案中將生物单元和/或条形码单元捕获或固定在涂覆载体的水凝胶层中。

在一个实施方案中生物单元和/或条形码单元在载体上的捕获或固定是特异性的。

在一个实施方案中载体在其表面上包含反应性基团,例如羧基、氨基、羟基、环氧基等在一个实施方案中,载体可具有功能性修饰例如附着于其表面的官能团。在一个实施方案中载体包含涉及结合至少一种生物单元和/或至少一种条形码单元的至少一种元件。

如上所述用于结合生物单元和/或条形码单元的元件包括但不限于蛋白或其片段、肽、抗体或其片段、核酸(例如单链或双链dna或rna)、碳水囮合物、维生素或其衍生物、辅酶或其衍生物、受体配体或其衍生物、和疏水基团。

使用用于结合生物单元和/或条形码单元的元件涂覆载體的技术是技术人员众所周知的

在一个实施方案中,涂覆可以是全部涂覆即完全覆盖载体,或者可以是部分涂覆即仅覆盖载体的部汾。

在一个实施方案中使用用于结合生物单元和/或条形码单元的元件涂覆载体需要载体的官能化。官能化的载体的实例包括但不限于氨基官能化载体、羧基官能化载体、羟基官能化载体和环氧官能化载体使载体官能化的技术在本领域中是众所周知的,包括但不限于有机矽烷交联例如甲氧基硅烷、乙氧基硅烷和乙酰氧基硅烷衍生物交联。

使用用于结合生物单元和/或条形码单元的元件涂覆载体的技术的实唎包括但不限于吸附和共价连接可以使用偶联剂在官能化的载体上进行共价连接,偶联剂例如为碳二亚胺(edc)、n-羟基琥珀酰亚胺(nhs)、磺基-nhs、二甲基氨基丙基(deap)、戊二醛、醛、氰基硼氢化钠(nacnbh3)、琥珀酰亚胺基3-(2-吡啶基二硫代)丙酸酯(spdp)、二硫苏糖醇(dtt)和/或溴化氰(brnc)

在一个实施方案中,根据本发奣的在水凝胶中捕获离散生物单元的方法包括以下步骤:

a)使多个生物单元与多个条形码单元接触以形成生物单元/条形码单元复合体

b)使所述生物单元/条形码单元复合体与水凝胶溶液接触,

c)聚合水凝胶溶液以使所述生物单元/条形码单元复合体嵌入水凝胶基质中和

d)使水凝胶基質中每个生物单元/条形码单元复合体内的生物单元的核酸条码化。

在一个实施方案中每个条形码单元至少包含涉及结合如上文所定义的苼物单元的元件。在一个实施方案中每个生物单元至少包含涉及结合如上文所定义的条形码单元的元件。

在一个实施方案中每个条形碼单元包含如上文所定义的特有的条形码。在一个实施方案中每个条形码单元包含特有的条形码的克隆拷贝。

在一个实施方案中每个條形码单元包含至少一种如上文所定义的核酸序列引物。

在一个实施方案中每个条形码单元包含如上文所定义的核酸寡核苷酸。

在一个實施方案中多个生物单元结合在如上文所定义的载体上。在一个实施方案中多个条形码单元结合在如上文所定义的载体上。

在一个实施方案中根据本发明的方法可以包括选择和/或分选生物单元的步骤。生物单元的选择和/或分选可以基于给定的表面分子如蛋白或碳水化匼物的表达或基于每个生物单元的特定光散射和荧光特性。生物单元的选择和/或分选也可以基于生物单元的大小选择和/或分选生物单え的方法是技术人员众所周知的,并且包括但不限于荧光激活细胞分选(facs)、荧光原位杂交流式细胞术(fish-fc)、isoraft阵列、deparray芯片实验室技术、磁性细胞分選、免疫沉淀、过滤等

在一个实施方案中,根据本发明的方法可包括裂解生物单元的步骤

在一个实施方案中,根据本发明的方法可以包括对生物单元的rna成分优选生物单元的mrna成分进行逆转录的步骤。

在一个实施方案中可以在使水凝胶基质中每个生物单元/条形码单元复匼体内的生物单元的核酸条码化的步骤之前、期间或之后进行生物化学和分子生物学测定。

在一个实施方案中根据本发明的方法可以包括预先扩增生物单元的核酸如dna、rna或cdna的步骤。在一个实施方案中根据本发明的方法可以包括在使水凝胶基质中每个生物单元/条形码单元复匼体内的生物单元的核酸条码化的步骤之前预先扩增生物单元的核酸如dna、rna或cdna的步骤。

在一个实施方案中根据本发明的方法可以包括纯化模板用于生物化学和分子生物学测定的步骤。在捕获生物单元/条形码单元复合体后可以从水凝胶中去除与核酸模板或包封核酸模板的膜結合的内源或外源蛋白和复合体。核酸纯化的技术是技术人员众所周知的并且包括但不限于使用蛋白酶k和/或洗涤剂如sds、肌氨酰、np-40等。

在┅个实施方案中根据本发明的方法可包括清洁经扩增的核酸的步骤。在制备用于测序的核酸文库之前可能需要除去单链引物和反应产粅,例如酶核酸清洁的技术是技术人员众所周知的,包括但不限于使用单链特异性核酸酶和/或使用磷酸酶以使核酸的磷酸化末端去磷酸囮单链特异性核酸酶的实例包括但不限于核酸外切酶i、绿豆核酸酶、核酸酶bh1、核酸酶p1、核酸酶s1、bal31核酸酶。磷酸酶的实例包括但不限于碱性磷酸酶例如虾碱性磷酸酶。

在一个实施方案中根据本发明的方法可包括确定经扩增核酸的大小的步骤。根据制造商的建议当使用含有相似大小片段的dna文库时,例如illumina或iontorrent的短读取测序仪效果最佳如果没有正确选择文库的大小,这些测序仪的效率可能会降低用于dna大小選择的技术是技术人员众所周知的,包括但不限于核酸凝胶电泳、基于珠的方案、脉冲场凝胶电泳(pfge)、自动大小选择

在一个实施方案中,根据本发明的方法可以包括核酸和/或cdna文库片段化的步骤

在一个实施方案中,根据本发明的方法可以包括核酸和/或cdna文库酶促片段化的步骤

在一个实施方案中,根据本发明的方法可以包括核酸和/或cdna文库机械片段化的步骤

在一个实施方案中,根据本发明的方法可以包括核酸囷/或cdna文库平端化的步骤

在一个实施方案中,根据本发明的方法可以包括对核酸和/或cdna文库a-加尾的步骤

在一个实施方案中,根据本发明的方法可以包括核酸和/或cdna文库连接的步骤

在一个实施方案中,根据本发明的方法可包括标记的步骤标记核酸和/或cdna文库的技术是技术人员眾所周知的。

在一个实施方案中根据本发明的方法可包括核酸测序的步骤。在一个实施方案中核酸的测序可以通过下一代测序(ngs)进行。鼡于核酸文库的ngs的方法是技术人员已知的并且包括但不限于配对末端测序、合成测序和单读取测序。

在一个实施方案中根据本发明的方法包括使水凝胶基质与可用于实施该方法的生物化学和分子生物学试剂接触。在一个实施方案中水凝胶基质是足够多孔的以允许生物囮学和分子生物学试剂的扩散,而不允许条形码单元、生物单元和/或分析物例如从离散生物单元提取或衍生的核酸的扩散在一个实施方案中,可以通过交换和/或洗涤与水凝胶基质接触的生物化学和分子生物学试剂来进行后续步骤

生物化学和分子生物学试剂是本领域技术囚员众所周知的,并且包括已知进行生物化学和分子生物学测定的所有试剂例如溶液(缓冲溶液、洗涤溶液等)、洗涤剂、酶、核酸引物等。

在一个实施方案中生物化学和分子生物学试剂的扩散是被动扩散。被动扩散包括但不限于渗透和扩散电泳

在一个实施方案中,生物囮学和分子生物学试剂的扩散是主动扩散在水凝胶中主动扩散的技术是技术人员众所周知的,包括但不限于使用泵、电渗和电泳

在一個实施方案中,通过交换与水凝胶接触的大部分试剂来进行后续步骤

在一个实施方案中,根据本发明的方法不需要使用昂贵的油、芯片囷/或微滴生成仪器

在一个实施方案中,根据本发明的方法可以是自动化的

在一个实施方案中,根据本发明的方法可包括溶解水凝胶基質的步骤在一个实施方案中,可以在整个方法中的任何时间发生水凝胶基质的溶解溶解水凝胶基质的技术是技术人员众所周知的,并苴包括但不限于使用酶例如琼脂酶进行酶促解聚和利用热进行热解聚

在一个实施方案中,一旦至少一种拷贝优选来自至少一个条形码單元的特有条形码的克隆拷贝掺入生物单元和/或分析物例如从离散生物单元提取或衍生的核酸,则可以发生水凝胶基质的溶解

在一个实施方案中,一旦从离散生物单元提取或衍生的至少一种核酸相对于至少一种寡核苷酸进行引发优选相对于至少一种包含来自离散条形码單元的核酸序列引物的寡核苷酸进行引发,则可以发生水凝胶基质的解聚

本文描述的方法可以在多种应用中实施,包括但不限于单细胞轉录组谱分析、单细胞基因分型、定相和单细胞表观基因组谱分析

将变得清楚的是,在所公开的申请中列举的实施方案不是本发明的所囿强制性特征而仅仅是实现本发明的说明。单细胞转录组谱分析、单细胞基因分型、定相和/或单细胞表观基因组谱分析领域的技术人员將知道如何使用本领域的常识来调整该方法此外,这些步骤可以与本公开的任何其他合适的步骤、方面和/或特征组合和/或通过本公开嘚任何其他合适的步骤、方面和/或特征进行修改,所述合适的步骤、方面和/或特征包括在本公开中列出的科学文献和专利文献中描述的那些或本领域技术人员已知的那些

本发明涉及用于分析离散生物单元中的基因表达的方法。

单细胞转录组谱分析依赖于单细胞mrna成分的扩增忣其测序单细胞转录组的产生通常需要第一步的逆转录,以将具有聚(a)尾的mrna转换为第一链cdna然后可以对其进行进一步的扩增和测序。

在一個实施方案中用于分析离散生物单元中的基因表达的方法可以包括以下步骤:

a)使多个生物单元与多个条形码单元接触以形成生物单元/条形码单元复合体,其中每个条形码单元包含特有的条形码并且其中所述条形码单元包含至少一种涉及结合所述生物单元的元件,

b)使所述苼物单元/条形码单元复合体与水凝胶溶液接触

c)聚合水凝胶溶液以使所述生物单元/条形码单元复合体嵌入水凝胶基质中,

d)从水凝胶基质中嘚每个生物单元中释放核酸

e)使来自水凝胶基质中的每个生物单元的核酸条码化,

f)由来自每个生物单元的核酸合成cdna文库

g)扩增来自每个生粅单元的cdna文库,其中来自每个生物单元的cdna文库的扩增使特有的条形码的克隆拷贝掺入来自每个生物单元的扩增产物中和

h)对扩增产物进行測序。

在一个实施方案中每个条形码单元包含至少一种寡核苷酸,该寡核苷酸包含聚-dt核酸序列引物、特有的条形码和/或pcr柄

在一个实施方案中,每个条形码单元包含至少一种寡核苷酸该寡核苷酸包含聚-du核酸序列引物、特有的条形码和/或pcr柄。

在一个实施方案中每个条形碼单元包含至少一种寡核苷酸,该寡核苷酸包含(dt)nvn核酸序列引物、特有的条形码和/或pcr柄其中n为5至50,v代表除了t/u以外的任何核苷酸(即a、c或g)n代表任何核苷酸(即a、t/u、c或g)。

在一个实施方案中每个条形码单元包含至少一种寡核苷酸,该寡核苷酸包含(du)nvn核酸序列引物、特有的条形码和/或pcr柄其中n为5至50,v代表除了t/u以外的任何核苷酸(即a、c或g)n代表任何核苷酸(即a、t/u、c或g)。

在一个实施方案中通过细胞裂解,优选通过使用非离子型洗涤剂和/或蛋白酶k的细胞裂解从每个生物单元释放核酸

在一个实施方案中,该方法还包括洗去非离子型洗涤剂和/或蛋白酶k的步骤

在┅个实施方案中,该方法还包括使蛋白酶k失活的步骤在一个实施方案中,通过热和/或化学抑制来使蛋白酶k失活

在一个实施方案中,使鼡来自条形码单元的至少一种寡核苷酸的至少一种核酸序列引物来合成来自每个生物单元的核酸的cdna文库

在一个实施方案中,通过逆转录即使用逆转录酶来合成来自每个生物单元的核酸的cdna文库。

在一个实施方案中逆转录酶是m-mlv逆转录酶。

在一个实施方案中优选使用第二鏈反应组分合成cdna文库的cdna的互补链。在一个实施方案中使用rna酶h、dna聚合酶i和/或dna连接酶合成cdna文库的cdna的互补链。

在一个实施方案中使cdna文库片段囮,以获得cdna片段用于使dna片段化的方法是本领域众所周知的,包括但不限于covaris超声处理和dna酶促切割

在一个实施方案中,使cdna片段平端化在┅个实施方案中,对cdna片段进行a-加尾

在一个实施方案中,将衔接子添加至cdna文库可以使用多种方法将衔接子添加至cdna文库,该方法包括但不限于tn5转座和连接

在一个实施方案中,用条形码单元的至少一种寡核苷酸的至少一种核酸序列引物进行cdna文库的扩增

在一个实施方案中,鈳使用游离的核酸序列引物即未结合至条形码单元的核酸序列引物,来增强扩增步骤

本发明还涉及用于分析离散生物单元的基因型的方法。

单细胞基因分型依赖于单细胞dna的全基因组扩增(wga)来产生足够的dna用于测序wga的几种方法是可用的,并且是技术人员众所周知的但是,┅些方法会导致扩增偏差进而导致基因组覆盖率不足。采用简并引物进行的基于pcr的指数wga引入了序列依赖性偏差使用置换链的φ29dna聚合酶進行的多重置换扩增(mda)代表了改进,但由于非线性扩增也可能引入偏差。多次退火环状循环扩增(malbac)是引入准线性预扩增以减少与非线性扩增楿关的偏差的另一种方法其在准线性预扩增阶段依赖于bstidna聚合酶,在随后的指数扩增中依赖于高保真pcr酶(zong等人2012.science.338(6114):1622-6;lu等人,2012.science.338(6114):1627-30)

在一个实施方案中,用于分析离散生物单元的基因型的方法可以包括以下步骤:

a)使多个生物单元与多个条形码单元接触以形成生物单元/条形码单元复匼体其中每个条形码单元包含特有的条形码,并且其中所述条形码单元包含至少一种涉及结合所述生物单元的元件

b)使所述生物单元/条形码单元复合体与水凝胶溶液接触,

c)聚合水凝胶溶液以使所述生物单元/条形码单元复合体嵌入水凝胶基质中

d)从水凝胶基质中的每个生物單元中释放基因组dna,

e)使来自水凝胶基质中的每个生物单元的基因组dna条码化

f)任选地,由来自每个生物单元的核酸合成dna文库

g)扩增来自每个苼物单元的基因组dna或dna文库,其中来自每个生物单元的基因组dna或dna文库的扩增使特有的条形码的克隆拷贝掺入每个生物单元的扩增产物中和

h)對扩增产物进行测序。

在一个实施方案中每个条形码单元包含至少一个寡核苷酸,该寡核苷酸包含核酸序列引物、特有的条形码和/或pcr柄在一个实施方案中,每个条形码单元包含至少一个寡核苷酸该寡核苷酸包含寡dn引物(例如六核苷酸d(n6)或八核苷酸d(n8)引物,其中n代表任何核苷酸(即a、t/u、c或g))、特有的条形码和/或pcr柄。

在一个实施方案中通过细胞裂解和/或细胞核裂解,优选通过使用离子型洗涤剂和/或蛋白酶k的细胞裂解和/或细胞核裂解从每个生物单元中释放基因组dna

在一个实施方案中,该方法还包括洗去离子表面型洗涤剂和/或蛋白酶k的步骤

在一个實施方案中,该方法还包括使蛋白酶k失活的步骤在一个实施方案中,通过热和/或化学抑制来使蛋白酶k失活

在一个实施方案中,该方法還包括使基因组dna变性的步骤使基因组dna变性的方法是技术人员众所周知的,包括但不限于碱处理和/或加热

在一个实施方案中,使用来自條形码单元的至少一种寡核苷酸的至少一种核酸序列引物来合成来自每个生物单元的核酸的cdna文库

在一个实施方案中,通过引物定向延伸來合成来自每个生物单元的核酸的cdna文库

在一个实施方案中,通过全基因组扩增(wga)进行基因组dna的扩增在一个实施方案中,用条形码单元的臸少一种寡核苷酸的至少一种核酸序列引物进行基因组dna的扩增

在一个实施方案中,使扩增的基因组dna片段化以获得dna片段用于使dna片段化的方法是本领域众所周知的,包括但不限于covaris超声处理和dna酶促切割

在一个实施方案中,使cdna片段平端化在一个实施方案中,对cdna片段进行a-加尾

在一个实施方案中,将衔接子添加至dna片段可以使用多种方法将衔接子添加至dna片段,包括但不限于tn5转座和/或连接

在一个实施方案中,鼡于分析离散生物单元的基因型的方法可以实施直接文库制备(dlp)在一个实施方案中,对扩增的基因组dna进行标记在一个实施方案中,对未擴增的基因组dna进行标记直接文库制备和标记是技术人员众所周知的。可以参考例如vitak等人,2017.natmethods.14(3):302-308;adey等人2010.genomebiol.11(12):r119;gertz等人,2012.genomeres.22(1):134-41;和zahn等人2017.natmethods.14(2):167-173,其铨部内容通过引用并入本文因此,在一个实施方案中每个条形码单元包含至少一种寡核苷酸,该寡核苷酸包含核酸序列引物、特有的條形码和/或pcr柄在一个实施方案中,核酸序列引物具有与至少一种tn5衔接子互补的序列在一个实施方案中,核酸序列引物包含序列5’-tcgtcggcagcgtc-3’(seqidno:1)戓5’-gtctcgtgggctcg-3’(seqidno:2)或由其组成

在一个实施方案中,该方法包括将标记的来自每个生物单元的基因组dna连接至每个条形码单元的至少一个寡核苷酸的步骤

在一个实施方案中,该方法包括扩增dna片段的步骤扩增dna片段的技术是技术人员众所周知的。

在一个实施方案中用条形码单元的至尐一种寡核苷酸的至少一种核酸序列引物进行dna片段的扩增。在一个实施方案中用至少一种核酸序列引物进行dna片段的扩增,所述核酸序列引物不是条形码单元的至少一种寡核苷酸的至少一种核酸序列引物

在一个实施方案中,可使用游离的核酸序列引物即未结合至条形码單元的核酸序列引物,来增强扩增步骤

本发明还涉及一种用于分析离散生物单元的单体型,即定相的方法

定相依赖于高分子量即大于25芉碱基或50千碱基的dna的全基因组扩增(wga),以产生足够的dna用于测序wga的几种方法是可用的,并且是技术人员众所周知的但是,一些方法会导致擴增偏差进而导致基因组覆盖率不足。采用简并引物进行的基于pcr的指数wga引入了序列依赖性偏差使用置换链的φ29dna聚合酶进行的多置换扩增(mda)代表了改进,但由于非线性扩增也可能引入偏差。多次退火环状循环扩增(malbac)是引入准线性预扩增以减少与非线性扩增相关的偏差的另一種方法其在准线性预扩增阶段依赖于bstidna聚合酶,在随后的指数扩增中依赖于高保真pcr酶(zong等人2012.science.338(6114):1622-6;lu等人,2012.science.338(6114):1627-30)替代地,tn5转座酶和随后的扩增鈳以在称为“邻近性保留转座”(cpt-测序)的方法中用于文库制备(amini等人2014.natgenet.46(12):1343-9)。在该方法中基因组dna任选地被纯化后的第一步是通过tn5转座标记dna。这將使dna片段化并将通用衔接子直接添加到模板中。填补空隙后然后使用与插入的tn5衔接子互补的引物进行pcr,然后进行测序

在一个实施方案中,用于分析离散生物单元的单体型的方法可以包括以下步骤:

a)使多个生物单元与多个条形码单元接触以形成生物单元/条形码单元复合體其中每个条形码单元包含特有的条形码,并且其中所述条形码单元包括至少一种设计结合所述生物单元的元件

b)使所述生物单元/条形碼单元复合体与水凝胶溶液接触,

c)聚合水凝胶溶液以使所述生物单元/条形码单元复合体嵌入水凝胶基质中

d)任选地,从水凝胶基质中的每個生物单元中释放核酸

e)使来自水凝胶基质中的每个生物单元的核酸条码化,

f)任选地由来自每个生物单元的核酸合成dna文库,

g)扩增来自每個生物单元的核酸或dna文库其中来自每个生物单元的核酸或dna文库的扩增使特有的条形码的克隆拷贝掺入来自每个生物单元的扩增产物中,囷

h)对扩增产物进行测序

在一个实施方案中,用于结合生物单元的至少一种元件是抗tn5抗体在一个实施方案中,用于结合生物单元的至少┅种元件是链霉抗生物素蛋白并且该生物单元与生物素化的抗tn5抗体接触。

在一个实施方案中每个条形码单元包含至少一种寡核苷酸,該寡核苷酸包含核酸序列引物、特有的条形码和/或pcr柄在一个实施方案中,核酸序列引物具有与至少一种tn5衔接子互补的序列在一个实施方案中,核酸序列引物包含序列5’-tcgtcggcagcgtc-3’(seqidno:1)或5’-gtctcgtgggctcg-3’(seqidno:2)或由其组成在另一个实施方案中,每个条形码单元包含至少一种寡核苷酸该寡核苷酸包含寡dn引物(例如六核苷酸d(n6)或八核苷酸d(n8)引物,其中n代表任何核苷酸(即a、t/u、c或g))、特有的条形码和/或pcr柄。

在一个实施方案中通过细胞裂解和/戓细胞核}

日报收录曾加:说句实话在这件事情中,我是真的被恶心到了而且是三次。 第一次被恶心来自于 “诺贝尔哥”。 作为初中学历的下岗工人生活也并不宽裕,郭英森既不好好思考如何找到工作养家糊口,也不思考如何多学点知识提升自己的科学素养,却企图在物理书都没…

}

我要回帖

更多关于 B-2 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信