实验方法

核磁共振技术在结构生物学研究中的应用

2015-07-24 13:15

核磁共振技术在结构生物学研究中的应用

颜贤忠(国家生物医学分析中心)

1. 前言

人类基因组计划提供了大量新的信息,并由此改变了生物学研究的方式。这些信息特别在结构生物学领域产生巨大影响,导致了一个新的研究领域的产生,这就是结构基因组学,或者叫做基于结构的功能基因组学。

基因组学的主要问题之一在于它不能确定新的基因产物的生物学功能,而这正是功能基因组学要解决的问题。利用新的基因与已知功能基因之间的序列同源性比较,人们在发现基因功能方面已经取得了巨大进步。然而,这些新发现的基因的产物也即是蛋白质在大多数情况下与已知功能的蛋白质并不具有序列相似性。

三维结构的同源性可以被用来确定序列同源性很低的蛋白质之间的功能关系,这是因为在漫长的进化过程中,结构与功能比序列本身更具有保守性。事实上,序列相似性只是一个易于检测到的线索,并暗示着可能的结构相似性。

“结构生物信息学”就试图通过三维结构的比较建立蛋白质之间的功能关系,并且为功能基因组学提供重要手段。另一项重要的事情就是要建立一套蛋白质基本折叠模式的信息库,用于同源模建以及结构演化的分析。那么自然界中到底有多少种基本的蛋白质折叠模式呢?

结构基因组学的目的就是要揭示大多数蛋白的结构信息。虽然我们不可能用实验方法确定每一个蛋白的结构,但是如果我们可以确定一定数量(如100,000个蛋白质)的经过适当选择的蛋白质结构,然后将其他的蛋白质与已知的蛋白质结构进行比较,模建,那么我们就可以得到数十万个有用的三维结构模型。这就是说,结构基因组学将把每一个蛋白都纳入一个与已知蛋白结构相似的模型中。

结构基因组计划将提出经过改进的用于高通量蛋白质结构确定的方法和过程。这个过程包括:

(1)靶蛋白或结构域的选择;

(2)靶蛋白的克隆,表达和纯化;

(3)晶体生长并利用X-射线衍射方法确定结构,或者利用核磁共振(NMR)方法确定结构;

(4)对新结构进行归档并解释。

在生物大分子结构确定方面,X-射线晶体学和核磁共振(NMR)波谱学是两种主要的方法。X-射线晶体学在处理能力、精确度、蛋白质大小限制等方面仍然具有优势,也许在确定每个蛋白的花费上也有优势。

然而,核磁共振具有其独特的能力,它可以得到多个时间尺度范围内蛋白质内部运动的动力学信息,以及其与配体结合的性质。人们越来越清楚的认识到,蛋白质的运动与其功能有着密不可分的关系。有的运动只是对结构的微小修正,而有的则至关重要。

由肽的结合而引起的钙调蛋白的结构变化以及由肽键断裂引起的丝氨酸蛋白酶抑制物的结构改变是最具重要意义的例子。在寻找蛋白质与配体的结合位点时,化学位移微扰是一个常用的方法。核磁共振方法还有可能用来确定难于结晶的膜蛋白的结构。

对与人类疾病有关的蛋白质结构和功能进行分析,将有助于我们确定靶蛋白并以此进行药物设计。合理性药物设计(rational drug design)正是以了解生物大分子(如蛋白质)的三维结构及其相关的分子识别为基础的。

到今年10月8日为止,PDB总共收集了18,881个由实验得到的三维结构,其中的2929个结构是由核磁共振方法所得。考虑到核磁共振研究生物大分子的历史较短,这样的成绩已经是很可观的了。

2. 生物大分子溶液构象的确定

2. 1样品的获得

2. 1. 1蛋白质

蛋白质样品通常由在原核系统克隆、表达获得,也可在真核系统里获得。对一些小肽,则可用化学合成的方法。对需由表达而得到的样品,必须构建过表达系统以获取大量的样品,来满足核磁共振实验的需要。

通常来讲,最好能由1L培养液得到10mg以上的纯蛋白质,而且要尽可能避免生成包含体,一保证构象的纯度。对分子量大于8000的蛋白质还需要进行15N或15N/13C标记;分子量大于20000的蛋白质,在条件允许的情况下,还可在15N/13C标记的同时进行2H标记,以提高谱图质量。

对需要全标记的蛋白质,通常将细菌放在M9培养基里生长,以15NH4Cl为氮源,[13C6]-葡萄糖为碳源。对那些同时还需要2H标记的蛋白质,则还须将培养基里H2O用D2O来代替。若须选取某一种氨基酸残基进行标记,则通常采用营养缺陷型的菌株。

另外还有其他许多种可以采用的标记方法,以满足不同实验目的的需要。最近,Nagayama等人将一个很大的蛋白分段克隆表达,并对其中一段进行了15N/13C标记,然后将所得的蛋白质片段在一种酶的作用下连接起来,得到了一个局部片段标记的蛋白质,大大简化了谱图。这种方法将会在分子量较大的蛋白质结构研究中发挥重要作用。

2. 1. 2核酸

核酸样品通常由化学合成或体外转录方法得到。DNA通常由化学合成获得,而RNA则既可以由化学合成获得,又可以通过体外转录方法得到,而且后一种方法更常用。

核酸的稳定同位素标记要比蛋白质的标记复杂。利用体外转录方法获得标记的RNA样品所需过程较复杂。由于所需标记的NTP量较大,通常都由自己制备。将普通的E.coli菌株在M9或M9-甘油培养基里生长,用15NH4Cl或(15NH4)2SO4替代相应的普通盐,或同时用[13C6]-葡萄糖或[13C3]-甘油替代普通的葡萄糖/甘油。

也可用嗜甲醇菌在以13C-甲醇为碳源的培养基里生长。分离提取收获的细菌中的rRNA或DNA,经水解得到NMP或dNMP,再经磷酸化得到NTP或dNTP,以此作为原料,进行下一步的合成或转录工作。

在利用T7 RNA聚合酶的体外转录方法已被广泛用于RNA的结构研究数年之后,才有关于利用DNA聚合酶获得标记的DNA样品的报道。

2. 2核磁共振样品的制备

灵敏度低是核磁共振的生物应用所碰到的最大问题。核磁共振信号的强度与处于谱仪中“灵敏体积”内的样品的量成正比。通常所用的样品管为5mm。最佳样品体积大约为400ml。为了提高信噪比,信号通常会被累加许多次。

信噪比的增加正比于累加次数的平方根。例如,要得到同样的信噪比,一个0.5mM的样品所需累加时间为一个1.0mM样品的4倍。对结构研究而言,大分子的浓度至少需要0.5mM以上,对***实验,则需要1-3mM。

随着磁场强度的提高以及低温探头的出现,核磁共振的灵敏度正在逐步提高。在样品量足够的情况下,溶解度则成了限制因素。

样品还必须能在核磁共振实验过程中保持稳定。要防止空气氧化,微生物污染,水解等现象的发生,以延长样品在样品管中的寿命。对那些本来就不稳定的样品,则很难得到高分辨谱图。

在长时间核磁共振实验的前后,最好对样品用电泳或测酶活性等方法进行检查,以确保样品仍保持正常状态。其实,最简单又好的方法,就是做一张1H谱,如果前后的谱图是一致的,则证明样品没有变化。

分子量的增大对核磁共振谱有两方面的影响:

(a) 谱的复杂程度会增加。较大的分子会产生较多的谱峰。当在一个给定的频率间隔内谱峰数目增加时,谱峰的重叠也随之增加,谱图解析也越困难。

(b) 每条谱峰的线宽也会增加。分子越大,其旋转相关时间(tc,分子旋转通过1弧度所需时间)也越大。而线宽是与tc成正比的。线宽越大,谱线强度就减小,谱峰重叠也增加。

可以用稳定同位素标记(15N, 13C, 2H) 和谱编辑技术来减小谱的复杂程度。***核磁共振技术可以减小谱峰重叠。目前核磁共振方法能够解析的蛋白质的分子量约为30,000左右,核酸约为40个碱基左右。

2.3 核磁共振实验技术

核磁共振技术可分为一维和***技术,在***技术中,又可以所涉及的核素分为同核和异核实验。

在生物大分子的核磁共振研究中,通常只检测样品的一维1H谱,其作用主要限于对样品进行初步检查,或针对谱图中可识别的,与其他谱峰不重叠的一些峰(如色氨酸和组氨酸的峰),进行温度、pH值、重水交换等因素变化的影响实验。

二维核磁共振实验包括同核和异核实验。同核实验主要有1H-1H COSY,TOCSY,E.COSY, NOESY,ROESY,relay-NOESY等实验,主要用于自旋体系(残基内部)的谱峰确认,耦合常数的测定,顺序识别,以及由NOE交叉峰的强度得出质子间距离约束条件。这也是非标记样品所能进行的主要实验。

异核二维实验包括1H-15N HSQC,HMQC,1H-13C HSQC, HMQC,用于标记样品中质子与其他核之间的关联和谱峰识别。在核酸结构研究中,1H-31P HETTOCSY也被广泛采用来作核糖谱峰的识别和序列的顺序识别。

对于较大的蛋白质分子,还需要利用15N或15N/13C标记的样品进行三维实验。这些实验又可大致氛围两类,即利用异核编辑技术的三维实验和三共振实验。前者是利用不同残基中15N和13C核的化学位移的差异,将二维COSY,TOCSY,NOESY谱中重叠在一个平面内的谱峰按照不同的15N和13C化学位移,分别放入不同的平面内,这样就大大地简化了谱图。

这些实验在确定残基的自旋体系和NOE相关峰指定时起着重要作用。三共振实验在标记样品的实验中起着非常重要的作用,这类实验完全利用1H,13C,15N核之间的化学键连接来得到核磁共振相关信号。

与只利用1H-1H耦合常数的实验相比,由于大多数异核之间的耦合常数(1J)都较大,使得它们之间的信号传递较有效;利用异核化学位移使得谱图被大大地简化了;谱图的顺序指认比依赖NOE信号的方法更可靠。所有的三共振实验都是根据信号传递路径来取名的。

2. 4结构计算

利用核磁共振技术确定生物大分子溶液结构的流程如下图所示,其中的约束条件主

要包括由NOE得到的距离约束和由耦合常数得到的二面角约束。计算出的结构的好坏由方均根偏差(RMSD)来衡量。如果所计算的大部分结构都能够收敛,并且满足所有的核磁共振约束条件,同时每一对结构之间的RMSD小于0.2nm,则表明计得到的结构与实际结构是接近的。

RMSD在0.15-0.2nm之间的NMR结构通常缺乏细部结构。而分辨率较高的结构其主干原子的RMSD通常在0.08nm左右,主干原子及一部分侧链重原子的RMSD在0.1nm左右,而包括所有原子的RMSD在0.15nm左右。

从约束条件方面来讲,每个残基只需5个约束条件就可以得到低分辨的结构;而要得到分辨率非常高的结构,如果只靠1H数据,每个残基需要大约15个约束条件。在这种情况下,对于有很好的二级结构的区域,主干原子与平均结构的RMSD只有大约0.05nm。

如果采用15N或13C标记的样品,则可以使更多的1H-1H NOE可以被确认,使每个残基的约束条件增加到20至25之间,得到的结构的精度也大大提高(主干原子的RMSD在0.03-0.05nm之间)。这样,就必须对数百甚至上千个NOE交叉峰进行准确无误的指认。

对于前手性基团(特别是CbH2,以及Val和Leu残基中的(CH3)2CH 基团)的空间特异性指认,是得到高精度结构的关键之一。

3.生物大分子在溶液中的运动

用核磁共振研究生物大分子的优点在于用它不但可以得到分子的结构,还可以研究分子的运动,而正是这种分子运动在生物大分子实现其功能的过程中起着重要的作用。蛋白质不是一个刚性、孤立的分子,要了解其功能,就必须了解其结构、动力学,以及与其他生物分子的相互作用。

因而得到蛋白质的三维结构只是研究蛋白质功能的一个开始,而不是结束。幸运的是,核磁共振技术不只局限于结构确定。许多与核磁共振有关的参数都依赖于时间平均的三维结构和分子内的动力学特性(相对于平均结构的波动)。

有许多专门用于研究分子内运动及分子间相互作用的实验方法,但这些方法是多种多样的,必须与所研究的现象的时间尺度想适应。例如,要研究蛋白质-多肽相互作用,在快交换的情况下,可以用转移NOE实验,而在慢交换的情况下,则用w1-滤波的NOESY实验。

核磁共振的时间尺度由核进动频率确定,发生在这样的时间尺度内的分子运动或动力学过程直接反映在化学位移(d),耦合常数(J),和弛豫时间(T1和T2)上。对溶液中的分子,在许多情形下,核自旋会在两个或更多的不同环境之间可逆地交换。

这种交换可以反映分子构象的柔性,化学反应,分子间复合物的形成,或其它事件的发生。根据交换过程的不同本质,采用不同的核磁共振参数来描述发生交换的环境的特征(化学位移,耦合常数,弛豫时间)。

如果检测的参数为化学位移,则对于在两个不同的环境A和B之间交换的体系而言,其在A和B的化学位移分别用dA和dB来描述。那么当交换速率k£|dA -dB |时,这种交换叫做慢交换;当k»|dA -dB |时,叫做中等速率交换;k³|dA -dB |时,叫做快交换。对其它的参数,也可以得到类似的表达式,而且都可以用寿期(lifetime)t来表达,t=1/ k。

对于蛋白质或核酸与配体相互作用的体系,可以通过一系列的核磁共振实验,由大分子或配体的化学位移在不同浓度比例下的变化得到体系的解离常数Kd。

对于大分子的分子内运动,一般采用标记(15N或13C)样品来检测其主干或侧链的15N或13C原子的弛豫时间(T1,T2)和NOE。根据不同残基的弛豫时间和NOE的大小,可以判断出分子内各部分以及侧链的刚柔程度。

再进一步利用分子运动模型(通常采用“Model Free”模型)进行拟合计算,可以得到与分子整体运动有关的相关时间tm和与分子内部运动有关的相关时间tc,以及描述分子刚性的参数S2。

参考文献

1. K. Wuthrich(1986), NMR of Proteins and Nucleic Acids, New York: Wiley.

2. J. Cavanagh, W. J. Fairbrother, A. G. Palmer and N. J. Skelton(1995), Protein NMR Spectroscopy, Principles and Practice, San Diego: Academic Press.

3. G. Wider(2000), Structure determination of biological macromolecules in solution using NMR spectroscopy. Biotechniques. 29(6):1278-82, 1284-90.

4. P. Guntert (1998) Structural calculation of biological macromolecules from NMR data. Q Rev Biophys. 31(2):145-237.

5. S. K. Burley(2000) An overview of structural genomics. Nat Struct Biol, 7(11): 932 – 934.

G. T. Montelione et al.(2000) Protein NMR spectroscopy in structural genomics. Nat Struct Biol, 7(11): 982 – 985.

扫码关注「实验菌」,入科研社群,领学习资源

更有优质直播、研选好物、福利活动等你来!

查看全部

来源:丁香园论坛

扫码关注「实验菌」,入科研社群,领学习资源

更有优质直播、研选好物、福利活动等你来!

知道了