福建水产设备联盟

GMX模拟多肽-蛋白相互作用(一)

分子模拟之道 2021-08-13 13:52:54

  • 原始文档: Molecular Modeling Practical 1; Molecular Modeling Practical 2

  • 补充文档: Tsjerk A. Wassenaar, Molecular Dynamics Hands-on Session I Session II

  • 参考译文: 淮海一粟, GROMACS教程, GROMACS教程II-MD结果分析; 刘恒江, GROMACS教程整理 I GROMACS教程整理 II

  • 2017-10-20 19:54:51 翻译整理: 李继存

  • 本教程用于引导学生运行足球直播免费高清无插件直播的分子动力学(MD)模拟. 如果待研究蛋白不包含非标准氨基酸残基, 教程所用的流程可作为研究蛋白的一个良好起点. 完成本教程后, 学生应该能够知晓设置和运行模拟所涉及的步骤, 以及在不同模拟阶段应如何选择. 此外, 学生还应该知道如何对模拟结果进行核查以保证模拟质量, 并了解可以使用哪些分析方法, 哪些分析方法更适合自己的需要.

    第一部分 准备工作

    1. 简介及大纲

    本教程的目的在于考察一段小肽结合到其蛋白受体时, 生物分子相互识别的两种机理—构象选择以及诱导匹配—所具有的不同贡献. 完成本教程后, 学生应该能够:

  • 使用GROMACS设置和运行蛋白的MD模拟.

  • 对模拟结果进行质量核查并分析

  • 对从多肽的不同构象开始的不同模拟, 比较结果

  • 对手头的体系能够得出一些理论上的考虑

  • 大多数教程都是使用终端或控制台应用程序完成的, 因为我们用于准备和进行模拟的程序没有图形化界面. 为了便于了解这种新的运行环境, 我们准备了一份简单的帮助文档, 以便让你熟悉在Linux环境下”生存”所需的基本命令. 点击这里下载此文件.

    Linux下的所有命令都需要小心输入, 因为shell(负责解析命令的程序)是区分大小写的. 另一经常发生的错误是将数字0当成了大写字母O, 小写字母l当成了数字1, 或者反过来. 你可以简单地复制粘贴这些命令: 先使用鼠标选中它们, 然后在需要输入的地方按下鼠标中键(Linux模式, Windows下未必可行). 首先来试试下面的命令:

    whoami 

    这会列出你的当前用户名. 请确保你不是以root用户登录.

    ls -l

    上面的命令列出当前工作目录下的所有文件和文件夹. 当遇到file not found之类的错误时, 可以使用这个命令来检查.

    pwd 

    这个命令给出当前目录的完整路径.

    cd Desktop

    此命令展示了如何更换目录.

    2. 蛋白-多肽相互作用

    在决定细胞命运的大量蛋白-蛋白相互作用中, 多肽起着关键作用, 并占了大约40%的比例. 从辅激活剂到抑制剂, 它们在许多信号和识别途径中都有涉及, 并且已经被证实与大量蛋白结构域存在相互作用, 例如, MHC, SH3和PDZ结构域就是由于其多肽亲和能力而知名. 由于功能的多样性以及间接参与的许多生物途径的重要性, 使得多它们与许多疾病相联系. 药物设计中的一个领域就专门研究多肽并用于治疗各种疾病. 与小分子抑制剂相比, 多肽的优点在于可以模拟蛋白结合的结构域, 并且自身足够大能竞争性地抑制蛋白蛋白相互作用. 许多药物先导分子就包含抗菌多肽.

    尽管科学家们收集了蛋白多肽相互作用的大量数据, 确定它们形成的复合物的结构仍然是个挑战. 这主要源于两个障碍, 多肽柔性极高, 并且与其底物的相互作用很弱,  这突出了它们在信号传导或调节中的重要性, 因为这些功能通常依赖于瞬态过程. 这些障碍使得实验结构测定并不简单, 需要借助额外的计算方法如生物分子对接才能完成. 从建模的角度看, 常规的用于蛋白-配体或者蛋白-蛋白对接的算法也经常受到柔性问题的困扰.

    解决柔性问题的一个途径是进行分子动力学模拟, 对多肽的构象空间进行采样, 收集具有代表性的构象, 并用于预测它们与蛋白受体的相互作用.

    3. 生物分子的识别机理

    上个世纪人们提出了一些理论来解释分子的识别过程. 在这些理论中, 构象选择诱导匹配 机理在过去的50年中得到了大致相同多的支持. 构象选择假定, 在配体不存在的情况下, 蛋白处于多种离散构象状态的平衡中, 其中包括倾向与配体结合的那个构象. 这一概念与诱导匹配理论相反, 后一理论起初引入用于描述酶的活性, 认为构象匹配是由与底物的结合导致的.

    在本教程中, 我们要考察这一两难问题—诱导匹配和/或构象选择, 方法是使用不同初始构象的分子动力学模拟对多肽的构象空间进行采样. 我们将不同的轨迹与实验确定的多肽在与其蛋白受体形成的复合物中的构象(结合构象)进行比较, 并检查这一构象在MD过程中是否出现, 这样就能验证构象选择理论.

    4. 分子动力学

    经典分子动力学模拟从定义好的构型开始, 使用牛顿运动方程来计算粒子的轨迹. 对于体系中的每一粒子, 所受的合力根据它与其他粒子的相互作用来计算, 这些相互作用以力场进行描述. 力除以粒子的质量为加速度, 再加上粒子以前的位置和速度, 就决定了一小段时间步长之后粒子的新位置. 高的时间和空间分辨率使得MD模拟在测试基于实验数据的模型, 理解功能背后的原理并形成新的假说时非常有用. 不幸的是, 模拟体系的大小以及时间尺度存在限制.

    GROMACS

    本教程使用GROMACS进行MD模拟和分析, 它是一个可以免费获取程序包, 遵循GNU GPL(General Public License). GROMACS程序只有命令行界面, 这意味着每一步运行都要键入程序的名称及其选项. 注意命令是区分大小写的, 每一命令键入时都必须精确地与教程一致, 关于GROMACS的更多信息以及手册请见其官方网站. (提示: MPI并行版本的GROMACS可以在多个节点(集群中的机器)上分配任务从而提高性能, 对单机而言MPI并不能提高性能, 因为GROMACS可以自动使用单个机器的多个核心)

    LINUX

    由于程序只有命令行界面, 因此我们必须使用终端. 尽管在Windows环境下借助DOS终端也可以运行GROMACS, 使用Linux有一些优点, 这也是本教程的选择. 对一些学生来说, 从Windows转到Linux或许会感到别扭, 因为他们已经更习惯了Windows提供的界面. 重要的一点是记住, Linux并非Windows的免费克隆品, 而是一个功能强大, 高度可定制化的操作系统, 能够使你的计算机发挥更大的威力. 从Windowa转到Linux有时会被描述成摩托车换汽车. 开始使用Linux终端时, 需要知道一些最基本的命令(ls, cd, mkdir, cp, mv, rm, more). 更多信息请查看这里和这里, 也可以参考上面提供的帮助文档.

    系统准备

    默认情况下, 你的系统已经正确设置好了.

    你可以使用gmx luck命令测试GROMACS是否正确安装. 幸运的话, 你会得到一句引言. 这说明你的GROMACS已经正确安装好了.

    gmx luck

    5. 浏览蛋白数据库

    在进行其他操作之前, 必须要获得初始结构. 结合构象可以从蛋白数据库获取, 它是一个蛋白三维结构的数据仓库, 根据每个蛋白的登记号(如1klu)搜索蛋白(提示: 你可以使用命令下载文件: wget http://www.rcsb.org/pdb/files/1klu.pdb).

    蛋白数据库的页面, 除了提供结构的坐标文件(pdb文件)外, 也包含了分子体系的一些有用信息, 如所有分子的一级序列, 二级结构的指认, 长度, 生物功能等. 花些时间来浏览页面, 收集待研究分子的尽可能多的信息.

    为开始教程, 根据多肽的PDB号下载相应的结构, 并记下下列信息:

  • 确定结构的实验方法及其分辨率

  • 多肽的链标识

  • 多肽的一级结构(氨基酸序列)

  • 多肽的来源: 天然蛋白还是大蛋白的一部分?

  • 6. 查看初始结构

    首先使用分子查看软件来看看分子的结构, 我们建议使用PyMOL. 可使用下面的PyMOL命令来载入结构

    PyMOL 1klu.pdb

    执行上面的命令后, PyMOL会启动, 在一个窗口中使用线形模式来显示分子, 并在主窗口的右面列出各个对象, 这些对象可以通过点击其名称来移除. 每个对象名称的后面是菜单, 用于更改显示模式. 试着使用卡通模式来显示结构. 对那些习惯使用键盘的人(我们强烈建议你也使用这种方式), 可以通过在窗口中键入下面的命令来达到目的

    show cartoon

    使用上一步骤中收集到的信息, 通过键入下面的命令来选择包含多肽的pdb链

    select sel_peptide, chain X

    然后抽取多肽链保存到另一个对象

    extract peptide, sel_peptide

    计算并显示蛋白的溶剂可及表面

    as surface, 1klu

    对蛋白表面和多肽使用两种可区分的颜色进行着色

    color white, 1klu
    color tv_blue, peptide

    选择处于多肽5埃之内的所有蛋白残基进行着色, 这构成了蛋白-多肽的界面

    select interface, byres( 1klu within 5A of peptide )
    color red, interface

    如果对显示结果满意, 你可以进一步使用ray命令改善显示结果, 并使用png filename命令保存图片.

    bg_color white
    set opaque_background, off
    ray 1000
    png my_pretty_peptide.png

    使用下面的命令记下在PyMOL中显示的结合多肽的氨基酸序列

    set seq_view, on

    比较PyMOL显示的序列和蛋白数据库给出的序列, 二者是否相同? 为什么?

    7. 获取初始结构

    PyMOL也可以用于生成多肽的初始构象. 默认情况下, 你可以使用Build菜单, 选择构象和需要增加的残基. 此外, 我们提供了一个脚本build_seq, 可以对给定的氨基酸序列生成相应的理想构象. 这个脚本可能很有用, 因为对于一些多肽构象, 如聚脯氨酸II, PyMOL并不知道所需要的phi/psi角度组合. 你可以通过在窗口中键入下面的命令来获知如何使用这个脚本

    help build_seq

    使用这个脚本生成多肽的三个不同构象, 我们在教程中要使用它们, 所以要给它们指定不同的名字, 将下面命令中的XXXXXX替换为结合多肽的序列(PyMOL中有显示)

    build_seq peptide_helix, XXXXXX, helix
    build_seq peptide_extended, XXXXXX, beta
    build_seq peptide_polyproline, XXXXXX, polypro

    使用卡通模式显示新创建的多肽

    show cartoon, peptide_*

    使用align命令在空间中对齐并叠合不同的构象, 查看它们的差异程度有多大

    align peptide_helix, peptide
    align peptide_extended, peptide
    align peptide_polyproline, peptide

    对齐与叠合计算会返回原子位置的根均方偏差(RMSD), 它定量地表征了不同构象的结构异同. 请记下每个align命令给出的RMSD值.

    最后, 使用save命令保存构象, 类似下面保存螺旋多肽的命令

    save helical_peptide.pdb, peptide_helix

    得到的pdb文件可以用于开始准备模拟.

    现在使用命令quit退出PyMOL. 正如你注意到的, 绘制结构必需的所有信息都保存在.pdb文件中. 你可以使用gedit来查看pdb文件, 并试着理解这种文件格式.

    pdb文件包含了很多涉及蛋白, 用于确定结构的实验方法和条件等的信息. PDB数据库网页实际就是将这些信息展示给你的. pdb文件中也包含了每一个原子的直角坐标. 注意, pdb文件中一般不包含成键连接信息, 而PyMOL像大多数分子查看软件一样绘制了原子之间的成键, 这些成键是自动根据原子间的距离来确定的.

    结合态多肽的pdb文件和你自己使用build_seq生成的有什么不同(如氢原子)?

    8. 准备

    为你的结构创建一个目录. 由于最后需要将结果合并起来, 最好通过组合PDB标识(如peptide_bound, peptide_helix等)和个人标识指定明确且唯一的目录名称. 将结构文件复制到目录中并切换目录. 举例来说,

    mkdir peptide_bound
    cp bound_peptide.pdb peptide_bound/
    cd peptide_bound/

    现在开始真正的MD部分. 记住在每一步都要指定正确的文件名. 特别注意, 教程简单地使用protein.pdbprotein-EM-solvated.gro作为通用名称, 这些通用名称应该替换为待研究蛋白的名称(如bound_peptide.pdbbound_peptide-EM-solvated.gro).

    请仔细阅读教程, 并检查在每一步是否成功完成. 请细心阅读程序输出!!! 如果程序给出错误信息, 这些信息通常是自明, 容易理解. 检查文件类型和程序输出以理解每一步的过程. 大多数文件是可读的, 除了扩展名为.tpr, .xtc, .trr.edr的文件.

    待续......