DNA 进行转录,细胞进行分裂调控,复杂生物体有着高级功能,几乎所有生物功能都依靠不同蛋白质相互作用。
然而在分子层面,这些功能是怎样协调运作的呢?蛋白质之间(无论是与其他蛋白质还是自身拷贝)的相互作用机制又是什么呢?这些方面仍然存在很多未知。
最新研究有了发现,哪怕是极为微小的蛋白质片段,都蕴含着极为巨大的功能潜力。虽然这些片段只是不完整的,但短链的氨基酸依然能够与靶蛋白相结合,还能模拟天然的相互作用过程。
这一过程能让蛋白质片段改变靶蛋白的功能,也能干扰靶蛋白与其他蛋白质的相互作用。所以,蛋白质片段不但对深入研究蛋白质相互作用和细胞过程有帮助,而且在治疗领域有潜在应用价值。
近期,麻省理工学院生物学系的科学家研发出了一种新办法。这种办法是基于现有的 AI 模型,通过计算进行预测,能够找到与大肠杆菌中全长蛋白质结合且能抑制其功能的蛋白质片段。他们觉得,从理论上来说,利用这个工具有望研发出针对任何蛋白质的遗传编码抑制剂。
目前,这篇研究论文已在 PNAS 上发表。麻省理工学院生物学副教授、霍华德·休斯医学研究所研究员 Gene-Wei Li 与生物工程教授兼系主任 Amy Keating 一同主导完成了该研究工作。
借助 AlphaFold 开发而来
近年来,AlphaFold 在生物学领域取得了诸多突破。它能够精确地预测蛋白质折叠,也能够预测蛋白质相互作用。此次,研究团队开发了一种名为“FragFold”的计算方法,该方法也是基于 AlphaFold 的。
在这项新研究里,他们借助 AlphaFold 去对蛋白质片段抑制剂进行预测,这是一个全新的应用方向。研究人员经过实验验证,即便在没有相互作用机制结构数据的状况下,FragFold 对结合或抑制作用的预测准确率依然能超过 50%。
我们的研究结果显示,这是一种具有通用性的方法,能够找出可能抑制蛋白质功能的结合模式,其中包括针对全新的蛋白质靶点。这些预测结果可以作为进一步开展实验的起始点。此外,我们甚至能够将其运用到功能未知、相互作用未知以及结构未知的蛋白质上。该论文的共同第一作者兼通讯作者 Andrew Savinov 作出了上述表示。
以 FtsZ 蛋白为例,它在细胞分裂过程中起着重要作用。它早已被广泛研究,然而,它包含一段天然无序区域,这使得针对它的研究特别具有挑战性。
毕竟,无序蛋白质的结构会动态变化。其功能性相互作用通常非常短暂。所以,现有的结构生物学工具难以捕捉到单一的结构或相互作用。
在这项研究里,他们借助 FragFold 去探究 FtsZ 片段,这些片段包含来自天然无序区域的那些片段,他们识别出了与多种其他蛋白质的新结合相互作用。
这一成果证实了此前对 FtsZ 生物活性的实验测量,还拓展了此前的测量。更重要的是,这一成果是在未解析无序区域结构的情况下完成的,此成果展现了 FragFold 的潜力。
这是一个典型案例,AlphaFold 从根本上改变了我们研究分子和细胞生物学的方式。Amy Keating 评价说,像 FragFold 这样对 AI 方法的创造性应用,为我们开拓了意想不到的功能,也开拓了全新的研究方向。
抑制作用及其他应用
研究人员运用这种计算方法把每个蛋白质划分成片段,接着模拟这些片段与相关交互对象的结合情形,以此实现了这些预测。
他们将整个序列的预测结合图谱。同时,将这些片段在活细胞中的影响与之进行对比。后者是通过高通量实验测量确定的,在该实验中,数百万个细胞各自产生一种类型的蛋白质片段。
AlphaFold 一般会借助共进化信息来进行折叠预测,并且在每次预测过程中,会通过多重序列比对(MSA)来评估蛋白质的进化。虽然 MSA 有着极为关键的作用,然而它却是大规模预测的一个瓶颈,原因是它需要消耗大量的时间和计算资源。
研究人员将对 FragFold 进行这样的操作:预先计算一次全长蛋白质的 MSA,然后利用该计算结果来指导对该全长蛋白质每个片段的预测。
研究人员除了对 FtsZ 进行研究外,还预测了多种蛋白质的抑制片段。他们所研究的相互作用包含了脂多糖转运蛋白 LptF 与 LptG 之间形成的复合物。
实验发现,LptG 的蛋白质片段有抑制这一相互作用的能力。它可能会对脂多糖的递送造成干扰。脂多糖是大肠杆菌外细胞膜的关键成分,对细胞健康有着至关重要的作用。
令人惊喜的是,我们的预测准确率很高,并且能够预测出与抑制相对应的结合情况。对于我们研究的每一种蛋白质,都成功地找到了抑制剂。Andrew Savinov 表示。
他们起初聚焦于蛋白质片段的抑制功能。因为检测片段能否阻断细胞基本功能,这种方式相对简单,是一种系统测量方式。
接下来,团队计划深入探索除抑制功能之外的蛋白质片段的作用。比如使其稳定结合蛋白质,对其功能进行增强或改变,还有触发蛋白质的降解等。
设计原理
这项研究为系统理解细胞设计原则奠定了基础,并且有助于探索深度学习模型能够利用哪些元素来做出准确预测。
Andrew Savinov 表示:“我们在向更广泛且更长远的目标前行。既然能够进行预测,那我们能否从预测以及实验数据里提取出关键特征呢?进而能否弄清楚 AlphaFold 对于有效抑制剂的判断依据呢?”
他们深入探索了蛋白质片段的结合方式,也探索了其他蛋白质的相互作用。并且通过改变特定残基,来观察这些变化对片段与靶点相互作用的影响。
研究人员通过名为“深度突变扫描”的方法,对细胞内数千个突变片段的行为进行了实验检查。他们发现了负责抑制的关键氨基酸。在某些情况下,突变后的片段的抑制效果比天然全长序列的还要好。
我们以往的方法有所不同,现在不再仅仅局限于从实验结构数据里去识别片段。Sebastian Swanson 指出,这项研究有其核心优势。高通量实验抑制数据与预测结构模型能够相互配合。实验数据可以帮助我们筛选出特别有研究价值的片段。FragFold 预测的结构模型能为片段在分子层面的功能提供具体且可验证的假设。
展望未来,研究团队对 FragFold 的广泛应用满怀期待。创建紧凑且可遗传编码的结合物,这是 FragFold 所做到的,它为调控蛋白质功能提供了很大的空间。我们可以想象,借助功能化片段去修饰天然蛋白质,对其亚细胞定位进行改变,甚至进行重新编程,这样就能开发出用于研究细胞生物学和治疗疾病的新工具。” Gene-Wei Li 总结道。