2023·生物医药
生物医学专题
CADD、蛋白质抗体设计、多组学
仅使用一种数据类型来理解疾病的某种现象是远远不够的。 随着高通量测序和多组学的快速发展,生物医学研究开始采用多组学技术的结合。 机器学习作为一种从数据中学习的算法,可以综合分析来自不同组学来源(如基因组学、转录组学、蛋白质组学和代谢组学)的数据,并开发个体多样性的多因素预测模型。 ,证明了预测可能存在的治疗方法的有效性。
天然蛋白质的特点是临界稳定性。 然而,关键的稳定性使得蛋白质在受到压力后容易发生错误折叠和功能丧失。 因此,优化蛋白质稳定性是科学研究和工程应用领域需要解决的关键问题。
Rosetta 是一种生物物理建模工具,可以根据氨基酸序列有效预测蛋白质的结构。 在此基础上,可以从头开始设计各种类型的新蛋白质。 基于Rosetta系列算法的蛋白质设计近十年来广泛应用于创新蛋白质药物、抗体、疫苗、合成生物新成分、纳米药物等生物大分子研究领域。
针对新老客户的培训需求,特举办“机器学习集成多组学、Rosetta蛋白抗体设计、计算机辅助药物设计”系列专题培训课程。 本次培训主办方为北京软研国际信息技术研究院,承办方为互动(北京)教育科技有限公司,现将具体相关事项通知如下:
课程目录
2023·课程目录
主题1
(线上直播)
(点击上方名称可查看大纲详情)
2023年5月19日-5月21日
2023年5月26日-5月28日
主题2
(北京线下)
(点击上方名称可查看大纲详情)
2023年5月12日-5月14日
(第一天报到,教学2天)
主题3
(线上直播)
(点击上方名称可查看大纲详情)
2023年5月19日-5月21日
2023年5月26日-5月28日
课程特色
2023·课程特色
1.本系列课程共有三个主题。 主题一、三采用腾讯会议在线直播的形式,课后提供无限视频播放。 课题二采用北京线下教学的形式,面对面教学,与老师及时沟通。 所有专题都建立了永不解散的课程群,长期互动问答。 完成课程后,学生可以继续与专业老师和同学交流问题,巩固学习内容,从而更好地满足学生对论文和实际科研工作的不同需求;
2.专题一课程采用基础入门+高级实例练习的教学思路,从初学者和应用研究的角度出发,带领您进行多维度机器学习的数据处理、预测模型和生物学意义阐述的实际练习。 -组学综合分析。 ,帮助大家掌握多种机器学习算法模型的构建以及多组学联合分析在肿瘤和慢性疾病中的实际应用,介绍当前深度学习算法高维组学数据处理和生物网络挖掘的前沿方法,最后以论文再次出现教授单细胞组学论文中常见的图表制作、细胞差异分析、细胞注释(自动和手动)、蛋白质-蛋白质相互作用网络构建和可视化,帮助研究创新的机器学习算法来解决生物学和临床疾病问题。 和需求。
3、第二专题课程基于Rosetta软件,以实例教学和练习为主。 Rosetta软件基础知识、蛋白质结构查看器、结构扰动和结构优化、蛋白质复合物预测、抗体抗原模型处理和对接、SSD和MSD设计、CartisenDDG突变扫描、Rosettascript开发流程、序列和结构设计、从头蛋白质设计、等按顺序教授。 操作等诸多内容。
4、三大专题课程带您一步一步学习蛋白质结构分析、同源建模、虚拟筛选、分子对接(半柔性、柔性对接、蛋白质-蛋白质、蛋白质-多肽、酶蛋白质-配体、核酸-小分子、共价对接)、药效团模型、定量构效关系、碎片化药物设计、Gromacs分子动力学模拟与结果分析,并注重实例讲解和练习,达到即时学习和使用效果,帮助学生系统掌握计算机-辅助药物设计技术协助学术研究;
讲师简介
2023·讲师简介
多组学课题讲师:教育部直属全国重点大学、国家“双一流”A类、“985”、“211”重点建设大学副教授、硕士生导师主讲。 中国科学院院士团队骨干成员,美国排名前50大学博士、博士后。 近五年发表SCI论文10余篇。 主持和参与多项国家、省部级自然科学基金项目,拥有多年生物医学数据挖掘结合人工智能算法研究经验。 主要擅长肿瘤等疾病机理研究中的多组学联合分析以及生物多组学算法开发。
Rosetta特聘讲师:国家双一流、985大学特聘研究员、博士生导师授课。 近五年发表SCI研究论文20余篇,并荣获国际生物设计研究大会奖项。 主持多项国家自然科学基金、科技部重点研发计划蛋白质设计相关项目。 主要擅长分子设计和分子模拟方法研究。
CADD特约讲师:由国家重点大学、国家“双一流”、“211工程”重点医科大学副教授、硕士生导师授课。 发表SCI研究论文20余篇,主持和参与多项国家、省部级自然科学基金项目。 拥有多年新药分子设计开发经验,主要擅长CADD、AIDD等药物设计方法研究。
增值服务
2023·增值服务
1、所有注册学员随课附赠所学科目预习培训书(或电子版)教材及电子教材;
2、所有注册学员将收到课程相关Windows版软件安装说明(有效期一年);
3、报名专题1课程即可免费获得上期专题课程《代谢组学与网络药理学研究技术与实践》的免费重播
4.报名专题三即可免费重播上期专题课程《GROMACS分子动力学蛋白质模拟、药物开发溶剂筛选》
5. 在线课程:课后将提供本次报名时所学在线专题的视频无限播放;
6、价格折扣:(折扣活动最终解释权归主办方所有)
1)早鸟优惠:2023年5月14日之前注册并支付所有特色课程,即享200元优惠
2)同一人报读两门及以上特色课程可享受额外优惠(详情请咨询招生联系人)
7、学生提出的问题可以在课程结束后得到老师长时间的解答和指导;
8、参加培训并通过考试的学员可获得:北京软研国际信息技术研究院颁发的《计算机辅助药物设计应用工程师》、《药物研发中从头蛋白抗体设计及应用工程师》培训中心《机器学习多组学与生物医学应用工程师》专业技能结业证书;
课程大纲
2023·教学大纲
主题 1:将多组学机器学习集成到
生物医学应用主题
基础课程大纲
机器学习和生物组学基础知识
免费预览视频
学习目标:介绍机器学习的基本概念,让大家对机器学习的基本概念有一个大致的了解。明确机器学习方法的适用性、优点和局限性
Ø什么是机器学习
Ø 机器学习应用实例
Ø 生物学概论(基因组学、转录组学、蛋白质组学、代谢组学)
Ø 机器学习在多组学数据分析中的应用
蟒蛇基础知识
免费预览视频
学习目标:机器学习的主流实现是python语言。在学习机器学习之前,需要系统的学习python以及基础的数据处理,以方便以后机器学习的学习。
Ø Python安装及开发环境搭建
Ø基本数据类型、组合数据类型
Ø 机器学习在多组学数据分析中的应用
Ø 函数、列表、元组、字典、集合
Ø 控制结构、循环结构
Ø Numpy模块——矩阵的科学计算
Ø Matplotlib模块-数据处理与绘图
Ø Pandas模块-csv数据处理与分析
Ø Sklearn模块——机器学习模型基础软件包调用
案例实践教学一:使用Python pandas读取omics CSV数据并进行数据读取、转换、保存等。
生物组学大数据预处理和探索性分析
学习目标:在对高维组学数据进行统计分析和机器学习建模之前,需要对数据进行预处理,例如缺失值填充、降维可视化等。大数据预处理和探索性分析是为了测试数据质量并理解数据。 分配的必要过程。
Ø 高维组学数据预处理框架
Ø 常用的数据预处理方法:缺失值填充、标准化、归一化、对数变换
Ø 常用的降维方法,PCA、tSNE等
Ø 数据探索分析(EDA)
案例实践教学二:使用Python读取组学CSV数据并进行数据探索和可视化分析(探索性数据分析,EDA)
经典机器学习模型和多组学应用
学习目标:介绍多组学综合分析中最常用的几种机器学习模型,总结其优缺点和适用范围r软件在聚类分析,通过动手实践快速掌握几种方法
Ø 线性模型(线性回归、梯度下降、正则化、回归的评价指标)
Ø 决策树(决策树原理、ID3算法、C4.5算法、CART算法)
Ø 支持向量机(线性支持向量机、可分离、不可分离支持向量机)
Ø 集成学习(AdaBoost与GBDT算法、XGBoost算法、LightGBM算法)
Ø 模型选择和性能优化(数据清洗、特征工程、数据建模)
Ø Scikit-learn机器学习库的使用
案例实践教学三:基于转录组数据的端到端机器学习项目泛癌预测(数据预处理、数据建模、模型评估)
案例实践教学四:基于蛋白质组学-代谢组学发现COVID-19生物标志物
深度学习在组学数据中的应用
(介绍与实践)
高级课程大纲
多组学联合分析阐明疾病分子机制(入门和实用)
学习目标:从常见的多组学联合分析策略,如转录组+代谢组、蛋白质组+代谢组等入手,介绍常用的数理统计分析方法,进而学习如何利用KEGG等数据库丰富生物学功能。 集合分析,结合机器学习方法进行生物标志物挖掘、疾病预测、生物分子作用机制等。
Ø 常用的生物实验和分析方法,如转录组学、代谢组学等
Ø 常用组学数据库介绍,如TCGA、PathBank、HMDB、KEGG
Ø Python批量处理组学数据——归一化处理、差异分析、相关性分析
Ø 生物功能分析:GO功能分析、代谢途径富集、分子相互作用等。
Ø 基于转录组学的差异基因筛选及疾病预测
Ø 基于差异基因和结合代谢组学分析疾病的分子机制
Ø 组学数据可视化,如火山图、t-SNE降维、代谢通路网络分析
Ø 组学特征(基因、蛋白质、代谢物)的选择(随机森林分析)
Ø 单细胞转录组数据分析及可视化分析
案例实践教学三:(包括以下内容)
胃癌转录组+代谢组多组学分析
从海量数据中筛选关键基因、代谢物及代谢途径
深入分析胃癌肿瘤标志物,解读肿瘤发生发展的复杂性和全案
高级深度学习神经网络(介绍与实践)
学习目标:学习卷积神经网络、循环神经网络、注意力机制、自编码器、图神经网络等前沿神经网络在生物组学和药物筛选中的应用、迁移学习应用等。
Ø 卷积神经网络基础与应用(放射组学)
Ø 循环神经网络基础及其应用(蛋白质组学)
Ø注意力机制基础及其应用
Ø 自动编码器基础知识及其应用(转录组学)
Ø 图神经网络基础及其应用(代谢组学)
Ø 迁移学习、深度学习框架——Transformer的应用
案例实践教学四:基于(变分)自编码器生成药物/代谢物分子
深度学习在组学数据药物发现中的应用(介绍与实践)
学习目标:根据基因表达特征建立疾病与小分子药物之间的关系,并利用转录组学、蛋白质组学和机器学习算法对药物进行重新定位。
Ø 基于生物组学的药物发现基础介绍
Ø 药物分子化学特征提取(分子指纹、描述符、分子图谱)
Ø 图神经网络预测药物分子特性
Ø 基于胰腺癌差异表达基因的药物重新定位
案例实践教学五:基于机器学习和图神经网络预测代谢物/药物分子的性质
人工智能+科学
学习目标:人工智能领域的前沿内容,让大家了解多组学和机器学习领域的最新研究动态,同时介绍几种更先进的机器学习算法。
Ø 集成学习在多组学数据联合分析中的应用
Ø 生物信息网络中多组学数据库的挖掘及应用
Ø 生成模型在多组学数据中的应用和挑战
Ø 先进的图神经网络,疾病-基因-蛋白质-代谢物关联网络中的链接预测应用
案例实践教学六:基于生成模型的单细胞转录组数据深度特征提取研究
经典案例论文研究(论文图表再现)
学习目标:通过学习经典多组学研究的SCI论文的研究思路,系统学习多组学研究的论文图表制作,以单细胞组学研究为例进行论文思路、方法探讨、图表研究生产。
论文转载一:单细胞组学论文的常用图表制作、细胞差异分析、细胞注释(自动和手动)
论文再现二:蛋白质-蛋白质相互作用网络构建及可视化再现。
主题2 Rosetta de novo蛋白抗体设计、结构优化及其在药物研发中的应用
第一天
时间
课程内容
早晨
教学目标:了解本方向的内容、理论基础、研究意义。
1. 从蛋白质折叠到蛋白质设计
1. 蛋白质折叠和结构预测简介
1.1 主链二面角和二级结构
1.2 侧链堆叠和三级结构
2. 蛋白质设计简介
蛋白质设计的分类及应用
教学目标:能够使用vim编辑器简单编辑文件,能够使用PyMOL或ChimeraX查看蛋白质结构。
2. 罗塞塔基础知识
3. 蛋白质结构查看器、Linux 和 Python 基础知识
3.姿势/移动/
得分函数
4.LINUX入门命令
4.1 用户组及权限目录文件属性
4.2 LINUX基本命令环境变量
4.3 常用shell命令练习
4.4 康达简介
下午
教学目标:了解Rosetta打包应用程序(以relax为例)和Rosettascript编写的应用程序(以pack/min/pack为例)
4 结构扰动与结构优化
5. 序列设计
PackRotamer 和 FastDesign
5. 最小移动器,MC移动器,
快速放松移动器
5.1 移动图
6. Rosettascript的组成和元素
6.1 过滤残基选择器
任务操作
6.2 DSSP/二硫化移动器
第二天
早晨
教学目标:了解蛋白质复合物基于序列和结构的预测方法。
6. 蛋白质-蛋白质对接的基础知识
7. 平移和旋转移动装置
7.1 低分辨率全局搜索
7.2 高分辨率微调
7.3 折叠树
教学目标:熟悉抗体模型预处理流程,掌握RAbD常用命令
7. 抗体设计
8. 抗体结构文件的处理
8.1 PyIg分类
8.2 抗体-抗原对接模型
8.3 CDR区域优化
8.4 框架区域优化
案例实践:
SSD 和 MSD 设计任务
下午
教学目标:熟悉Rosettascript开发流程,了解序列和结构设计原理,完成蛋白质从头设计的操作练习。
8.CartisenDDG突变扫描
9.Rosettascript应用程序
9 序列和结构设计
9.1 输入和输出标志控制输入和输出
9.2 CleanAtom结构预处理
9.3ROSETTACLASH.LOG 和 RosettaCommons
9.4 ResFile及其他辅助文件
9.5 小变化、中等变化和大变化
9.6 练习回答问题
案例实践:
Ø FastDesign设计任务
部分案例图解:
向下滚动查看
主题三:CADD蛋白结构分析、虚拟筛选与分子对接
第一天早上
课程名称
课程内容
生物分子相互作用的基础知识
1.生物分子相互作用的研究方法
1.1 蛋白质-小分子和蛋白质-蛋白质相互作用的原理
1.2 分子对接研究生物分子相互作用
1.3 蛋白质-蛋白质对接研究分子相互作用
蛋白质数据库
1.PDB数据库简介
1.1 PDB蛋白数据库功能
1.2 PDB蛋白数据可用资源
1.3 PDB蛋白数据库对药物研发的重要性
2、PDB数据库的使用
2.1 目标蛋白结构类型、数据解读及下载
2.2 下载目标蛋白结构序列
2.3 目标蛋白背景分析
2.4 相关数据资源获取方式
2.4 蛋白质晶体结构批量下载
第一天下午
蛋白质结构分析
1.Pymol软件介绍
1.1 软件安装及初始设置 1.2 基础知识介绍(如氢键等)
2.使用Pymol软件
2.1 蛋白质小分子相互作用图示
2.2 蛋白质-蛋白质相互作用的说明
2.3 蛋白质和小分子的表面图像和静电势表示
2.4 蛋白质与小分子结构的叠加比较
2.5 绘制相互作用力
2.6 Pymol动画制作
示例解释和练习:
(1)尼罗替尼与靶点的相互作用,列出相互作用的氨基酸,并导出结合模式图
(2)制作组合口袋的曲面图
(3) Bcr/Abl靶标的PDB结构叠加
(4) 创建蛋白质相互作用动画
(5) 为 ACE2 和 COVID-19 Spike 的蛋白质晶体复合物创建蛋白质-蛋白质相互作用
第二天早上
同源建模
1.同源建模原理介绍
1.1 同源建模的功能及使用场景
1.2 同源建模方法
2、Swiss-Model同源建模;
2.1 寻找同源蛋白(blast等方法)
2.2 蛋白质序列比对
2.3 蛋白质模板选择
2.4 蛋白质模型构建
2.5 模型评估(蛋白质拉曼图像)
2.6 蛋白质模型优化
示例讲解及练习:使用2019-nCoV刺突蛋白序列进行建模r软件在聚类分析,并根据相应的参数和方法对模型进行评估
第二天下午
小分子结构
1.ChemDraw软件简介
1.1 小分子结构的构建
1.2 小分子理化性质计算(如分子量、clogP等)
示例讲解及练习:分别构建大环、氨基酸、DNA、RNA等分子
小分子化合物库
1. 小分子数据库
1.1 DrugBank、ZINC、ChEMBL等数据库介绍及使用
1.2 天然产物及中药成分数据库介绍及使用
第三天早上
生物分子相互作用Ⅰ
1. 分子对接基础知识
分子对接原理及对接软件简介
2.分子对接软件(Autodock)的使用
2.1 半柔性对接
2.1.1 小分子配体优化准备
2.1.2 蛋白受体优化及坐标文件准备
2.1.3 蛋白质受体网格计算
2.1.4 半柔性对接计算
2.2 对接结果评价
2.2.1 晶体结构和构象比较
2.2.2 从能量角度评估对接结果
2.2.3 聚类分析评估对接结果
2.2.4 最佳结合构象的选择
2.2.5 已知活性化合物PDB 1IEP对接结果对比
示例讲解与实践:激酶Bcr/Abl靶点抑制剂的半柔性对接
第三天下午
生物分子相互作用II
2.3 灵活对接
2.3.1 小分子配体优化的准备
2.3.2 蛋白受体优化及坐标文件准备
2.3.3 蛋白质受体网格计算
2.3.4 灵活对接计算及结果评估
2.3.6 半柔性对接与柔性对接的比较与选择
实例讲解与实践:Bcr/Abl靶点抑制剂的灵活对接
虚拟筛选
3. 用于虚拟筛选的分子对接(Autodock)
3.1 虚拟筛选定义、流程构建和演示
3.2 目标蛋白选择和化合物库获取
3.3 虚拟筛选
3.4 结果分析(分值、能量及交互分析)
示例讲解与实践:Bcr/Abl靶点抑制剂的虚拟筛选
小分子格式转换
1.openbabel介绍及使用
1.1 openbabel软件简介
1.2 小分子结构类型
1.3 小分子结构类型转换
问答
前三天学习问题的答案
第四天早上
拓展对接使用场景(第1部分)
1. 蛋白质-蛋白质大分子对接
1.1 蛋白质-蛋白质对接的应用场景
1.2 相关流程介绍
1.3 受体和配体蛋白优化的准备
1.4 加载受体和配体分子
1.5 蛋白质-蛋白质相互作用对接位点设置
1.6 蛋白-蛋白对接结果分析与解释
实例讲解与实践:新型冠状病毒Spike蛋白与宿主蛋白ACE2的对接
2. 蛋白-肽对接
2.1 蛋白质-肽相互作用简介
2.2 蛋白肽分子的预处理
2.3 蛋白-肽分子对接
2.4 对接结果展示与分析
实例讲解与实践:新型冠状病毒靶点3CL与肽/类肽抑制剂的对接
3. 将含有金属离子的蛋白质靶标与小分子对接
3.1 金属酶蛋白质-配体相互作用简介
3.2 相关蛋白和配体分子的收集和预处理
3.3 金属离子的处理与制备
3.4 金属辅酶蛋白与配体的对接
3.5 对接结果展示与分析
实例讲解与实践:基质金属蛋白酶MMP与其抑制剂的对接
第四天下午
拓展对接使用场景(二)
4. 小分子对接
4.1 小分子-小分子相互作用简介
4.2 小分子结构预处理
4.3 小分子-小分子对接
4.4 对接结果展示与分析
实例讲解与实践:环糊精与药物小分子的对接
5. 核酸-小分子对接
5.1 核酸-小分子应用场景
5.2 核酸-小分子相互作用简介
5.3 核酸-小分子的预处理
5.4 核酸-小分子对接
5.5 相关结果展示与分析
实例讲解与实践:DNA G-四联体与配体分子对接
6. 共价对接
6.1 共价对接原理及应用场景
6.2 蛋白质和共价结合配体的预处理
6.3 药物分子与靶蛋白的共价对接
6.4 相关结果展示与分析
示例解释和实践:激酶靶标 EGFR 抑制剂的共价对接
第五天早上
基于片段的药物设计
1. 基于片段的药物设计
1.1 基于片段的药物设计和发现
1.2 基于片段化合物的文库构建
1.2.1 骨骼更换
1.2.2 分片连接
1.2.3 碎片增长
1.3 基于药效基团的化合物库生成
1.4 基于蛋白质结合袋的化合物库生成
1.5 基于分子描述符的化合物库生成
1.6 基于BREED规则的化合物库构建
1.7 基于片段的化合物库筛选
示例解释和练习:基于片段的Bcr/Abl靶点抑制剂的优化和转化
第五天下午
构效关系分析
1. 3D-QSAR模型构建(Sybyl软件)
1.1 小分子的构建
1.2 创建小分子数据库
1.3 小分子充电与能量优化
1.4 分子活性构象的测定与叠加
1.5 创建3D-QSAR模型
1.6 CoMFA和CoMSIA模型构建
1.7 验证模型的测试集
1.8 模型参数分析
1.9 模型等势图分析
1.10 3D-QSAR模型指导药物设计
实例讲解与实践:激酶靶点Bcr/Abl抑制剂的构效关系模型构建及活性预测
全天六
分子动力学模拟
1.分子动力学简介(GROMACS软件)
1.1 分子动力学基本原理
1.2 Linux系统简介
1.3 分子动力学软件(Gromacs)简介
2. Gromacs 用于分子动力学模拟
2.1 配体分子的处理
2.2 蛋白质结构的处理
2.3 修改蛋白质坐标文件
2.4 修改拓扑文件
2.5 搭建盒子并放入溶剂
2.6 平衡系统费用
2.7 能源最小化
2.8 NVT平衡
2.9 NPT 平衡
2.10 输出动态仿真
3. 分子动力学结果分析
3.1 轨迹文件观察
3.2 能量数据绘图
3.3 轨迹修正处理
3.4 回转半径分析
3.5 计算蛋白质构象的RMSD变化
3.6 计算原子位置的RMSF变化
3.7 蛋白质配体构象聚类
3.8 蛋白质-配体相互作用的氢键分析
3.9 蛋白质-配体相互作用能分析
示例解释和练习:
(1)溶菌酶在水中的纯蛋白质模拟
(2) T4溶菌酶与配体复合物的模拟
问答
未来三天学习问题解答
部分案例图解:
向下滚动查看
注册须知
2023·报名须知
注册费用
(含注册费、培训费、材料费)
课程
原价
特价
多组学主题
(在线六天)
5600
5400
罗塞塔专题
(已离线两天)
3100
2900
CADD 主题
(在线六天)
5900
5700
【注】线下课程食宿可统一安排,费用自理。 For reimbursement, a formal machine-printed invoice and a paper training notification document or meeting invitation letter with an official seal will be provided.