新的机器学习技术可以用更少的数据提高虚拟药物筛选的预测

使用机器学习工具来分析生物医学数据的科学家通常会转向神经网络算法，但在这些模型流行之前，通常使用另一种更简单的机器学习算法，称为核方法。核方法的工作原理是首先应用简单的操作来转换数据，然后在转换后的数据上训练一个简单的模型。

现在，在《自然通讯》最近发表的一篇新论文中，麻省理工学院和哈佛大学布罗德研究所埃里克和温迪施密特中心的研究人员开发了一种使用核方法的新方法，可以使它们在更广泛的应用中更有用，例如虚拟药物筛选。

他们提出了第一个可成功应用于大规模数据集的核方法“迁移学习”技术。迁移学习允许研究人员通过在一项任务上训练机器学习模型，从而提高在第二项任务上的表现，从而改进机器学习模型，而无需花费时间和资源为每项新任务训练新模型。

在他们的论文中，该团队展示了他们的迁移学习框架如何使他们能够预测哪些药物可能对某些数据很少的癌细胞系最有效。他们通过从许多药物已经过测试的细胞系中转移来做到这一点。

“在我们的论文之前，还没有可以扩展到生物医学领域及其他领域最感兴趣的大型数据集的内核方法的迁移学习方法。我们首次证明，在这些设置中使用内核的迁移学习是可能的，并且我认为这真的很令人兴奋。”该论文的资深作者、布罗德核心研究所成员、布罗德施密特中心联合主任、电气工程和计算机科学系教授以及麻省理工学院数据、系统和社会研究所。

该团队的关键创新是创造性地调整神经网络算法中使用的迁移学习方法，以便将它们应用于核方法。这一进步可以在其他应用中找到用途。

“特别是对于医疗保健和生物医学应用，很难为每个感兴趣的问题收集大量数据。当某项任务的数据很少，但相关任务却有丰富的数据时，这正是我们的方法的设置该研究的共同第一作者、施密特中心研究员 Adityanarayanan Radhakrishnan 说，他在完成博士学位的同时也参与了这项研究。作为布罗德和麻省理工学院 Uhler 实验室的 Eric 和 Wendy Schmidt 中心研究员，目前是哈佛大学工程与应用科学学院的 George F. Carrier 博士后研究员。

新的机器学习技术可以用更少的数据提高虚拟药物筛选的预测

猜你喜欢

最新文章

今日推荐

热门文章