描述主动学习的人机

Learn, share, and connect around europe dataset solutions.
Post Reply
asimd23
Posts: 427
Joined: Mon Dec 23, 2024 3:52 am

描述主动学习的人机

Post by asimd23 »

借助经过训练的模型,我们可以对所有仍缺少标签的行进行评分,并开始主动学习周期的第一次迭代。此周期的下一步称为主动学习抽样。主动学习抽样是关于选择人机循环下一步应该标记的内容以最好地改进模型。它在人机循环周期的每次迭代期间进行。

要选择行子集,我们使用指标对它们进行排序,然后向专家显示 自雇数据 排名靠前的行。专家可以按降序浏览行,并逐一标记或跳过它们。一旦到达提供的样本的末尾,专家就可以告诉应用程序重新训练模型,将新标签添加到训练集,然后再次重复人机交互循环。


图 1. 循环周期的图表
领域专家(上图 1 中称为“预言机”)在主动学习文献中很常见,他会在每次迭代中标记数据点。模型会重新训练,而主动学习抽样会对数据点仍缺少标签的任何行重新排序。在此周期的下一次迭代中,用户会标记排名靠前的行,然后模型会再次进行训练。使用良好的主动学习抽样技术,您可以实现好榜样使用比通常需要更少的标签即可实现出色的性能。

一切都清楚了,对吧?当然不是!我们还需要了解如何进行主动学习抽样。在本系列的下一篇主动学习文章中,我们将展示如何在每次迭代中对行进行排序和选择标记。这就是主动学习策略的真正核心。
Post Reply