Active Learning
- Motivation:
- 从Unlabel数据中选中比较困难的,给专家来进行补充标注,以完成任务
- 在实际标注的时候,我们不知道标注多少数据才能得到预期的结果,实际上只需要有大多数的就可以了(Label effiency)
- 也会被称为 Query Learning
- 使用的场景
- 获取Label困难(比如医疗图像)
- 注意对于一些复杂的任务,需要衡量模型本身能够解决,不然再大量的标注数据也不能达到预期结果
- 衡量Hard Sample和Easy Sample的指标需要定义 (会不会与NAS的rank相有一些矛盾)
-
核心问题在于Selected Strategy
- 经过思考之后发现和NAS本身有些难以结合,暂且放下这个