本書共分為5章.**章概述了主動學習中樣例選擇方法,并對噪聲-標注主動學習模型進行定義,給出了多標注者或大規(guī)模未標注樣本環(huán)境下的主動學習問題。第2章主要討論了多標注者環(huán)境下的準確度估計問題,給出了如何從收集到的噪聲標注中判斷和選擇可靠標注者的方法。第3章考慮了大規(guī)模未標注樣本集中的噪聲數(shù)據(jù)和樣本分布不均衡對分類模型的影響,給出了如何利用分類模型風險來選取信息含量*高的未標注樣本。第4章考慮了從大規(guī)模未標注樣本集選取樣本的效率問題,給出了基于哈希技術的快速主動采樣方法。*后一章是對主動采樣策略做了一些總結(jié)性的工作。
|