大數(shù)據(jù)時代的到來推動了各個行業(yè)的發(fā)展,各行各業(yè)在發(fā)展過程中積累了大量數(shù)據(jù),而數(shù)據(jù)挖掘是大數(shù)據(jù)分析的一種有效途徑,但現(xiàn)有的離群數(shù)據(jù)挖掘算法因復(fù)雜性高難以適應(yīng)大數(shù)據(jù)分析任務(wù)。本書充分利用Spark集群系統(tǒng)的強(qiáng)大數(shù)據(jù)處理能力,論述了支持大數(shù)據(jù)分析的離群數(shù)據(jù)并行挖掘算法與集群系統(tǒng)性能優(yōu)化,提出了一種基于互信息的混合屬性離群檢測方法,并探討了其在智能制造領(lǐng)域的應(yīng)用。
|