根據運行的環境,操作系統可以分為桌面操作系統,手機操作系統,服務器操作系統,嵌入式操作系統等。 [摘要]: 數據挖掘是一種知識發現技術,可用于決策支持,數據分析和其他領域來挖掘大量數據. 其中,針對,高維數據的聚類分析是數據挖掘研究的熱點和難題. 在低維空間中,通常使用諸如歐幾里得距離之類的函數來測量數據之間的相似性. 傳統的聚類方法基于數??據對象之間的相似性. 由于高維數據的稀疏性,當將低維空間中的距離測量功能擴展到高維空間時,隨著維數的增加,數據對象之間距離的對比度將不再存在,其有效性將達到大大減少;另外高維聚類分析,在高維空間中,簇通常僅存在于某些低維子空間中,并且不同的簇可以位于不同的子空間中. 但是,傳統的低維聚類方法無法識別不同子空間中的聚類. 針對高維數據聚類的問題,本文的主要工作如下. 首先,介紹了各種傳統的相似度測量功能. 通過分析高維數據的特性以及高維數據對傳統相似度測量函數的影響,以及在處理高維數據時這些測量函數的缺點,提出了一種基于二次方的相似度測量函數Psim等深度分割. 此函數采用對所有維度進行不平等對待的想法,并將維度分為多個不相交的值區間. 通過判斷兩個數據對象在某個維上是否落入相同的值區間來確定是否在此維上計算兩者之間的相似度. 其次,在對現有子空間聚類算法進行深入分析的基礎上,提出了一種基于子空間二次濾波和相對熵的SRE-CLIQUE算法. 該算法根據數據的分布對每個維度采用自適應區間劃分方法,并以相對熵為密集和稀疏區域的劃分標準. 采用子空間二次過濾策略高維聚類分析,并使用屬性相關矩陣判斷子空間是否包含聚類. 最后,本文在Matlab中完成了相關的實驗驗證. 對于Psim相似度測量函數,實驗使用高維仿真數據來驗證Psim函數可以避免傳統相似度測量函數降低高維空間中分辨能力的問題. 此外,對于SRE-CLIQUE算法,通過仿真數據進行的實驗表明,SRE-CLIQUE算法在準確性和時間復雜度方面均優于原始算法.
|
溫馨提示:喜歡本站的話,請收藏一下本站!