??? 作者:Flyingis
??? 數據挖掘是一個由數據庫、人工智能、數理統計和可視化等多學科與技術交叉、滲透、融合形成的交叉學科。地理空間數據挖掘(Geospatial Data Mining)是數據挖掘的一個研究分支,即從地理空間數據庫中挖掘時空系統中潛在的、有價值的信息、規律和知識的過程,包括空間模式與特征、空間與非空間數據之間的概要關系等。數據挖掘可以用來模擬事物的一種變化方式,通過一些先驗的知識或樣本來判斷事物未來的發展狀況或某種狀態。地理空間數據挖掘則可以作為一種可用的科學方法來解決一些地學相關的問題,對地學狀況的變化作出分析和預測,這些分析很多都是基于對空間分析的基礎上的,因此地理空間數據挖掘的根本是事物的空間特性,例如方位、距離、拓撲關系等等。
??? 數據挖掘需要通過訪問正確、完整和集成的數據庫才能進行深層次的分析,挖掘出有用的信息,而這些正確的、完整的數據信息則是由數據立方體所提供的,其聯機分析功能OLAP為數據挖掘提供了一個良好的操作平臺。
??? 地理空間數據挖掘典型方法主要有以下幾種:
1.? 地理空間統計方法
??? 地理空間統計是指分析地理空間數據的統計方法,主要是利用了空間中鄰近的要素通常比相距較遠的要素具有較高的相似性這一原理。該模型可以分為三類:地統計、格網空間模型和空間點分步形態。
2.??地理空間聚類方法
??? 地理空間數據聚類是按照某種距離度量準則,在大型、多維數據集中標識出聚類或稠密分布的區域,從而發現數據集的整體空間分步模式。該方法主要分為四類:分割法、層次法、基于密度的方法及基于網格的方法。
3.? 地理空間關聯分析
??? 地理空間關聯分析利用空間關聯規則提取算法發現空間數據庫中空間目標間的關聯程度,從而進行空間數據關聯分析的知識發現研究,其核心內容是挖掘空間關聯規則。
4.? 地理空間分類與預測分析
??? 地理空間分類與預測是根據已知的分類模型把數據庫中的數據映射到給定類別中,進行數據趨勢預測分析的方法。人工神經網絡可以作為該方法的典型技術應用于實際研究中。
5.? 異常值分析
??? 顧名思義,異常值分析即將數據庫中與通常的行為或數據模型不一致的數據提取出來的分析方法。通過這種方法可以提取出數據庫中的異常信息或噪聲數據,有時也會導致隱藏的重要數據丟失。異常值分析方法主要有三種:基于統計的異常值分析、基于距離的異常值探測、基于偏差的異常值探測。
??? 使用地理空間數據挖掘方法進行數據分析、信息提取時,Mathlab是一個非常好的輔助工具,很多函數庫和可視化界面可以方便的使用,也可以很好的判斷算法是否達到了應用要求,同時還可以作為其他語言實現數據挖掘方法的一種對比參考。
參考資料:
GIS空間分析原理與方法