??? 作者:Flyingis
??? 數(shù)據(jù)挖掘是一個(gè)由數(shù)據(jù)庫(kù)、人工智能、數(shù)理統(tǒng)計(jì)和可視化等多學(xué)科與技術(shù)交叉、滲透、融合形成的交叉學(xué)科。地理空間數(shù)據(jù)挖掘(Geospatial Data Mining)是數(shù)據(jù)挖掘的一個(gè)研究分支,即從地理空間數(shù)據(jù)庫(kù)中挖掘時(shí)空系統(tǒng)中潛在的、有價(jià)值的信息、規(guī)律和知識(shí)的過(guò)程,包括空間模式與特征、空間與非空間數(shù)據(jù)之間的概要關(guān)系等。數(shù)據(jù)挖掘可以用來(lái)模擬事物的一種變化方式,通過(guò)一些先驗(yàn)的知識(shí)或樣本來(lái)判斷事物未來(lái)的發(fā)展?fàn)顩r或某種狀態(tài)。地理空間數(shù)據(jù)挖掘則可以作為一種可用的科學(xué)方法來(lái)解決一些地學(xué)相關(guān)的問(wèn)題,對(duì)地學(xué)狀況的變化作出分析和預(yù)測(cè),這些分析很多都是基于對(duì)空間分析的基礎(chǔ)上的,因此地理空間數(shù)據(jù)挖掘的根本是事物的空間特性,例如方位、距離、拓?fù)潢P(guān)系等等。
??? 數(shù)據(jù)挖掘需要通過(guò)訪問(wèn)正確、完整和集成的數(shù)據(jù)庫(kù)才能進(jìn)行深層次的分析,挖掘出有用的信息,而這些正確的、完整的數(shù)據(jù)信息則是由數(shù)據(jù)立方體所提供的,其聯(lián)機(jī)分析功能OLAP為數(shù)據(jù)挖掘提供了一個(gè)良好的操作平臺(tái)。
??? 地理空間數(shù)據(jù)挖掘典型方法主要有以下幾種:
1.? 地理空間統(tǒng)計(jì)方法
??? 地理空間統(tǒng)計(jì)是指分析地理空間數(shù)據(jù)的統(tǒng)計(jì)方法,主要是利用了空間中鄰近的要素通常比相距較遠(yuǎn)的要素具有較高的相似性這一原理。該模型可以分為三類:地統(tǒng)計(jì)、格網(wǎng)空間模型和空間點(diǎn)分步形態(tài)。
2.??地理空間聚類方法
??? 地理空間數(shù)據(jù)聚類是按照某種距離度量準(zhǔn)則,在大型、多維數(shù)據(jù)集中標(biāo)識(shí)出聚類或稠密分布的區(qū)域,從而發(fā)現(xiàn)數(shù)據(jù)集的整體空間分步模式。該方法主要分為四類:分割法、層次法、基于密度的方法及基于網(wǎng)格的方法。
3.? 地理空間關(guān)聯(lián)分析
??? 地理空間關(guān)聯(lián)分析利用空間關(guān)聯(lián)規(guī)則提取算法發(fā)現(xiàn)空間數(shù)據(jù)庫(kù)中空間目標(biāo)間的關(guān)聯(lián)程度,從而進(jìn)行空間數(shù)據(jù)關(guān)聯(lián)分析的知識(shí)發(fā)現(xiàn)研究,其核心內(nèi)容是挖掘空間關(guān)聯(lián)規(guī)則。
4.? 地理空間分類與預(yù)測(cè)分析
??? 地理空間分類與預(yù)測(cè)是根據(jù)已知的分類模型把數(shù)據(jù)庫(kù)中的數(shù)據(jù)映射到給定類別中,進(jìn)行數(shù)據(jù)趨勢(shì)預(yù)測(cè)分析的方法。人工神經(jīng)網(wǎng)絡(luò)可以作為該方法的典型技術(shù)應(yīng)用于實(shí)際研究中。
5.? 異常值分析
??? 顧名思義,異常值分析即將數(shù)據(jù)庫(kù)中與通常的行為或數(shù)據(jù)模型不一致的數(shù)據(jù)提取出來(lái)的分析方法。通過(guò)這種方法可以提取出數(shù)據(jù)庫(kù)中的異常信息或噪聲數(shù)據(jù),有時(shí)也會(huì)導(dǎo)致隱藏的重要數(shù)據(jù)丟失。異常值分析方法主要有三種:基于統(tǒng)計(jì)的異常值分析、基于距離的異常值探測(cè)、基于偏差的異常值探測(cè)。
??? 使用地理空間數(shù)據(jù)挖掘方法進(jìn)行數(shù)據(jù)分析、信息提取時(shí),Mathlab是一個(gè)非常好的輔助工具,很多函數(shù)庫(kù)和可視化界面可以方便的使用,也可以很好的判斷算法是否達(dá)到了應(yīng)用要求,同時(shí)還可以作為其他語(yǔ)言實(shí)現(xiàn)數(shù)據(jù)挖掘方法的一種對(duì)比參考。
參考資料:
GIS空間分析原理與方法