摘要:目前,Web數據的抓取和挖掘成為計算機研究和開發中的熱點,同時,抓取和挖掘到的數據進行地理空間化也越來越受到關注。地理空間化后的數據可視化也漸漸成為地理信息系統發展的一個重要方向。本文所述的方法是對人力資源網站進行在線實時的計算機軟件職位Web內容抽取,將獲取到的職位招聘數據通過在線地圖服務進行地理空間定位,然后把地理空間化后的相關職位信息通過動態集束線和動態點進行地理空間可視化表達。從實現的Demo實驗效果來看,地理空間動態集束線的流向圖表達方法比傳統的靜態表達更能夠促進用戶獲取數據之間各類流動和遷徙等方向的空間關系,幫助理解在其他形式表達下不易發覺的空間模式。在本文實現的方法中,通過計算機招聘職位的工作所在地與公司所在地之間的動態集束線可視化表達,除了能夠顯式地收集工作崗位職位空間分布情況,還獲悉了當前計算機軟件行業的計算機軟件產業遷移的態勢。
關鍵字:Web數據抓取和抽;數據地理空間化; 數據可視化;數據線可視化;集束線表達
引言
隨著大數據、數據挖掘和知識發現在計算機的研究和應用,數據的可視化技術也越來越受到人們的重視。數據的可視化主要通過人的視覺感知到的計算機圖形或圖像為基礎,描述和展現數據的模式、趨勢和關系,而某些數據的某些性質是難以用其他表達方式呈現所能被發現的。數據可視化的功能實質就是將獲取到的數據轉換和映射為圖形、圖像、動畫等等。如圖1所示為數據可視化的領域模型。
|