王家耀(1936—),中國工程院院士,著名地圖學與地理信息系統專家,《測繪學報》編委。
原題 時空大數據時代:地圖學的過去與未來
作者 王家耀
注釋(整理) 峪果
資料來源見文後說明
王家耀院士2017年10月21日在《測繪學報》創刊60周年學術研討會(深圳)上作了題為《時空大數據時代:地圖學的過去與未來》的報告,該報告在業界產生了巨大的反響。
為了便於理解和手機閱讀,GeoTalks在原報告PPT內容的基礎上,增加了必要的注釋和補充,並重新做了編排。注釋和補充包括綠色文字內容,圖A~L等。
本文分四部分:
1 引言
2 地圖學4500餘年歷史的信息圖表
3 時空大數據時代將給地圖學帶來哪些變化?
4 總結
1 引言
1.1 地圖學發展的三個時期
如果從已經發現的古巴比倫地圖算起,迄今地圖學也有4500餘年的歷史,可以將其劃分為3個時期。
圖A
1.2 地圖學的使命、屬性和地圖的價值
1.3 地圖(學)的獨特研究視角:與空間和時間的不可分割性
人類活動本質上就是一種時空行為,世界上的任何事物和現象的發生、發展和演變,都是在一定的時間和空間進行的,任何地圖都要標註製作的時間(時間參考系)和採用的空間參考系(大地坐標系、高程系統、深度基準)。
任何地圖都依賴於其製圖資料(數據),都要標註資料的類別、時間、空間參考系統和出處,要關注這些資料的可靠性和可用性並研究多種不同製圖資料的處理方法。
地圖是用來認知、管理和治理世界的,要研究時間序列的預測分析和空間分布規律分析的模型和算法。
任何時期的地圖(學)皆如此,只不過時空精準度及內容的深度和廣度不同而已。
2 地圖學4500餘年歷史的信息圖表
2.1 地圖學的信息圖表
2.2 啟示
2.2.1 啟示一>>
地圖(學)至今已有4500餘年的歷史,幾乎同世界最早的文化同樣悠久,有著深厚的土壤,經歷了地圖演化的歷史長河,承載著世界五大文明的地圖文化今天正日益繁榮,地圖學是一門充滿哲學思維的科學。地圖哲學、地圖演化、地圖文化都是我們要關注和研究的。
2.2.2 啟示二>>
地圖學在4500餘年的發展進程中,從地圖的起源和萌芽到古代地圖學的發展經歷了近4000年,自此以後到近代地圖測繪與近代(經典)地圖學的形成只經歷了約400年,而自此以後到地圖學技術的革命和資訊時代的地圖學則只經歷了約60年,地圖演進的周期越來越短。社會進步和科技發展是重要的推動力量,而地圖學自身的矛盾運動是根本因素。
2.2.3 啟示三>>
今天地圖學正處於時空大數據時代。在這樣一個時代,我們應當怎樣看待近代(經典)地圖學甚至古代地圖學呢?
當前,學界業界有一種思想傾向,動不動就給某學科冠以「傳統」一詞,什麼「傳統地圖沒用了」,甚至連還不到60年歷史的地理信息系統也要冠以「傳統」一詞,什麼「傳統GIS已經死去,時空信息雲平臺已經誕生」,云云。似乎為了立一個所謂「新概念」就必須把過去的、現有的都冠以「傳統」,都要「過時了」。這不是歷史唯物主義和辯證唯物主義的科學觀。
須知:沒有古代地圖學,就沒有近代地圖學,沒有古代地圖學、近代地圖學也就沒有資訊時代地圖學,而且資訊時代地圖學面對時空大數據時代的到來還要繼續發展。這才是歷史唯物主義和辯證唯物主義的科學觀。
3 時空大數據時代的到來將給地圖學帶來哪些變化?
3.1 地圖學的時空觀和方法論
3.1.1 地圖學的一個重要哲學命題>>
地圖學本質上是研究用地圖的方法重構地理世界、反映地理世界的空間結構和空間關係及其隨時間變化的規律的科學。
地圖學同空間和時間密不可分。在哲學上,空間與時間一起構成運動著的物質存在的兩種基本形式。空間指物質存在的廣延性;時間指物質運動過程的持續性和順序性。空間和時間同運動著的物質不可分割。沒有脫離物質運動的空間和時間,也沒有不在空間和時間中運動的物質。空間和時間是無限和有限的統一。
就宇宙而言,空間無邊無際、時間無始無終,而對各個具體事物來說,則是有限的。與此相關的是,空間參照與時間參照是自然與社會現象的兩個基本參照系統,任何事物和任何現象都離不開這兩個基本參照。換句話說,空間坐標與時間刻度是標識自然萬物與社會現象的兩個基本特徵。
3.1.2 大數據離不開空間參照和時間參照>>
包括人類活動在內的任何事物和現象的運動變化都是在確定的空間和時間發生的,而所有大數據都是包括人類活動在內的任何事物和現象的運動變化所產生的,這就是時空大數據,它是基於統一時空基準,活動於時空中與位置直接或間接相關聯的大數據。
從這個意義上講,大數據本就是時空大數據,它是包括人類活動在內的現實地理世界空間結構和空間關係各要素(現象)的數量、質量特徵及其在時空中變化的數據集的「總和」,都具有空間參照與時間參照。
3.1.3 地圖學研究與表達對象的拓展和延伸——萬事萬物的空間和時間特徵>>
從時間序列講,可以科學表達過去(歷史)、現有(現狀)與未來(規劃、預測),即時間序列的延伸。
從空間範圍講,可以科學表達地球表層(四大圈層:大氣圈、水圈、生物圈和巖石圈)、海洋(海底地形、海洋資源、海流、海洋熱帶氣旋)、月球表面(月球形貌和月球地形)、網絡空間等,即深空、深地、深海、深藍等都成為了地圖學描述和表達的對象,體現了時空一體化,深刻地影響著地圖學研究的認識論和方法論。
圖B
圖C海底
圖D月球表面
圖E月球儀(博目)
圖F
3.1.4 地圖學的時空觀必將推動地理學理論、技術和應用的創新發展>>
3.1.4.1 理論的創新
地圖哲學——哲學視野下的地圖學成為最高層次的地圖學理論的概括
時空綜合認知·時空信息傳輸·時空信息模型·時空信息本體·時空信息語言學……
3.1.4.2 技術的創新
網際網路、物聯網、雲計算技術的發展,地圖製圖的系統論方法、協同論方法、最優化方法等將成為地圖學的方法論。
新興計算技術、機器學習技術、人類自然智能與人工智深度融合技術、數據挖掘與知識發現技術、時空大數據可視化技術、虛擬地理環境與增強地理環境融合技術、網絡/網格/雲服務技術,以及語義網、語義網格和語義網絡技術等,都將成為時空大數據時代地圖學發展的重要支撐技術。
3.1.4.3 地圖傳播的創新發展
地圖的實時動態性、主題的針對性和多樣性、內容的複合性、表現形式的個性化、應用的泛在化等。
數字地圖、網絡地圖、電子地圖(多媒體)、知識地圖……。
3.2 地圖學的第一位任務是多源(元)時空大數據的整合(融合)
3.2.1 地圖學發展的漫長歷史中始終需要面對的一個「難」題——地圖的資料(數據)源>>
主要難在兩個方面:
一是,數據源少,可能出現「巧婦難做無米之炊」,導致地圖品種少、內容貧乏,但數據處理簡單。
二是,數據源多,可能出現數據多源(元)異構問題,導致數據處理難度大,但地圖品種多、內容豐富。
地圖學正是在解決這個「難題」的過程中發展的。
3.2.2 地圖學的著重點由信息源獲取一端向信息深加工一端漂移>>
20世紀50年代以後,衛星遙感、全球衛星導航定位系統、計算機地圖製圖、數字攝影測量、地圖(觀)資料庫、地理信息系統等相繼問世,地圖學完全有必要而且也有可能把著重點放在信息深加工方面來,時空數據處理成為現代地圖學的主要研究對象,這是由地圖製圖資料的數據化、地圖製圖生產的計量化和地圖製圖技術的現代化背景決定的。
「原始製圖數據的特徵分析和預處理數學模型的設計和建立數據處理製圖模型的設計、建立和解釋」成為製圖數據處理的基本過程。
相關分析用於研究和製作顯示要素或現象相互關係的相關地圖;
預測分析用於研究現象間的制約關係和製作預測地圖;
主要素(和主成份)分析用於研究複雜地理綜合體的形式化和製作綜合地圖;
聚類分析用於研究系統的組合分類和製作區劃地圖;
……
把數據處理作為地圖學的核心的數據思維方法
3.2.3 多源(元)時空大數據整合——時空大數據時代給地圖學帶來的新問題>>
隨著時空大數據時代的到來,地圖學再也無須為製圖數據源發愁了,但也給地圖學數據源處理增加了新的複雜性和難度。這主要表現在:
多類型
多解析度
多時態
多尺度
多語義
多參考系
如何科學描述、表達和揭示不同類型、不同尺度、不同時間、不同語義和不同參考系統的時空大數據的複雜關係及其相互轉換規律,從根本上解決多源異構時空大數據的融合,已成為計算機數字地圖製圖環境下地圖學急待解決的科學技術問題。
[ 註:語義就是數據的含義。數據本身沒有任何意義,只有被賦予含義的數據才能夠被使用,這時候數據就轉化為了信息。]
3.2.4 貴在整合、難在整合、贏在整合>>
近幾年來,該領域研究取得了一些進展,但有待研究解決的問題還很多,發展和提升的空間還很大。
不同時空基準之間的轉換模型和轉換參數的研究已有很好的基礎,但基於不同時空基準的時空大數據的轉換工作量很大。
多尺度空間數據相似性模型及其度量及面狀和線性目標的自動匹配方面的研究有明顯進展,前者主要研究多尺度空間數據幾何相似性模型及其度量;後者主要研究不同時間、不同尺度道路和面狀居民地的自動匹配算法。
不同語義空間數據的轉換,由於涉及到地理本體領域的一系列理論、方法和技術,難度很大,目前的研究多著重語義表達、基於本體的地理信息查詢檢索和基於語義匹配的地理信息服務等方面,需要進一步研究地理本體的形式化表達、地理本體庫、語義轉換規則與規則庫和語義自動轉換適配器等的理論、方法與技術。
3.3 地圖學科學範式的變化
3.3.1 美國著名科學哲學家Thomass·Kuhn的範式概念和理論>>
美國著名科學哲學家Thomass·Kuhn(託馬斯·庫恩)在《The Structure of Scientific Revolutions》(《科學革命的結構》)一書中提出「範式」的概念和理論:
指的是一個共同體成員所共享的信仰、價值、技術等等的集合,指常規科學所賴以運作的理論基礎和實踐規範,是從事某一科學的研究者群體所共同遵從的世界觀和行為方式。
圖G託馬斯·庫恩(1922—1996),出生於美國俄亥俄州辛辛那提,物理學家、歷史學家和科學哲學家。
圖H《科學革命的結構》(託馬斯·庫恩 著)
3.3.2 計算機圖靈獎得主Jim Grey(吉姆·格雷)的四個科學範式理論>>
圖I吉姆·格雷(1944—2007),為詹姆士·格雷的暱稱,他的全名是詹姆斯·尼古拉·格雷,出生於是美國加利福尼亞州的舊金山,計算機科學家。1998年,他因在「資料庫和交易流程處理研究領域的開創性貢獻以及在系統實現方面的領袖地位」而獲得圖靈獎。
3.3.3 地圖學的四個科學範式>>
3.3.4 以數據密集型計算為特徵的地圖學科學範式,推動地圖學把著重點放在時空大數據的智能深加工方面來>>
主要表現在三個方面:
3.3.4.1 之一:時空大數據多尺度智能變換>>>>
從地圖製圖技術層面講,20世紀最具裡程碑意義的事件是計算機數字地圖製圖技術「取代」了經典(傳統)的手工地圖製圖技術,其中多尺度空間數據的自動綜合是核心。經過60餘年的艱難研究和總結,目前在國家地形圖系列的製圖綜合方面取得了突破性進展:
製圖綜合基本理論、方法和綜合指標的計量化
自動製圖綜合模型、算法、知識及基於知識的推理
基於自動製圖綜合鏈的全要素、自過程的綜合控制和綜合質量評估
多尺度空間數據幾何相似性關係度量理論和模型
不過目前的智能化水平和自動化程度並不很理想,需要進一步研究:
大規模、大範圍時空大數據背景下機器學習,讓大數據教會計算機獲得製圖綜合的知識、識別製圖要素(圖形)並自適應地進行製圖綜合
人類自然智能與計算機人工智慧深度融合式的智能綜合理論、方法和技術
基於雲計算的分布、並列、協同式智能綜合技術
3.3.4.2 之二:時空大數據的統計分析挖掘與知識發現 >>>>
時空大數據的統計分析,較之地圖製圖數據處理(小樣本)其難度和複雜度要大的多,它涉及到大數據的取捨(清洗)、統計學與大數據如何結合,以及如何在大數據分布式存儲驅動下進行統計計算等一系列科學技術問題。
時空大數據挖掘,是要用大數據思維發現過去的科學方法發現不了的新模式、新知識和新規律。目前,還存在許多問題:
研究商業大數據的多,而研究科學大數據的少
研究一般大數據的多,而研究時空大數據的少
研究大數據統計分析的多,真正研究時空大數據挖掘與知識發現的少
時空大數據理論研究薄弱,更未形成科學理論體系
「時空大數據隱含價值計算發現價值應用實現價值」的技術體系尚未形成
3.3.4.3 之三:時空大數據的可視化>>>>
面向不同層次不同用戶需要的可視化主題多變性、強交互性、形式多樣化和快速性。
主題多變性:根據眾多不同需求從大數據中快速提取與主題相關的大數據,對提取的大數據進行統計分析與挖掘,設計知識表達方法,並快速可視化。
強交互性:面對實時動態的流數據(數據流),強交互貫穿於「提取數據分析挖掘發現知識表達方法可視化」的整個過程中。
形式多樣化:表達方式多樣化(個性化)。
快速性:貫串各個環節。
時空大數據可視化超越了一般地圖可視化和空間信息可視化
3.4 時空認知模型的變化
3.4.1 時空大數據時代時空認知研究的三個出發點>>
一是,從社會需求和地圖學的功能來看,人類必須不間斷地認知自身賴以生存和發展的環境,而這是離不開地圖學的;
二是,當我們面對時空大數據時,計算機地圖製圖的能力和GIS的空間分析與數據挖掘功能如何在人類時空認知中發揮作用;
三是,在當今空間對地觀測傳感器網絡時代,傳感器網感知的「現實地理世界」在人類時空認知中將發揮什麼作用。
3.4.2 人類空間認知的過程>>
目前,人類的空間認知主要利用地圖,稱為地圖空間認知。地圖空間認知的過程:
感知過程:研究地圖圖形(刺激物)作用於人的視覺器官產生對地理空間的感覺和知覺的過程。在這裡,地圖實際上是現實世界的替代物。
表象過程:是在地圖感知基礎上產生的,是通過回憶、聯想或在感知基礎上將產生的映象再現出來(心象地圖)。
記憶過程:記憶是人腦對過去經驗中發生過的事物的反映。根據記憶操作時間的長短,分為感覺記憶、短時記憶和長時記憶,以及動態記憶和聯想記憶。
思維過程:是地圖空間認知的高級階段,提供關於現實世界的客觀事物的本質特徵和空間關係知識,實現「從現象到本質」的轉化,是在心象地圖及其存儲記憶的基礎上進行的,具有概括性和間接性。
3.4.3 捷克人柯拉斯尼(A·Kolacny)的第一個地圖空間認知模型(1969年)>>
3.4.4 地圖空間認知模型到多模式時空綜合認知模型的轉移>>
3.4.5 用科學活動的「三要素」說明時空認知模型的變化>>
3.5 機器學習技術將促進智能化地圖製圖中知識獲取方式發生深刻的變革
3.5.1 智能化地圖製圖的核心>>
智能化地圖製圖的核心是「智能」,「智能」的核心是「知識」,而「知識」的核心是怎樣獲得知識,知識就是「力量」,地圖製圖知識就是智能化地圖製圖的「力量」。沒有地圖製圖知識,智能化地圖製圖就成了「無米之炊」、「無源之水」。
3.5.2 人工智慧技術發展的三個時期>>
3.5.3 計算機地圖製圖發展進程與人工智慧技術發展的三個時期相近>>
回顧計算機地圖製圖的發展,也與人工智慧技術發展的「三個時期」相似,只是進程滯後一些。
20世紀80年代到90年代中期,地圖製圖專家系統形成熱潮,處於「知識期」。
此後的10多年期間,地圖製圖專家系統熱潮不存在,之前研製的地圖製圖專家系統在製圖生產中基本未得到應用,原因在於「製圖知識工程瓶頸」。錢學森先生早在1984年9月1日給戴汝為的信中有精僻的分析;時隔17年後的2011年《科學導報》第14期刊登李娜的文章,題目是「被批20年無進展,人工智慧需要重啟」。
進入21世紀以來,特別近幾年來,機器學習技術在智能化地圖製圖領域活躍起來,取得了可喜成果。
3.5.4 機器學習技術是解決智能化地圖製圖中「知識工程瓶頸」問題的技術進步源泉>>
近幾年的研究表明,機器學習是解決智能化地圖製圖中的「知識工程瓶頸」問題的有效途徑,時空大數據分析正是各種機器學習技術的平臺,利用這個平臺深入研究機器學習、雲計算、眾包三大關鍵技術。
機器學習提供數據分析能力,雲計算提供數據處理能力,眾包提供數據標註能力。
3.5.5 機器學習技術是解決智能化地圖製圖中「知識工程瓶頸」問題的技術進步源泉>>
在時空大數據平臺上,採用「從樣例中學習」特別是人類自然智能與計算機人工智慧深度融合的人機融合智能技術等,機器學習技術使計算機具有各類(種)地圖(集)設計(總體設計、地圖投影設計、地圖符號設計、地圖表示方法設計、地圖色彩設計)知識,地圖製圖綜合(內容各要素圖形結構特徵自動識別與化簡、點雲數據特徵點識別與抽稀、時空大數據多尺度轉換……)知識,各要素圖形關係自動識別與處理知識,等等,大幅提升地圖製圖智能化水平和自動化程度。
4 總結
站在2017年時間點上看過去,歷史是一面鏡子,它不僅記錄著過去,還透視著未來。
地圖(學)在其4500餘年的漫長發展的歷程中,曾經有過幾次關鍵、轉折的時間點。
站在16世紀那個時間點上看過去近4000年,中國的裴秀(224-271年)和古希臘的託勒密(90-168年)好似東西輝映的兩顆燦爛的明星,他們的著作《禹貢地域圖十八篇·序》《地理學指南》以及中國長沙馬王堆地圖(地形圖、駐軍圖、城邑圖),和歐洲以地中海為中心的航海圖為代表的一系列地圖,標誌著古代地圖學的總結性成就,反映了東西方不同的發展特點,奠定了古代地圖學的基石,對後來的地圖學發展產生過長期而深遠的影響。
圖J裴秀,字季彥,河東聞喜(今山西省聞喜縣)人, 魏晉時期大臣,著名地圖學家。
圖K託勒密,數學家、天文學家、地理學家。
站在20世紀50年代中葉那個時間點上看過去,或站在16世紀那個時間點上看未來(過去的未來):
由中國航海家鄭和(1371或1375-1433或1435年)先後七下西洋拉開序幕的15世紀末至17世紀中葉的世界地理大發現,奠定了世界地圖的輪廓;
16世紀地圖集的盛行,總結了16世紀以前東西方地圖學的歷史性成就;
17世紀以後的大規模三角測量和地形圖測繪,奠定了近代地圖測繪的基礎;
18世紀以後專題地圖的萌芽和發展,照相製版方法的出現和航空攝影測量技術的發明,導致了地圖製圖生產技術工藝的變革;
20世紀50年代,形成了系統而完整的近代地圖學理論、技術、方法和工藝。近代(經典)地圖學是20世紀50年代中葉以前地圖學成果的積累和科學的總結,又是現代(資訊時代)地圖學形成與發展的基石和起點。
站在20世紀50年代中葉那個時間點上看過去,或站在16世紀那個時間點上看未來(過去的未來):
由中國航海家鄭和(公元1371-1435年)先後七下西洋拉開序幕的15世紀末至17世紀中葉的世界地理大發現,奠定了世界地圖的輪廓;
16世紀地圖集的盛行,總結了16世紀以前東西方地圖學的歷史性成就;
17世紀以後的大規模三角測量和地形圖測繪,奠定了近代地圖測繪的基礎;
18世紀以後專題地圖的萌芽和發展,照相製版方法的出現和航空攝影測量技術的發明,導致了地圖製圖生產技術工藝的變革;
20世紀50年代,形成了系統而完整的近代地圖學理論、技術、方法和工藝。近代(經典)地圖學是20世紀50年代中葉以前地圖學成果的積累和科學的總結,又是現代(資訊時代)地圖學形成與發展的基石和起點。
主要表現在:
一是,地圖製圖技術上的革命。
電子計算機技術和自動化技術為地圖學的發展開闢了嶄新的道路,60年代以來迅速發展起來衛星遙感技術為地圖學信息獲取和處理提供了新的方法和手段,並促使地圖學重點的漂移,地圖印刷材料和技術工藝發生了很大變化,90年代地圖電子編輯出版系統的問世打破了長期以來地圖製圖與出版之間的界線並出現了全數字地圖製圖與出版的一體化。
二是,理論地圖學的提出和發展。
地圖空間認知論、地圖模型論、地圖資訊理論、地圖信息傳輸論、地圖感受論、地圖符號學等成為理論地圖學的主要研究內容,證明「沒有理論指導的技術是盲目的技術,沒有先進技術支撐的理論是落後的理論」;
三是,地圖學功能的拓展延伸和新的生長點。
地理信息系統(GISystem)是地圖學功能的拓展和延伸,在其誕生以來的半個多世紀裡,應用領域、信息來源、功能作用、體系結構、開發模式等,都發生了根本性變化,由「系統」到「服務」已成為趨勢;空間信息可視化與虛擬地理環境是地圖學的新的生長點,擴展了人的空間認知手段和範圍,對拓寬地圖學的研究領域和促進地圖學理論與技術的進步產生了重要影響。
圖L
站在2017年代這個時間點上看未來,隨著時空大數據時代的到來,地圖學面臨著新的機遇和挑戰,地圖學又一次站在了新的起點上:
地圖學的時空觀和方法論的確立,必將推動地圖哲學指導下的新的地圖學理論創新、技術創新;
多源異構時空大數據的整合(融合),必定能將「貴在整合、難在整合」轉變為「贏在整合」;
地圖學科學範式的變化——以數據密集型計算為特徵的地圖學科學範式,將推動地圖學把著重點放在時空大數據的智能化深加工和知識服務上來,時空大數據挖掘的多尺度智能轉換、時空大數據的智能分析與挖掘,以及時空大數據的快速可視化,已經凸顯出了地圖學的時代特徵;
時空認知模型的研究,將進一步說明時空認知活動中的主體、客體和工具「三要素」本身及其相互關係都發生了變化,主體的大數據思維方式、客體(現實地理世界)的時空變化、工具(傳感器網動態感知、大數據分析與挖掘模型算法及其軟體,等等)的進步,使主體人類認知器官的延長和擴大,這一切必將促使地圖空間認知模型向時空數據時代多模式時空綜合認知模型發展。
在時空大數據時代,機器學習技術是解決智能化地圖製圖中「知識工程瓶頸」問題的技術進步源泉,特別是人類自然智能與計算機人工智慧深度融合的人機融合智能技術更有廣闊的前景。回頭看過去,向前看未來,地圖學在4500餘年的悠久歷史進程中一次又一次地站在了新的起點上,而且每一次都有新的突破和發展,這就是地圖學作為一門科學的魅力所在。
國家與國家之間的競爭,表面上是經濟的競爭和科技的競爭,實質上卻是國人素質和文化的競爭。地圖學作為一門科學的發展,當然與社會安全穩定、經濟繁榮和技術進步有關,但地圖文化卻起著重要作用。
時空大數據時代地圖學的發展,不僅需要有優秀的地圖文化,還需要有優秀的數據文化。我們地圖人應當堅定這個自信。
致謝
對報告中引用的有關文獻的作者表示感謝!
資料來源
圖A圖C圖D:GeoTalks補充
圖B:firsthdwallpapers.com
圖E:測繪出版社
圖F:harris.com
圖H:amazon.com
圖G圖I圖K:Wikipedia
圖J:中國測繪宣傳中心
圖L:powersystem.org