12月17日-18日,2020空天信息大會在杭州雲棲小鎮舉行。大會在「空天地海、數智融合」的主題之下,充分展示空天信息產業和杭州數字經濟的深度融合。兩天大會,濃縮主峰會、空天信息產業論壇、路演會、無人機秀、閉門論壇等精彩環節,幾百位來自商業航天、遙感、北鬥、導航、測繪、時空大數據等領域的產業巨頭、優秀企業、投資機構齊聚,一起回望中國航空航天快速崛起的發展史,一起展望空天信息產業的無限可能。
會中,來自中國空間技術研究院502所(北京控制工程研究所)總監劉磊分享了關於人工智慧技術賦能空間飛行器控制系統的發展歷程、典型應用、應用難點和未來方向。人工智慧技術可以用於空間目標測量感知、地形匹配導航避障、空間飛行器全壽命自主控制、在軌服務和操作和空間精細操作視覺伺服智能控制等領域。隨著未來空間任務的複雜和靈活多變,需要打造「感知–決策–操控」星上閉環的智能增強控制系統。目前的空間只能控制處於目標識別、自主機動的水平(第三級),距離知識遷移群體協同的第五級所要求的多智能體姿態軌道協同控制、協同感知和推理認知、群體決策與任務分配和群智湧現、多任務操控學習和協同操控、壽命預測和進化自修復等能力還有一定距離。預計到2040年,以上技術能力將會實現。
以下是劉磊的演講實錄,經36氪整理編輯:
各位同仁,大家上午好。非常榮幸有機會在2020空天信息大會上向大家報告和交流關於人工智慧賦能空間飛行器控制系統發展的一些認識和思考。
我來自北京控制工程研究所,我們所是隸屬於中國空間技術研究院的,自1956年建所之初就致力於太空飛行器的控制系統、推進系統以及程控系統的研究設計實驗,以及相關的部組件單機的研究工作。
伴隨著中國航天事業的成長,我們已經為載人航天工程、北鬥工程和探月工程提供了控制系統或推進系統。中國空天事業的80%以上的重大任務都是由我所裡來提供控制和推進系統的。
所以,我想藉此機會,與大家交流我們對空間飛行器控制系統發展的一些想法。
最早的東方一號衛星在軌飛行的時候,實際上是沒有軌道控制和姿態控制的。現在的一些微納衛星,可能有一些是有姿態控制的,但大多數也是沒有軌道控制的。但是,隨著任務的逐漸的複雜化,比如後續出現的通信衛星、北鬥導航衛星,它們的軌控也是相對比較複雜的。所以,在控制的基礎上,又發展了導航的功能。
而像載人航天工程、在軌的神州飛船、未來的空間站以及現在我們正在建的空間目標飛行器的交匯過程,對制導律的要求是非常高的。所以我們的姿軌控系統也逐漸發展成了制導導航與控制系統,也就是我們所說的GNC系統。
同時,隨著任務的進一步的複雜化,比如說空間交互對接、月球軟著陸,以及月面巡視探測的這種自主控制技術,我們面臨的任務和目標的邊界越來越寬,要求我們系統要向「感知-決策-控制」一體化的自主控制的方向發展。
比如說,我們昨天(12月17日)成功回收的嫦娥五號,對我們的姿態軌道控制系統(GNC系統)提出了非常高的挑戰。它的每一個環節(月面上升入軌、環月交會對接、第二宇宙速度返回地球等)都是環環相扣的,不能有任何閃失。我們也很好的保障了這次任務。
首先,關於人工智慧和控制技術結合,我還是想從空間目標測量感知的方面來說。因為最早,我們的姿態和軌道控制都是利用的一些單一敏感器的。比如說,姿態測量的顯敏感器,和一些角速度、線速度測量的敏感器。隨著一些複雜任務的要求,比如說,空間操作的任務、在軌服務的任務,是非常複雜的。空間的目標已經不是已知的目標了,或者說目標呈現了一種非合作化。所以,測量姿態軌道的測量,已從單一的測量,向感知方向在發展;單一敏感器的配置,也向多傳感器融合和智能識別技術的方向在發展。
測量感知存在著一些難點。比如說,在地面上的一顆衛星裝備,有著熱控層。而實際上,在實驗室裡,要模擬太空的光照條件,有些暗的地方可能亮了,有些地方有些亮的地方可能暗了。但是在衛星進行太空飛行的時候,實際上目標的某些關鍵特徵點是相機識別不到的。
所以,這些問題和困難也需要我們利用現有的人工智慧技術的和測量感知的敏感器結合,可以很好地利用人工智慧技術來分類識別星上的特徵點。比如說,目前我們已經採用了深度學習的技術,讓單相機的功能做了大幅提升。
但是,目前也存在一些問題。有邊界的圖片是容易處理的,而實際在太空上,空域的目標範圍在上百公裡或上千公裡的級別,是非常大的。也許我們看到的並不是一個點目標,所以,我們還需要繼續發展像結構光、雷射三維測量等這些技術,和我們的人工技術進步融合,做信息的融合處理。同時,我們可以讓載荷做功能的復用。也就是說,在測量的同時也兼具目標識別和運動意圖判斷的能力。對於在軌道上飛行太空飛行器,如果僅是按照目標的特徵做識別,而沒有根據一些軌道的信息、姿態或位置的運動信息融合的話,對目標的識別還是存在非常大困難的。
我們做落月的時候,我們模擬的月亮的情況和實際的落月過程,從光線到色彩等方面的情況是完全不一樣的。也就是說,在地面上,即使已經做了一些特徵的分類學習,並運用了人工智慧的方法,但運用到實際場景上的差異還是非常大的。
我們要充分認識到太空和地外行星探測這些任務的巨大難點:沒有無線電的導航信號、廣闊的相似環境範圍、大部分的未知地區、沒有地標、磁場異常等。這和我們地面的一些無人系統、無人駕駛系統的差異還是非常大的。針對這個問題,目前也正在開展「慣性+視覺+雷射/結構光」這樣多源數據融合的新智能導航方法,目前實現了自主的定位,以及自主對場景的理解,比如說火星任務。我們還需要更多的對科學任務和場景做綜合的理解,才能更好的去實現任務。
我在這也舉一個例子:嫦娥四號的月背軟著陸是世界性首創,實際上這個任務的挑戰是非常巨大的。首先,需要選擇一個規避石塊、坡度等的落點。而且,落月速度非常大。在這樣一個高速軟著陸的過程當中,要快速的來識別目標點並進行避障,實際上我們突破了地形識別重建,使用了主減速目標的自學習。這個任務就是一個典型的感知、控制一體化的結果。
還有一個典型應用,就是空間飛行器全壽命的自主控制。空間飛行器目前在軌運行需要增強更多的自主功能。比如說遙感衛星對熱點目標的一些自主觀測等等,如果我們還要靠地面的指令去指揮的話,它效率是大幅降低的。
再有一方面的應用,是在軌服務與操作。這需要太空飛行器具有自主感知測量、部位識別、決策規劃、接近與柔順捕獲、在軌自主學習精準操作的能力。我們可以想像,太空中兩個浮動的目標,去做精細的操作、維修建造的工作任務還是非常難的。這就像一個人站在湖裡的船上,拿竹竿去控制球一樣,不論是去捕獲皮球還是控制皮球,都是非常難的。空間飛行器的自身質量和在軌飛行的速度也非常大,所以它產生的這些碰撞力都需要我們精確地克服。
所以,基於人工智慧技術,我們開展了一些研究工作,包括完成了深度強化學習全流程的一些驗證,實現了非結構環境的目標識別。
現在,已經做到了端到端的字符的控制。比如說,未來的想做衛星的自主加速度的工作,那麼可以對衛星的加注端進行自主識別。但在太空當中,目標也是在運動的,光照條件是在時刻變化的。所以這也增加了我們人工智慧技術應用的難度。我們在地面實驗的過程當中也採用了一些學習訓練的方法,較好地實現了這個空間操作的任務的需求。
我國將陸續實施「火星探測」 、「深空及在軌維修維護」、「載人登月與月球基地」等國家重大專項,這對空間飛行器的自主能力和智能水平提出了新的挑戰。 比如說,智能遙感深空探測空間操作的任務有一個突出的特點,就是自主、長時和複雜化。需要我們更多樣化的、高精度的、高可靠的測量感知的技術,以及更智能化的控制系統技術。同時,我們後續的任務也具有位置不確定、空間環境靈活多變、任務要求越來越高的可靠性的特點。這些普遍的要求也需要空間飛行器的能夠對目標看得清、辨得準,對任務進行推理、思考,同時能夠智能地去適應、積累經驗,做到自我的管理和自我的提升。
楊嘉墀先生是我們是促進北鬥導航系統應用的一個牽頭建設者。他在上世紀80年代就提出,智能自主控制是未來航天技術的發展方向。在系統當中需要引入人工智慧技術,以實現半自主或自主的運行。而現在,新一代的人工智慧技術從數據算法、算力方面都提供了很多的先進支持。
人工智慧技術賦能空間飛行器的控制發展,並不是再去研究已經水平很高的泛在技術,而是能夠從控制系統的角度,在體系框架智能方面做深入研究,把現有的一些泛在智能算法融入到控制體系框架當中。新一代人工智慧技術與控制技術的融合發展,能夠推動空間飛行器的智能水平和自主運行能力的快速提升。
在這裡,我也想再談一下我們對智能控制的分級。並不是說現有的無人系統搞了智能分級,我們空間飛行器也要照葫蘆畫瓢。我們做分級,是為了更好的來識別任務的要求。並不是說所有的空間任務都要應用到人工智慧。有些任務用現在的程控系統或者自動控制系統,可以簡單有效的完成的。我們做智能分級,是為了更好的定位我們的任務目標,同時也從任務的能力要素方面,進一步的去分析和認識需要哪些人工智慧的技術。
所以,經過分析,目前來看,我們的空間飛行器還是處在現在的L3的水平,也就是說,具備了目標識別和自主機動的能力。但這和未來的差距還是比較大的。剛才講到,傳統的太空飛行器是一個半自主屬性的太空飛行器。而未來,還是要發展全自主屬性的無人太空系統的。也就是說,需要把現在的傳統的衛星等空間飛行器升級成無人自主的太空系統。
目前學界和產業界對於空間智能控制分級還沒有一個標準化的認識。這裡也是我們研究所從工程應用的角度提出的觀點。
同時,在分級分類的基礎之上,我們也考慮了智能自主控制的內涵。這個內涵我們也借也是借鑑了相關學者的一些研究:我們認為,系統具備感知、學習、推理、認知、執行、演化等類人行為屬性的,能夠對環境和態勢的變化作出適應性反應,在沒有人或其他系統幹預的條件下實現目標的控制過程。
這樣新的太空自主無人系統如何實現呢?為了適應新的空間任務,還需要打造「感知-決策-控制」的星上閉環的智能增強系統。
以前我們的空間飛行器的控制系統是按照指令序列來執行的。也就是說,我們不需要對任務理解,也不需要和環境、目標做任何交互。但現在的在軌維護任務、深空探測任務等等,都是未知的環境、未知的任務目標,這就需要我們和環境、目標有進一步的交互。我們想構建一個這樣的新的閉環的系統,是為了建立信息的短迴路,同時能夠做信息的融合處理。當然,這個也是根據我們現在研究的現狀提出的設想。
從空間飛行器的行為能力層面,智能是實踐自主的重要的手段。我們明確了智能和自主的關係——智能的發展實際上是為了實現自主。
智能和自主同時也是來衡量空間飛行器控制能力和控制水平的兩個方面。當然,這是站在控制角度來講的。系統的智能水平的高低可以作為自主能力的評價要素,包括對智能技術的一些評測評估,也是站在這個角度上來考慮的。航天任務是要求萬無一失和穩妥可靠的,而智能自主是讓太空飛行器進化到自主化的一個高級的階段。
從這個體系架構層面,我們也是根據現在的工程研製的一些任務,我們有這樣的一些體會,就是目前的我們的空間飛行器,我們從架構設計上來講,條塊的分割還是比較明顯的。因為我們的任務的複雜化,我們的系統很多,我們這些系統的組成相對的封閉了自己,我們的信息的交互就受到了制約。
所以我們提出了要建立感知角色控制這樣一體化的閉環系統,目的就是我們能夠形成一個開放的架構和信息物理深度融合的體系,這樣我們有利於我們的計算資源的有效的利用和軟硬體資源的靈活的部署,能夠賦能我們系統的發展。
感知,是對傳統框架下軌道確定和自帶測量的功能的擴展。感知包括了對環境和目標和任務意圖的理解。
決策,指的是空間飛行器的未來發展需要自主任務規劃和決策,是對傳統制導的能力的擴展,根據用戶的要求,自主進行分配、任務調整,包括完成任務的優化的排布、執行和重規劃。這樣可以解決現在目前傳統的空間飛行器,自主導航任務規劃決策非常依賴於地面而效率低的現狀。
智能控制,是對傳統的姿態軌道控制的一個擴展,強調的是「行為+評價」的學習模式。Action Intelligence(機器學習與智能操作)是我們未來進行操作任務、科學考察任務等等必須要考慮能力的擴展。
最後一個發展方向,是自主健康管理。這是對傳統框架下「故障診斷與重構」的功能的擴展。這是對現有的太空飛行器解析冗餘、硬體備份的措施的傳統故障診斷功能替代。未來,飛行器系統能夠自主識別自身的異常,根據任務的需求做健康的管理。健康管理可以組成獨立的Agent(智能體),並行於我們構建的「感知-決策-控制」迴路。
未來空間飛行器,要從目前的第三級要達到2040年第五級的目標。要實現後者,還需要突破群體智能自主控制等這些核心技術。我們目前的差距還是比較巨大的。
最後我想說,智能自主是我們未來空間任務的必然的要求。
令人非常欣喜的是,目前我們已經攜手在杭州的知名高校和優勢研究機構一起開展了「地外探測無人系統自主智能精準感知與操控」的這樣國家級的重大專項研究。 我們也非常希望能夠藉助杭州這塊人傑地靈的寶地,充分利用杭州人工智慧優勢資源聚集的特點,面向國家的重大的戰略需求,突破空間無人系統自主感知與操控等共性關鍵技術,來推動人工智慧與科學技術、空間技術的融合發展。
發現未來獨角獸,項目BP發過來!
如果你的項目足夠優秀,希望得到36氪浙江的報導,參加36氪浙江的「未來獨角獸活動」,請將你的需求和BP發至36氪浙江項目徵集郵箱:zhejiang@36kr.com,我們會及時回復。
36氪浙江——讓浙江創業者先看到未來!