郭雷:讓反饋控制「對付」智能時代不確定性—新聞—科學網

2021-01-07 科學網

 「不確定性無處不在,人們也總是想盡各種辦法『對付』不確定性,以達到調控目的或期望目標。但就像我們在理想化的封閉環境中通過練習學會了開車,真正到了複雜開放的實際公路上,還會面臨各種不確定性情況。也就是說,理想模型與現實情況可能存在著較大差異,而解決它的一個有力且必要的機制就是實時反饋調控。」中國科學院院士、中國科學院數學與系統科學研究院研究員郭雷表示。

 

前不久,在法國召開的IEEE決策與控制大會上,郭雷榮獲國際自動控制領域最具聲望和影響的學術榮譽之一「波德獎」,他也是首位獲得該獎項的華人科學家。他在會議期間作了唯一的大會報告「波德講座」。近日,他回國後分享了題為《反饋與不確定性》的報告內容。

 

 「無處不在」

 

郭雷表示,在人工智慧時代,反饋控制與學習算法一樣,也將扮演關鍵作用,兩者都是對付系統不確定性的有力手段。控制系統是自動化或智能化系統的「大腦」,支配控制系統運行的是控制算法。

 

研究控制算法如何具體設計,如何保障其具有安全、穩定、優化等良好性能的學科是控制系統理論,而這一理論核心和關鍵的概念就是反饋。

 

 「反饋無處不在,正如控制論創始人維納所說明的,反饋普遍存在於動物和機器中,它存在於幾乎一切有目的的行為中。在控制系統中,反饋的主要目的是對付各種不確定性因素對系統性能的影響。」郭雷說,「反饋與不確定性」是控制論的核心議題,它們之間的定量關係是富有挑戰性的基本科學問題。

 

那麼,如何具體設計反饋算法來對付不確定性,反饋機制究竟能夠對付多大的不確定性,反饋機制的根本局限是什麼,能否建立基本反饋算法對付不確定性的理論基礎......無論是理論發展還是實際應用,解決這些問題都顯得極為重要和必要。

 

郭雷指出,數學模型在控制理論中起著基礎性的作用,但是任何模型都是實際複雜系統的抽象、簡化或近似。無論是系統內部的數學模型描述,還是系統外部的複雜環境影響,總存在各種各樣的不確定性。「對不確定動態系統的控制,就是通過利用系統運行中的動態數據來構造反饋控制規律,使其能夠實現對與此不確定集合相應的所有可能動態系統的有效控制。」

 

近百年來,關於反饋控制和不確定性的研究,無論在理論上還是應用上,都取得了巨大進展。例如,現代控制理論和電子通信先驅波德就留下了兩大「遺產」:波德圖和波德積分公式,他們對線性系統控制器的設計分析和反饋系統局限性理解認識,產生了持久的影響。

 

 「三個故事」

 

關於以反饋對付不確定性,郭雷在報告中講了三個典型「故事」:自校正調節器(線性系統的非線性反饋);比例-積分-微分(PID)控制(非線性系統的線性反饋);反饋機制能力(非線性系統的非線性反饋)。

 

首先是自校正控制器。郭雷指出,它的穩定性與收斂性被認為是自適應控制領域的「中心問題」。其表面看起來基本而又自然,但本質上卻是由一組很複雜的非線性與非平穩隨機動態方程所刻畫,這使其研究過程中面臨意想不到的數學困難。也正因如此,自校正調節器的穩定性和收斂性曾經是控制領域長期懸而未決的著名難題。

 

郭雷講述了他如何實現理論研究的突破,從而建立自校正調節器的全局穩定性、漸近最優性、最優收斂速度等重要性能的過程。特別是提到對智能系統基礎理論研究的啟發和借鑑意義。比如,在處理複雜系統問題時,在人工智慧系統設計中實現機器學習與實時決策的有機結合,通過這種「邊學習邊控制」的反饋機制,對真正「智能行為」的研究有重要意義。

 

再者是「比例-積分-微分(PID)」控制器。這是一種僅通過利用控制系統輸出的偏差來校正輸入端信號的線性反饋控制方法,具有無模型、數據驅動、簡單易用等特點。

 

「越簡單有效的方法往往越具有持久的生命力。」郭雷說,PID控制器具有百餘年歷史,是迄今為止實際工程技術系統中應用最為廣泛的控制器,例如,95%以上的過程控制迴路都是基於PID控制。 PID控制被譽為「控制工程師的麵包和黃油」,也被認為「沒有它就沒有現代文明」。

 

郭雷指出,值得注意的是,絕大多數實際系統都是非線性不確定性系統,但迄今為止,絕大多數理論研究卻都集中在線性系統,並且控制器參數的選取一般憑藉經驗或實驗。因此,PID理論研究與實踐之間存在著較大鴻溝,控制理論學者有責任來填補它。

 

近年來,郭雷與合作者在PID控制的基礎理論方面取得重要研究成果,它們不僅奠定了PID在工程中成功應用的理論基礎,還將為進一步改進或設計實際工程控制系統提供理論指導。

 

 「有所為,有所不為」

 

在郭雷看來,目前在控制理論中有兩大領域與「反饋與不確定性」研究的關係最密切,那就是魯棒控制和自適應控制。但是由於問題提法的不同,以前很少有具體研究結果涉及反饋機制對付不確定性的最大能力和根本局限。

 

在許多重要工程控制應用中,被控系統的不確定性比較大,自然期望反饋控制器對付不確定性的能力越大越好。因此,定量理解反饋機制的最大能力和根本局限非常重要。

 

他說:「面對系統的不確定性,我們不僅要知道反饋機制能夠做什麼,更要知道它不能做什麼,這樣會激勵我們不斷改進控制器的設計,以接近或達到理論上最大能力的極限,也可以減少對系統建模和學習的壓力,還可避免在控制器設計中走不必要的彎路。」

 

 「控制論發展至今,雖然進展很大,但還遠未成熟。」郭雷表示,信息技術的快速發展,使得研究越來越複雜的控制系統成為可能,同時也帶來了一系列有意義的挑戰性新問題,而對它們的研究往往仍然依賴於對控制領域的基本概念和基本問題的理解。

 

郭雷認為,除了不確定性外,在社會、經濟、生物中的許多複雜系統和未來「智能」工程系統等都需要加以調控,但它們作為被控對象可能會有自己的「追求目標」。對這類複雜系統的控制,已經超出傳統控制論或博弈論框架,需要在未來研究中加以重視。

 

版權聲明:凡本網註明「來源:中國科學報、科學網、科學新聞雜誌」的所有作品,網站轉載,請在正文上方註明來源和作者,且不得對內容作實質性改動;微信公眾號、頭條號等新媒體平臺,轉載請聯繫授權。郵箱:shouquan@stimes.cn。

相關焦點

  • 郭雷:以反饋控制「對付」智能時代不確定性
    「無處不在」  郭雷表示,在人工智慧時代,反饋控制與學習算法一樣,也將扮演關鍵角色,兩者都是對付系統不確定性的有力手段。控制系統是自動化或智能化系統的「大腦」,支配控制系統運行的是控制算法。  研究控制算法如何具體設計,如何保障其具有安全、穩定、優化等良好性能的學科是控制系統理論,而這一理論核心和關鍵的概念就是反饋。
  • 探尋系統之美 發揮控制之妙—新聞—科學網
    1961年,他從前蘇聯列寧格勒大學數學力學系畢業後,回國成為中科院數學所新成立的控制理論研究室的第一批成員。 「文革」結束後的1978年,在芬蘭召開的第七屆國際自動控制聯合會(IFAC)世界大會上,陳翰馥作了「關於隨機能觀性與能控性」的報告,這是該次大會錄取的唯一一篇來自中國大陸的論文。改革開放後,陳翰馥開始研究隨機系統的辨識與適應控制問題,這在當時乃至現在仍是自動控制理論的前沿。
  • 郭雷院士《時變隨機系統:穩定性與自適應理論》第二版出版
    郭雷院士的《時變隨機系統現在,他又在幾年鑽研的基礎上,寫出這本《時變隨機系統:穩定性、估計與控制》專著,用統一的觀點研究了幾個不同領域共同關心的問題,必將產生廣泛影響。這本專著,不僅概述了一系列重要的經典結果,同時也包括了郭雷近年來的研究成果,有些是首次發表。
  • 對付大黃蜂?試試水牛糞—新聞—科學網
    但這樣的行為真的是為了對付大黃蜂嗎?為此,研究者對比觀察了更多蜂巢,並密切追蹤了一些有攻擊行為的大黃蜂。 最終,他們發現,與被保護起來的蜂巢相比,那些更可能被大黃蜂攻擊的蜂巢上有更多的動物糞便。在蜂箱上塗抹來自不同大黃蜂的氣味後,研究者確認蜜蜂的這些行為是用來抵禦大黃蜂侵襲的。
  • 在充滿不確定性的世界裡準確突破—新聞—科學網
  • 競技智慧機器人 感受科技魅力—新聞—科學網
    12月20日,山東科技大學機電學院舉辦了「海信杯」大學生智慧機器人競賽,數百名學習機電、自動化、交通等專業的大學生同臺競技機器人挑戰賽、機器人循跡、機器人爬坡避障、機器人定向取物等項目的比賽,感受智慧機器人的魅力,提升自主創新能力
  • 是什麼控制著攻擊行為?—新聞—科學網
    圖片來源:中國科學院腦科學與智能技術卓越創新中心 攻擊行為是大多數脊椎動物甚至無脊椎動物中非常重要的本能行為之一,在人類社會中,攻擊行為以及無法控制的憤怒及衝動,也是精神類疾病如躁狂症、雙向情感障礙等重要的表現形式,因此對於攻擊行為發生的神經基礎研究,以及遺傳分子、外界環境對於攻擊行為神經環路的影響,可能為這些精神類疾病中出現的病理性攻擊行為提供新的治療思路
  • 「量子加密智慧型手機」真來了—新聞—科學網
    近日,國內多家媒體援引韓媒Etnews報導稱,三星公司將於5月聯手韓國電信運營商「SK電訊」共同推出「全球首款量子加密智慧型手機」。
  • 山東大學何以頻出一流數學家—新聞—科學網
    山東大學何以頻出一流數學家   獨創「夏道行函數」的夏道行院士,在解析數論尤其對「哥德巴赫猜想」作出重大研究成果的潘承洞,系統與控制科學家、中科院院士郭雷,在密碼學中做開創性貢獻的王小雲院士 此外,我們構建了「頂尖人才—領軍人才—青年人才—後備人才」四個層次銜接有序的傑出人才體系,將學術水平、發展潛力和學術影響力等作為選留人才和提供支持條件的重要評價依據,這為留住人才及人才的後續發展暢通通道。
  • 基因重組控制技術獲突破—新聞—科學網
    葉海峰向《中國科學報》介紹,他們利用課題組前期開發的遠紅光調控的哺乳動物細胞轉基因表達控制系統,將能響應遠紅光和合成c-di-GMP的光敏蛋白BphS,響應c-di-GMP的BldD蛋白以及Cre重組酶進行合理拼接組裝。
  • 多名科學家寄語中國科學報和科學網—新聞—科學網
    ◆何毓琦(中國科學院外籍院士) 自2007年起,作為科學網的一名博主,我已經深深感受到了世界舞臺上中國科學技術時代的到來。在《中國科學報》創刊六十年之際,我願送上我最美好的祝福。衷心祝願《中國科學報》以更加昂揚的姿態,在融合媒體的美麗畫卷上,書寫出更加壯麗的新時代科技創新偉大篇章。
  • 科技部將推動人工智慧五大方向研發—新聞—科學網
    圍繞人工智慧基礎研究、關鍵核心技術研發、產業化應用、政策試點示範等,科技部加快新一代人工智慧規劃有關任務的落實,實施重大項目,深入推進大數據智能、跨媒體智能、群體智能、增強混合智能、自主智能系統等五大方向的研發。
  • 可調控室溫磷光材料研究獲突破—新聞—科學網
    近日,華東理工大學費林加諾貝爾獎科學家聯合研究中心教授馬驤團隊基於前期純有機室溫磷光材料研究基礎,將動態共價化學與有機室溫磷光聚合物材料相結合,通過可逆狄爾斯—阿爾德反應,將熱可逆的動態共價鍵引入發光基團,構建了發光可調控的智能純有機室溫磷光聚合物材料
  • 朱美芳院士:把碳纖維穿在身上—新聞—科學網
    「智能的碳基纖維。」在3月30日愛思唯爾在線組織的能源前沿論壇上,中國科學院院士、東華大學材料科學與工程學院院長朱美芳教授給出答案,「世界上70多億人不僅要穿得漂亮,還要穿得更智能。」 朱美芳介紹,1940年之前,人類處於天然和人造纖維時代,人們常常使用棉花、麻類、絲綢、羊毛、粘膠等纖維材料做衣服;從1950年到1980年,人類進入常規合成纖維時代,從1980年到2000年,人類又進入了差別化纖維時代,如使用異形纖維、易染纖維等;而進入新世紀至今,功能纖維的時代開啟了,抗菌纖維、阻燃纖維、抗靜電纖維、耐光老化纖維等產品進入市場。
  • 航天智能控制技術讓運載火箭「會學習「
    1)萌芽期:19世紀中葉,Maxwell為解決蒸汽機調速系統劇烈問題,引出了控制穩定性等基本概念,在機械化廣泛應用的背景下,萌生了自動控制的研究需求。2)古典控制:在20世紀上半葉,Wiener等提出了控制中最經典的「反饋」概念,在通訊技術及自動控制的推動下,控制理論迅速發展。
  • 遠紅光可調控基因編輯—新聞—科學網
    該系統以較低強度的遠紅光外部照射作為控制手段,藉助於遠紅光本身的組織通透性優勢,克服了目前化學小分子調控以及藍光調控CRISPR-Cas9系統的缺點,具有遠程無痕、低本底洩露、低脫靶效應、低毒性等體內應用優勢,能夠在時間和空間上特異性精準控制體內深層組織和器官的基因編輯。 CRISPR-Cas9基因編輯技術作為新興的第三代基因編輯技術,因其諸多優點而倍受關注。
  • 張小曳:治理霧霾最主要的方法是減少排放—新聞—科學網
    張小曳解釋,氣象條件是汙染出現的必要外部條件,當汙染累積到一定程度後,還會使氣象條件進一步惡化,出現顯著的「雙向反饋」效應。 「雙向反饋」的機理是氣溶膠削弱到達地面的太陽輻射,抑制邊界層發展,使所有汙染物稀釋的能力明顯下降。因此,「雙向反饋」效應控制著PM2.5的爆發性增加。 張小曳提出,治理霧霾最主要的方法是減少排放。
  • 聚焦中微子-新聞專題-科學網
    此次發現加速了中微子物理理論研究的進展,成為了中國物理學史上新的裡程碑式發現,可以說為中微子研究開啟了新的時代。       科學網作為以網絡社區為基礎構建起面向全球華人科學家的網絡新媒體,利用網絡平臺優勢,2012年3月8日第一時間網絡同步直播中微子實驗結果新聞發布會
  • 周其仁教授:如何理解不確定性?不確定性不意味著一定是壞事情
    現在要討論怎麼對付通過經驗沒有辦法推斷的不確定性事件,其實關於對付不確定事件,人類的經驗已經積累了很長時間,我理解對付市場不確定性最主要的一個工具,一個機制就是企業組織。  大家看一個企業有哪些要件,第一個要件是要有資本金,而為什麼要有資本金?搞企業要有錢好理解,否則怎麼買設備,請人,買原料,但這個錢為什麼一定要是本金?為什麼不能借錢來?
  • 科學家提出新粒子生成物理機制新解釋—新聞—科學網
    一般認為新粒子生成僅受制於氣體前體物化學成分,其增長過程研究主要注重於光化學反應,但這些不能完全解釋實際發生的新粒子生成和增長的具體特性,也給重汙染事件預報帶來很大不確定性。 通過分析在中國、美國和芬蘭發生的大量新粒子生成事件及其伴隨的近地面湍流和氣溶膠各種特徵參數觀測,發現這些地區大氣前體物成分和含量有很大不同,但它們有一個共同點:新粒子生成前都伴隨不穩定大氣下很強的湍流發展趨勢。