啟元世界:打造AI決策智能體,小樣本實現10的26次方複雜空間決策

2020-12-12 金融界

來源:創業邦

2020年ChinaJoy周末在上海如期舉行,今年這場備受關注的數字娛樂盛會融合了更多前沿科技的元素。

其中,國內決策AI技術公司啟元世界在會上展出了與人對戰的星際AI——啟元星際指揮官,及與人配合協作的娛樂智能體,引起了業界轟動。

「人機對戰」一直以來都是AI玩家的角逐之地。在AlphaGo徵服世界圍棋冠軍後,這一趨勢顯得更加明顯。不過圍棋策略類遊戲已不足以展現玩家的全方位AI技術能力,於是,兼具戰術策略博弈+即時對抗的《星際爭霸》成為了下一個目標。

在6月舉辦的《星際爭霸》人機大戰中,啟元AI「星際指揮官」不負眾望,以兩個2:0的成績先後擊敗人類頂尖職業選手——全國冠軍黃慧明(TooDming)以及中國星際最強人族選手李培楠(TIME)。

開發這款「星際指揮官」的公司為啟元世界,成立於2017年8月,是一家AI認知決策技術公司,致力於利用深度學習、強化學習和超大規模並行計算等技術,搭建智能體應用訓練雲平臺,為企業客戶提供端到端的智能體開發、訓練、評估和部署工具,幫助其快速構建智能體應用。

公司核心成員大多來自BAT、Netflix、香港科大、伯克利等國內外知名高科技企業和一流院校,具備深度學習、強化學習、雲計算等核心技術的自主研發能力,且在產品打造方面擁有豐富的行業應用經驗。

啟元世界CEO袁泉在技術產品領域積澱深厚,曾擔任阿里認知計算實驗室負責人和資深總監,是手機淘寶、手機天貓推薦算法團隊締造者。

「和DeepMind、OPENAI類似,以在線遊戲為試驗平臺,以行業賽事作為技術驗證,快速打磨決策智能體訓練雲平臺服務相關行業,是啟元世界近期正在做的事。」袁泉告訴創業邦。

據悉,成立至今,啟元世界選擇各類典型遊戲打磨新一代決策AI技術,已在2018年底獲NeurIPS 2018多智能體強化學習比賽冠軍,2019年中旬,啟元星際指揮官3:0擊敗人類黃金選手,2020年中旬獲CVPR 2020機器人虛實遷移挑戰賽冠軍。

對於此次在星際爭霸中打敗職業冠軍選手,袁泉表示,相比於圍棋人機對戰,這次比賽中增加了複雜場景感知、分析決策、長期規劃運營和實施操作四個維度的技術難度:

首先,對複雜場景的感知方面,圍棋棋盤環境簡單,只需按照落子順序操作即可,但星際爭霸中需要啟元AI實時感知周圍環境,在毫秒級做出判斷;

其次,在決策方面,啟元AI必須在十幾毫秒時機內快速做出決策,保證決策準確性;

然後,在定位方面,由於圍棋棋盤規格固定為16×16,難度較低,而此次比賽中,決策空間高達10的26次方,還需要從200個作戰單位中選出作戰主體;

同時,在具體操作中,還需要依託、感知、分析、定位能力,精準空投到地圖的指定位置上,技術門檻頗高。

「這四個維度的能力所帶來的乘數效應的疊加,最終實現了看似不可能的『奇蹟』。」袁泉告訴創業邦。

在挑戰賽結束後,部分網友表示,AI的高APM值似乎在其中起到了天然優勢。對此,啟元世界技術團隊在賽後進行技術分析後解釋:對局過程中,AI的平均APM值為250左右,僅略高於職業選手李培楠237左右的水平,並不會影響此次比賽成績。

當然,此次比賽只是啟元世界AI技術能力的一個縮影,其背後是強大底層技術的有力支撐。

據袁泉透露,啟元世界智能雲訓練雲可以實現AI自我訓練,通過小樣本學習,再利用自主搭建的智能體COMMANDER神經網絡,同時結合高效率的群體演化訓練方法,不僅可在有限的算力條件下,增強智能體的魯棒性,還實現智能體的快速進化。而此次比賽中,啟元世界僅用了頂尖科技公司1%的算力。

不過,袁泉也深知,AI開發的最終目標是將這一技術應用於現實世界,而不僅僅停留在遊戲層面。

因此,啟元世界還基於AI技術基礎搭建了一個私有雲部署、軟硬結合智能體訓練雲平臺,真正將技術融入行業中,為公共科技、數字娛樂、電力能源、機器人等行業客戶提供AI解決方案,幫助客戶快速構建智能體應用,實現智能化轉型。

目前這款智能體訓練雲平臺已深度服務於數十家國內相關行業的知名公司、院校和科研機構。

據悉,啟元世界已於2017年獲得來自高榕資本的數千萬元天使輪融資,並於2018年12月完成知名投資機構Pre A輪融資。

文章來源於啟元世界,經授權使用。本文為創業邦原創,未經授權不得轉載,否則創業邦將保留向其追究法律責任的權利。如需轉載或有任何疑問,請聯繫editor@cyzone.cn。

相關焦點

  • 深度強化學習+啟發人類的決策智能,專訪一家有願景的中國企業...
    啟元世界是一家 2017 年成立的以認知決策智能技術為核心的公司,由前阿里、Netflix、IBM 的科學家和高管發起,多位名牌大學的博士和碩士加入,並擁有伯克利、CMU 等知名機構的特聘顧問。啟元世界的願景是「打造決策智能、構建平行世界、激發人類潛能」,團隊核心能力以深度學習、強化學習、超大規模並行計算為基礎,擁有網際網路、遊戲等眾多領域的成功經驗,受到國內外一流投資人的青睞。
  • 2:0戰勝星際2頂級職業選手,啟元AI「星際指揮官」一戰成名!
    6月21日,在啟元世界舉辦的國內首屆《星際AI頂級職業選手挑戰賽》中,啟元「AI星際指揮官」以2:0的成績戰勝《星際爭霸I/II》全國冠軍黃慧明(TooDming)和黃金總決賽冠軍、最強人族選手李培楠(Time)。與圍棋相比,《星際爭霸》屬於不完全信息博弈,戰爭迷霧對AI的戰略規劃、布局、決策提出了更高的要求。
  • 從決策樹到隨機森林:樹型算法的原理與實現
    簡要來說,創建一個決策樹包含兩步:1. 把預測器空間,即一系列可能值 X_1,X_2,...,X_p 分成 J 個不同的且非重疊的區域 R_1,R_2,...,R_J。2. 對進入區域 R_J 的每一個樣本觀測值都進行相同的預測,該預測就是 R_J 中訓練樣本預測值的均值。為了創建 J 個區域 R_1,R_2,...
  • 打造自進化城市智能體,雲天勵飛打造「1+1+N」生態聯盟
    活動上,雲天勵飛董事長兼CEO陳寧重磅發布「自進化城市智能體」。陳寧表示,未來 10 年是新基建的關鍵 10 年,是基於自進化城市智能體發展的關鍵 10 年,也是AI技術自進化學習的關鍵 10 年,雲天勵飛願攜手合作夥伴,共同打造群智、群創、群享的自進化城市智能體生態。
  • 不只是顛覆,九次方打造數字農業新未來
    機遇當前,同時也應該看到推動農業實現數位化並非易事,季節性、地域性,生物的生長繁育規律和自然條件的制約……農業涉及的勞動對象和產出都是有生命力的動植物,從事農業的勞動力,農業依賴的氣象、土地、河流湖泊、草場等資源環境無一不在變動之中。這為農業的數位化轉型升級增加了難度。紛繁複雜的因素也正為農業提供了豐富的數據。是短板是窪地,往往代表著更大的發展空間。
  • ...版本AI商業決策平臺,提高90%決策效率,為企業提供GPS般「導航」
    成立於2016年的訊能集思,便是一家致力於開發人工智慧商業決策平臺的公司,透過洞察數據、預測行為與流程自動化,協助企業解決日常運營、產銷供應鏈、產品生產製造流程等問題,並透過數據賦能,幫助企業實現智能化管理。
  • 智慧氣象大屏可視化決策系統
    數據分析決策駕駛艙  支持對各級各類氣象機構現有數據資源,提供統計圖表、分布圖、關係圖、空間統計圖、空間分布圖、空間關係圖等多大類近百種數據可視分析圖表,進行多維度分析研判,並支持組合為數據分析駕駛艙進行綜合顯示,實現多指標數據的並行監測分析,為管理者決策研判提供全面的數據支持。
  • 如何用決策樹模型做數據分析?
    簡單:邏輯相對簡單,整個算法沒有更複雜的邏輯,只是對節點進行分叉;高效:模型訓練速度較快;強解釋性:模型的判斷邏輯可以用語言清晰的表達出來,比如上述決策樹案例中的判斷,就可以直接用語言表述成:脫離水不能生存的沒有腳蹼的動物,我們判斷它是魚
  • 智慧景區可視化決策系統
    1.產品概述數字冰雹智慧景區可視化決策系統,面向景區運營管理部門,支持整合景區現有信息系統的數據資源,覆蓋景區各業務領域,憑藉先進的人機互動方式,實現景區三維全景可視化、景觀資源管理可視化、景區客流監測、景區自然環境監測等多種功能,用以提升景區管理者的指揮決策效率,實現景區的智慧化管理和運營,可廣泛應用於態勢監測、應急指揮、
  • OpenAI嘗試打破「中文房間悖論」,讓AI創造語言並自發交流
    雷鋒網了解到,如今越來越多的研究表示,如果用某種語言訓練計算機,實際上系統並不能深刻理解語言與真實世界的關係。OpenAI 發現了這一問題,並致力於讓智能體自己創造基於自身感知的語言。圖示展示了智能體是如何溝通的。
  • 專訪IJCAI 17 傑出青年科學家夏立榮博士:以人為本,是群體決策的必...
    從「人機合作」和「以人為本(human-aware)」兩個角度,如何理解改善群體決策的研究的?夏立榮博士認為,群體決策是人類社會中十分常見的問題。大到政治選舉,國防,醫療,經濟等重要決策,小到企業招聘,朋友聚餐點菜等,都屬於群體決策的範疇。「困難之處在於人們的偏好經常不一致,導致經常不存在對所有人都最優的決策。
  • 華為鄭葉來:知識計算是實現行業知識與AI結合的全新途徑
    來源:時刻頭條今世界,新一輪科技革命和產業變革方興未艾,並帶動數位技術快速發展。在這一背景下,世界網際網路大會·網際網路發展論壇於11月23日在浙江烏鎮開幕。進而實現輔助人高效分析和決策,釋放行業專家的精力,集中關注業務創新,輔助人實現高效知識傳承,縮短人員培養周期。許多企業藉助華為雲知識計算解決方案,打造了自己的知識計算平臺,通過釋放知識的力量,推動AI進入核心業務系統。到目前為止,華為雲知識計算解決方案已經在石油、汽車、醫療、化纖、煤焦化、鋼鐵、交通等多個行業進行實踐並取得不錯進展。
  • 智能體實現了從「點」、「線」的智能到「面」、「體」的智能
    面向數字經濟時代,華為將充分利用'5機'協同的技術優勢,基於'智能體'技術參考架構和華為雲,與政府、企業、運營商、行業夥伴一起打造城市智能體、工業智能體、行業智能體,助力廣州數字經濟的高速發展,成為創新、創業、創投的沃土,加速實現全場景智慧。"數字經濟已成為經濟增長的主引擎,這不僅是數字經濟本身的增長,更多的是數位技術帶來的行業數位化的增長。
  • 高速公路大屏可視化決策系統
    1.1.2 車流量監測支持集成交管部門數據,實現管轄路段車流量的實時監測,並可基於專業的模型算法,對車流量、平均車速等多項核心數據進行多維度可視化分析,實現管轄路段車流量的科學監測評估,為交通指揮提供科學的決策支持。
  • 決策樹模型
    母親說:26。女孩問:很帥長得不好看?母親說:挺帥的女孩問:收益高不高?母親說:算不上很高,中等水平狀況。女孩問:是很勤奮,熱愛學習嗎?1假設滿意的最高分是10分,不滿意的最高分是-10分,2脾氣好,有錢,你有多滿意?如果真是這樣,那是100%的滿意啊!打10分。
  • 智慧高速大屏可視化決策系統
    車流量監測支持集成交管部門數據,實現管轄路段車流量的實時監測,並可基於專業的模型算法,對車流量、平均車速等多項核心數據進行多維度可視化分析,實現管轄路段車流量的科學監測評估,為交通指揮提供科學的決策支持。
  • 雀神,微軟亞研推出超級麻將AI Suphx,還上了專業十段水平
    以前圍棋的難主要體現在狀態空間非常複雜,19×19 的棋盤上每一個位置都有「黑、白、無」三種狀態,這樣的複雜度差不多是 10^172。2017 年,AlphaZero 利用蒙特卡洛樹搜索 和深度強化學習,成功解決了包括圍棋在內的多個完美信息遊戲。既然完美信息博弈已經難不倒智能體了,那麼該探索探索不完美信息了。
  • KT決策法:管理者高效決策的法寶,讓你擺脫決策恐懼症的決策方法
    今天第一桶金學派和大家聊一聊助力企業進行高效決策的法寶——KT決策法。01關於KT決策法KT決策法是美國蘭德公司的凱普納(Kepner)和特雷高(Benjamin B.Tregoe)這一經典的決策工具已被翻譯成17種語言,並被世界各地許多國家的數千名員工和經理使用。KT決策方法通過對各個要素的排序和識別,可以提供無偏見的決策分析,優化最終的決策結果。
  • 阿里餘勇:消費者決策的鏈路越來越複雜
    餘勇指出整個消費者決策的鏈路不斷在演進,變得越來越複雜。怎樣找到和消費者產生互動、交易、從而達到自己商業目的的那個買點,這是一個比較大的挑戰。據悉,第二屆中國品牌電商峰會由火蝠電商主辦、億邦動力承辦,於12月17日在廣州萬富希爾頓酒店舉行。
  • 揭開可口可樂公司的品牌決策秘訣
    因其具有都市時尚感的形象,符合現代人享受和拓展生活空間的生活主張,並且又順應了部分消費者需求低熱量飲食的選擇,上市之後廣受各地消費者的喜愛,迅速搶佔市場,成為全球第三大飲料品牌。利用消費者對可口可樂這個現有品牌的認知度和認可度推出符合消費者需求的新產品,可以實現快速盈利。多品牌決策可口可樂在中國地區銷售三種品牌果味碳酸汽水,其中比較相近的是擁有橙、蘋果、葡萄、青檸、西瓜等八種口味的芬達和有蘋果、葡萄、荔枝、西瓜四種口味的醒目,另外就是檸檬味汽水雪碧。