深圳大學巧解AI算力資源難題,人工智慧教學科研駛上快車道

2020-12-12 浪潮企業級解決方案

深圳大學計算機與軟體學院(以下簡稱「深大計軟學院」)藉助浪潮人工智慧資源平臺AIStation巧妙地解決了AI算力資源調配和管理難題,將GPGPU資源利用率提升至60%以上,整體開發工作效率提升75%,AI科研和教學工作駛入快車道。

深圳大學是廣東省高水平大學重點建設高校,培養了馬化騰、張志東、史玉柱等傑出校友。依託國家戰略、地緣優勢和校友資源,深大計軟學院於2012年率先開啟AI科學研究與人才培養。在人工智慧領域取得了多項科研成果,承擔多個國家級自然科學基金項目。在晶片、算法、比賽以及論文等方面,也獲得了令人矚目的成績。在全球院校計算機科學排行榜CSRankings 2017-2019區間中,深圳大學計算機圖形學名列亞洲高校第一,進入世界一流水平。近年來,學院大力推進產學融合,積極開展人工智慧教學探索與實踐,與騰訊等領先AI企業合作制定了人工智慧人才培養方案,在課程體系、資源銜接、師資培訓、課程內容建設等方面進行了深度合作,成立了廣東省首個人工智慧學院。

為了支持人工智慧教學科研工作,深大計軟學院大力投入AI計算平臺建設,然而隨著AI應用場景的增加和使用人數的上升,AI算力資源調度管理問題逐漸凸顯。

AI算力資源管理拖累教學科研進度

2018年以前,深大計軟學院在AI計算資源獲得方面主要由各研究所/研究團隊自行解決。相關科研人員自行購買了大量的不同品牌的AI伺服器,新舊不一、型號各異,性能表現參差不齊,作業系統版本繁多。這些伺服器均託管於學院公用伺服器機房內,但由各個團隊自行進行維護,故障停機、維護停機是家常便飯,大多數AI伺服器的MTBF(平均故障間隔時間)低於150小時。同時相關伺服器僅在團隊內部共享,利用率低,而對機房製冷量、供電等資源的消耗卻很高。至2018年底,託管於學院公用伺服器機房內的各型AI伺服器已有近90臺,機房業務負荷(三相交流電)供電總電流高峰時超過110A,伺服器機房開通僅1年半即已超過接入線路設計最大供電能力的50%,而各研究團隊的採購和託管申請仍紛至沓來,機房管理人員苦惱不堪。

2018年起,深大計軟學院下決心建設統一的學院公共AI計算平臺,同時收緊研究團隊自行購買與託管AI伺服器,以期通過提升資源利用率來解決科研人員對AI計算資源的需求與機房動力系統約束之間的矛盾。學院統一採購了16臺8卡AI伺服器組成伺服器機群,安裝虛擬化軟體進行伺服器虛擬化,分配給學院師生使用。同時在另外6臺AI伺服器上安裝PBS系統,供研究各團隊按需申請,用於長時間模型訓練、調優等短期使用需求。然而,傳統虛擬化軟體對GPU資源的虛擬化支持較差,只能通過PCIe設備直通的方式手動分配給虛擬機使用,無法根據用戶的計算需求對GPU資源進行動態調度。而PBS等傳統並行計算機群管理系統,對GPU加速卡等異構計算資源的監控和調度能力也遠遠不能滿足公共AI計算平臺的需要,同時在多人共享使用時,運行環境、任務相互之間幹擾較大。

「當時在建這套AI計算平臺時,我們花了不少的精力,投入了很大的成本,但是卻沒有達到我們對提升人工智慧科研和教學效率的預期,這讓我們非常苦惱。」深大計軟學院AI計算平臺負責人提到。

巧解難題,AI教研駛上快車道

浪潮AIStation是面向企業級用戶提供的一體化人工智慧開發資源平臺, 可支持數據處理、AI算法開發、模型訓練、模型管理、模型部署等AI全鏈條操作管理。浪潮AIStation可以支持大規模計算集群擴展,支持CPU、GPU、FPGA等多種系統架構,在業內首先可以達到「管資源」、「管人」、「管調度」三管齊下。深大的AI算力資源管理難題在部署了浪潮AIStation之後已經迎刃而解,目前深大計軟學院AI計算平臺的GPGPU資源利用率,在高峰時期已提升至60%以上,而開發效率也大幅度提升,人工智慧教學科研步入快車道。

通過AIStation平臺,集群管理員可以清晰地了解到每個使用者對資源使用和提交訓練任務的狀況,將閒置的計算資源進行有效的管理,並靈活配置用戶的資源配額,防止資源過多佔用和浪費。

深大師生通過AIStation可以自行按需申請資源,AIStation自動分配GPU資源給用戶使用。其GPU共享策略可實現實現多人共用一臺機器、多人共用一張GPU卡,開發環境相互隔離互不影響,大大縮短了以往的排隊等待時間,大幅降低了因任務相互幹擾而造成的故障停機和數據丟失的風險。

此外,AIStation還支持任務排隊託管、定義任務優先級。深大師生們現在可以同時提交多個訓練任務,資源不足時排隊等待,一個任務訓練結束後自動釋放資源給排隊等待的任務,從而可以更好地利用夜間、假期執行訓練任務,同時可設置優先級,讓重要任務優先執行。

AIStation還提供基於Web的用戶界面,師生們無需安裝任何插件,通過瀏覽器即可快速接入實驗平臺。疫情期間,藉助AIstation進行遠程教學和科研實驗,深大計軟學院迅速恢復了正常的教學和科研工作,更好地應對了疫情帶來的挑戰。

「在AIStation的幫助下,我們可以把精力更多地投入到教學與科研中去,不用再苦苦尋找計算資源了。」深大計軟學院一名教師說,「同時,AIStation採用圖形化界面,內置多種主流深度學習框架和開發組件,能夠快速部署開發環境,大大降低了學生們的學習難度和使用門檻,提高了學生們的實驗效率,也為AI開發和教學提供了極大的便利,將我們的開發工作效率整體提升了近一倍。」

深大計軟學院借力浪潮AIStation擺脫了AI算力資源難題,將繼續堅守「視野寬廣、素質優良、注重實踐、創新創業」的人才培養原則,加速推進AI科研創新與人才培養,打造人工智慧教研標杆高校。

相關焦點

  • 編程貓與深圳大學合作《圖形化的人工智慧編程課程的設計與開發...
    2020年10月26日上午,教育部產學合作協同育人項目——圖形化的人工智慧編程課程的設計與開發(項目編號:201802283001)項目結題評審會在深圳大學師範學院國際會議廳順利召開。  出席評審會的有胡世清(深圳大學教育技術系主任、教授)、李冰(深圳大學老師、博士、講師)、秦曾昌(編程貓首席科學家、編程與人工智慧教育研究院院長)、夏立(編程貓首席學術官)、戴啟明(編程貓高校合作發展部負責人)、邵雪竹(
  • 深圳大學首次獲得吳文俊人工智慧科學技術獎
    深圳大學作為主要單位完成的項目「面向下一代信息處理的智能光電子元器件與晶片」成果獲得吳文俊人工智慧專項獎晶片項目三等獎。這是深圳大學首次獲得該獎項。經全國各地方人工智慧學會、協會及聯盟,各高校及科研(院)所,學會各專業委員會及工作委會,各團體會員(企業)單位和兩院院士、學會會士等專家學者的提名推薦,吳文俊人工智慧科學技術獎辦公室通過對提名項目進行網絡評審、會議初評和終評答辯,最終對100個成果授獎。
  • 深圳教育裝備博覽會舉辦 「人工智慧+教育」解決方案搶眼
    鄭小紅 攝中新網深圳9月20日電(記者 鄭小紅)人工智慧正逐漸進入從小學到大學教育領域,18日至20日在深圳會展中心舉辦的第三屆(2020)深圳教育裝備博覽會,以「先行示範,智引未來」為主題,智慧教育產品各顯其能,「人工智慧+教育」解決方案尤為搶眼。
  • 浙江工商大學薩塞克斯人工智慧學院成立 今年招本碩學生300名
    今天上午,由浙江工商大學和英國薩塞克斯大學共建的浙江工商大學薩塞克斯人工智慧學院揭牌成立。作為國內第一個中外合作辦學的人工智慧學院,將開設電子信息工程、通信工程兩個本科專業,機器人與自動化系統、人工智慧與自適應系統兩個碩士專業,今年計劃招收本科生200名,碩士研究生100人。
  • 南山區是深圳科研、教育中心,集中了深圳最優質的的高等教育資源
    南山區是深圳的科研、教育、體育中心,是深圳大學、南方科技大學、深圳大學城、深圳市高新技術產業園、深圳灣體育中心所在地。南山區旅遊資源豐富,有深圳華僑城、世界之窗、歡樂谷、錦繡中華,海上世界、新安古城、青青世界、深圳野生動物園、南頭古城等主題公園和著名景點。2016年5月,深圳市南山區成為國務院首批雙創區域示範基地。
  • 深圳清華大學研究院下一代網際網路研發中心參加CERNET學術年會超算...
    12月3日下午,中國教育和科研計算機網CERNET第二十七屆學術年會超算網際網路和高性能論壇在深圳成功舉辦。深圳清華大學研究院下一代網際網路研發中心受邀參加此次論壇,與來自國家科研機構、國家超算中心與高校超算中心的多位專家學者圍繞超算網際網路建設實踐與需求展望、國家超算中心應用發展與網絡需求、高校超算平臺建設及其科研支撐作用等主題,展開深入研討與廣泛交流。我國超算中心的發展近年來在國家政策的支持下,取得了巨大的進展,初步形成了基礎設施形態。
  • 本土動漫遊戲駛上快車道 人才缺口待補足
    原標題:本土動漫遊戲駛上快車道 人才缺口待補足 摘要 【本土動漫遊戲駛上快車道 人才缺口待補足】這兩款高人氣的遊戲IP均為「本土」打造,且都在多領域進行衍生開發
  • 港中大(深圳)「牽手」龍崗區人民政府,「八大亮點」開創政府與大學...
    大學將充分發揮海外引進的專家學者的科研創新能力,聯合深港兩地優質資源,結合龍崗區產業發展布局,以科技創新為核心,在電子信息、智能製造、生物醫藥、新能源、新材料以及教育醫療、人才交流等方面,建設一批高端智庫,打造一批科研平臺,共建一批孵化基地,為龍崗區的創新發展和深港合作提供強有力的支撐。香港中文大學(深圳)校長徐揚生致辭港中大(深圳)希望成為龍崗區的文化中樞。
  • 香港中文大學(深圳):辦學六年,交出了一份滿意答卷
    徐揚生校長介紹大學辦學進展 屬於港中大(深圳)的明天一定是曙光一片香港中文大學(深圳)校長徐揚生教授港中大(深圳)校長徐揚生教授在線介紹,香港中文大學(深圳)的發展之路已走過六年,一步一個腳印,不斷向前邁進,在優質教學、人才引進、科研創新、國際交流等諸多方面
  • 這位重大教授,帶領其「機械科研天團」攻克軸承技術領域多項難題!
    重慶大學機械工程學院邵毅敏教授及其「機械科研天團」就是其中「一份子」,他們共同解決了嫦娥五號核心鑽取裝置衝擊機構疲勞技術難題,保證月壤的成功採集。 邵毅敏多年來積極參與了冶金、交通、船舶、車輛等多個領域的重要項目,為國家做出了重要貢獻。
  • 【碩士課程】深圳大學南特商學院2020級金融科技與風險控制理學...
    深圳大學與法國南特高等商學院2020級中外合作辦學項目金融科技與風險控制理學碩士金融科技與風險控制專業是中國教育部批准的由深圳大學與法國南特高等商學院共同推出的中外合作辦學項目
  • 寧波大學:將科研做在服務產業中
    據了解,連續三年,寧波大學材料科學與化學工程學院在《高等分析化學》研究生課程一直做的事情,就是對遂昌縣茶葉成分進行比對,找出一些特異性的指標,將遂昌的茶葉與其它地區的茶葉區分開來,由此進行產地保護。這也是該課程教學「內外雙驅、知德合一」教改中重要的一項內容。
  • 香港中文大學(深圳)舉行網絡傳媒春茗活動, 與100餘位媒體記者相約...
    今年,香港中文大學(深圳)的發展之路已走過六年,這六年裡,大學一步一個腳印,不斷向前邁進,在優質教學、人才引進、科研創新、國際交流等諸多方面,給社會交出了一份滿意的答卷。  經過六年的發展,大學學科建設已逐步完善,截至目前,大學已有經管學院、理工學院、人文社科學院和生命與健康科學學院四個學院,醫學院正在籌建之中,開設17個本科生專業和 18個研究生專業。
  • 人工智慧產業鏈基礎層發展薄弱,北京AI發展步入快車道
    打開APP 人工智慧產業鏈基礎層發展薄弱,北京AI發展步入快車道 佚名 發表於 2020-12-09 15:10:47 人工智慧產業鏈分為基礎層、技術層和應用層。
  • 山東農業大學園藝科學與工程學院教學科研實踐育人基地在岱崮鎮揭牌
    11月17日,山東農業大學園藝科學與工程學院教學科研實踐育人基地在岱崮鎮揭牌。國家文化和旅遊部資源開發公司紅色旅遊指導處副處長韓冰、省文化和旅遊廳資源開發處二級調研員吳紅、山東農業大學社會合作與成果轉化處副處長王永軍、山東農業大學園藝科學與工程學院院長彭福田、山東師範大學副教授、MBA中心副主任餘潔、臨沂市文化和旅遊局二級調研員陳常密、縣領導李永剛出席揭牌儀式。
  • 深圳大學首個中外合作辦學項目今年招生
    近日,教育部公布了最新一批中外合作辦學項目,深圳大學與法國南特高等商學院合作舉辦的金融科技與風險控制理學碩士項目入選。歐美發達國家憑藉科研能力優勢在技術研發方面較為領先,我國在實踐應用方面走在國際前列。目前,我國只有極少數高校開設了相關專業,且尚處於起步階段。
  • 塔克創新:專注人工智慧教育科研機器人 打造全球領先品牌
    塔克創新秉持著「產品與服務至上」的理念,專注ROS教育機器人產品的研發,踏實穩健地走在人工智慧機器人的道路上。  以興趣為業,研發人工智慧教育機器人  「從小熱愛機器人,大學學習的是機器人專業。」 煙臺塔克創新總經理韓泉城說道。興趣是最好的老師,懷著對機器人的熱愛,韓泉城在積累了一些工作經驗後,毅然辭去了穩定的工作,創辦了塔克創新。
  • 香港中文大學(深圳)舉辦全球與當代中國高等研究院成立儀式暨全球...
    中國社會科學院副院長蔡昉教授、廣東省政府副秘書長陳岸明先生,香港中文大學(深圳)理事會理事、深圳市原副市長唐傑教授,深圳市政府副市長聶新平先生,以及深圳市和龍崗區相關部門負責人、高等院校、科研院所、深圳市企業界代表、社會媒體與香港中文大學(深圳)部分師生代表共同出席並見證了全球與當代中國高等研究院的正式成立。
  • 深圳大學藝術學部及專業簡介(2021版)
    【科研平臺】藝術學部現擁有藝術設計省級實驗教學示範中心、深圳大學美術館、深圳現代設計博物館、設計部落、三號藝棧、深圳現代藝術設計研究中心、深圳傳統音樂文化教育基地、深圳市音樂劇創作中心、廣東省流行歌舞實訓基地、音樂廳、廣東省深圳大學藝術創作與演出實踐基地等機構,擁有良好的實驗、科研平臺和環境。
  • 【訊方新聞】「AI」拍了拍你:請查收人工智慧專業實驗室解決方案!
    與此同時,人工智慧專業作為新興專業,高校在專業建設過程中面臨著諸多問題:人才培養方向如何定位、課程體系是否完善、人工智慧教學如何開展、師資力量能否支撐教學、應用實踐環境是否具備等,這些因素都影響著人工智慧人才培養的效率和質量。