深圳大學巧解AI算力資源難題,人工智慧教學科研駛上快車道

2020-12-10 浪潮企業級解決方案

深圳大學計算機與軟體學院(以下簡稱「深大計軟學院」)藉助浪潮人工智慧資源平臺AIStation巧妙地解決了AI算力資源調配和管理難題,將GPGPU資源利用率提升至60%以上,整體開發工作效率提升75%,AI科研和教學工作駛入快車道。

深圳大學是廣東省高水平大學重點建設高校,培養了馬化騰、張志東、史玉柱等傑出校友。依託國家戰略、地緣優勢和校友資源,深大計軟學院於2012年率先開啟AI科學研究與人才培養。在人工智慧領域取得了多項科研成果,承擔多個國家級自然科學基金項目。在晶片、算法、比賽以及論文等方面,也獲得了令人矚目的成績。在全球院校計算機科學排行榜CSRankings 2017-2019區間中,深圳大學計算機圖形學名列亞洲高校第一,進入世界一流水平。近年來,學院大力推進產學融合,積極開展人工智慧教學探索與實踐,與騰訊等領先AI企業合作制定了人工智慧人才培養方案,在課程體系、資源銜接、師資培訓、課程內容建設等方面進行了深度合作,成立了廣東省首個人工智慧學院。

為了支持人工智慧教學科研工作,深大計軟學院大力投入AI計算平臺建設,然而隨著AI應用場景的增加和使用人數的上升,AI算力資源調度管理問題逐漸凸顯。

AI算力資源管理拖累教學科研進度

2018年以前,深大計軟學院在AI計算資源獲得方面主要由各研究所/研究團隊自行解決。相關科研人員自行購買了大量的不同品牌的AI伺服器,新舊不一、型號各異,性能表現參差不齊,作業系統版本繁多。這些伺服器均託管於學院公用伺服器機房內,但由各個團隊自行進行維護,故障停機、維護停機是家常便飯,大多數AI伺服器的MTBF(平均故障間隔時間)低於150小時。同時相關伺服器僅在團隊內部共享,利用率低,而對機房製冷量、供電等資源的消耗卻很高。至2018年底,託管於學院公用伺服器機房內的各型AI伺服器已有近90臺,機房業務負荷(三相交流電)供電總電流高峰時超過110A,伺服器機房開通僅1年半即已超過接入線路設計最大供電能力的50%,而各研究團隊的採購和託管申請仍紛至沓來,機房管理人員苦惱不堪。

2018年起,深大計軟學院下決心建設統一的學院公共AI計算平臺,同時收緊研究團隊自行購買與託管AI伺服器,以期通過提升資源利用率來解決科研人員對AI計算資源的需求與機房動力系統約束之間的矛盾。學院統一採購了16臺8卡AI伺服器組成伺服器機群,安裝虛擬化軟體進行伺服器虛擬化,分配給學院師生使用。同時在另外6臺AI伺服器上安裝PBS系統,供研究各團隊按需申請,用於長時間模型訓練、調優等短期使用需求。然而,傳統虛擬化軟體對GPU資源的虛擬化支持較差,只能通過PCIe設備直通的方式手動分配給虛擬機使用,無法根據用戶的計算需求對GPU資源進行動態調度。而PBS等傳統並行計算機群管理系統,對GPU加速卡等異構計算資源的監控和調度能力也遠遠不能滿足公共AI計算平臺的需要,同時在多人共享使用時,運行環境、任務相互之間幹擾較大。

「當時在建這套AI計算平臺時,我們花了不少的精力,投入了很大的成本,但是卻沒有達到我們對提升人工智慧科研和教學效率的預期,這讓我們非常苦惱。」深大計軟學院AI計算平臺負責人提到。

巧解難題,AI教研駛上快車道

浪潮AIStation是面向企業級用戶提供的一體化人工智慧開發資源平臺, 可支持數據處理、AI算法開發、模型訓練、模型管理、模型部署等AI全鏈條操作管理。浪潮AIStation可以支持大規模計算集群擴展,支持CPU、GPU、FPGA等多種系統架構,在業內首先可以達到「管資源」、「管人」、「管調度」三管齊下。深大的AI算力資源管理難題在部署了浪潮AIStation之後已經迎刃而解,目前深大計軟學院AI計算平臺的GPGPU資源利用率,在高峰時期已提升至60%以上,而開發效率也大幅度提升,人工智慧教學科研步入快車道。

通過AIStation平臺,集群管理員可以清晰地了解到每個使用者對資源使用和提交訓練任務的狀況,將閒置的計算資源進行有效的管理,並靈活配置用戶的資源配額,防止資源過多佔用和浪費。

深大師生通過AIStation可以自行按需申請資源,AIStation自動分配GPU資源給用戶使用。其GPU共享策略可實現實現多人共用一臺機器、多人共用一張GPU卡,開發環境相互隔離互不影響,大大縮短了以往的排隊等待時間,大幅降低了因任務相互幹擾而造成的故障停機和數據丟失的風險。

此外,AIStation還支持任務排隊託管、定義任務優先級。深大師生們現在可以同時提交多個訓練任務,資源不足時排隊等待,一個任務訓練結束後自動釋放資源給排隊等待的任務,從而可以更好地利用夜間、假期執行訓練任務,同時可設置優先級,讓重要任務優先執行。

AIStation還提供基於Web的用戶界面,師生們無需安裝任何插件,通過瀏覽器即可快速接入實驗平臺。疫情期間,藉助AIstation進行遠程教學和科研實驗,深大計軟學院迅速恢復了正常的教學和科研工作,更好地應對了疫情帶來的挑戰。

「在AIStation的幫助下,我們可以把精力更多地投入到教學與科研中去,不用再苦苦尋找計算資源了。」深大計軟學院一名教師說,「同時,AIStation採用圖形化界面,內置多種主流深度學習框架和開發組件,能夠快速部署開發環境,大大降低了學生們的學習難度和使用門檻,提高了學生們的實驗效率,也為AI開發和教學提供了極大的便利,將我們的開發工作效率整體提升了近一倍。」

深大計軟學院借力浪潮AIStation擺脫了AI算力資源難題,將繼續堅守「視野寬廣、素質優良、注重實踐、創新創業」的人才培養原則,加速推進AI科研創新與人才培養,打造人工智慧教研標杆高校。

相關焦點

  • 天津大學喬治亞理工深圳學院信號處理與數據分析科研中心成立
    本站訊(記者劉曉豔 通訊員王志亞 攝影趙習鈞)7月18日上午,天津大學喬治亞理工深圳學院信號處理與數據分析科研中心在深圳揭牌。這也是繼今年5月成立人工與智能學部以來,天津大學在人工智慧方向上的又一突破和布局。
  • 粵西北邊城連山旅遊駛上快車道
    2014連山戲水節。   她就是清遠市連山壯族瑤族自治縣,此前連山由於位置偏遠等客觀因素,旅遊業發展受到限制,但今年來,連山抓住二廣高速開通的機遇,利用自身生態優勢和壯瑤風情,採取「網際網路+」等措施,旅遊業進入飛速發展的「快車道」。
  • ...深圳技術大學工程物理學院招聘學科帶頭人、教學科研崗、博士後...
    一、學校和學院簡介深圳技術大學是廣東省和深圳市高起點、高水平、高標準建設的本科層次公辦普通高等學校。2015年,深圳市委市政府開始籌建深圳技術大學。2018年11月30日,經教育部批准正式設立深圳技術大學,學校獨立招生,標識碼為4144014655,定位於應用型高等學校。
  • 深圳技術大學2019-2020學年度教學科研崗招聘啟事
    中國教育在線訊 根據深圳技術大學教學科研崗工作安排,即日起公開招聘教學科研崗人員若干名,現就有關事項公告如下:   一、崗位基本聘用條件  (一)遵守我國憲法和法律; (二)報名步驟:   1)請進入深圳技術大學2019-2020學年度教學科研崗招聘啟事( http://ohr.sztu.edu.cn/zp/a/zp/news/recruitPost?postType=1&planId=385&tmp=2 )了解更多信息及完成崗位申請。
  • 法院「拍了拍」銀行 金融糾紛化解駛上「快車道」
    為紮實做好「六穩」工作、落實「六保」任務,今年以來,象山法院主動強化法銀聯動,積極通過「兩室聯動」、「訴調對接」、「繁簡分流」和「考核激勵」四大驅動,助力金融糾紛化解駛上快車道。
  • 穿金戴銀與澳門城市大學產學研合作籤約儀式圓滿舉行
    近日,澳門城市大學人文社會科學學院與深圳穿金戴銀科技股份有限公司舉行產學研合作籤約儀式!   籤約雙方本著「優勢互補、資源共享、共贏發展」的原則,充分發揮各自優勢及資源稟賦,圍繞「科技與文化融合」的發展方向,攜手共建全方位的腕錶研發創新合作機制。
  • 2019廣東深圳技術大學工程物理學院招聘教學科研崗、專職研究系列...
    深圳技術大學工程物理學院招聘教學科研崗、專職研究系列、博士後一、學校和學院簡介深圳技術大學是廣東省和深圳市高起點、高水平、高標準建設的本科層次公辦普通高等學校。2015年,深圳市委市政府開始籌建深圳技術大學。2018年11月30日,經教育部批准正式設立深圳技術大學,學校獨立招生,標識碼為4144014655,定位於應用型高等學校。
  • 浙江平湖汽車零部件產業發展駛上「快車道」
    原標題:平湖汽車零部件產業發展駛上「快車道」 自2015年11月成功承辦中國汽車零部件行業年會暨中國汽車零部件發展與整零合作高峰論壇後,近期,浙江平湖市又迎來了中國汽車零部件行業協會(中國汽車工業協會)的專家評審組,並獲得專家評審的一致意見:「平湖符合設立『中國汽車零部件製造基地』的基本要求,同意通過驗收。」
  • 人工智慧時代,如何破創客教育難題
    回想起2015年1月李克強到深圳考察柴火創客空間時曾提出「讓眾多『創客』自由創業、能夠成業」,讓「創客」一詞紅遍了大江南北,2015年成為中國的「創客」元年,各地經過3年來的推進和發展,創客教育已進入了爆發期。但是,隨著人工智慧時代的到來,今後我國創客教育之路該何去何從?
  • 深圳大學首次獲得吳文俊人工智慧科學技術獎
    深圳大學作為主要單位完成的項目「面向下一代信息處理的智能光電子元器件與晶片」成果獲得吳文俊人工智慧專項獎晶片項目三等獎。這是深圳大學首次獲得該獎項。經全國各地方人工智慧學會、協會及聯盟,各高校及科研(院)所,學會各專業委員會及工作委會,各團體會員(企業)單位和兩院院士、學會會士等專家學者的提名推薦,吳文俊人工智慧科學技術獎辦公室通過對提名項目進行網絡評審、會議初評和終評答辯,最終對100個成果授獎。
  • 港中大(深圳):建設高水平大學 培養國際化創新人才
    ■ 深圳特區報記者 焦子宇 「十二五」以來,深圳緊緊抓住國家「雙一流」和廣東省高水平大學建設的機遇,高等教育發展步入快車道。而高等教育的跨越式發展,吸引了不少國內外頂尖知名院校入駐深圳,香港中文大學(深圳)便是其中之一。 梧桐樹下聽鳳鳴,神仙湖畔論古今。
  • 編程貓與深圳大學合作《圖形化的人工智慧編程課程的設計與開發...
    2020年10月26日上午,教育部產學合作協同育人項目——圖形化的人工智慧編程課程的設計與開發(項目編號:201802283001)項目結題評審會在深圳大學師範學院國際會議廳順利召開。出席評審會的有胡世清(深圳大學教育技術系主任、教授)、李冰(深圳大學老師、博士、講師)、秦曾昌(編程貓首席科學家、編程與人工智慧教育研究院院長)、夏立(編程貓首席學術官
  • 讀博選擇深圳而不是國外名校,深圳的科研吸引力到底有多強?
    據了解,實驗室由香港中文大學(深圳)、深圳市大數據研究院和華為技術有限公司共同建立,隸屬華為服務與軟體研發管理部。「目前行動網路的基礎性能存在根本短板,網絡優化耗時費力只是打補丁,導致網絡並沒有充分發揮能力。」香港中文大學(深圳)副校長、深圳市大數據研究院院長羅智泉表示,本次成立的未來網絡系統優化創新實驗室旨在用數學從根本上解決網絡結構的問題。
  • 深圳教育裝備博覽會舉辦「人工智慧+教育」解決方案搶眼
    中新網深圳9月20日電(記者 鄭小紅)人工智慧正逐漸進入從小學到大學教育領域,18日至20日在深圳會展中心舉辦的第三屆(2020)深圳教育裝備博覽會,以「先行示範,智引未來」為主題,智慧教育產品各顯其能,「人工智慧+教育」解決方案尤為搶眼。
  • 人工智慧分論壇 產學研融合打造人工智慧教學新模式
    大會由教育部高等學校計算機類專業教學指導委員會、教育部高等學校軟體工程專業教學指導委員會、教育部高等學校網絡空間安全專業教學指導委員會、教育部高等學校大學計算機課程教學指導委員會聯合主辦,廈門大學、華僑大學、集美大學、麥思博(MSUP)承辦,清華大學出版社、高等教育出版社、機械工業出版社、電子工業出版社、人民郵電出版社協辦。
  • 浙江工商大學薩塞克斯人工智慧學院揭牌成立
    他強調,浙江工商大學薩塞克斯人工智慧學院的設立,是浙江省引進國外優質教育資源、落實高等教育強省戰略的一大成果。兩校成功攜手,優勢互補,必將在人才培養、科研合作、教育教學等領域結出豐碩成果,通過人工智慧學院這座橋梁,浙江和英國的教育合作也必將進一步拓展和深化。
  • 人工智慧+大化工!這所大學成立人工智慧交叉研究中心
    開展重大問題研究 推進創新成果落地7月28日,北京化工大學舉辦了人工智慧交叉研究中心揭牌儀式。(李聞芝 攝)中國工程院院士、北京化工大學校長譚天偉表示,當前人工智慧是國家戰略、新基建的重要組成。國務院和教育部從國家需要和高等教育層面對新一代人工智慧的創新發展作出了重大部署。北京化工大學將充分發揮人才、科技、智庫等優勢,構建「人工智慧+X」型特色專業,探索人才培養新模式,打造化工行業人工智慧科學研究和人才培養的高地。
  • 第三屆吳文俊人工智慧科學技術獎在深圳揭曉
    第三屆吳文俊人工智慧科學技術獎在深圳揭曉   中新網深圳10月28日電(記者 鄭小紅)第三屆吳文俊人工智慧科學技術獎,28日在深圳先進技術研究院揭曉。
  • ...燕山大學設人工智慧學院,北京航空航天大學與慕尼黑工業大學...
    新聞來源:南方新聞網人工智慧燕山大學設立人工智慧與機器人學院近日,燕山大學正式出臺了《燕山大學人工智慧與機器人學院建設方案》,在學校學科專業優化調整、新工科專業方向建設的基礎上,統一協調學校相關課程資源
  • 香港中文大學(深圳)迎來第五所學院
    7月1日,香港中文大學(深圳)數據科學學院於正式成立,這是港中大(深圳)繼經管學院、理工學院、人文社科學院、生命與健康科學學院後的第五所學院,由戴建崗教授擔任首任院長。中國工程院院士、香港中文大學(深圳)校長徐揚生教授表示,「數據科學學院專注於數據科學方向的人才培養與科學研究,學院在運籌學、統計學、計算機科學等基礎領域以及運營管理、決策科學、機器學習等前沿領域有著系統的教學體系,為學生提供完整且前沿的理論與實踐相結合的教育。