每一臺冰箱、每一臺電視、每一輛汽車……世界萬物,都為終端。藉由傳感器、計算板、模型等,讓終端聽得懂每一句話、看得懂每一張圖,實現這些或許不是「天方夜譚」。1月16日,「在端上思考」百度大腦AI硬體平臺及產品發布會於深圳召開。現場,百度大腦全新發布了12項新產品和1項新服務,覆蓋模型生產到產品售賣全層次鏈條,助力打造端側智能應用。活動現場火爆異常,不少參會者站在後排聽完了全場發布,「非常豐富!」一位參會者表示,「全陣列新品相當亮眼。」那麼現場究竟發布了哪些新品?小編帶你一一來看。
能力開放與模型生產,新發EasyEdge端計算模型生產平臺
開源深度學習框架、語音、視覺、自然語言處理……AI能力開發上百度大腦開放了相當全面的能力。AI技術應用場景日趨複雜,更低成本、更快部署、更優體驗,愈發需要優秀的邊緣計算方案,而繁多的端上晶片品種、網絡結構等,無疑加大了軟體算法的適配難度。
針對以上問題,百度大腦全新發布了基於Paddle Mobile打造的零代碼生成高性能端計算模型平臺EasyEdge。平臺支持4種深度學習框架、13種網絡結構,只需3步,最快2分鐘即可生成端計算模型SDK,適配5種晶片與3大作業系統。可減少90%開發時間,模型識別速度最高提升10倍。
視覺技術的軟硬一體化
視覺技術的應用中存在兩種經典場景,包括遠距離識別多目標、承擔多種分析任務的場景,例如人流統計、工業檢測等;以及需求近距離目標檢測、安全級別高的場景,如人證比對等。針對不同需求,百度大腦提供了AI加速計算平臺方案和通用計算平臺方案兩套解決方案。
AI加速計算平臺方案適用於遠距離目標檢測和識別,包含兩套端計算加速卡,不同定位和形態助於滿足多種端計算加速需求。包括主打小型化、低功耗,易於快速集成的X-eye計算卡,以及主打高性能、大規模計算量、需自定製模型的EdgeBoard高性能計算卡&軟體工具包&參考方案。
約一元硬幣大小的X-eye計算卡內置了多種百度高性能視覺算法,Intel Movdius AI加速器AI計算資源實測超過1Tops,Xos加速技術終端神經網絡模型平均提速15%,核心模型,如人臉等可提速200%,並可靈活搭配多種視覺模組組成整體解決方案。
同樣全新發布的華途人臉抓拍機——尋相VX-HT01-10正基於X-eye計算卡打造,小型化、畫質出色、高性價比,基於百度領先的人臉算法,抓拍率高達98%。部署在營業廳、便利店等可快速完成店內智能化改造。
而對於性能要求更高、需求定製化的用戶而言,高性能計算卡EdgeBoard則是更合適的選擇。EdgeBoard內含模型嵌入工具包、AI加速工具包、嵌入式計算卡成品和參考設計,其軟硬一體的完整架構造具有強悍的終端加速性能。賽靈思FPGA高性能的加速引擎提供2.4Tops的強大AI算力,性能3倍於終端GPU,10倍於終端CPU,Resnet50實測可達到55FPS處理速度,且方案商可以根據需要輸入百度大腦預置或自定製模型。通過集成EdgeBoard可大大提升終端設備算法運載性能表現,解決終端算力發展相對不足與用戶對更低延遲更快響應體驗需求之間的矛盾。
全新發布的X-Target-01定製化全目標抓拍機搭載了百度EdgeBoard加速方案,作為一款綜合視覺圖像能力的設備,可支持圖像檢測包括不限於人臉、人體、動作、物體等識別,並支持定製模型的全目標抓拍,通用於更多如工業質檢、城市管理等複雜場景。以人臉識別為例,每幀最多可同時捕捉超過 100 張以上的人臉,高達每秒55幀實時人臉檢測,人臉抓拍率98%以上,並支持對人臉質量的判斷。
通用計算平臺方案,則是針對近場景視覺對安全、本地、響應速度的需求。百度大腦從算法、鏡頭模組、計算板卡三方面進行了適配與調優。
算法方面,百度大腦全新發布了人臉離線識別SDK2.0,速度、精度較1.0顯著提升,且集成更簡單。識別速度上,全流程總體耗時小於500ms,檢測/活體/特徵抽取速度提升150%;識別精度方面,萬分之一誤識率下生活照/證件照模型精度高達99.23%,較1.0精度提高近1.5%;集成方面,重構20餘個底層API,可降低近30%開發量。新增人臉通行、人證核驗場景化工程,讓開發者一分鐘跑通全流程業務邏輯
鏡頭模組上,現場全新發布了三款合作鏡頭,與百度大腦人臉識別離線SDK深度適配,並將於2019年2月正式在AI市場獨家發售。奧比中光3D結構光鏡頭模組Atlas
支持高精度深度識別,多維完整採集人臉數據RGB、IR、Depth,投射出 18000 個識別點,誤差率僅百萬分之一,超強寬動態支持逆光環境下可達到無差異識別。可更有效應用於活體安全度較高的業務場景中。睿識雙目近紅外鏡頭模組,超低功耗、千分之一誤識率下活體通過率超過99%。慧谷航天單目可見光鏡頭模組支持115DB超級寬動態,活體穩定識別範圍更大(0.5m-2.0m)。
為了進一步降低研發與驗證成本,百度大腦與天啟智能Firefly合作推出人臉識別開發套件2.0,其全新AIO-3399C(AI版)板卡搭載神經網絡加速器SPR2801S與百度大腦人臉識別算法專項適配,提速50%+。一體化整機發貨,開機即用,內置百度人臉識別SDK 2.0,軟硬體已全部結合完畢,可快速進行效果驗證進入二次開發階段,極大減小研發周期、硬體採購等成本開銷。
語音技術的軟硬一體化
百度在遠場語音交互技術突破,包括一次喚醒多次交互技術以及SMLTA模型,使人與機器更自然流暢的語音交互成為可能。百度遠場語音端到端解決方案從用戶交互端到雲端識別模型全鏈條定製,解決了遠場語音交互識別不穩定、錯誤率高等應用問題。
全新發布的百度遠場語音開發套件,包括遠場語音端到端技術、兩款分別主打高性能和高性價比的計算板卡、3種形態的麥克風陣列,形成了環形6+1麥、線形4麥和車載3麥的多形態麥克風陣列套件方案。百度遠場語音開發套件基於端到端方案,嚴格按照最佳技術實踐指導生產,可解決語音交互產品研發過程中無可用設備選型、選型調試成本大、調試效果不佳等問題。該方案支持回聲消除、聲源定位、波束形成、噪聲抑制等處理算法,一、三、五米識別和喚醒效果優於同類產品,目前已落地150多款產品。
硬體接入與售賣
在最終的接入與售賣環節,百度大腦同樣發布了全新的針對性服務,包括硬體端雲協同以及評測認證等。
視覺傳感器等邊緣設備要應用於具體的業務場景,往往需要開發並部署相應的業務系統和雲端環境,才能使機器具備簡單的AI業務能力,該過程往往研發成本大,周期長。百度大腦全新發布的Edge Cloud端雲協同平臺集成豐富的雲端業務及AI處理能力,通過提供設備管理、數據管理等業務功能,抓拍機等邊緣設備簡單對接即可擁有雲端AI能力,大大降低場景落地的成本和周期。
此外,針對標準化問題,百度大腦全新推出了硬體評測認證,該認證是國內首個AI硬體評測認證體系。百度為AI技術周邊的硬體產品如傳感器、計算卡等進行標準化的評測和認證,例如,鏡頭輸出的圖像質量是否符合場景需求、圖像和算法是否匹配等等,減輕集成過程中選型、評測的成本及工作量,助力推動AI硬體產品標準化及推廣應用。
從模型生產到產品售賣,百度大腦硬體開放平臺與產品矩陣已覆蓋近全層次鏈條。目前,百度大腦已有100多家硬體生態夥伴,同時「百度大腦硬體生態聯盟」 也正式宣告啟動。全鏈條的AI計算終端賦能產品功能矩陣,軟硬一體的AI技術應用,與硬體中間件深度適配, 百度大腦硬體產品與服務,正在不斷推動AI終端智能發展。