作者:彭昭(物聯網智庫創始人&雲和資本合伙人)
物聯網智庫 原創
轉載請註明來源和出處
導 讀
TinyML是指在毫瓦(mW)功率範圍以下的設備上,實現機器學習的方法、工具和技術。這裡的關鍵詞是「毫瓦功率範圍以下的設備」。TinyML功耗極低,不僅適用於邊緣硬體,還可用於物聯網終端設備,支持各種不同的電池驅動的設備,和需要始終在線的應用。最近TinyML與AutoML正在快速融合,構建嵌入式自動化機器學習算法,發揮更大的效力。
全文字數:4500字,閱讀時間:9分鐘
物女王:從All in AIoT,到AIoT in All
這是我在【物女心經】專欄寫的第181篇文章。
AIoT智聯網是AI(人工智慧)和IoT(物聯網)技術在實際應用中的落地融合。近年來,智聯網AIoT一詞熱度劇增,她正在以極快的速度從襁褓中的嬰兒長大成人。
昨天,All inAIoT還是單個企業的市場宣言;今天,AIoT in All已經成為各行各業嘗試轉型以及尋找下一增長點的主力。
根據中國信息通信研究院統計預測數據顯示,2020年全球人工智慧市場將達到6800億元人民幣。據研究機構Markets and Markets在2019年發布的報告稱,2019年全球AIoT市場規模為51億美元。到2024年,這一數字將增長至162億美元,複合年增長率為26.0%。
AIoT的成熟,一方面需要企業的重視與投入,另一方面需要技術的支撐與迭代。上周,我們談到阿里投百億加速AIoT布局的「大手筆」;這周,我們來看看AIoT的領域吹起的技術「新風向」。
在文章《一文讀懂即將引爆的TinyML:在邊緣側實現超低功耗機器學習》中,我曾經介紹過一個新趨勢:TinyML,並提到將會持續追蹤TinyML的進展。
TinyML是指在毫瓦(mW)功率範圍以下的設備上,實現機器學習的方法、工具和技術。這裡的關鍵詞是「毫瓦功率範圍以下的設備」。TinyML功耗極低,不僅適用於邊緣硬體,還可用於物聯網終端設備,支持各種不同的電池驅動的設備,和需要始終在線的應用。
這些設備包括智能攝像頭、遠程監控設備、可穿戴設備、音頻採集硬體以及各種傳感器等…TinyML是一個新興領域,是快速增長的機器學習技術和應用,是一片巨大的、未被充分開發的藍海。
最近TinyML與AutoML正在快速融合,構建嵌入式自動化機器學習算法,發揮更大的效力。
AutoML全稱是Automated Machine Learning,自動化機器學習,這是2014年以來,機器學習和深度學習領域最炙手可熱的領域之一。
我們都知道,機器學習的應用需要大量的人工幹預,這些人工幹預表現在:特徵提取、模型選擇、參數調節等各個方面。AutoML試圖將這些與特徵、模型、優化、評價有關的重要步驟進行自動化地學習,使得機器學習模型無需人工幹預即可被應用。
就在今年3月,谷歌證明了AutoML可以走得更遠。根據谷歌已將代碼開源的AutoML-Zero,如今有可能僅使用基本的數學運算作為構建塊,就可以自動「進化」為完整的機器學習算法。
因此本文將介紹TinyML與AutoML相結合的最新進展,值得你關注的包括:
TinyML+ AutoML的價值何在?
21世紀最性感的工作是什麼?
你可能已經腦補了五花八門的答案,但《哈佛商業評論》(Harvard Business Review)認為是「數據科學家」。HBR在文章中寫道,「如果『性感』意味著擁有非常搶手的稀有品質,那麼數據科學家就是。」
數據科學家很難招到、工資很高、更難留住,這也許是每個試圖嘗試AI應用的物聯網企業都會頭疼的問題。
數據顯示,在2018年,初級數據科學家的平均工資為11.5萬美元/年,能夠管理10至15人團隊的數據科學家則可以拿到35萬美元的年薪。
2019年,全球對數據科學家的需求量是供應量的1.5倍。超過40%的公司認為招聘不到數據科學家是嚴重阻礙他們競爭力的原因之一。超過60%的公司試圖通過內部培訓,讓現有員工變身成為數據科學家。
在物聯網領域,數據科學家除了稀有,還面臨另一個問題:在物聯網終端,很多AI絕技無法施展。分布最廣的物聯網設備往往體積很小、電量有限。它們被作為終端硬體,通過嵌入式傳感器採集各種數據;計算能力有限,對功耗極為敏感。物聯網領域佔比超過95%以上,都是需要超低功耗、佔用極少存儲空間、完成實時數據處理的場景。能夠在這類設備上實現機器學習的人才,更是精英中的高階精英。
TinyML與AutoML「攜手」,就是試圖讓物聯網領域的機器學習,突破人才稀缺和硬體受限的掣肘,讓機器學習算法在物聯網終端自我進化,讓非技術人員可以輕鬆的使用人工智慧進行數據分析,讓原本「物以稀為貴」的機器學習以親民的方式「飛入百姓家」。
TinyML在《一文讀懂即將引爆的TinyML:在邊緣側實現超低功耗機器學習》中已有詳細介紹,此處重點來說AutoML。
什麼是AutoML?
為了更好的理解AutoML,清華校友翟偉所在公司Qeexo通過一個有趣的對比進行了解釋。
在某種程度上,人工智慧與印刷術非常相似,它們的誕生都是人類歷史上的巨大轉折,而且演進過程也有一定的可比性。
印刷術發明之前,文化的傳播主要靠手抄的書籍。手抄費時、費事,又容易抄錯、抄漏,既阻礙了文化的發展,又給文化的傳播帶來不應有的損失。
就像在人工智慧誕生之前,工程師們要自己寫計算程序完成數據分析,不僅效率低而且有可能存在很多誤判。
印章和石刻給印刷術提供了直接的經驗性啟示,用紙在石碑上墨拓的方法,直接為雕版印刷指明了方向。
雕版印刷的版料,一般選用紋質細密堅實的木材,然後把木材鋸成一塊塊木板,把要印的字寫在薄紙上,反貼在木板上,再根據每個字的筆劃,用刀一筆一筆雕刻成陽文,使每個字的筆劃突出在板上。木板雕好以後,就可以印書了。
就像在人工智慧的初始階段,工程師們為每個用例,從零開始寫機器學習的代碼,一個用例對應一塊「雕版」,在不同用例之間代碼很難重複利用,靈活性差、對工程師的技藝要求高。
活字製版避免了雕版的不足,只要事先準備好足夠的單個活字,就可隨時拼版,大大地加快了製版時間。活字版印完後,可以拆版,活字可重複使用,且活字比雕版佔有的空間小,容易存儲和保管。這樣活字的優越性就表現出來了。
就像隨著人工智慧的發展,工程師們開始使用解耦的思維,使用現有的機器學習模塊與框架活用拼湊AI。這個階段開發一個上手的應用或許很簡單,但是要開發真正的產品卻很難,需要一個團隊的專業人士,花費幾個星期的時間完成。
而現在,我們每個人都知道如何使用電腦打字,並使用印表機將文稿印出。
AutoML就是試圖將人工智慧也帶入到同樣階段的做法,讓一位非專業人士,花費幾分鐘的時間,即可完成多個人工智慧模型。在這個階段,合適的AutoML工具是關鍵。
谷歌最近發布了一篇論文名為《AutoML-Zero:從零開始的自動機器學習》,AutoML-Zero:Evolving Machine Learning Algorithms From Scratch。
AutoML-Zero這個名字難免讓人產生聯想。當年AlphaGo戰勝了人類最強棋手,但前提是它先學會了人類棋譜,離不開人類指導。接著谷歌又推出了AlphaGo Zero,只讓AI知道圍棋規則,從零開始學下棋,結果再次登上棋藝頂峰。
AutoML-Zero似乎想要證明,既然AI能從零學習圍棋,也可以從零開始摸索機器學習算法。
谷歌這篇論文的全文可以通過文末的提示下載閱讀。
現在谷歌已將AutoML-Zero的開源程序提交到GitHub,普通電腦只需5分鐘就能體驗一下它的實際效果。GitHub網址:
https://github.com/google-research/google-research/tree/master/automl_zero
應用場景有哪些?
目前一些智能可穿戴設備,包括智能耳機和智能手錶已經在使用相關技術。通過加速度傳感器和陀螺儀輔以相應的嵌入式自動化機器學習算法,可以更好的分析用戶行為,並且支持自定義手勢創建、情境感知、活動分類、步態分析,提供更加貼合用戶自身的服務。
智能家居也是應用場景之一。智能水壺和智能灶臺可以通過聲學傳感器和算法,檢測水是否燒開、燒開的水是否溢出、壺和鍋的溫度有沒有過高。還可以監測智能微波爐中的玉米花是否爆開,以便及時關閉設備。
當然,你也許會想,這些場景都是「小兒科」,只有在最複雜的工業場景中實現應用,才能驗證「TinyML+AutoML」嵌入式自動化機器學習算法真正有效。如你所料,有些企業正在將嵌入式機器學習自動算法用於預測性維護。
對於預測性維護(PDM)的發展階段進行簡單劃分,可分為4個階段:
PDM 1.0—反應性維護:當問題出現時再來解決它,例如救火。
PDM 2.0—預防性維護:包括外觀檢測,以及能夠提供更具體、更客觀的有關機器或系統狀況相關信息的定期資產檢測。
PDM 3.0—基於規則的預測性維護:也就是「狀態監測」。傳感器持續收集來自設備的數據,並根據預先設定的規則,包含在預先設定的臨界值出現時發出警報。
PDM 4.0—基於機器學習的預測性維護:依靠大量的歷史數據或者測試數據,結合為不同情境定製的機器學習算法,預測錯誤出現的時間和位置,然後發出警報。
PDM 4.0是通過先進的分析技術對資產的技術條件、使用、環境、維修歷史、其他類似設備以及任何可能與之相關的大數據進行分析,預測未來將會發生的故障,並最終制定出最有效的預防措施。
在這個過程中,聽聲能力很重要,就像維護維修專家能夠通過汽車引擎的聲音,來診斷車輛的問題一樣,工業設備如果擁有了一雙遠程的「順風耳」,結合振動分析,就可以讓PDM方案更精確。聲音同樣還能被用於診斷液體洩露、管道腐蝕和液位測量。
PDM4.0還面臨一個規模化應用的窘境,由於每個設備的安裝條件、載重性能和外部環境都不相同,單一的AI模型可能無法在類似的電機上批量複製。
TinyML+AutoML使用時間序列傳感器,包括模擬和數字麥克風,可以自適應的創建AI模型。通過聲音傳感與分析,有助於識別預測性維護應用的問題。
初創公司&各類資源
關於TinyML+AutoML,有很多現成的工具和軟體可以使用,物聯網企業不需要招聘昂貴的數據科學家,也不需要擴充團隊,就可以初步嘗試。
這裡介紹比較有代表性的初創公司和資源,包括QEEXO、MindsDB和Cartesiam。
這家公司成立於2012年,總部位於加利福尼亞州山景城,機器學習的研發團隊位於賓夕法尼亞州匹茨堡,在北京和上海擁有工程師團隊。
目前已經有260多種硬體平臺,超過3億臺設備,搭載了QEEXO的機器學習引擎。
知名的包括在華為手機中嵌入的指關節操作技術。
指關節操作功能通過使用指關節在屏幕上敲擊或勾畫,快速調用系統功能,支持利用指關節雙擊全屏截屏、敲擊並畫圈局部截屏、敲擊並畫字母S滾動截屏、雙指關節雙擊錄屏、直線分屏等5種手勢操作。今年5月,榮耀發布了新機榮耀X10,指關節操作功能首次下放給了「千元機」。
QEEXO與瑞薩電子等領先硬體廠商進行合作,完成了多種硬體的適配。QEEXO可支持Arm Cortex – M0到M4核的單片機,如瑞薩RA6M3組單片機產品。
據悉,QEEXO的自動機器學習算法將在亞馬遜AWS上架,以SaaS年度訂閱的方式提供服務,並將在下周周一,6月8日進行全球商用版Qeexo AutoML的正式發布。
MindsDB公司成立於2017年,總部位於加利福尼亞州伯克利,源自美國加州大學伯克利分校的研究項目,其同名服務已在GitHub上發布開源版本。GitHub網址:
https://github.com/mindsdb/mindsdb#mindsdb
最近MindsDB完成了一筆300萬美元的融資,用於擴充團隊和驗證商業模式。
Cartesiam公司創立於2016年,總部位於法國土倫,商務運營中心位於巴黎和紐約,主要實現讓普通的ARM微控制器都能運行的無監督學習AI。
今年2月,Cartesiam發布了一個名為NanoEdge AI Studio的軟體系統,該系統能夠安全地生成AI算法,並且生成的算法只需兩分鐘就可在ARM微處理器上運行,容量大小僅為4~16KB RAM。
法國的工業電子製造商Eolane與Cartesiam合作推出了一款名為Bob Assistant的溫度/振動傳感器,主要用於預測工業維修。目前,該解決方案已經被許多歐洲客戶所採用,成為首個大規模部署的工業4.0預測性維護解決方案。
5月19日,Cartesiam發布了針對STM32開發板優化的新版NanoEdge AI Studio軟體工具。STM32是意法半導體開發的微控制器。新版提供一個新的硬體平臺選項,讓開發者可以直接選擇意法半導體的Nucleo-F401RE或Nucleo-L432KC開發板。在選擇之後,用戶可以解鎖設計流程的最後一步,下載可在所選硬體平臺上立即運行的自定義機器學習庫。
----寫在最後----
看似微小的TinyML和自我進化的AutoML蘊含大機會,物聯網企業需要轉變的首先是思維,積極擁抱和勇於嘗試,或許就會開闢一番新天地。
【掃碼下方二維碼,下載論文《AutoML-Zero:從零開始的自動機器學習》。】
最後,衷心感謝清華校友、QEEXO中國區市場負責人翟偉在寫作過程中幫我提供的大量資料以及各種支持。6月8日,QEEXO嵌入式自動化機器學習服務的商用版本即將正式發布,邀請你與我們共同見證。
本文總結:
TinyML與AutoML正在快速融合,構建嵌入式自動化機器學習算法。
TinyML與AutoML「攜手」,讓原本「物以稀為貴」的機器學習以親民的方式「飛入百姓家」。
嵌入式自動化機器學習算法具有廣泛的應用領域,包括智能家居硬體、智能可穿戴設備、建築物振動監測和工業預測性維護。
這個領域中比較有代表性的初創公司和資源,包括QEEXO、MindsDB和Cartesiam。
參考資料:
1.一文讀懂即將引爆的TinyML:在邊緣側實現超低功耗機器學習【物女心經】,來源:物聯網智庫
2.ThisIs How Algorithms Will Evolve Themselves, by Courtney Linder, popularmechanics.com
3.Googleclaims new AutoML will 『evolve』 without human intervention, techhq.com
4.ComparingMindsDB with Sklearn and Tensorflow, mindsdb.com
5.WhyTinyML is a giant opportunity, by TX ZHUO and FIKA VENTURES, venturebeat.com
6.QeexoAutoML is Now Live on Amazon Web Services, prweb.com
7.EtaCompute與EdgeImpulse合作,以促進邊緣端機器學習的開發和部署,times.hinet.net
8.BackingMindsDB - Automated Machine Learning for the Software Developer, by SamuelHields, blog.openocean.vc
9.STMicroelectronicsand Cartesiam announce general availability of NanoEdge AI Studio now optimizedfor STMicroelectronics development boards, cartesiam.ai
10.Why, Hello FPGA and AI - HowNice to See You Together, by Max Maxfield, eejournal.com
11.TOP AUTOML PLATFORMS TO LOOKOUT FOR IN 2020, by Smriti Srivastava, analyticsinsight.net
12.Machine Learning at the Pushof a Button, by Jim Turley, eejournal.com
13.Do You Hear What I Hear?Connecting IoT Devices with Sound, engineering.com