本文將揭開新世代AI 機器人的神秘面紗,並分析AI機器人將如何影響我們的未來。
人工智慧開啟了新一代機器人技術Robotics 2.0,最大改變是從原先人工編寫程序而來的自動化,邁向了真正的自主學習。 本文將嘗試揭開人工智慧(AI)應用的神秘面紗,協助讀者了解AI機器人將如何影響我們的未來,並釐清我們常常聽到,但卻著墨不多、甚至根本尚未全然理解的主題。
本文為「Robotics 2.0」系列文章的第一篇,講述機器人技術與AI對於各大產業和未來工作的影響。 我們將討論AI將如何釋放機器人技術的潛力,這項新技術的挑戰和機會,以及這一切將如何影響我們的生產力、就業狀況、甚至日常生活。 在人工智慧被大肆宣傳的當下,我們希望透過這些文章鼓勵更有建設性和全面性的探討。
01 重新定義機器人:揭開次世代AI機器人Robotics 2.0的神秘面紗
提到機器人,我們總有各式各樣天馬行空的想像:從Softbank(軟銀集團)的社交機器人Pepper、能輕鬆後空翻的Boston Dynamics公司機器人Atlas、《魔鬼終結者》(Terminator)系列電影的人造人殺手,到電視影集《西方極樂園》( West World)中隨處可見、栩栩如生的擬真機器人角色。
我們常常聽到兩極化的觀點;有些人傾向高估機器人模仿人類的能力,認為機器終將取代人類,有些人則對新研究和技術的潛力太過悲觀。
在過去一年之中,許多創業、科技、新創業界的朋友都曾問過我,在AI,尤其是深度強化學習和機器人技術的領域,究竟有哪些「實際」進展?
令人最為好奇的是:
AI機器人和傳統機器人有什麼不一樣? AI機器人是否真有顛覆各大產業的潛力? 它的能力和限制又是什麼?
看來,想要了解現在的技術進步和產業格局,是出乎意料的困難,更不用說要對未來做出預測。 藉由這篇文章,我嘗試揭開人工智慧應用於機器的神秘面紗,釐清這個我們常常聽到,但卻著墨不多、或根本未全然理解的主題。
首先必須回答的基本問題:什麼是AI機器人(AI-enabled Robotics)? 它們又有什麼獨特之處?
02 機器人演進:從自動化到自主化
「機器學習解決了以往『對計算機困難,對人來說卻容易』的各種問題,或以更容易理解的方式來說,就是解決了『人類很難讓計算機也理解』的問題。 」——Benedict Evans,安霍創投(a16z)
AI所造就的機器人技術領域,最大成果是從原先的「自動化」(工程師藉由程序設計編寫規則,讓機器人遵守)邁向了真正的「自主學習」。
如果機器人只需要處理一件事情,那麼,它到底有沒有人工智慧,差別其實看不出來;但是,如果機器人需要處理各式各樣的任務、或是響應人類與環境的變化,就需要一定程度的自主性才能勝任。
我們不妨借用下列不同等級的自駕車定義,一併解釋機器人的演變:
Level 0 —無自動化:由人類操作機器,沒有機器人的參與。 (機器人的普遍定義,是指有能力自行從事複雜動作的可程序化擬人機械)。Level 1 —單一自動化運作:單一功能已自動化,但不使用環境信息。 這是自動化與製造業中傳統的機器人使用現況。 透過程序編輯,機器人能夠以高精度與速度重複執行特定工作;但直至目前為止,多數實際運用的機器人都無法感知或應變環境的變化。Level 2 —部分自動化:透過環境感知所輸入的特定功能,協助機器進行決策。 例如某些機器人透過視覺傳感器,識別並應付不同的對象:然而,傳統的計算機視覺,需要對每個對象進行預先登記和清楚的指示,且機器人還是缺乏處理變更、意外狀況、或是新對象的能力。Level 3 —條件式自主:機器控制了所有的環境監控行為,但仍需要人為檢查關注與(實時)介入。Level 4 —高度自主:在某些情況下、或是定義的區域內完全自主。Level 5 —完全自主:在任何狀況下均可完全自主,不需人為介入。
03 我們現在處於哪一種自主等級呢?
現在,工廠裡多數機器人都是透過開放式迴路、或是非回饋方式予以控制。 這意味著它們的運作與傳感器回饋各自獨立、彼此互不影響(level 1)。
少數在工廠中的機器人,會根據傳感器回饋而調整操作(level 2);此外還有協作型機器人(cobot),他們的操作更加簡單安全,因此能與人類共同作業。然而,相較於產業用機器人,這種機器人的精確度和速度卻相形失色。
另外,雖然協作型機器人的程序化相對簡單,但它們仍然不具有自主學習性;每當工作內容或環境有所變動時,就需要由人類手動引導協作機器人進行調整,或是重新編寫程序,機器本身無法自主舉一反三,彈性應變。
深度學習(Deep Learning)和強化學習(Reinforcement Learning)能幫助機器人自主處理各種對象,將人類的介入程度降到最低。
我們已經開始看到一些使用AI 機器人(level 3/4)的前導試行項目,例如「倉儲揀貨」就是一個很好的例子。 在貨運倉庫中,員工需要根據客戶需求,將數百萬種不同的產品放入箱子裡。 傳統的計算機視覺沒辦法處理如此廣泛的物品類別,因為每個物品都需要事先登錄、並針對機器人需要採取的動作,先進行程序設計。
然而,現在由於深度學習和強化學習技術,機器人能夠開始自主學習處理各種對象,降低人類的介入程度。 在機器人的學習過程中,可能會出現它未曾遇過的某些貨品,而需要人類的協助或示範(level 3)。 但是,隨著機器人搜集更多的數據、從試驗和錯誤中學習(level 4),算法也將日益改善,邁向完全自主。
就像自駕汽車產業一樣,機器人新創公司也採取了不同的策略:有些公司看好人類和機器人之間的合作,專注於level 3的研發;有些公司則相信,機器終將實現真正的完全自主,於是他們跳過level 3,直接著眼於level 4、甚至到level 5。
這也是為什麼我們很難評估現在產業自主程度的原因之一。
新創公司有可能自稱致力於研究level 3/4的自主系統,但實際上卻是大量委外,以人工遠程操控機器。 在無法了解其內部軟體及AI產品發展程度的前提下,光從機器外觀看不出遠程操控和自主學習的差別。 另一方面,目標為level 4/5的新創公司,萬一無法在短時間取得理想結果,可能反而降低了客戶的早期採用意願、並導致早期階段的數據搜集更加困難。
在本文的後半部分,我將進一步討論新創公司的不同的商業策略思考。
04 AI機器人的崛起:運用範圍不再局限於倉儲管理
有趣的是,機器人的人工智慧應用潛能甚至高於無人車,因為機器人有各式各樣的應用與產業,因此從某種意義上說,機器人理當比汽車更容易實現level 4目標。
AI機器手臂開始在倉庫中被採用,就是最好的例子。 因為倉庫屬於「半受控」的環境,不確定性相對低。 另外,揀貨作業雖然關鍵、但能容許錯誤。
至於自主居家型或手術機器人,則要等到更遙遠的未來才能實現;畢竟相關環境的變量更多,且有些任務具備不可逆性,以及一定程度的危險性。 但是,可以預見的是,隨著技術精度、準確性、可靠性的與時俱進,我們將看到更多產業採用AI機器人。
許多產業還沒有使用機械手臂,主要原因在於傳統機器人和計算機視覺的限制。
目前世界上只有大約300萬臺機器手臂,其中大多數從事搬運、焊接、裝配等任務。 到目前為止,除了汽車業和電子業以外,倉儲、農業和其他產業,幾乎都還沒有開始使用機械手臂;主要原因,就在於上述傳統機器人和計算機視覺的限制。
在接下來的幾十年中,隨著深度學習(DL)、強化學習(RL)、以及雲端技術釋放出的機器人潛力,我們將看到新一代機器人帶來的爆炸式增長、並改變產業格局。 其中,AI機器人的成長契機有哪些? 新創公司和現有業者,又採取了哪些不同的方法和商業模式,來因應新科技帶來的變化?
05 新世代AI機器人新創公司產業概況
接下來,我會介紹不同市場區隔中的幾間範例公司。 這樣的概略介紹,當然無法涵蓋所有企業的狀況;歡迎你提供其他公司及應用案例,一起讓內容更加完備。
AI/Robotics新創公司市場概況(作者提供)
06 垂直應用與水平應用
研究新世代機器人新創產業結構,可以看到兩種截然不同的商業模式。
1. 垂直應用
第一種是垂直應用:矽谷當地多數的新創公司,專注於為特定的垂直市場開發解決方案;如電子商務物流、製造業、農業等等。
這種提供完整解決方案的作法相當合理,畢竟相關技術還處於萌芽階段;公司不依賴他人提供關鍵模塊或組件,而是建構端對端的解決方案。 這種垂直整合的解決方案能更快進入市場,也能確保公司更全面掌握終端用戶的案例與效能表現。
但是,要找到像「倉庫分揀」這樣相對容易實現的應用案例,則沒有那麼容易。 倉庫揀貨是相對簡單的工作,客戶的投資意願與技術可行性都較高,而且每個倉庫幾乎都有相同的揀貨需求。
但在其他產業(如製造業)中,裝配任務可能因工廠而各不相同;另外,在製造業中執行的任務,也需要更高的精度和速度,技術上相對困難。
目前具有學習能力的機器人,仍無法達到與封閉迴路機器人相同的精度。
儘管機器學習能讓機器人與時俱進,但目前透過機器學習運作的機器人,仍無法達到與封閉迴路機器人相同的精度,因為它需要累積嘗試錯誤的經驗,從錯誤中學習,逐漸進步。
這點說明了為什麼Mujin和CapSen機器人這樣的新創公司,並未採用深度強化學習,反而選擇使用傳統計算機視覺。
然而,傳統計算機視覺要求每個對象都要事先登錄,終究還是缺乏擴充和適應變化的能力。 一旦深度強化學習(DRL)達到了效能門坎、逐步成為產業主流,這種傳統方法終究會變得無用武之地。
此外,這些新創公司的另一個問題,在於它們的價值往往遭到高估。 我們經常看到,新創公司在矽谷籌集了數千萬美元資金,卻無法承諾創造出任何真正具體的收入流。
對於創業者來說,「描繪」深度強化學習的美好未來,再容易也不過了;但現實則是,我們還需要數年的時間才能達到如此的成果。 儘管這些公司離創造獲利還有一段距離,矽谷的創投仍願意繼續押寶在這些人才優秀、技術先進的團隊上。
2. 水平應用
另一方面,水平應用則是更實用、卻比較罕見的模式。 我們可以簡單將機器人技術簡化為感測(輸入)、處理、驅動(輸出)三個部分;除此之外,還有開發工具。
(這裡使用的「處理」一詞,同時概略涵蓋了控制器、機器學習、作業系統和機器人模塊等等,各種不屬於感測或驅動的其他項目 )
我認為未來,這個領域將最具增長潛力。 對於機器人的用戶來說,破碎而零細的市場是棘手的問題;因為所有的機器人製造商,都各自推展自家開發的語言和接口,使得系統整合商與終端用戶,都很難將機器人與相關系統進行整合。
隨著產業的逐漸成熟,有越來越多機器人應用到了汽車和電子廠以外的領域;因此我們更加需要標準的作業系統、通訊協議、接口,從而提高效率、並縮短上市時間。
舉例來說,美國波士頓的幾家新創公司正在研究相關的模塊;例如Veo Robotics公司開發的安全模塊,能讓工業機器人更安全地和人類協同工作;Realtime Robotics 公司則提供加速了機械手臂路徑的解決方案。
作者:Bastiane Huang,擁有近10年產品及市場開發管理經驗,目前在舊金山擔任 AI/Robotics新創公司產品經理,專注於開發機器學習軟體,用於機器人視覺和控制。
本文由 @Bastiane 原創發布於人人都是產品經理,未經許可,禁止轉載
題圖來自Unsplash,基於 CC0 協議。