國務院於2017年7月21日印發了《新一代人工智慧發展規劃》,提出了面向2030年我國新一代人工智慧發展的指導思想、戰略目標、重點任務和保障措施,部署構築我國人工智慧發展的先發優勢,加快建設創新型國家和世界科技強國。
工信部於2017年12月14日印發了《促進新一代人工智慧產業發展三年行動計劃(2018-2020年)》,明確以信息技術與製造技術深度融合為主線,以新一代人工智慧技術的產業化和集成應用為重點,推進人工智慧和製造業深度融合,加快製造強國和網絡強國建設。
新一代人工智慧關鍵共性技術的研發部署是以算法為核心,以數據和硬體為基礎,以提升感知識別、知識計算、認知推理、運動執行、人機互動能力為重點,形成開放兼容、穩定成熟的技術體系。主要包括:知識計算引擎與知識服務、跨媒體分析推理、群體智能、混合增強智能、自主無人系統、虛擬實境智能建模、智能計算晶片與系統和自然語言處理等8項技術。
那麼,未來3年,我們作為該領域的從業者,到底能做什麼呢,請繼續往下看:
加快突破關鍵技術,研發並應用一批具備複雜環境感知、智能人機互動、靈活精準控制、群體實時協同等特徵的智能化設備,滿足高可用、高可靠、安全等要求,提升設備處理複雜、突發、極端情況的能力。
加快模式識別、智能語義理解、智能分析決策等核心技術研發和產業化,支持設計一批智能化水平和可靠性較高的智能理解產品或模塊,優化智能系統與服務的供給結構。
深化人工智慧技術在智能家居、健康管理、移動智能終端和車載產品等領域的應用,豐富終端產品的智能化功能,推動信息消費升級。
重點涉及的產品包括:
智能網聯汽車
智能服務機器人
智能無人機
醫療影像輔助診斷系統
視頻圖像身份識別系統
智能語音交互系統
智能翻譯系統
智能家居產品
到2020年具備在移動式可穿戴、網際網路、汽車電子等重點領域的系統方案設計能力。
到2020年在智能終端、自動駕駛、智能安防、智能家居等重點領域實現神經網絡晶片的規模化商用。
到2020年面向雲端訓練的開源開發平臺支持大規模分布式集群、多種硬體平臺、多種算法,面向終端執行的開源開發平臺具備輕量化、模塊化和可靠性等特徵。
到2020年,高檔數控工具機智能化水平進一步提升,具備人機協調、自然交互、自主學習功能的新一代工業機器人實現批量生產及應用;
增材製造裝備成形效率大於450cm3/h,連續工作時間大於240h;
實現智能傳感與控制裝備在工具機、機器人、石油化工、軌道交通等領域的集成應用;
智能檢測與裝配裝備的工業現場視覺識別準確率達到90%,測量精度及速度滿足實際生產需求;
開發10個以上智能物流與倉儲裝備。
離散型製造業企業以生產設備網絡化、智能化為基礎,應用機器學習技術分析處理現場數據,實現設備在線診斷、產品質量實時控制等功能。
流程型製造企業建設全流程、智能化生產管理和安防系統,實現連續性生產、安全生產的智能化管理。
打造網絡化協同製造平臺,增強人工智慧指引下的人機協作與企業間協作研發設計與生產能力。
發展個性化定製服務平臺,提高對用戶需求特徵的深度學習和分析能力,優化產品的模塊化設計能力和個性化組合方式。
搭建基於標準化信息採集的控制與自動診斷系統,加快對故障預測模型和用戶使用習慣信息模型的訓練和優化,提升對產品、核心配件的生命周期分析能力。
到2020年,智能製造推進效益:
數位化車間的運營成本降低20%,產品研製周期縮短20%;
智能工廠產品不良品率降低10%,能源利用率提高10%;
航空航天、汽車等領域加快推廣企業內外並行組織和協同優化新模式;
服裝、家電等領域對大規模、小批量個性化訂單全流程的柔性生產與協作優化能力普遍提升;
在裝備製造、零部件製造等領域推進開展智能裝備健康狀況監測預警等遠程運維服務。
面向語音識別、視覺識別、自然語言處理等基礎領域及工業、醫療、金融、交通等行業領域,支持建設高質量人工智慧訓練資源庫、標準測試數據集並推動共享,鼓勵建設提供知識圖譜、算法訓練、產品優化等共性服務的開放性雲平臺。
到2020年,初步建立人工智慧產業標準體系,建成第三方試點測試平臺並開展評估評測服務;在模式識別、語義理解、自動駕駛、智慧機器人等領域建成具有基礎支撐能力的智慧財產權服務平臺。
到2020年,全國90%以上地區的寬帶接入速率和時延滿足人工智慧行業應用需求,10家以上重點企業實現覆蓋生產全流程的工業網際網路示範建設,重點區域車聯網網絡設施初步建成。
到2020年,完善人工智慧網絡安全產業布局,形成人工智慧安全防控體系框架,初步建成具備人工智慧安全態勢感知、測試評估、威脅信息共享以及應急處置等基本能力的安全保障平臺。
這一周有個事刷遍朋友圈,就是支付寶的2017總結,同時還弄了個2018年的預測。心想,大概是依靠支付寶後臺的大數據做個歸納統計吧。預測哪那麼容易做啊,畢竟個人各異。後來發現預測的詞彙也就幾十個,更加加深了自己最初的判斷。
同時最近正好在看統計的資料,加上去年碰到幾個預測方面的需求,所以在新年開始之際,藉此寫下這篇文章談談個人對預測在智能製造上的應用的初步理解。
本人一直覺得,預測是智能化的最好體現也是最難體現,還是那句老話」千金難買早知道「,如果你比別人早知道底牌,你一定可以每次都贏。
• 先談談預測的方法:
其實人類一直在做預測方面的實踐。只是,隨著科技的發展,使用的技術和方法不同,從以前的統計學方法到人工智慧再到現在的機器學習和深度學習。統計學基本上都快有2,3百年的歷史,AI也快60多年,而現在最火最新的深度學習也快10年。
圖片來源於Nvidia
AI現在分為兩種:統計型AI或機器學習在模式識別方面很厲害,但它並不使用邏輯。而符號型的 AI 可以使用預先制定的規則來理解關係,但是在臨場處理中表現並不好。
• 再談談預測在智能製造的應用:
去年主要碰到了2個方面的預測應用需求,一個是銷售的預測,另一個是預測性維護。關於銷售預測,不同行業不同特性,預測的期望要求和結果會很不相同。加上前期提過一次,這次我就談談預測性維護。
預測性維護(PdM,Predictive Maintenance),首先談談它的簡寫,是PdM小寫的d,不要和PDM混淆,也不是PM畢竟PM在TPM的體系中,標識的是Preventive Maintenance。
去年,在做預測性維護的項目的開始,一度糾結Predictive Maintenance和Preventive Maintenance到底有什麼區別,因為從英文翻譯來看,Preventive也有預防的意思。通過項目的過程和不斷學習的過程,逐步體會到了兩者的不同。
談起維護大家一定聽過TPM的概念(網上太多資料可查就不描述了)。我們來詳細談一下維護的等級,我通常劃分成2類3層級:
2類指的是計劃維護和非計劃維護,3層級指的是
1、事後維修-BM(Breakdown Maintenance) 這是最早期的維修方式,即出了故障再修;
2、預防維護-PM(Preventive Maintenance)這是以生產時間,生產數量因數基於計劃的維護;
3、預測性維護-預測性維護(PdM)流程旨在檢測最終會導致故障的設備狀態,然後預估出距離故障發生還有多少時間。
3層裡面的第一層和第三層是非計劃的,只有第二層是計劃內的。
有些地方會把預測性維護也解釋為條件型維護Condition Based Maintenance(CBM),但我個人覺得不是很確切。畢竟預防維護PM也是有條件的維護,根據時間或者根據次數,這些可能都是根據經驗或者供應商而來。但當考慮因數或迭代次數變多的時候,個人覺得PM就自然而然地轉向PdM了。
簡而言之就是PdM是藉助算法分析檢測故障發生前的機械狀態,並預測更正確的故障發生的時間。但預測性維護的最大價值體現不是延長最大的維護時間點,而是做到維護和使用的最佳Balance,需要找到一個既能提高設備每次使用時間,又能不縮短整個使用壽命,同時維持產品質量品質的維護節點,這涉及到大量的因數,傳統經驗和方法很難推算出來或者真正明白哪些是主要因數。智能的體現就是要把每項工作逐漸推向極致,從而獲得最好的OEE,最好的經濟效益。
預測性維護的另一個表現,可能在於不單單只是加工產品的設備需要預測性維護,成品也可以做到預測性維護比如發動機,最好的舉例就是你知道你車子的小保養需要什麼時候做嗎?現在很多可能都是按裡程或按時間來做,對於一個開車少的來說一定是浪費的,但你不敢不做,因為你沒有數據依靠,會心裡沒底。加上大數據,雲平臺,Digital Twin,物聯網時代的很多產品都可以慢慢實現預測性維護。
預測性維護的實施過程中的最大難點在於數據的採集和關鍵因數的判斷取捨,其實這也是其他很多預測應用的難點。經驗是非常有用的,但當你需要一個更加接近極限的答案時,一定是需要通過不同因子的推算結果和不斷實施迭代比較來找出最可靠的答案。這一點AI技術的發展,幫助我們做到無限接近可能。
預測不是求百分百對的解,預測的結果都是錯的(也可能小概率的碰巧對),預測帶給我們的只是減少偏差,儘量少錯,從數據開始,由算法來結束。
最後,附上PdM的市場預測圖(真是哪裡都可以看到預測)。
雷鋒網
作者:Smiletalker
概要:《Science》雜誌也發表了一篇長文,從幾個不同角度詳細闡述了機器學習對於未來人類工作的影響。
人工智慧、機器學習相關技術已經多次刷新了人們對於「計算機能做什麼」的認知,那麼緊接著的一個問題就是「計算機會不會替代人類的工作」。李開復就曾經多次在公開場合表示人工智慧會取代許多人類工作,而這也已經引起了一定的憂慮和討論。近日,《Science》雜誌也發表了一篇長文,從幾個不同角度詳細闡述了機器學習對於未來人類工作的影響。
在過去的幾十年中,數字計算機已經改變了幾乎所有經濟部門的工作。由於機器學習(ML)的發展加快了自動化的步伐,我們正處於一個更大、更迅速轉變的開始階段。然而,雖然很明顯 ML 是一種「通用技術」,就像蒸汽機和電力一樣,產生了大量新的創新和能力,但關於 ML 系統擅長的任務並沒有廣泛的共識,ML 對勞動力和經濟的具體影響的預期也沒有達成一致。在本文中,我們討論了 ML 對勞動力的關鍵影響,參考了目前這一代 ML 系統可以做和不可以做的事情。工作中的一部分可能是「適合 ML」(SML),但這些相同工作中的其他任務並不適合 ML 的標準;因此,ML 對就業的影響比一些人所強調的簡單的替代和替換更為複雜。雖然目前 ML 對經濟的影響相對有限,而且我們並沒有像有的人宣稱的那樣面臨即將到來的「工作的終結」,但 ML 對經濟和未來勞動力的影響卻是深遠的。
任何有關 ML 可以做什麼、不可以做什麼、以及可能對經濟產生哪些影響的討論,首先應該認識到兩個廣泛的基本考慮因素。第一,我們離通用人工智慧還很遠;第二,機器不能完成人類的全部任務。此外,雖然創新總體上對收入和生活水平的提高是重要的,特別是 ML 之前的第一波信息技術(IT)系統創造了數萬億美元的經濟價值,但技術進步也是造成工資不平等的重要因素,儘管造成不平等的因素有很多,比如全球化程度加深,但由於 ML 的巨大而迅速的變化潛力,可能對經濟影響造成很大的破壞性,既產生贏家,也產生輸家。這將需要政策制定者,商業領袖,技術人員和研究人員的高度重視。
當機器自動執行特定工作或流程中的 適合 ML 的任務時,剩下的不適合 ML 的任務可能會變得更有價值。此外,機器將增強人的能力,使全新的產品、服務和流程成為可能。因此,即使在部分自動化的工作崗位內,對勞動力需求的影響既可能是負面的,也可能是正面的。雖然更廣泛的經濟影響是複雜的,但與 ML 能力接近的任務上,對勞動力需求更有可能下降,而作為這些系統補充的任務勞動力的需求可能增加。每當 ML 系統跨越一個門檻,在某個任務上比人類更具成本效益時,企業家和管理者為了利潤最大化,將越來越多地尋求用機器替代人類。這將影響整個經濟,提高生產力,降低價格,轉移勞動力需求,重組行業。
正如哲學家波拉尼所說,我們知道的,多於我們所能言說的。認識一張臉、騎自行車和理解言語都是人類非常清楚怎麼做的任務,但是我們反思自己如何去做的能力卻很差。執行起來輕而易舉的任務要整理成正式規則卻很難,很多時候我們根本做不到。因此,在 ML 之前,波拉尼的悖論限制了通過編程計算機自動完成的任務種類。但是今天,在許多情況下,ML 算法已經使得訓練計算機系統比我們手動編程更精確和更有能力。
一直到近幾年,創建一個新的電腦程式都需要涉及勞動密集型的手工編程過程。但是,這個昂貴的過程正日益被增強,或者被一個更加自動化的、在適當的訓練數據上運行的 ML 算法流程所取代。這種轉變的重要性體現在兩個兩方面:在越來越多的應用程式中,這種模式可以產生比人類程式設計師更精確和可靠的程序(例如人臉識別和信用卡欺詐檢測);其次,這種模式可以大大降低創建和維護新軟體的成本。降低了成本,減少了實驗的障礙,並能夠探索潛在的計算機化任務,鼓勵發展計算機系統,實現許多類型的常規工作流程的自動化,減少或消除人為幹預。
在過去的 6 到 8 年裡,ML 在這方面的進展尤其迅速,這在很大程度上是因為大量的訓練數據,這些數據量足夠大,以至於可能捕捉到非常有價值且以前未被注意到的規律,可以在 ML 算法的處理能力範圍內進行檢查或理解。當有足夠多的訓練數據集時,ML 有時生成的電腦程式表現勝過人類。(例如皮膚病診斷、圍棋、檢測潛在的信用卡欺詐)。
算法的改進也是 ML 進展的關鍵,包括深度神經網絡(DNN)和更快的計算機硬體。例如,Facebook 已經都從基於短語的機器翻譯模式轉換到深度神經網絡,每天進行的翻譯超過 45 億次;用於圖像識別的 DNN 降低了 ImageNet 上的錯誤率,ImageNet 是一個包含 10000 多類標註圖像的大型數據集,錯誤率從 2010 年的超過 30% 下降到現在的不到 3%;同樣,自 2016 年 7 月以來,DNN 幫助語音識別錯誤率從 8.4% 提高到 4.9%。圖像和語音識別率達到 5% 的閾值非常重要,因為這幾乎接近人類在面對類似數據時的錯誤率。
要產生一個定義明確的學習任務,以便應用 ML 算法,必須要有充分的說明任務、性能指標和訓練過程。在大多數實際應用中,要學習的任務與某些目標功能相對應,例如輸入醫療患者健康記錄,輸出患者診斷的功能,或者從自動駕駛汽車的傳感器接收輸入,然後輸出正確的轉向命令。最常見的訓練過程類型是由目標功能的輸入 - 輸出對組成的數據(例如與正確診斷配對的醫療記錄)。然而獲取真實訓練數據在許多領域都很困難,如精神病診斷,招聘決策和法律案例。
成功的商業應用的關鍵步驟,通常包括精確識別要學習的功能;收集和清洗數據以用於訓練 ML 算法;通過工程數據特徵來選擇哪些數據可能有助於預測目標輸出,並且收集新的數據以彌補原始特徵的不足;嘗試不同的算法和參數設置,以優化學習分類器的準確性;並將提供的學習系統嵌入到日常業務運營中,從而提高生產力;如果可能,持續獲取更多訓練樣本。
測量未來自動化程度非常相關的方法是「學徒學習法」,其中人工智慧程序作為學徒,通過觀察人類的決定來進行學習,並將其作為額外的訓練樣本。這種方法產生了新的商業模式。
訓練學徒模仿人為決策讓機器可以從它所協助的多個人的綜合數據中進行學習,這導致機器可能最終超過訓練它的團隊中的每個個體的表現。不過,其學到的專業知識可能仍受到團隊成員的技能水平和相關決策變量的可用性的限制。但是,在計算機可以訪問獨立數據來確定最佳決策(基本事實)的情況下,有可能改進人的決策,從而幫助人類提高自己的績效。例如,在從皮膚病學圖像中對皮膚癌進行醫學診斷時,將隨後的活檢結果作為訓練的標準可以產生比人類醫生更高診斷準確度的電腦程式。
儘管近來 ML 系統的進步令人印象深刻,但它們並不適用於所有的任務。當前的成功浪潮在很大程度上取決於被稱為監督學習的範式,通常使用 DNN(深度神經網絡)。在非常適合這種用途的領域,ML 非常強大。但是它的能力也比人的決策範圍要窄的多,也比人的決策更脆弱,而且這種方法對許多任務是完全無效的。 當然,ML 的技術還在繼續進步,DNN 之外的其他方法可能更適合不同類型的任務。 我們下面給出 8 個關鍵評判標準,以區分適合 ML 的任務和不適合 ML 的任務。
1.明確定義的輸入和輸出
其中包括分類(例如,區分不同品種狗的圖像或根據癌症的可能性標註醫療記錄)和預測(例如分析貸款申請以預測未來違約的可能性)。不過,雖然 ML 系統可以根據統計上的相關性來預測與輸入(X)有最大關聯的輸出(Y),但可能無法學習如何判斷因果關係。
2.存在、或者能夠創建規模巨大、帶有成對的輸入輸出的數位化數據集
可用的訓練樣本越多,學習就越準確。 DNN 的顯著特徵之一是在許多領域內的表現似乎並不會在樣本超過一定數量之後就停止增長。 在訓練數據中捕獲所有相關輸入特徵尤為重要。 儘管 DNN 原則上可以表示任意函數,但是計算機很容易模仿和延續訓練數據中存在的不需要的偏差,解決方法是通過聘用專人來標記部分數據或創建全新的數據集,或通過模擬相關的問題設置來創建。
3.該任務提供明確的反饋,具有明確的目標和指標
當我們能夠清晰的描述目標,哪怕不能確定實現目標的最佳過程,ML 也能很好的運作。這就像早期的自動化方法,獲取個體輸入輸出決策的能力雖然允許學習模仿這些個體,但可能不能得到最佳的系統最性能,因為人類本身也無法做出完美的決策。 因此,明確界定全系統績效指標(例如,優化整個城市的交通流量而不是特定路口)為 ML 系統提供了一條黃金標準。 當訓練數據按照這種黃金準則進行標註時,ML 就特別有用,因為確定了預期的目標。
4.不需要基於豐富背景知識的很長的邏輯或推理鏈
ML 系統在學習數據中關聯性方面非常強大,但是當任務需要依賴計算機沒有的常識或背景知識或複雜計劃時,ML 系統的效率較低。ML 在電子遊戲中表現出色,這些遊戲需要快速反應,並提供即時反饋,但當遊戲中最佳選擇取決於記憶以前事件的時間和未知背景知識時,效率就會降低,例外是圍棋和象棋這樣的遊戲,因為這些非物理的遊戲可以以非常精確的速度進行快速模擬,因此可以自動收集數百萬個完全自我標記的訓練樣本。 但是,在大多數現實世界中,我們無法做到完美的模擬。
5.沒有必要詳細解釋如何做出決策
大型神經網絡通過微妙地調整多達數億個數字權重來學習做出決定。解釋這種決定對人類來說很困難,因為 DNN 與人類的思維系統不同。目前的系統在這個方面相對較弱。例如,雖然計算機可以診斷特定類型的癌症或肺炎,甚至比專家醫生更準確,但與人類醫生相比,它們解釋為什麼以及如何作出診斷的能力較差。對於許多感性的任務,人類也很難解釋,例如,如何從所聽到的聲音中識別出單詞。
6.容錯性,不需要最佳的解決方案
幾乎所有的 ML 算法都是從統計和概率上推導出解決方案。 因此,很難將其訓練到 100% 的準確度。 即使是最好的語音、物體識別和臨床診斷計算機系統也會犯錯(和人一樣)。 因此,對學習系統誤差的容忍是制約這樣的系統應用的重要標準。
7.學習的現象或功能不應該隨著時間的推移而快速變化
一般來說,只有當需要處理的數據和訓練的數據分布是類似的結構,ML 算法才能很好地工作。 如果這些分布隨著時間而改變,則通常需要重新訓練,因此成功取決於相對於新訓練數據獲取率的變化。
8.沒有特別的靈巧性,身體技能或流動性要求
在處理非結構化環境和任務中的物理操作時,機器人與人類相比仍然笨拙。 這不是 ML 的缺點,而是機器人技術自身的局限性。
之前 ML 對 IT 的影響主要在於一些常規、高度結構化和重複性的任務。這也是勞動力需求下降的一個原因。未來,更廣泛的任務將被機器自動化或增強。這包括人類無法解釋的任務,但是簡單地根據過去的趨勢進行推斷將是錯誤的,需要一個新的框架。
一項工作中通常包含許多不同的但相互關聯的任務。在大多數情況下,這些任務中只有一部分適用於 ML,而且可能是傳統的技術不容易自動化的任務。例如,訓練 ML 系統可以幫助律師對案件的相關文件進行分類,但是在訪談潛在的證人或制定策略時使用 ML 就很困難。類似地,ML 系統在閱讀醫學圖像方面取得了迅速的進展,在某些應用中表現超過了人類。然而,與其他醫生交流、以及與患者交流和安慰患者的潛在情緒困擾的等任務,都不適合 ML 方法,至少不適合現有的 ML 系統。
這並不是說所有涉及情商的任務都 ML 系統都無法實現。銷售和客戶互動的某些方面就非常合適。例如,銷售人員和潛在客戶之間的大量在線聊天記錄可以用簡單聊天機器人替代,以識別哪些常見的詢問最有可能帶來銷售。也有公司使用 ML 來識別來自視頻中人們的微妙情緒。
另一個領域是涉及創意的任務。在舊的計算模式中,需要事先精確地規定一個過程的每個步驟。機器沒有任何「創造性」的空間,不能想出如何解決特定問題。但 ML 系統是經過專門設計的,使機器可以自己找出解決方案。所需要的不是預先詳細定義過程,而是需要明確規定所需解決方案的性質,並有一個合適的模擬器,以便 ML 系統可以探索可用替代方案並準確評估其性能。例如,設計複雜的新設備在一直是人類比機器更擅長的任務。但是生成式設計軟體可以為熱交換器等物體提供新的設計,比任何人設計的都能更有效地滿足所有的要求(例如重量,強度和冷卻速率)外觀和觸感。
這是「創意」嗎?這取決我們如何定義。但以前人類的一些「創造性」任務在未來幾年將日益自動化。當最終目標可以被很好地規定並且解決方案可以被自動評估時,這種方法運行良好。因此,我們可以預見這些任務越來越受到自動化的影響。與此同時,人類在更明確界定目標方面的作用將更加重要,這意味著科學家,企業家和那些能夠提出正確的問題的人的作用將會增加。
有許多非技術因素會影響 ML 對未來工作的影響。 具體而言,ML 對勞動力需求和工資的總體影響可以歸類為六個不同經濟因素:
1.替換
基於 ML 創建的計算機系統可以直接在某些工作中取代人類,降低任何給定的輸出產量所需的人力。
2.價格彈性
通過機器學習實現自動化可以降低完成任務的成本, 這會導致總支增加或減少,取決於需求的價格彈性。 例如,如果彈性小於 -1,則價格下降導致購買數量的比例增加,總支出(價格乘以數量)將增加。 例如,隨著技術在 1903 年以後降低了航空旅行的價格,這類旅行的總支出增加了,就業也隨之增多。
3.互補性
任務 B 對於另一個自動化的任務 A 來說可能很重要,甚至是不可或缺。 隨著 A 的價格下降,對 B 的需求將會增加。 通過類比,隨著計算自動化的程度提高,對程式設計師的需求增加了。 技能也可以是其他技能的補充。 例如,人際交往能力與分析能力是一種互補關係。
4.收入彈性
自動化可能會改變人群的總收入。如果一個商品的收入彈性不為零,這又會改變對某些商品類型的需求,以及生產這些商品所需任務的需求。就像隨著總收入的增加,美國人花在餐館的錢也越來越多。
5.勞動力供給的彈性
隨著工資的變化,從事該項工作的人數也會變化。 如果有許多人已經具備了必要的技能(例如駕駛汽車進行乘車服務),那麼供給就具有相當的彈性,即使需求增加(或下降)很多,工資也不會上漲(或下降)很多。 相反,如果技能很難獲得,比如成為數據科學家,那麼需求的變化將主要體現在工資上而不是就業上。
6.重新設計業務流程
任何一組不同類型和數量的勞動力,資本和其他投入與產出聯繫起來的生產函數不是固定的。 企業家,管理人員和員工不斷努力重塑相關流程。 當面對新技術時,他們將通過設計或機緣巧合改變了生產過程,並找到更有效的方法來進行產量。 這些變化可能需要一段時間,而且往往能夠節約昂貴的投入,增加需求彈性。 同樣,隨著時間的推移,個人可以通過學習新技能或換新工作,來表示對於高工資的認可和回應,這樣會增加相關的供給彈性。
由於需要改變生產流程、組織設計、商業模式、供應鏈、法律甚至文化環境,所以技術的採用和推廣往往需要幾年或幾十年的時間。這種互補性在現代企業和經濟中是無處不在的,並且具有相當大的慣性,從而放慢實施新技術不乏。例如,將自動駕駛卡車整合到城市街道上可能需要改變交通法規,責任規則,保險等,因此需要在多個維度上進行補充性修改,應用需要更長的時間來影響經濟和勞動力、法規、交通流量等,而將呼叫中心人員切換到虛擬助理可能只需要對業務過程或客戶體驗進行相對較少的重新設計。
隨著時間的推移,另一個因素變得越來越重要:新商品,新服務,新任務和新流程會出現。 這導致全新的任務和工作,從而可以改變上述關係的程度和標誌。 從歷史上看,隨著一些任務的自動化,釋放的勞動力會重轉移到新的商品或服務,進入到更有效的生產過程中。 這種創新比增加資本、勞動力或資源投入,更能提高總體收入和生活水平。 ML 系統可以通過自動化來加速符合上述標準的許多任務。
隨著越來越多的數據進去線上並匯集起來,以及發現哪些任務應該由 ML 實現自動化,我們將更迅速地收集數據以創建更強大的系統。與我們以及掌握的解決方案不同,許多 ML 自動化任務的解決方案都幾乎可以立即在全世界傳播。我們可以期待未來的企業軟體系統都將嵌入ML系統,自動化的成本將進一步降低。
近期監督學習系統的浪潮已經產生了相當大的經濟影響。 ML 進一步發展,最終影響的範圍和規模可能會超過或內燃機或電力等通用技術。 這些進步不僅直接提高了生產力,而且更重要的是,引發了機器、商業組織乃至整個經濟的創新浪潮。 在技能,資源和基礎設施等方面作出正確的互補性投資的個人、企業和社會得到了蓬勃發展,更好地理解每種類型 ML 的具體適用性及其對具體任務的影響,對於理解 ML 帶來的經濟影響至關重要。
2018-01-13 人工智慧學家 人工智慧學家
人工智慧學家
微信號AItists
功能介紹致力成為權威的人工智慧科技媒體和前沿科技研究機構
來源|公眾號「AI 前線」,(ID:ai-front)
譯者|核子可樂
編輯|Emily
概要:在 2018 年,開發者如何將一系列 AI 技術成果應用於當前的工作當中呢?
近日,一篇預測 2018 年 AI 技術趨勢的文章,文中討論了如何將 2017 年業界已經醞釀出一些成熟產物在在 2018 年實現大規模應用。在 2018 年,開發者如何將一系列 AI 技術成果應用於當前的工作當中呢?
今天的文章包括一份目前已經在實踐中應用的 AI 算法與技術成果清單,如時序分析(深度學習正迅速取代信號處理領域中的一些傳統技術)等。一方面,這些成果可以說相當酷炫,但本文暫時不會對強化學習的實際應用進行展望,因為在我看來,實際上其還很難在某些工業應用環境中產生實際效果。當然,不能否認的是,強化學習確實是個前景廣闊,且正處於快速發展中的研究領域。這裡我就不再繼續討論圖像識別與簡單的計算機視覺議題了,畢竟這幾年此類文章已經多如牛毛:)
GAN 與偽造
儘管生成性對抗網絡已經擁有數年發展歷史,但我對其仍抱有懷疑態度。幾年過去,雖然如今的技術不再只能生成可憐的 64 x 64 圖像,但這仍不足以打消我的顧慮。在閱讀相關數學文章後,我對 GAN 並不能真正理解其分布狀況的懷疑進一步加深。不過這一切在今年有所改變——首先是 CycleGAN 等有趣的體系以及 Wasserstein GAN 等數學改進讓我得以在實踐當中加以嘗試。雖然其實際效果仍無法令人完全滿意,但現在我已經確定,其生成能力絕對不容質疑。
首先,我強烈推薦英偉達公司發表的關於生成逼真全高清圖像的研究論文(共結果要遠好於一年之前恐怕的 64 x 64 面部圖像):《AI 可以生成偽造的名人臉部圖像,效果好得讓人意外......》
https://www.theverge.com/2017/10/30/16569402/ai-generate-fake-faces-celebs-nvidia-gan
不過更讓我激動的(甚至喚起了我的『少年夢想』),則是利用 AI 生成偽造的色情影片:
《AI 生成的色情片》
https://motherboard.vice.com/en_us/article/gydydm/gal-gadot-fake-ai-porn
另外,遊戲行業也在大規模採用這些新型技術,例如利用 GAN 生成景觀、英雄甚至整個世界。在我看來,我們必須提高自己的分辨能力——從偽造的色情影片到欺詐性網絡人物。
全部神經網絡皆遵循同一獨特格式
現代開發領域(不僅僅是在人工智慧行業)的一大難題在於,我們往往面對數十種作用基本相同的框架方案。目前,每家投身於機器學習領域的大型企業都擁有自己的框架:谷歌、Facebook、Amazon、微軟、英特爾、甚至包括索尼與優步都是如此,這還不算其它眾多開源解決方案。在單一人工智慧應用程式當中,我們往往需要使用多種不同框架——例如利用 Caffe2 實現計算機視覺,PyTorch 實現自然語言處理,TensorFlow/Keras 則專攻推薦系統。將這一切加以合併需要耗費大量時間,意味著數據科學家與軟體開發人員需要費心費力,而無法專注於處理真正重要的任務。理想的解決方案應當是一種獨特的神經網絡格式,且可輕鬆與各類框架進行對接,包括允許開發人員輕鬆部署、確保科學家能夠輕鬆使用。在這方面,ONNX 應運而生:
《ONNX:開源神經網絡改變了格式》
http://onnx.ai/getting-started
可互換 AI 模型的新開源生態
事實上,ONNX 只是非循環計算圖的一種簡單格式,但卻在實踐層面為我們帶來真正部署複雜 AI 解決方案的機會。我個人非常看好該項目——人們能夠在 PyTorch 等框架當中開發神經網絡並部署工具,而不再需要從頭到尾始終被局限在 TensorFlow 生態系統之內。
Zoo 快速普及
三年之前,人工智慧領域最令人興奮的成果當數 Caffe Zoo。當時我負責處理大量計算機視覺工作,因此需要嘗試所有模型,並觀察其工作原理以及實際效果。在此之後,我會利用這些模型進行遷移學習或者作為特徵提取器。最近我開始使用兩種不同的開源模型,並將引入規模更大的計算機視覺處理管道。究其本質,這意味著我們已經不再需要自行訓練網絡。舉例來說,ImageNet 能夠很好地實現對象或者地點識別,因此我們可以直接將這些基礎性成果下載並接入到自己的系統當中。除了 Caffe Zoo 之外,其它框架也提供類似的 Zoo 方案。但真正讓我驚奇的是,現在大家甚至能夠將各類模型添加至計算機視覺、自然語言處理甚至是 iPhone 內的加速度計信號處理機制當中。
最全的核心機器學習模型列表(iOS 11 以上)
https://github.com/likedan/Awesome-CoreML-Models
在我看來,這類 Zoo 方案只會越來越多 ; 再加上 ONNX 這類生態系統的出現,這些方案將變得更加集中(並憑藉機器學習區塊鏈類應用實現本體分散)。
AutoML 替換管道
設計一套神經網絡架構無疑是一項痛苦的任務——有時候,大家可以通過疊加卷積層獲得相當出色的結果,但在大多數情況下,我們需要利用直覺與超參數搜索等方法認真設計寬度、深度與超參數——例如隨機搜索或貝葉斯優化。而且對於除計算機視覺以外的其它工作,我們不光需要對 ImageNet 上訓練完成的 DenseNet 進行微調,同時也要面對 3D 數據分類或者多變量時序應用等其它難題。
目前已經存在多種能夠利用其它神經網絡從零開始生成新的神經網絡架構的嘗試,但其中我最為看好的,當數谷歌研究團隊拿出的最新成果:
AutoML 用於大規模圖像分類與對象檢測
https://research.googleblog.com/2017/11/automl-for-large-scale-image.html
他們利用其生成計算機視覺模型,且不僅速度較人類科學家更快,效果也更好!我相信很快就會出現大量與之相關的論文與開源成果。在我看來,未來將有更多博文或初創企業不再強調「我們開發出一套 AI 方案……」,而是轉向「我們的 AI 方案能夠學習其它 AI 方案,並藉此創造出新的 AI 方案」。至少我肯定會在自己的項目中加以嘗試,請告訴不只我一個人有這樣的衝動。
智能堆棧規範化
關於這個概念,我的認知主要來自俄羅斯系統分析師、教練兼 AI 愛好者 Anatoly Levenchuk 的博客。通過以下圖片,大家可以看到所謂「AI 堆棧」的示例:
其中不僅包含機器學習算法與您最喜愛的框架,同時也存在著諸多更為深入的層級,且各個層級都擁有自己的發展與研究趨向。
我認為人工智慧開發行業已經非常成熟,其中存在著大量多元化的專家。事實上,團隊中僅有一名數據科學家是遠遠不夠的——大家需要不同的人才來進行硬體優化、神經網絡研究、AI 編譯器開發、解決方案優化以及生產實現。而在他們之上,還應設置不同的團隊領導者、軟體架構師(分別為各個問題進行堆棧設計)以及管理員。之所以在這裡提及這個概念,是希望各位 AI 技術專家能夠在職業規劃當中予以關注——例如對於希望成為人工智慧軟體架構師或者技術領導者的朋友,您將能夠藉此確定自己需要學習哪些知識。
語音類應用
人工智慧能夠以高於 95% 的精確度解決的問題其實非常有限:我們可以將圖像歸類為 100 種類別、可以判斷文本內容屬於正面還是負面,此外還有少數更為複雜的可行任務。展望新的一年,我認為最具突破的應用方向在於語音識別與生成。事實上,一年之前 DeepMind 發布的 WaveNet 已經擁有相當出色的表現,但現在感謝百度 DeepVoice 3 以及谷歌 Tacotron2 的助力,上述結論已經基本成為板上釘釘的事實:Tacotron 2: 立足文本生成逼真的人類語音
數十年以來,技術人員們一直在努力研究如何立足文本生成自然的人類語音(即文本到語音,簡稱 TTS 技術)……
https://research.googleblog.com/2017/12/tacotron-2-generating-human-like-speech.html
這項技術將很快擁有自己的開源版本(或者被其他一些技術天才所重現),意味著未來每個人都能夠以極高的精度實現語音識別與生成。那麼接下來的前景如何?毫無疑問,除了更出色的個人虛擬助手、自動閱讀器以及對話轉錄工具之外,音頻偽造也將成為現實。
機器人智能水平略有提高
我們目前所擁有的機器人存在著一大共通性問題——其中 99% 根本不屬於人工智慧,而只是硬編碼型方案。考慮到這樣的情況,我們意識到已經不能簡單利用數百萬次對話訓練編碼器 - 解碼器 LSTM,並指望能夠藉此建立起智能系統。正因為如此,Facebook Messenger 與 Telegram 中的大多數聊天機器人只能遵循硬編碼命令,或者最多只能算是具備 LSTM 與 word2vec 語句分類能力的神經網絡。現代先進自然語言處理技術的實際水平應該略高於此,Salesforce 公司做出的一些有趣實驗已經證明了這一點:
AI 研究 - Salesforce.com
他們正在著手構建自然語言處理與資料庫的接口,希望藉此克服現代編碼器 - 解碼器自回歸模型——即不僅能夠對文字或句子進行嵌入,同時還可實現字符嵌入。此外,ROUGE 等自然語言評分優化機制等研究成果同樣值得關注。
我相信通過上述開發工作,未來我們的聊天機器人至少能夠獲得更強大的智能信息檢索與命名實體識別能力,並可能會在一部分封閉領域當中出現完全由深度學習技術驅動的機器人方案。
時序分析的當前發展水平
除了 Salesforce 之外,另一股遭受嚴重低估的機器學習研究力量當數優步 AI 實驗室。前一段時間,他們曾發表一篇博文,其中展示了其時序預測方法。老實講,這實在令我感到受寵若驚——因為其成果與我在應用當中使用的方法基本相同!下面來看這一將統計特徵與深度學習表達加以結合的驚人示例:
優步公司利用遞歸神經網絡預測極端性工程事件在優步公司,事件預測能力允許我們根據預期中的用戶需求設計面向未來的服務方案。
https://eng.uber.com/neural-networks/
此外還出現了其它更激動人心的實例,包括利用 34 層 1 維 ResNet 診斷心律失常。最酷的是其擁有非常出色的成效——不僅遠超多種傳統統計模型,甚至在診斷率方面勝過了專業心臟病專家!算法診斷心律失常疾病,準確度超越心臟病專家|斯坦福新聞由史丹福大學計算機科學家們發明的一種新算法能夠對心律數據進行篩選……
https://news.stanford.edu/2017/07/06/algorithm-diagnoses-heart-arrhythmiascardiologist-level-accuracy/
我最近一直投身於深度學習的時序分析工作當中,並可以向大家保證神經網絡在這方面確實表現良好。與傳統的「黃金標準」相比,其成效可達到原有水平的 5 到 10 倍。
優化應當獲得更多關注
我們該如何對自己的神經網絡進行訓練?實事求是地講,大多數從業者只是在使用「Adam()」以及標準學習率。也有一些聰明的從業者會選擇最適合的優化器,同時調整並安排其學習速度。然而,大多數朋友對於優化這個主題仍然重視不足,因為我們習慣於直接按下「訓練」按鈕,並靜待自己的神經網絡收斂完成。但從計算能力、內存資源以及開原始碼解決方案等層面來看,我們實際上基本處於公平的競爭環境當中——最終的贏家屬於那些能夠立足同一 Amazon 實例在最短時間內獲得最佳 TensorFlow 模型成效的技術人員。從這個角度來看,決定一切的實際上正是優化。
2017 年深度學習優化大事記
目錄:深度學習的終極目標在於找出最低程度的概括方法……
http://ruder.io/deep-learning-optimization-2017/index.html
在這裡,我建議大家參閱 Sebastian 的 Ruder 博文,其中談到了 2017 年內新近出現的、能夠對標準優化器加以改進的簡單方法,外加其它一些輕鬆易行的強化手段。
炒作態勢有所降溫
談到這裡,我們能夠從以上圖片當中得到怎樣的啟示?很明顯,開發出有價值的新方案並藉此獲利絕非易事,特別是考慮到目前正有大量開源工具與算法被持續發布出來。我認為 2018 年對於 Prisma 這樣的初創企業可能不會太友好——畢竟這個世界永遠不缺少競爭對手與「技術天才」。他們完全可以將如今的開源網絡部署在移動應用當中,並藉此建立自己的商業企業。
在新的一年中,我們必須專注於更為基礎的技術研發——而非一味追求快錢。即使大家只是打算利用谷歌 Ratacon 語音識別技術生成語音讀物,也絕對不能僅僅將其視為簡單的 Web 服務——相反,良好的合作夥伴與商業模式將成為您獲得投資的必要前提。
總結
總結起來,我們目前已經擁有多種可以應用於實際產品的技術成果,具體包括時序分析、GAN、語音識別以及自然語言處理技術方面的改進等。我們不必再針對分類或者回歸等目標自己設計基礎架構,因為 AutoML 已經能夠幫助我們完成這些任務,希望在經過進一步優化之後,AutoML 能夠在速度方面更上一層樓。而在 ONNX 與模型 Zoo 的幫助下,我們將能夠輕鬆將基礎模型引入自己的應用程式當中。在我看來,至少就目前的最新發展水平而言,這將顯著簡化基於 AI 類應用程式的開發難度。
人工智慧賽博物理作業系統
AI-CPS OS
「人工智慧賽博物理作業系統」(新一代技術+商業作業系統「AI-CPS OS」:雲計算+大數據+物聯網+區塊鏈+人工智慧)分支用來的今天,企業領導者必須了解如何將「技術」全面滲入整個公司、產品等「商業」場景中,利用AI-CPS OS形成數位化+智能化力量,實現行業的重新布局、企業的重新構建和自我的煥然新生。
AI-CPS OS的真正價值並不來自構成技術或功能,而是要以一種傳遞獨特競爭優勢的方式將自動化+信息化、智造+產品+服務和數據+分析一體化,這種整合方式能夠釋放新的業務和運營模式。如果不能實現跨功能的更大規模融合,沒有顛覆現狀的意願,這些將不可能實現。
領導者無法依靠某種單一戰略方法來應對多維度的數位化變革。面對新一代技術+商業作業系統AI-CPS OS顛覆性的數位化+智能化力量,領導者必須在行業、企業與個人這三個層面都保持領先地位:
重新行業布局:你的世界觀要怎樣改變才算足夠?你必須對行業典範進行怎樣的反思?
重新構建企業:你的企業需要做出什麼樣的變化?你準備如何重新定義你的公司?
重新打造自己:你需要成為怎樣的人?要重塑自己並在數位化+智能化時代保有領先地位,你必須如何去做?
AI-CPS OS是數位化智能化創新平臺,設計思路是將大數據、物聯網、區塊鏈和人工智慧等無縫整合在雲端,可以幫助企業將創新成果融入自身業務體系,實現各個前沿技術在雲端的優勢協同。AI-CPS OS形成的數位化+智能化力量與行業、企業及個人三個層面的交叉,形成了領導力模式,使數位化融入到領導者所在企業與領導方式的核心位置:
精細:這種力量能夠使人在更加真實、細緻的層面觀察與感知現實世界和數位化世界正在發生的一切,進而理解和更加精細地進行產品個性化控制、微觀業務場景事件和結果控制。
智能:模型隨著時間(數據)的變化而變化,整個系統就具備了智能(自學習)的能力。
高效:企業需要建立實時或者準實時的數據採集傳輸、模型預測和響應決策能力,這樣智能就從批量性、階段性的行為變成一個可以實時觸達的行為。
不確定性:數位化變更顛覆和改變了領導者曾經仰仗的思維方式、結構和實踐經驗,其結果就是形成了複合不確定性這種顛覆性力量。主要的不確定性蘊含於三個領域:技術、文化、制度。
邊界模糊:數字世界與現實世界的不斷融合成CPS不僅讓人們所知行業的核心產品、經濟學定理和可能性都產生了變化,還模糊了不同行業間的界限。這種效應正在向生態系統、企業、客戶、產品快速蔓延。
AI-CPS OS形成的數位化+智能化力量通過三個方式激發經濟增長:
創造虛擬勞動力,承擔需要適應性和敏捷性的複雜任務,即「智能自動化」,以區別於傳統的自動化解決方案;
對現有勞動力和實物資產進行有利的補充和提升,提高資本效率;
人工智慧的普及,將推動多行業的相關創新,開闢嶄新的經濟增長空間。
給決策制定者和商業領袖的建議:
超越自動化,開啟新創新模式:利用具有自主學習和自我控制能力的動態機器智能,為企業創造新商機;
迎接新一代信息技術,迎接人工智慧:無縫整合人類智慧與機器智能,重新
評估未來的知識和技能類型;
制定道德規範:切實為人工智慧生態系統制定道德準則,並在智能機器的開
發過程中確定更加明晰的標準和最佳實踐;
重視再分配效應:對人工智慧可能帶來的衝擊做好準備,制定戰略幫助面臨
較高失業風險的人群;
開發數位化+智能化企業所需新能力:員工團隊需要積極掌握判斷、溝通及想像力和創造力等人類所特有的重要能力。對於中國企業來說,創造兼具包容性和多樣性的文化也非常重要。
子曰:「君子和而不同,小人同而不和。」 《論語·子路》雲計算、大數據、物聯網、區塊鏈和 人工智慧,像君子一般融合,一起體現科技就是生產力。
如果說上一次哥倫布地理大發現,拓展的是人類的物理空間。那麼這一次地理大發現,拓展的就是人們的數字空間。在數學空間,建立新的商業文明,從而發現新的創富模式,為人類社會帶來新的財富空間。雲計算,大數據、物聯網和區塊鏈,是進入這個數字空間的船,而人工智慧就是那船上的帆,哥倫布之帆!
新一代技術+商業的人工智慧賽博物理作業系統AI-CPS OS作為新一輪產業變革的核心驅動力,將進一步釋放歷次科技革命和產業變革積蓄的巨大能量,並創造新的強大引擎。重構生產、分配、交換、消費等經濟活動各環節,形成從宏觀到微觀各領域的智能化新需求,催生新技術、新產品、新產業、新業態、新模式。引發經濟結構重大變革,深刻改變人類生產生活方式和思維模式,實現社會生產力的整體躍升。
產業智能官 AI-CPS
用「人工智慧賽博物理作業系統」(新一代技術+商業作業系統「AI-CPS OS」:雲計算+大數據+物聯網+區塊鏈+人工智慧),在場景中構建狀態感知-實時分析-自主決策-精準執行-學習提升的認知計算和機器智能;實現產業轉型升級、DT驅動業務、價值創新創造的產業互聯生態鏈。
長按上方二維碼關注微信公眾號: AI-CPS,更多信息回覆:
新技術:「雲計算」、「大數據」、「物聯網」、「區塊鏈」、「人工智慧」;新產業:「智能製造」、「智能農業」、「智能金融」、「智能零售」、「智能城市」、「智能駕駛」;新模式:「財富空間」、「數據科學家」、「賽博物理」、「供應鏈金融」。
官方網站:AI-CPS.NET
本文系「產業智能官」(公眾號ID:AI-CPS)收集整理,轉載請註明出處!
版權聲明:由產業智能官(公眾號ID:AI-CPS)推薦的文章,除非確實無法確認,我們都會註明作者和來源。部分文章推送時未能與原作者取得聯繫。若涉及版權問題,煩請原作者聯繫我們,與您共同協商解決。聯繫、投稿郵箱:erp_vip@hotmail.com