智東西(公眾號:zhidxcom)
文 | 心緣
隨著AI技術的成熟,AI已經開始作為一種基礎工具,加速安防、零售、醫療、金融等傳統行業的智能化進程。具備先發優勢的谷歌、微軟、BAT等大公司都在積極布局平臺,而AI創企們則紛紛在細分行業領域深耕,賦能B端、服務C端等T2B2C的商業模式成為主流,創新奇智正是其中一員。
創新奇智是李開復創辦的創新工場旗下面向企業服務的AI+B2B公司,脫胎於創新工場人工智慧研究院。其業務聚焦零售、製造、金融三大行業。今年成立的創新奇智,已經獲得過億元天使輪融資,客戶包括永輝、原麥山丘、鴻海科技、徐工信息、儲蓄銀行、民生銀行等多家。
最近,智東西與少數媒體來到創新奇智,和創新奇智的CTO、聯合創始人、創新工場AI工程院首席架構師張發恩聊了聊創新奇智的AI技術的特色、布局和商業落地情況。
張發恩畢業於中國科學院軟體研究所,先後加入微軟、谷歌負責研發工作,並曾任百度主任研發架構師、百度雲計算事業部技術委員會主席、百度雲計算事業部大數據和人工智慧首席架構師。
▲創新奇智的CTO、聯合創始人、創新工場AI工程院首席架構師張發恩
今年3月,創新工場正式宣布成立子公司創新奇智,隨後,在5月份,張發恩加入創新奇智擔任CTO一職。創新奇智在5月已完成天使輪融資,由成為資本領投,創新工場等跟投,融資過億元。
創新奇智基於計算機視覺識別技術、自然語言處理、機器學習,為製造業、零售業和金融業三類提供AI技術平臺,其中製造和零售業相對佔據更多業務量。
該公司有三位行業合伙人,分別在三個行業工作超過20年,具有豐富的行業經驗,有助於創新奇智事半功倍地深入三個商業領域。
自成立以來,創新奇智快速發展,以北京為核心,先後落地廣州、重慶、南京、寧波、合肥等城市。
脫胎於創新工場人工智慧工程院,創新奇智的近兩百位技術及行業團隊成員,大多來自國內外高校和谷歌、微軟、SAP、萬達等企業。目前技術團隊的人才分布主要分為四類團隊:視覺算法,自然語言處理,機器學習,工程和業務開發,目前十餘篇專利和若干篇國際頂級學術會議論文在申請中。
隨後,張發恩介紹了創新奇智的在視覺方面的一些技術差異點,包括畸變圖像識別、語義級的圖像差分系統與亞像素級缺陷識別、自研卷積神經網絡架構、商品識別與缺陷檢測、光衍射神經網絡、以及3D視覺引導。
和同做圖像識別的商湯、曠視、雲從不同,創新奇智的一個技術優勢在於廣角攝像頭造成的畸變圖像。
張發恩表示,畸變圖像識別在新零售不可或缺。由於智能貨櫃要求攝像頭能夠清楚拍攝每一層每一個商品,這需要一定高度,如果使用正常攝像頭最多能擺放2層,但有了畸變圖像識別技術,可以擺放至少5層。
另一個技術差異點在於語義級的圖像差分系統與亞像素級缺陷識別,他們主要用在智能製造的缺陷識別中。以手機為例,它的缺陷可能小到幾個像素點,很難建立視覺特徵,但如果缺陷未被識別,可能會出現電力問題。
此外,創新奇智正在自研卷積神經網絡架構,目標要超過ResNet。商品識別和缺陷識別也是該公司的研發重點,張發恩稱,預計在2020年-2021年實現非監督式學習,靠強化學習做商品識別,到2024年,計劃探索光衍射神經網絡。光衍射神經網絡不再需要晶片,依靠光傳播即可實現零延時、低能耗的深度學習。
還有一個技術差異點在於3D視覺引導。目前很多機械臂是編程機械臂,只有手,無眼無腦,創新奇智要讓機械臂「看得見,摸得著」,具備識別和分揀規劃能力。具體來說,就是基於RGBD攝像頭,獲取立體信息和深度距離信息。
新零售、智能製造和智慧金融的主要應用產品存在一些常見問題,創新奇智的產品則對這些問題逐個擊破。
三個月前,原麥山丘引入一個心算滿分的新「收銀員」,只需將選好的麵包盤放在掃描儀下,瞬間你的帳單就出來啦。
這個超高效率的「收銀員」就是創新奇智打造的自助結算機,它採用更高效的數據採集和互動設計解決方案,既能識別外觀相似的不同類商品,也能辨別「造型百變」的同一類商品。
上文提到的畸變圖像問題則常發生在智能貨櫃產品中,創新奇智從控制變量和增加校驗信息著手,全流程無手機處理,即可準確識別畸變圖像中被遮擋的相似商品。目前,該產品在北京、廣州、重慶、寧波都有布局,並具有成本低、貨架好用的競爭優勢。
此外,許多線下商店開始陸續布置渠道陳列監控,但是在不可預知的拍攝設備、場景、人物下,難以準確識別排面商品的口味和容量。對此,創新奇智通過控制、引導拍攝內容和標準,以及設計更精細複雜的網絡,解決這一痛點。
AI在製造業的主要工作之一就是表面檢測。比如某生產汽油發動機的廠商,其裝配線上有25道工序,每道工序都需要仔細查錯,創新奇智在其每一道工序備有一個基於視覺檢測的一體機,可以有效降低出錯可能性。當然,表面檢測還能用於檢測零部件數量、位置、是否有劃痕等。
此外,在金屬加工類細分領域,對零部件、產成品雷射刻碼、打碼是進行數據管理以及追查質量的重要手段之一。創新奇智用OCR技術代替手工採集和錄入,可快速、準確進行掃碼錄入。
在創新奇智主打的三個行業中,金融屬於另一個主打行業。目前,已經有一些智能核保、智能定損、智能定價等解決方案推出。
比如,為保險業打造智能核保,買健康險需要體檢報告,通過做文字識別,用結構化模型把主要疾病直接錄入數據管理和數據中心。用做決策分析,還可以有效降低製冷系統的能源消耗。
在新零售、製造和金融中,張發恩提出P3理論的規劃,即項目(Project)-產品(Product)-平臺(Platform)。他告訴我們,在後AI時代,小公司玩場景,大公司做平臺,目前創新奇智在第一到第二階段之間,並或在2024-2025年進入到第3個「P」階段。
當記者問道為何選擇製造業,張發恩表示,真正對國家非常有用的是第一產業和第二產業,儘管服務業產生巨大營收,但「皮之不存,毛將焉附」。當下,我們的衣食住行都離不開製造業,而中國製造業「大而不強」,AI將幫助整個製造業節省大量人力並提高效率。
在規划行業發展的道路中,要「有所為有所不為」,不在不熟悉的領域分散精力,因此創新奇智不會涉足自動駕駛領域。雖然暫不會涉及其他傳統行業,不過製造業的安全防控、預測性維保等與安防稍有交叉點,未來公司業務是有可能向這些方面拓展的。
張發恩表示,後AI時代應用為王,最重要的是找到有價值的場景。一些原來的技術公司和進入瓶頸期的公司,如今都不得不走上尋找落地場景的轉型之路。
以鋼鐵為例,其製造過程有很多智能質檢的場景,但它最主要痛點在鋼板檢測、貨物堆疊等方面。AI創企要深入行業,將AI技術應用在更有價值的場景上,才能在日益激烈的AI行業競賽中勝出。
建設AI離不開「數據、算法、算力」三要素,張發恩表示,基於這三大要素,創新奇智取得了一些成績。
在數據方面,創新工場有分布式爬蟲平臺、數據採集和標註平臺、智能貨櫃和智能結算一體機,用來收集和處理海量線下消費行為數據。
在算法方面,創新奇智研發了全分布式機器學習平臺、全分布式深度學習平臺,支持市面上多種算法和框架,並開發出具有創新性網絡結構的深度神經網絡(DNN)模型,在物體識別應用方面取得非常好的效果。
在算力方面,創新奇智建立統一在線中臺,提供CPU、GPU、FPGA多種異構計算算力,目標建設峰值能力達到1200 Teraflops,相當於4000臺至強CPU伺服器的算力。該公司還計劃在智能貨櫃和自助結帳產品上應用FPGA加速晶片,使訂單結算速度少於20毫秒。
基於上述平臺,創新奇智主要發力於計算機視覺方面的感知智能、文本處理類的認知智能和決策分析,打造AI在新零售、智能製造和金融行業的應用。其交付形式為軟硬一體交付,即為客戶提供ABC一體機。
正如張發恩所言,儘管我國是世界上公認的製造業大國,但主要優勢體現在資源與勞動力「大」,而非技術和專利「強」。就目前來看,製造業想要長足發展,搭乘AI等新興技術的的東風完成轉型是大勢所趨,而AI技術也通過和更多傳統行業的結合產生更多實用價值。
如今,我國的智能製造體系初具雛形,AI的計算機視覺、自然語言處理、機器學習、知識圖譜等技術已經開始為一些企業的生產過程智能化提供可靠的支撐,提高收益並降低成本。
但與此同時,「AI寒冬論」已然初顯徵兆,一些業內人士預言,未來兩年將有大量AI創企舉步維艱。當各家技術實力相差不多,真正有價值的市場需求對於AI創企而言,可能是邁過寒冬的「救命稻草」。