網易高級副總裁、網易有道CEO周楓在開場致辭中指出,新十年的紅利將是人工智慧技術,金融科技和物聯網(IoT)。談及有道的AI布局,周楓認為智能硬體是網際網路面向消費新場景的設備延伸,有道智雲則是面向合作夥伴的整合優化服務,強化這兩部分能夠使有道AI產品矩陣的布局和擴充更為穩健。
有道AI技術總監林輝介紹了有道智雲面向手機和智能硬體的解決方案。首先是機器翻譯,有道智雲提供拍照翻譯、原圖翻譯、AR翻譯三種功能。在智能交互方面,有道雲提供語音助手和有道魔鏡(智能識別物體)。
此外,以上功能也能離線處理。為了實現這個效果,有道做了,模型定點化、模型量化、在CPU方面做了指令級別的優化、自研的離線運算庫、與晶片廠商合作優化,做到了識別50個字只需要50毫秒,如果字數比較多的話,每增加50個字只要增加15毫秒。
這些能力都以高級API的形式存在於有道智雲上,開發者可以只花幾分鐘時間就將這些能力集成到自己的應用中。目前,已經有多家手機廠商與有道智雲合作,使用了這些解決方案,包括OPPO,華為、小米、三星、360等。
接下來,有道AI技術總監黃瑾分享了有道智雲在辦公場景下的解決方案。首先是文檔翻譯,通過OCR技術,有道能識別文檔結構、圖片、表格、公式,10頁4000詞的英文論文PDF,1分鐘內就能完成翻譯。第二個是文檔數位化,有道提供了一鍵導入圖片、自動識別、文本審校、語義理解、文檔終校等支持,實現中文標準印刷體99.9%識別率。
黃瑾介紹到,很多政府、企業都有將文檔轉化為電子版的需求,但是挑戰是必須百分之百地正確,能識別特殊符號、表格等,不能出錯。這一點,有道做了很多細化的工作來滿足需求。
最後,有道AI技術總監林會傑分享了有道智雲在教育上的解決方案。在教育場景,有道提出了三套解決方案:面向數位化內容的解決方案、面向教育過程的網絡化解決方案,以及教育方法的智能化解決方案。
在數位化內容方面,有道OCR技術可以幫助紙質教育材料實現數位化,比如將試題收入電子庫;在教育過程方面,有道推出了智能答題板、作業批改系統、AR拍照自動判題;在教育方法智能化方面,有道提出了英語語音跟讀、口語評分、知識圖譜等方案。以上方案也都可以通過有道智雲接入。
AI+教育是近兩年的一大風口。面對AI+教育領域的激烈競爭,周楓談到:「在大型網際網路公司中,網易很早就開始做教育。百度也做了很多年,但是他們做的是平臺,網易是在認真扣內容。做教育多年,我們感受到,做教育和做平臺、做電商不一樣,我們需要去讓學生獲得更好的智慧教育。
很多公司看中了教育這塊大蛋糕,認為家長很樂意為了教育掏錢,所以都湧進來。但是由於市場競爭是在是太激烈,教育產品的獲客成本會特別高,也就不那麼賺錢了,網易有道的一個優勢是,我們的流量和客戶就在那裡,就可以省掉營銷費用。」
有道以自己在教育、翻譯上的積累切入AI,雖然來得晚,但是他們的發展卻很快速。但是媒體也注意到,有道目前的AI產品,少有原創,翻譯機、AI口語測評、AI批改試卷等都是行業內已經有的模式,網易如何在這些產品上破局呢?
關於這一點,周楓談到,「回到我們4月份說的一句話,我們希望做教育領域最懂AI的公司,同樣也是希望做AI公司裡最懂教育的公司。所以看的是綜合能力,不管是從相關的團隊的規模上、投入上,以及說做相關技術的時間和數據積累等等方面,綜合來看,我們還是比較有信心的。具體到某一個上面的話,有些事情可能我們做的會晚一些,但是總體上是長跑,所以我們還是挺有信心,說每一個領域都能做很好。
比如說搜題,搜題用到的是OCR技術,傳統的文字識別部分是比較拼湊型的,他做的是找類似項而不是真的把裡面東西認出來,那我們現在發現,我們鑽研之後能夠實際做真正意義的識別,這裡面一個典型例子就是公式,我們發現國內幾乎沒有廠商做公式識別,後來找到評估之後發現根本不能用,後來我們自己解決了公式識別的問題。」
段亦濤也談到,「語音識別是一個例子,我們語音識別起步比較晚,但是我們很快就追上來。像剛才那幾個例子,包括作文批改,這裡面很多東西真的要說透的話,它依賴於很多自然語音處理的積累,比如我們做作文批改項目時候,我們大量應用到我們翻譯技術,這裡面有翻譯模型在裡面。我們會在了解清楚問題本質後,把這些問題拆解成我們現有技術可以解決的方式。很多事情還是看積累是不是足夠深厚,是不是對這個問題有比較好的理解。」