當前IT領域最熱門的科技名詞是什麼? 「人工智慧」當之無愧,這個已經存在了數十年的技術領域因為谷歌的Alpha Go人機大戰而聲名鵲起,從過去的高高在上到今天的人人皆知,人工智慧已經無處不在。蘋果的Siri, 亞馬遜的Echo,谷歌的無人車等都有人工智慧技術的身影。
人工智慧是製造智能機器、可學習計算程序和需要人類智慧解決問題的科學和工程,是計算機科學的一個分支。經典地,這些包括自然語言處理和翻譯、視覺感知、模式識別、決策制定等。人造智能是機器能夠以我們認為「聰明」的方式執行任務的更廣泛的概念。
機器學習(Machine Learning)是AI的一個子領域,機器學習可以創建從數據中學習的算法,然後在遇到新數據時進行預測。機器學習是從案例和經驗(例如數據配置)中習得的算法,而不是依賴於硬體、代碼和事先定義的規則。機器學習涉及其核心算法,應用高級統計學和數學理論來在數據中執行模式識別。機器學習在我們生活中大量使用,其使用將在未來也將大幅增加,一些例子包括:自駕汽車、語音識別、手寫識別、面部識別、光學字符識別、垃圾郵件檢測、市場細分、預測、天文學(能夠開發關於宇宙形成的理論)、欺詐檢測、噴氣發動機故障預測。
深度學習(Deep Learning)是機器學習的分集,深度學習的主要發展是現有人工智慧拐點的驅動力量之一。深度學習是一種需要訓練大型神經網絡(Neural Network)的「深層」層次結構,且每層可以解決問題不同方面的機器學習,從而使系統能解決更複雜問題的。神經網絡在AI /機器學習的中充當一種模擬人類大腦的計算機體系結構,在其上可以構建AI /機器學習程序。它由聚合的連接節點組成,如人類大腦中的神經元般可以解決更複雜的問題並學習。
監督學習(Supervised Learning)和非監督學習(Unsupervised Learning)是機器學習的兩種類型。在監督學習中,系統給出一系列「正確答案」的例子。基於這些例子,系統將從正確的答案中學習什麼是對的,從而進行正確預測的輸出。監督學習的現實應用包括圖像識別(以圖片分析為例,對監督學習來說,訓練數據裡的圖片需要被標識為狗、貓或者別的動物,系統通過學習,能夠識別其他圖片中的狗、貓或者其他動物)。與監督學習不同,非監督學習不需要訓練數據被標識,例如非監督學習中的聚類學習,可以把一堆無標識的圖片自動聚合成若干類,其中每類分別對應一種動物。
神經網絡、深度學習以及之後潛在的技術架構,已經存在了幾十年,但是過去的5到10 年,IT領域三個方面發生了巨大的改變:
通過分布於全球持續增長無所不在的互相聯繫的設備、機器和系統產生的非結構化數據的數量呈現巨大的增長。擁有的數據越多,神經網絡就變得越有效率,意味著隨著數據量的增長,機器語言可以解決的問題的數量也在增長。移動手機、物聯網、低耗數據存儲的成熟和處理技術(通常在雲端)已經在數量、大小、可靠數據結構方面創造了大量的成長。根據IDC的數字領域報告,到2020年,每年數據量將達到44ZB(萬億G),5 年內年複合增長率達到141%,暗示我們剛開始看到這些科技可以達到的應用場景。
GPU 的使用、低成本計算能力的普遍化,特別是通過雲服務,以及建立新的神經網絡模型,已經極大的增加了神經網絡產生結果的速度與準確率。GPU 和並行架構要比傳統的基於數據中心架構的CPU 能更快的訓練機器學習系統。通過使用圖像晶片,網絡能更快的迭代,能在短期內進行更準確的訓練。在2016 年,單張英偉達遊戲顯卡就有了類似於2002年之前最強大的超級計算機擁有的計算能力。成本也有了極大的降低,英偉達GPU(GTX 1080)有9 TFLOPS 的性能,只要700 美元,意味著每GFLOPS 只要8 美分。在1961 年,要提供1GFLOPS,需要足夠多的IBM 1620s 串聯在一起,計算下來費用要超過9萬億美元。
更好的輸入(計算和數據)使得更多的研發是面向算法,從而支持深度學習的使用。例如伯克利的Caffe、谷歌的TensorFlow 和Torch 這樣的開源框架。剛開源一年多的TensorFlow,已經成為GitHub 上最多分支的框架。雖然不是所有的人工智慧都發生於普遍可用的開源框架中,但開源確實在加速發展,而且也有更多先進的工具正在開源。
在過去十多年間,移動應用作為企業與客戶和員工的互動與參與渠道,在後移動應用時代,我們看到的更多是像微信、Facebook Messenger、WhatsApp、Slack等作為訂閱渠道的消息傳遞渠道。全球有超過41億用戶在即時通訊應用上,採用的速度比社交網絡快。這導致了由AI驅動的Chatbots的創新,這將有助於企業通過這些渠道自動化這些對話。Chatbots使用強大的自然語言處理(Natural Language Processing)機器學習算法來了解最終用戶意圖,並通過處理這些對話並與業務數據集成來回應最終用戶來完成業務處理。針對垂直和企業應用場景下,Chatbot已經有很多應用案例,Gartner預測:「Conversational AI-first」將取代「Cloud-first,Mobile-first」,作為未來十年信息戰略的最高級別。機器人的興起與諸如Facebook Messenger、WhatsApp以及面向企業的Slack和HipChat 等消息應用的快速增長同步。消息應用程式提供了一種媒介,通過它,機器人可以與iOS,Android 和網絡上的用戶進行交互。此外,更大的消息應用正在發展成支持多種交互類型的平臺。在Slack 上,企業用戶可能與團隊合作,監控應用程式,創建待辦事項列表或從同一接口監控費用。在微信聊天程序中,能夠利用同一個界面,用戶可以與朋友聊天,提出品牌的支持問題或進行計程車預約、預定外賣等等。
在以機器人為中心的世界,用戶體驗從基於點擊的行為轉向會話(文本或者語音)以及互動從網絡或面向應用轉向消息或語音平臺。換句話說,相比之前的打開三個不同的應用程式分別預約旅行、購買衣服以及參與客戶服務,而現在用戶只需要通過會話提供信息給提供幫助的機器人,從而完成同樣的事情。因此,我們能看到這些對電子商務、客戶支持、員工工作流程及工作效率的廣泛影響。機器人的期望植根於他們智能或處理自然語言的潛力。因此伴隨著機器學習、自然語言處理的人工智慧技術、計算機理解、以及語義理解興趣和創新的興起,對機器人的興趣也在興起。相比過去的文字處理方式,與基於硬編碼規則集構建的函數操作的處理操作相反,NLP 利用機器學習算法來基於海量訓練數據來學習規則,然後可以將其應用於新的文本集。機器學習的核心原則同樣適用於NLP,獲取的數據越多,其應用程式就越準確和更廣泛。
Intelligent Bots Cloud Service (IBCS)介紹
甲骨文在IT創新領域持續投入,並通過使用機器學習算法的智能聊天機器人功能擴展甲骨文雲服務,幫助客戶通過Chatbots與用戶和員工互動。在用戶處理自然語言的解決方案中有多種機器學習算法,聊天機器人的自我和深度學習算法隨著對話的增長而不斷變得更加智能,通過算法來了解用戶情緒、翻譯語言等。甲骨文智慧機器人雲服務建立在微服務架構上,每個Machine Learning引擎作為微服務運行。IBCS的渠道框架與微信、Facebook Messenger、WhatsApp、Native行動應用程式、基於Web的應用程式集成在一起,自然語言處理 NLP 微服務處理該功能的語言識別方面。 任何想要構建使用NLP服務的應用程式的開發人員都可以調用相同的NLP服務,這種架構允許我們開始向希望在其應用場景中使用特定機器學習算法的開發人員提供AIaaS服務。
甲骨智慧機器人雲服務四大關鍵組件
IBCS使用一系列基於神經網絡(Neural Networks)的技術,使用語言事件和語言建模通過自然語言處理(Natural Language Processing)技術來提高處理最終用戶輸入的內容的準確性,這使得Bot開發者專注於配置Bot業務流程,而不是花費大量的修改算法,調試模型參數。
IBCS公開了多種自然語言理解(Natural Language Understanding)模型,以便從傳入的Bot請求中預測用戶意圖,並準確執行所需的對話流程。為了實現這一點,我們利用多種自然語言處理(NLP)和機器學習(ML)算法對最終用戶意圖進行分類。這些方法描述如下:
通過以上兩種方法,客戶可以快速入門,然後使用強大的機器學習模型在初始語料庫中構建,以便在數據集增長時更準確地預測使用意圖。
除了上述之外自然語言處理算法應用之外,還有其他一些算法,理解用戶情緒、圖像分析、自動補全等人工智慧解決方案,給用戶更多選擇。
客戶化組件是通過REST API暴露的一組服務,客戶化組件是可重用的工作單元,可以在NodeJS容器中編寫的業務邏輯,開發人員可以通過IBCS為機器人所需的各種個性化功能構建客戶化組件,還可以訪問後端服務來查詢數據和寫入數據。甲骨文是企業和雲數據集成的領導者,同時也提供了開箱即用的REST API, Oracle PaaS之一的集成雲服務(ICS),集成了超過75多個企業和非企業後端系統,IBCS客戶化組件可以通過ICS與企業後端應用及數據相連,為企業提供強大的企業服務能力。
當前有多個渠道具有不同的集成接口,開發人員可能需要花費大量的時間和精力來了解這些接口,像微信、FB Messenger、Skype、Line、Slack等即時消息軟體,如Amazon Alexa、Google Home等虛擬個人助手,像科大訊飛、Siri,Cortana等語音接口,了解這些渠道哪些特性支持哪些特性不支持,同時現有的移動應用和網頁的聊天界面的擴展,用戶可以通過BOT與客戶服務人員進行交流。 這些渠道處理排隊,路由,速率限制,回退,重試,正常運行時間,錯誤和異常等等。 IBCS為開發人員提供了一個抽象的整合,將其整合到這些渠道中。 這降低了部署速度,提供更加敏捷的開發運維體驗。
IBCS為開發人員提供一種簡單的方法來構建對話對話流程 - 與最終用戶的對話。最終用戶在人際交往的過程中可能會分支到不同的狀態/上下文,平臺通過內置狀態管理非常容易地對其進行建模,因此開發人員可以通過」零代碼」或者」低代碼」維護這個機器人交互流程。
本文簡要介紹了甲骨文提供的智慧機器人雲服務Intelligent Bots Cloud Service (IBCS) ,欲了解更多信息,請訪問www.oracle.com/bots, 使用IBCS快速構建滿足需求的智慧機器人。
向志華,Oracle雲平臺高級售前顧問,專注 Application PaaS 產品及服務,同時關注Docker容器產品及Kubernetes容器調度產品方向。13年IT行業從業經驗,擅長J2EE產品架構及開發,參與過OpenStack相關產品研發工作。您可以通過george.xiang@oracle.com,與他聯繫。
了解更多,敬請關注甲骨文開發者社區.