IBM日前宣布推出IBM Watson數據平臺,以幫助企業從數據中獲得更多有價值的洞察。該平臺可為專業數據人員提供世界上最快的數據採集引擎,允許他們基於認知做出決策,並支持其在IBM Cloud中根據需要展開協作。IBM還提供IBM Watson機器學習服務,直觀的自助服務界面使得機器學習變得非常簡單。
圖片轉自infoWorld
IBM分析事業部高級副總裁Bob Picciano表示:「機器學習是非常強大的工具,但當今的許多專業數據人員都沒有能力去充分利用這項技術來全面開拓其業務,和更有效地協同開發數據集。Watson數據平臺可在認知技術的輔助下創建機器學習模型,從而大大加快將數據轉變為洞察的速度。此外,它還允許用戶從單一位置訪問機器學習服務和語言,以便從應用程式開發人員到首席數據官的任何用戶都能無縫協作,從而理解數據,提出更有價值的問題,並且更有效地利用洞察。」
Watson機器學習解決方案基於Apache Spark,可智能和自動地利用從結構化到非結構化的數據建立模型,同時開放機器學習庫,加速將模型部署到業務運營中。其獲得專利的Cognitive Assistance for Data Science技術可對機器學習的運算法則進行打分,並對比所提供的數據,以推薦最能滿足需求的搭配。此外,產品中還包括業界最全面的算法集。
《哈佛商業評論》近期開展的調查顯示,80%的企業認為各自工作團隊無法使用通用數據開展協作是導致他們無法及時實現業務目標的主要障礙。其專業數據人員有如在孤島上工作,接受不同的語言培訓,缺乏一致的數據視圖,並且將太多時間用在了數據收集和清理上面。Watson數據平臺可幫助其全面地解決這些問題。
Watson數據平臺支持專業數據人員跨領域開展高級別的協作,如數據科學家、數據工程師、業務分析師和開發人員,允許他們共同操縱單一數據集並使用他們希望使用的語言、服務和工具。此外,該平臺還允許數據從業者跨越整個企業,輕鬆直觀地發現和共享洞察。
圖片轉自Digital News Asia
Watson數據平臺利用IBM對Apache Spark、IBM Cloud、認知計算以及The Weather Company的投資,同時利用IBM研究院開發的多項技術,現已允許數據從業者:
通過基於IBM Cloud的Watson數據平臺,企業可將他們自己的數據與外部數據結合起來,利用內置監管(built-in governance)來滿足流程、隱私與合規需求,同時保持對數據的控制權。
Watson數據平臺正在不斷構建一個不斷壯大的技術服務供應商生態系統,允許專業數據人員使用自己喜歡的語言和服務。IBM已將SQL、Python、R、Java和Scala以及生態系統合作夥伴提供的20多款應用整合到Watson數據平臺之中。它們包括:
Qubole®——允許IBM Data Science Experience的用戶使用Spark在其首選的公有雲基礎架構上面處理數據;
RStudio——支持開發R軟體包併集成現有的R工具,包括Shiny及面向Apache Spark的全新R接口「sparklyr」,從而將數據科學工作流程快速應用到生產中;
Keen IO——提供一系列功能強大的API,以允許數據科學家從連接網際網路的任何地方收集、分析並構想事件。
IDC分析與信息管理集團副總裁Dan Vesset表示:「數據專業人員可通過各種工具和語言來處理數據。無論是使用R、python或Scala編寫的工具,還是使用不同的機器學習或可視化服務,他們都希望使用自己熟悉的工具來處理數據。IBM Watson數據平臺為專業數據人員提供了一個開放的、繁榮的合作夥伴生態系統,允許他們在平臺上使用自己熟悉的服務,同時鼓勵他們開展組織內部協作。」