【CSDN現場報導】2014年12月12-14日,由中國計算機學會(CCF)主辦,CCF大數據專家委員會承辦,中科院計算所與CSDN共同協辦,以推進大數據科研、應用與產業發展為主旨的2014中國大數據技術大會(Big Data Technology Conference 2014,BDTC 2014)暨第二屆CCF大數據學術會議在北京新雲南皇冠假日酒店盛大開幕。
2014中國大數據技術大會第二日上午的大數據應用論壇上,包括華盛頓大學終身教授,中國聯通研究院大數據/雲計算首席科學家陳一昕,Co-Creator of Apache Kylin, eBay高級產品經理韓卿,百度研究院大數據實驗室數據科學家沈志勇,中國移動蘇州研發中心大數據項目總監徐萌,騰訊數據平臺部精準推薦中心深度學習方向負責人鄒永強在內的一線專家就大數據應用相關研究發表了主題演講。
1. 陳一昕:電信運營商大數據應用實踐
華盛頓大學終身教授,中國聯通研究院大數據/雲計算首席科學家 陳一昕
華盛頓大學終身教授,中國聯通研究院大數據/雲計算首席科學家陳一昕發表了題為「電信運營商大數據應用實踐 」的主題演講,他表示,運營商現在面臨激烈競爭,大數據時代想要點石成金,關鍵是大數據挖掘,那麼當下面臨的主要挑戰是通信行業缺乏專業化數據挖掘技術、支持海量數據的高性能算法、保護用戶隱私的數據交互模式以及高素質的大數據團隊。
他表示現在電信運營商內部包括自己做的都是一些比較簡單對數據統計簡單的分析,缺乏的是對大數據的深度挖掘探索和創新,所以在中國聯通研究院目前的主要任務就是全面提高中國聯通大數據研發能力,可以概括為兩個方面:一方面是大數據核心技術的支撐,另外一方面大數據的產品服務,通過一系列的研發對內更好的提供應用支撐,對外提供產品服務。
期間,他還詳細介紹了聯通目前正在進行的大數據技術和產品方面的研發。包括基於高性能計算的海量數據挖掘工具箱、超大規模用戶社交網絡分析、模型庫組合與優化、用戶搜尋引擎 、基於聯通大數據的金融徵信。在他看來,聯通想要擁有行業領先的大數據對內及對外開放能力,搶佔大數據戰略制定高點,極大的依賴於聯通自身的大數據分析和挖掘能力。建立一套有效、安全、高質量的,針對通信領域的大數據挖掘分析工具無疑能夠幫助聯通提升大數據產業的競爭力。最後,他還就運營商大數據、用戶搜尋引擎、用戶徵信系統展開敘述。
2. 韓卿:Apache Kylin introduction
Co-Creator of Apache Kylin, eBay高級產品經理 韓卿
Co-Creator of Apache Kylin, eBay高級產品經理韓卿發表題為「Apache Kylin introduction」的主題演講,他表示Kylin是一套由eBay公司打造的開源分布式分析引擎,其突出特性在於能夠為Hadoop支持下的龐大數據集帶來標準SQL接口與多維分析(OLAP)能力。
他首先介紹了什麼是Kylin以及開發這個項目的初衷,並且分享了Apache Kylin的背景以及想要解決的業務問題,還有所採用的技術。之後,他介紹了產品與技術的一些特性,同時還詳細介紹了 Kylin性能的一些數據。
該項目已經在今年10月1號開源,並且在今年11月25日已經成為Apache的孵化項目。關於Kylin的整體架構以及Kylin技術亮點,他都做了詳細解讀,談到性能方面,他將Kylin和Hive作了對比。最後他們希望打造的Kylin的生態系統能夠和Hadoop等系統合作,將整個系統聯繫起來。
3. 沈志勇:從數據到智能——百度大數據智能分析應用實踐
百度研究院大數據實驗室數據科學家 沈志勇
百度研究院大數據實驗室數據科學家沈志勇的演講主題為「從數據到智能——百度大數據智能分析應用實踐」,他的演講從三個方面展開:大數據時代與百度大數據引擎、百度大數據智能分析、百度大數據智能應用案例。
在他看來,大數據時代給行業帶來的挑戰主要是企業最基礎數據存儲和計算能力缺乏;數據管理以及數據挖掘這塊對數據積累要求比較高也會存在挑戰;另外,現在各行各業都的數據很多時候是孤島,沒有打通起來達到更大的價值。
對應上面的挑戰,他分享了百度提出來的大數據引擎,它也是分為三個層次,跟剛才說的三個挑戰對應的。最底層我們叫做開放雲,它承擔的是存儲能力,開放雲基礎上有一個數據工廠,數據工廠就是數據倉庫,再上層叫做百度大腦。最後,他重點介紹了百度大腦和BDL,關於BDL大數據智能分析案例,他分享了在旅遊、體育、運維/運營、金融等方面的應用。
4. 徐萌:中國移動「大雲」大數據產品及應用
中國移動蘇州研發中心大數據項目總監 徐萌
中國移動蘇州研發中心大數據項目總監徐萌發表了題為「中國移動『大雲』大數據產品及應用」的主題演講,談到中國移動「大雲」大數據產品整體規劃,她表示大雲大數據產品線為中國移動大數據應用提供三大領域的基礎能力:數據採集和處理、數據挖掘及可視化、運營管理。
接著,她重點分享了目前他們做的大數據產品,主要由「大雲」大數據平臺BC-Hadoop,「大雲」大數據倉庫系統BC- HugeTable,「大雲」分布式關係資料庫BC-RDB,「大雲」數據挖掘和ETL工具BC-PDM。
關於「大雲」大數據應用實踐,她強調對內支撐精細化運營,包括支撐客戶體驗提升、精細營銷、產品創新、網絡優化、企業管理水平提升;對外尋求新業務增長點,包括支撐行業大數據解決方案、數據變現及社會化洞察等對外服務模式。
5. 鄒永強:Mariana:騰訊深度學習平臺進展與應用
騰訊數據平臺部精準推薦中心深度學習方向負責人 鄒永強
騰訊數據平臺部精準推薦中心深度學習方向負責人鄒永強發表了題為「Mariana:騰訊深度學習平臺進展與應用」的主題演講,他首先介紹了騰訊深度學習的應用需求。在談到騰訊深度學習平臺的挑戰時候,在他看來主要包括:
深度神經網絡模型複雜,訓練數據多,計算量大深度神經網絡需要支持大模型深度神經網絡訓練中超參數多,需要反覆多次實驗基於以上的挑戰他們構建了騰訊深度學習平臺Mariana,它的目標首先是通過並行加速計算;第二通過模型拆分支持大的模型;第三構建通用的框架簡化代碼的編寫加速實驗。對Mariana提出三大框架,第一個MarianaDNN,這是深度神經網絡GPU運行的框架;第二個是MarianaCNN;第三個MarianaCluster,它們主要應用就是語音識別、圖像識別和廣告推薦。
更多精彩內容,請關注直播專題2014中國大數據技術大會(BDTC) ,新浪微博@CSDN雲計算,訂閱CSDN大數據微信號。