【慧聰通信網】近日,百度副總裁王海峰博士受美國問答網站Quora邀請回答網友提問,回答了頗具代表性的十個問題,覆蓋從中國人工智慧的發展階段到百度工程師的日常工作狀態,十問十答的形式,為美國網友打開了解百度,了
【慧聰通信網】近日,百度副總裁王海峰博士受美國問答網站Quora邀請回答網友提問,回答了頗具代表性的十個問題,覆蓋從中國人工智慧的發展階段到百度工程師的日常工作狀態,十問十答的形式,為美國網友打開了解百度,了解中國人工智慧的一扇窗。
Quora是問答型SNS網站,被譽為「獲取高質量內容的來源地」,聚集了大量高質量知識用戶。海峰受邀答疑的session上線後,大量海外網友關注,提問紛至沓來。
王海峰是百度搜索業務的負責人,同時還負責手機百度、百度信息流、百度新聞、百度手機瀏覽器、自然語言處理、知識圖譜、網際網路數據挖掘等業務。他是自然語言處理領域世界上最具影響力的國際學術組織ACL(Association for Computational Linguistics)50多年歷史上唯一出任過主席的華人,也是目前最年輕的ACL fellow,在人工智慧領域有著重要影響力。此次參與網友問答,闡述他對人工智慧及相關技術現狀和未來的理解,王海峰在答案中寫到,人類正在逐步進入人工智慧時代,而百度的優秀工程師們將在其中發揮重要作用。
Quora問答為英文,以下為問答實錄的中文翻譯。
1、中國人工智慧的現狀如何?
中國的人工智慧正在高速發展。今年,中國政府工作報告中首次提到人工智慧,這表明中國十分重視人工智慧的發展。包括百度在內的很多網際網路企業都在加大人工智慧方面的投入。其中許多企業都設立了專門的部門,推動人工智慧在各自業務中的研發與應用。傳統企業也在利用人工智慧降低成本,以人工智慧為核心業務的創業企業也像雨後春筍般湧現。
此外,中國有許多大學和研究機構也在開展人工智慧方面的研究。近些年來,越來越多的優秀科學家與學者們投入到人工智慧領域,其中不乏業內公認的佼佼者。在今年的舊金山AAAI大會上,有大約三分之一的論文來自中國,比例與美國相當。
人工智慧不僅迅速應用於各大行業,也在改變人們的日常生活,包括交通、教育、醫療等各個方面。我相信,人類正逐步進入人工智慧時代。
2、百度的機器學習團隊會不會錄用不會講中文的人才?
百度已經有不會講中文的員工,而且不光是機器學習團隊,其他團隊也有。
3、自然語言處理技術在中文和英文上主要有哪些不同?
從語言學上來講,中文與英文截然不同。中文是孤立語,文本的詞與詞之間沒有空格,主要通過詞序來表示語法關係。這些因素加大了中文在詞彙、句法和語義層面消除歧義的難度。相比中文,現代語言學的概念與語法更適用於英文。
目前,大多數主流自然語言處理技術都同語言無關,比如各種統計或神經網絡的算法。我們會根據不同的應用需求,對這些方法再進行語言相關的優化。
比如,百度在2015年5月推出了首個在線神經機器翻譯系統。其核心的NMT模型是與語言無關的,可以得到相當好的翻譯結果。為進一步優化翻譯效果,我們又根據具體語言的特徵對翻譯系統進行了優化。
4、百度有沒有與IBM Watson或者Facebook的Wit.ai類似的可訪問的AIAPI?
請訪問ai.baidu.com,就可使用語音、圖以像、NLP、用戶畫像等百度人工智慧技術。
5、未來十年裡搜尋引擎會有怎樣的發展?
現在一說到搜尋引擎,大多數人會想到搜索框和搜索結果。那麼未來的搜尋引擎會是什麼樣子呢?現在還不好說。但是我們都願意看到更加強大的搜尋引擎,能夠讓我們在任意場景和產品中利用視覺、聽覺甚至觸覺等交互形式搜索。搜索將會無處不在。
首先,對用戶意圖和內容更加深入的理解,以及更加精準的對意圖與內容的匹配,都將大大增強搜尋引擎的使用體驗。理解用戶意圖不再僅依賴一次查詢,而是包括更加複雜的搜索上下文、時間、位置、設備和用戶的個性特徵。而對內容的理解也將大大深入,不僅能更好的理解語義、語境、觀點,還能理解內容的其他各個方面,從內容中抽取出知識。意圖與內容的匹配也將考慮上述所有因素,提供更加貼合個人特徵與具體語境的搜索結果。此外,搜尋引擎也會更像「應答引擎」和「執行引擎」,能夠直接回答問題或執行用戶指令。
其次,搜尋引擎與用戶的交互界面也將有更多創新變化。除鍵盤輸入外,還將更加廣泛地使用語音和圖片等輸入方式。隨著語音、圖像等技術更加成熟和實用,用戶將可以使用更加高效、便捷的多模搜索。自然語言交互將成為搜尋引擎的主流交互模式。用戶可以與搜尋引擎對話,直接告訴搜尋引擎他們的需求,這比打開鍵盤輸入要方便實用得多。用戶可以通過多輪對話與搜尋引擎交互,百度是最早嘗試運用這種全新的交互方法提升用戶搜索體驗的公司之一。
第三,搜索將不僅僅是使用搜尋引擎,還會融入到各種產品中。比如說,搜索將成為智能硬體產品的核心功能。未來,搜索將無處不在,隨處可見。而且,我們還將重新定義可搜索的內容,不僅包括當前搜尋引擎已經索引的內容,還將納入更多服務、物體、設備和數據。
搜尋引擎已是大家日常生活中必不可少的工具。用戶需求決定搜尋引擎的發展方向,而技術進步決定了搜尋引擎的發展高度。
6、百度產品如何應用NLP?
百度研發了多種NLP技術,包括知識圖譜、語義理解、內容標籤、情感分析、文本生成、摘要、深度問答、機器翻譯和對話系統等。這些技術廣泛應用於百度的搜索、信息流、智能助手等產品中,為數億用戶提供服務。我們還將這些技術集成到統一的平臺之中,名為NLPC平臺。NLPC平臺提供二十多個NLP模塊和技術解決方案,為百度產品提供全方位支持。我們的NLPC平臺每天有上千億次請求。
比如在搜索上,分詞、命名實體識別、句法分析和複述等NLP模塊都是其必不可少的基礎模塊。這些模塊一直在根據應用需求優化並實現技術突破。另一個NLP技術在搜索中的典型應用是問答。高性能的問答系統需要對查詢實行精準的語義語法分析,構建大規模知識圖譜,以及對網頁搜索結果全面深入的分析。用戶在搜索框中輸入問題,搜尋引擎就可以直接提供答案。很多用戶會使用搜尋引擎查找相關信息,來幫助做出決策。在這種情況下,情感分析(即觀點挖掘),可以抽取出很多候選觀點,聚合後提供給用戶作為決策參考。
再比如在信息流產品中,文章質量十分重要。NLP技術用於甄別並去除謠言、剽竊等垃圾文章。另外,文本分析可以識別出高質量文章,並為文章打上描述其質量的標籤。從各個層面說明用戶偏好的用戶模型也要用到NLP技術。
總而言之,對於各種與語言相關的產品,NLP技術都是必不可少。
7、你如何看待自己從科學家到網際網路公司業務副總裁的職業轉變?
我熱愛技術,並且喜歡投入到技術研究中去。我相信技術可以改變世界。百度為我提供了一個理想的平臺,在這裡,我的技術工作得以快速、直接地惠及用戶。這就是我加入百度的首要原因。我在百度的前幾年負責包括NLP、語音、圖像、數據挖掘、知識圖譜、機器學習和深度學習等在內的技術團隊。後來,我意識到偉大的產品是連接技術和廣大用戶的橋梁,並能推動技術進步。偉大的產品不僅需要先進的技術,更需要出色的產品設計、運營和高效管理。因此,我逐步從只帶技術團隊轉變為全面的業務管理者。我現在的團隊超過3000人,包括技術、產品、運營等各方面人才,他們年輕、充滿活力、富有激情。我們同心協力,致力為用戶提供更好的技術和產品,進而使人們的生活更美好。
在管理大型綜合業務團隊時,首先要設定戰略和目標,然後組建合適的執行團隊。良好的制度和文化對於一個大團隊來說非常重要,這是業務健康發展的支持和保證。與此同時,我會始終關注技術突破,用戶需求的演變以及整個社會環境的發展變化。
8、「百度」這個詞的意思是什麼?
我們的名字「百度」,其靈感來源於800年前中國宋代的一首詞。「......眾裡尋他千百度,驀然回首,那人卻在燈火闌珊處。」百度的字面意思是「數百次」,代表對理想的不懈追求探索。
9、在未來5到10年,我們將在自然語言處理領域看到哪些進步?
在機器翻譯、語義理解、問答和對話技術方面將會有重大突破。而且這些技術將被廣泛應用,使得人與計算機之間、人與各種智能硬體之間以及人與人之間的溝通和交互方式都會發生改變。
上述技術進步將受益於以下四個方面的技術進展:大數據、學習機制、知識圖譜、推理和規劃。
大數據——隨著網際網路的持續蓬勃發展,數據的數量和類型都在高速增長。即便是那些傳統行業也開始把他們的數據遷移到線上,一切都在線上被連接起來。數據的價值隨著物聯網發展會越來越大。
學習機制——學習機制也將持續進步,使我們能從更大規模數據中學習到更多知識。
知識圖譜——有了更大規模數據和更強大的學習機制,我們可以構建更完善更龐大的知識圖譜,對整個現實世界進行建模。
推理和規劃——有了更完善更龐大的知識圖譜,我們可以在推理和規劃方面取得突破,推理和規劃的能力將使自然語言處理系統變得更加智能。
10、百度工作的工程師是怎樣的?
百度工程師的典型工作狀態是這樣的:坐在工位戴上耳機一寫代碼就是數個小時;在會議室或休息室與其他工程師一起討論技術問題或系統設計。你會看到他們一邊在餐廳吃午飯或晚餐,一邊在互相談論算法優化;你會看到他們工作到深夜,廢寢忘食。
這裡的工程師有他們自己鮮明的風格:務實、自驅和負責到底。我們鼓勵工程師將想法付諸實踐,有激情,有毅力,有責任感,能使夢想成真。百度搜尋引擎每天為數億人提供服務的同時,也使百度工程師能更好理解大多數用戶的需求,進而有機會專注於最有價值的問題,並提出創新解決方案。百度作為一個平臺,支持這有才華有熱情的工程師實現他們的夢想。
年輕的工程師也有機會去豐富自己的愛好,業餘時間可以在健身房和瑜伽室進行鍛鍊。
在百度,我們為每個新入職的工程師提供導師計劃。導師會指導提升他們的技術能力,並幫助他們熟悉公司。我們為工程師提供在線學習課程,還有資深高工的技術講座。工程師可以選擇自己感興趣的話題,了解前瞻技術進展。我們定期舉辦黑客馬拉松,鼓勵工程師大膽思考,與產品、設計等不同角色合作,創造出驚豔的產品。
我相信百度是工程師鑽研技術、提升自己最好的平臺之一。