百度王海峰Quora總結百度工程師品質:務實,自驅,負責到底

2021-01-09 鈦克風暴

【慧聰通信網】近日,百度副總裁王海峰博士受美國問答網站Quora邀請回答網友提問,回答了頗具代表性的十個問題,覆蓋從中國人工智慧的發展階段到百度工程師的日常工作狀態,十問十答的形式,為美國網友打開了解百度,了

【慧聰通信網】近日,百度副總裁王海峰博士受美國問答網站Quora邀請回答網友提問,回答了頗具代表性的十個問題,覆蓋從中國人工智慧的發展階段到百度工程師的日常工作狀態,十問十答的形式,為美國網友打開了解百度,了解中國人工智慧的一扇窗。

Quora是問答型SNS網站,被譽為「獲取高質量內容的來源地」,聚集了大量高質量知識用戶。海峰受邀答疑的session上線後,大量海外網友關注,提問紛至沓來。

王海峰是百度搜索業務的負責人,同時還負責手機百度、百度信息流、百度新聞、百度手機瀏覽器、自然語言處理、知識圖譜、網際網路數據挖掘等業務。他是自然語言處理領域世界上最具影響力的國際學術組織ACL(Association for Computational Linguistics)50多年歷史上唯一出任過主席的華人,也是目前最年輕的ACL fellow,在人工智慧領域有著重要影響力。此次參與網友問答,闡述他對人工智慧及相關技術現狀和未來的理解,王海峰在答案中寫到,人類正在逐步進入人工智慧時代,而百度的優秀工程師們將在其中發揮重要作用。

Quora問答為英文,以下為問答實錄的中文翻譯。

1、中國人工智慧的現狀如何?

中國的人工智慧正在高速發展。今年,中國政府工作報告中首次提到人工智慧,這表明中國十分重視人工智慧的發展。包括百度在內的很多網際網路企業都在加大人工智慧方面的投入。其中許多企業都設立了專門的部門,推動人工智慧在各自業務中的研發與應用。傳統企業也在利用人工智慧降低成本,以人工智慧為核心業務的創業企業也像雨後春筍般湧現。

此外,中國有許多大學和研究機構也在開展人工智慧方面的研究。近些年來,越來越多的優秀科學家與學者們投入到人工智慧領域,其中不乏業內公認的佼佼者。在今年的舊金山AAAI大會上,有大約三分之一的論文來自中國,比例與美國相當。

人工智慧不僅迅速應用於各大行業,也在改變人們的日常生活,包括交通、教育、醫療等各個方面。我相信,人類正逐步進入人工智慧時代。

2、百度的機器學習團隊會不會錄用不會講中文的人才?

百度已經有不會講中文的員工,而且不光是機器學習團隊,其他團隊也有。

3、自然語言處理技術在中文和英文上主要有哪些不同?

從語言學上來講,中文與英文截然不同。中文是孤立語,文本的詞與詞之間沒有空格,主要通過詞序來表示語法關係。這些因素加大了中文在詞彙、句法和語義層面消除歧義的難度。相比中文,現代語言學的概念與語法更適用於英文。

目前,大多數主流自然語言處理技術都同語言無關,比如各種統計或神經網絡的算法。我們會根據不同的應用需求,對這些方法再進行語言相關的優化。

比如,百度在2015年5月推出了首個在線神經機器翻譯系統。其核心的NMT模型是與語言無關的,可以得到相當好的翻譯結果。為進一步優化翻譯效果,我們又根據具體語言的特徵對翻譯系統進行了優化。

4、百度有沒有與IBM Watson或者Facebook的Wit.ai類似的可訪問的AIAPI?

請訪問ai.baidu.com,就可使用語音、圖以像、NLP、用戶畫像等百度人工智慧技術。

5、未來十年裡搜尋引擎會有怎樣的發展?

現在一說到搜尋引擎,大多數人會想到搜索框和搜索結果。那麼未來的搜尋引擎會是什麼樣子呢?現在還不好說。但是我們都願意看到更加強大的搜尋引擎,能夠讓我們在任意場景和產品中利用視覺、聽覺甚至觸覺等交互形式搜索。搜索將會無處不在。

首先,對用戶意圖和內容更加深入的理解,以及更加精準的對意圖與內容的匹配,都將大大增強搜尋引擎的使用體驗。理解用戶意圖不再僅依賴一次查詢,而是包括更加複雜的搜索上下文、時間、位置、設備和用戶的個性特徵。而對內容的理解也將大大深入,不僅能更好的理解語義、語境、觀點,還能理解內容的其他各個方面,從內容中抽取出知識。意圖與內容的匹配也將考慮上述所有因素,提供更加貼合個人特徵與具體語境的搜索結果。此外,搜尋引擎也會更像「應答引擎」和「執行引擎」,能夠直接回答問題或執行用戶指令。

其次,搜尋引擎與用戶的交互界面也將有更多創新變化。除鍵盤輸入外,還將更加廣泛地使用語音和圖片等輸入方式。隨著語音、圖像等技術更加成熟和實用,用戶將可以使用更加高效、便捷的多模搜索。自然語言交互將成為搜尋引擎的主流交互模式。用戶可以與搜尋引擎對話,直接告訴搜尋引擎他們的需求,這比打開鍵盤輸入要方便實用得多。用戶可以通過多輪對話與搜尋引擎交互,百度是最早嘗試運用這種全新的交互方法提升用戶搜索體驗的公司之一。

第三,搜索將不僅僅是使用搜尋引擎,還會融入到各種產品中。比如說,搜索將成為智能硬體產品的核心功能。未來,搜索將無處不在,隨處可見。而且,我們還將重新定義可搜索的內容,不僅包括當前搜尋引擎已經索引的內容,還將納入更多服務、物體、設備和數據。

搜尋引擎已是大家日常生活中必不可少的工具。用戶需求決定搜尋引擎的發展方向,而技術進步決定了搜尋引擎的發展高度。

6、百度產品如何應用NLP?

百度研發了多種NLP技術,包括知識圖譜、語義理解、內容標籤、情感分析、文本生成、摘要、深度問答、機器翻譯和對話系統等。這些技術廣泛應用於百度的搜索、信息流、智能助手等產品中,為數億用戶提供服務。我們還將這些技術集成到統一的平臺之中,名為NLPC平臺。NLPC平臺提供二十多個NLP模塊和技術解決方案,為百度產品提供全方位支持。我們的NLPC平臺每天有上千億次請求。

比如在搜索上,分詞、命名實體識別、句法分析和複述等NLP模塊都是其必不可少的基礎模塊。這些模塊一直在根據應用需求優化並實現技術突破。另一個NLP技術在搜索中的典型應用是問答。高性能的問答系統需要對查詢實行精準的語義語法分析,構建大規模知識圖譜,以及對網頁搜索結果全面深入的分析。用戶在搜索框中輸入問題,搜尋引擎就可以直接提供答案。很多用戶會使用搜尋引擎查找相關信息,來幫助做出決策。在這種情況下,情感分析(即觀點挖掘),可以抽取出很多候選觀點,聚合後提供給用戶作為決策參考。

再比如在信息流產品中,文章質量十分重要。NLP技術用於甄別並去除謠言、剽竊等垃圾文章。另外,文本分析可以識別出高質量文章,並為文章打上描述其質量的標籤。從各個層面說明用戶偏好的用戶模型也要用到NLP技術。

總而言之,對於各種與語言相關的產品,NLP技術都是必不可少。

7、你如何看待自己從科學家到網際網路公司業務副總裁的職業轉變?

我熱愛技術,並且喜歡投入到技術研究中去。我相信技術可以改變世界。百度為我提供了一個理想的平臺,在這裡,我的技術工作得以快速、直接地惠及用戶。這就是我加入百度的首要原因。我在百度的前幾年負責包括NLP、語音、圖像、數據挖掘、知識圖譜、機器學習和深度學習等在內的技術團隊。後來,我意識到偉大的產品是連接技術和廣大用戶的橋梁,並能推動技術進步。偉大的產品不僅需要先進的技術,更需要出色的產品設計、運營和高效管理。因此,我逐步從只帶技術團隊轉變為全面的業務管理者。我現在的團隊超過3000人,包括技術、產品、運營等各方面人才,他們年輕、充滿活力、富有激情。我們同心協力,致力為用戶提供更好的技術和產品,進而使人們的生活更美好。

在管理大型綜合業務團隊時,首先要設定戰略和目標,然後組建合適的執行團隊。良好的制度和文化對於一個大團隊來說非常重要,這是業務健康發展的支持和保證。與此同時,我會始終關注技術突破,用戶需求的演變以及整個社會環境的發展變化。

8、「百度」這個詞的意思是什麼?

我們的名字「百度」,其靈感來源於800年前中國宋代的一首詞。「......眾裡尋他千百度,驀然回首,那人卻在燈火闌珊處。」百度的字面意思是「數百次」,代表對理想的不懈追求探索。

9、在未來5到10年,我們將在自然語言處理領域看到哪些進步?

在機器翻譯、語義理解、問答和對話技術方面將會有重大突破。而且這些技術將被廣泛應用,使得人與計算機之間、人與各種智能硬體之間以及人與人之間的溝通和交互方式都會發生改變。

上述技術進步將受益於以下四個方面的技術進展:大數據、學習機制、知識圖譜、推理和規劃。

大數據——隨著網際網路的持續蓬勃發展,數據的數量和類型都在高速增長。即便是那些傳統行業也開始把他們的數據遷移到線上,一切都在線上被連接起來。數據的價值隨著物聯網發展會越來越大。

學習機制——學習機制也將持續進步,使我們能從更大規模數據中學習到更多知識。

知識圖譜——有了更大規模數據和更強大的學習機制,我們可以構建更完善更龐大的知識圖譜,對整個現實世界進行建模。

推理和規劃——有了更完善更龐大的知識圖譜,我們可以在推理和規劃方面取得突破,推理和規劃的能力將使自然語言處理系統變得更加智能。

10、百度工作的工程師是怎樣的?

百度工程師的典型工作狀態是這樣的:坐在工位戴上耳機一寫代碼就是數個小時;在會議室或休息室與其他工程師一起討論技術問題或系統設計。你會看到他們一邊在餐廳吃午飯或晚餐,一邊在互相談論算法優化;你會看到他們工作到深夜,廢寢忘食。

這裡的工程師有他們自己鮮明的風格:務實、自驅和負責到底。我們鼓勵工程師將想法付諸實踐,有激情,有毅力,有責任感,能使夢想成真。百度搜尋引擎每天為數億人提供服務的同時,也使百度工程師能更好理解大多數用戶的需求,進而有機會專注於最有價值的問題,並提出創新解決方案。百度作為一個平臺,支持這有才華有熱情的工程師實現他們的夢想。

年輕的工程師也有機會去豐富自己的愛好,業餘時間可以在健身房和瑜伽室進行鍛鍊。

在百度,我們為每個新入職的工程師提供導師計劃。導師會指導提升他們的技術能力,並幫助他們熟悉公司。我們為工程師提供在線學習課程,還有資深高工的技術講座。工程師可以選擇自己感興趣的話題,了解前瞻技術進展。我們定期舉辦黑客馬拉松,鼓勵工程師大膽思考,與產品、設計等不同角色合作,創造出驚豔的產品。

我相信百度是工程師鑽研技術、提升自己最好的平臺之一。

相關焦點

  • 獨家對話百度副總裁王海峰:NLP 的路還很長
    王海峰博士現任百度副總裁,負責百度搜尋引擎、手機百度、百度信息流、百度新聞、百度手機瀏覽器、百度翻譯、自然語言處理上篇:產品與技術機器之心:首先請您介紹一下,目前所負責的研究和關注的重點有哪些?王海峰:從整體上,我在百度負責搜索、信息流、手機百度,百度新聞、百度翻譯、手機瀏覽器、自然語言處理、知識圖譜等業務,既包括技術和產品,也包括運營等。
  • 百度王海峰Quora精華整理:未來5-10年,NLP領域將會有什麼進展?
    幾乎在同一時間,百度也宣布進一步深度整合,將包括NLP、KG、IDL、Speech、Big Data等在內的百度核心技術,組成百度AI技術平臺體系(AIG),並任命百度副總裁王海峰為AI技術平臺體系(AIG)總負責人,同時晉升為Estaff成員,轉向百度集團總裁和營運長陸奇匯報。
  • 百度CTO王海峰獲第十三屆光華工程科技獎
    11月9日消息,第十三屆光華工程科技獎揭曉儀式於11月8日在北京舉行,百度CTO王海峰榮獲該獎項,成為AI產業界首位獲此殊榮的科技工作者。據悉,光華工程科技獎被譽為「中國工程界最高獎項」,旨在對我國工程科技及管理領域做出傑出貢獻的科學家、工程師進行表彰
  • 百度CTO王海峰榮膺第十三屆光華工程科技獎
    該獎項被譽為「中國工程界最高獎項」,旨在對我國工程科技及管理領域做出傑出貢獻的科學家、工程師進行表彰。百度CTO王海峰因其在人工智慧領域、尤其是自然語言處理領域的卓越貢獻,成為AI產業界首位獲此殊榮的科技工作者。
  • 王海峰揭秘:百度地圖80%數據採集環節實現AI化
    王海峰揭秘:百度地圖80%數據採集環節實現AI化 【TechWeb】7月3日,在2019百度AI開發者大會上,百度首席技術官王海峰介紹,百度地圖向外界全面展示了其AI化數據採集能力,80%數據採集環節實現了AI化,已成為業內AI化水平最高
  • 自研晶片+自主AI框架,百度CTO王海峰攜百度大腦6.0亮相
    剛剛,百度用AI技術帶我們體驗了一把「穿越」的感覺,面對20年前的自己。今天「百度世界大會」首次與「央視新聞」合作,總臺央視主持人康輝和百度創始人、董事長兼CEO李彥宏、百度CTO王海峰,「5個人」進行了一次特殊的對話。明明只有康輝、李彥宏和王海峰三人,為何會變成「5個人」的對話呢?
  • 百度大腦獲中國電子學會年度科技獎,王海峰詳解語言與智能
    百度高級副總裁、AI 技術平臺體系 (AIG) 和基礎技術體系(TG)總負責人王海峰發表題為《語言與智能》的演講。此外,作為國內最早投身人工智慧的科技巨頭,百度於 2016 年發布的 AI 核心技術引擎「百度大腦核心技術及開放平臺」榮獲 2018 年度中國電子學會科學技術獎科技進步獎一等獎。
  • 王海峰:百度翻譯日翻譯量達千億次,百度語音交流量超150億次
    新京報貝殼財經訊(記者 張思源)9月18日,中關村論壇在京召開,在AI開源創新與產業智能化論壇分論壇上,百度首席技術官、深度學習技術及應用國家工程實驗室主任王海峰介紹,早在2012年,百度即開放了31%的API全社會共享,非常多的來自各方公司、企事業單位等的開發者調用百度翻譯的API
  • 百度CTO王海峰獲光華工程科技獎 為中國工程科技界最高獎
    該獎項被譽為「中國工程界最高獎項」,旨在對我國工程科技及管理領域做出傑出貢獻的科學家、工程師進行表彰。百度 CTO 王海峰因其在人工智慧領域、尤其是自然語言處理領域的卓越貢獻,成為 AI 產業界首位獲此殊榮的科技工作者。
  • 百度CTO王海峰:AI推動量子科技發展
    10月27日,百度CTO王海峰表示,「一方面,以深度學習框架和雲計算為代表的人工智慧技術有望在量子計算軟、硬體的研發過程中大顯身手,比如百度飛槳深度學習 平臺就包含了量子機器學習工具集『量槳』,可以支持開發者和科研人員更便捷地開發量子人工智慧應用;另一方面,隨著量子科技的發展,量子計算、量子通信以及量子精密測量等方面的先進成果也將逐步融入人工智慧的技術發展和應用落地之中
  • 百度王海峰出席中國認知計算和混合智能學術大會 深度解析「多模態...
    同時,王海峰是百度人工智慧的奠基者和領導者,為百度創建和發展了自然語言處理、知識圖譜、語音、視覺、深度學習等AI核心技術,並成立AI技術平臺體系(AIG)擔任總負責人,致力於AI相關技術的研究及其應用落地。
  • 百度王海峰:人工智慧是新一輪科技革命的核心驅動力
    來源:中國經營網原標題:直擊烏鎮|百度王海峰:人工智慧是新一輪科技革命和產業變革的核心驅動力量本報實習記者 陳溢波 記者 張靖超 烏鎮報導10月21日,第六屆世界網際網路大會在水鄉烏鎮繼續隆重召開。在當天下午召開的人工智慧分論壇中,百度首席技術官、深度學習技術及應用國家工程實驗室主任王海峰作了一場題為《人工智慧進入工業大生產時代》的演講。《中國經營報》記者從現場了解到,已經開放216項能力,每天調用次數已過萬億次,上面有150多萬名開發者,有大量的模型發布出來。
  • 百度王海峰獲得光華工程科技獎
    北京商報訊(記者 魏蔚)11月8日,第十三屆光華工程科技獎揭曉,百度CTO、人工智慧專家王海峰等39位專家獲得光華工程科技獎,中國工程院核動力專家彭士祿獲得光華工程科技成就獎,中國工程院醫藥衛生學部全體院士獲得光華工程科技特別貢獻獎。
  • 百度重生之戰:李彥宏的矩陣革命
    2018年12月18日,李彥宏突然發了一封內部信,信中稱,「搜索公司及各BG的運維、基礎架構和集團級共享平臺整合至基礎技術體系(TG),整合後的TG向王海峰匯報,王海峰同時繼續負責AIG。今後TG將進一步提升數據中心、基礎架構、運維等方面的能力,打造強大的技術平臺,提高工程效率及資源效率,早日實現「雲上百度」的目標!」
  • 百度AI人才圖鑑及頂層攻略
    但在學術界享有盛名的同時,王海峰博士在產業界的身份是百度副總裁,AI技術平臺體系(AIG)總負責人,百度研究院院長,負責百度研究院、語音技術部、自然語言處理部、知識圖譜部、大數據部、視覺技術部、人臉技術部、增強現實技術部、AI技術生態部、及若干創新業務部門。
  • 三位世界級科學家加盟百度研究院 百度AI「中國速度」再加速
    至此,百度研究院全新升級,建立起包括七位世界級科學家、五大實驗室的「全明星」陣容。  會上,百度副總裁、AI技術平臺體系(AIG)總負責人、百度研究院院長王海峰表示,這是百度研究院新徵程的開始。百度研究院將聚焦前瞻基礎研究,布局百度人工智慧未來發展方向,服務百度作為人工智慧公司的長期發展戰略。
  • 一文回顧百度人工智慧2020上半年,王海峰:百度AI助力新基建提速
    7月23日,百度AI 發布了2020年上半年總結,從AI戰「疫」、AI新基建、產業智能化三大方面詳述了過去半年的努力和突破。過去半年,百度AI是戰「疫」大旗下的科技奇兵,是新基建浪潮裡的中堅力量,作為人工智慧基礎設施,步履堅定,在喧囂中快速成長。
  • 百度研究院升級為五大實驗室 三位世界級科學家加盟
    、浣軍、熊輝加盟百度研究院。會上,百度副總裁、AI技術平臺體系(AIG)總負責人、百度研究院院長王海峰表示,這是百度研究院新徵程的開始。除了院長王海峰,還有徐偉、李平、楊睿剛三位已經任職於百度研究院的資深科學家,本次加盟的Kenneth Ward Church、浣軍、熊輝均是AI領域的世界級學者。Kenneth Ward Church是自然語言處理領域的大師級人物,是經驗主義方法的奠基人之一。
  • 外媒評選20位中國AI領袖 百度系佔據半壁江山
    據中新網6月22日報導,近日,《福布斯》刊登了一篇文章,AI領域知名科技媒體TOPBOTS評選出了20位驅動中國人工智慧改革的科技領導者,李開復、陸奇、王海峰、林元慶等眾多來自業界學術界人工智慧領域資深人士均榜上有名。值得注意的是這些AI領袖中,近半數來自百度或曾在百度就職。
  • 當百度to B | 甲子光年
    這個逐漸成熟的打法,也正對應著已發展15個年頭的雲計算服務正在經歷的新變化:即當雲計算進入以各行業傳統企業和政府部門為主力客戶的「下半場」,一個行業共識是,計算與存儲的基本能力之外,雲與AI的結合將成為接下來的關鍵競爭點——雲計算負責新型IT基礎架構,AI負責具體