WAIC 開發者日Daniel Povey:在中國,打造新一代的「Kaldi」

2020-12-23 機器之心Pro

機器之心發布

參與:蛋醬

Daniel Povey 來到中國半年多了,微博中最常出現的地點是小米科技園。在籤下 offer 之前,他曾表示計劃在中國打造新一代的「Kaldi」。

Daniel Povey 這個名字為人們所熟知,前前後後大概因為三件事。

一是語音識別開源工具 Kaldi 之父的身份;

二是對約翰霍普金斯大學內的學生抗議提出抗議,之後乾脆離開學界並怒辭 Facebook;

三是漂洋過海來到中國,加入小米,同時被記住的還有他那雙一年四季都在穿的涼拖鞋。

語音識別領域的天才

Daniel Povey 是語音界赫赫有名的人物,他從 1999 年起陸續發表關於語音識別和處理方面的研究成果,迄今為止被引用次數接近 25000 次。

2003 年,Daniel Povey 從英國劍橋大學拿到了語音識別方向的博士學位,此後近十年間,他一直在工業界做語音方面的研究,先後加入了 IBM 研究院和微軟研究院。

在 IBM 研究院的時候,Daniel Povey 推出了特徵空間的判別訓練方法,這一方法已成為當前語音識別領域 SOTA 系統的標配。

他還設計了「子空間高斯混合模型框架」,這是一種後來被廣泛應用的建模技術,原理是通過類似說話者識別中的子空間思想來增強高斯混合模型框架。

但 Daniel Povey 最著名的研究是「Kaldi」。2008 年,Daniel Povey 進入微軟研究院,次年開始主導這款語音識別工具包的搭建工作。Kaldi 集成了多種語音識別的模型,包括隱馬爾可夫和最新的深度學習神經網絡,在語音識別方面有著不可撼動的地位。

2011 年,Daniel Povey 和他的團隊在一篇論文中向大家介紹了 Kaldi,並公開了所有代碼。而 Daniel Povey 不僅是 Kaldi 的主要開發者,也是該論文的第一作者,後來也被稱為「Kaldi 之父」。

實際上,Kaldi 的工作最初也是在 2009 年約翰霍普金斯大學的一場 workshop 上啟動的。後來,Daniel Povey 從工業界退出,在 2012 年進入約翰霍普金斯大學擔任助理教授。

這篇關於 Kaldi 的論文引用次數現在已經達到了 3000 多次,在 GitHub 上的項目 Star 量也已經超過了 8k。在這九年裡,Daniel Povey 一直是 Kaldi 主要開發和維護者。

漂洋過海,加入小米

但由於捲入去年的一場校園抗議事件,Daniel Povey 的研究生涯發生了意外轉折。

2019 年 4 月,約翰霍普金斯大學校內出現了抗議事件,學生們佔領了學校的行政大樓。不幸的是,CLSP(語音語言處理中心)的機房就處在被佔領的樓中。因為缺乏維護,機器和數據都面臨著被損壞的風險。為了保護機器和數據,Daniel Povey 在 5 月 8 日夜晚試圖用斷線鉗絞開封鎖大樓的鐵鏈,從學生手中奪回機房,但未能成功。

之後 Daniel Povey 就離開了約翰霍普金斯大學,又因為 Facebook 的「六星期審查事件」直接拒絕了 offer。在一系列事件後,他決定來到中國。

「如果任何人想知道後續的話,我的計劃是去一家中國公司任職,並可能在中國高校找一份兼職工作。」

與幾家中國公司見過面之後,Daniel Povey 最終選擇了小米。

北京時間 2019 年 11 月 18 日,Daniel Povey 在 Twitter 上宣布,他將很快與小米籤訂一項工作協議,工作地點位於北京,所以自己也會在 2019 年底或者之前搬去北京。在小米的工作內容是打造新一代的「Kaldi」。

隨後,小米的幾位聯合創始人也都在微博確認了這一消息。很快,Daniel Povey 就以小米集團語音首席科學家的身份出席了 2019 小米開發者大會。

來到中國後,他也擁有了自己的微博帳號:

工作之餘,他也會在微博分享在中國的新生活:

拍下這張照片的理由是:「我感覺自己穿這件襯衫的時候,看起來很像大佬的心腹。」

如果足夠關注 Daniel Povey 的動態,還會發現他幾乎每天穿著同一雙「涼拖鞋」,即使在冬季下雪的日子也是如此。(當然,也許是買了很多雙同款)

打造新一代的「Kaldi」

對於熟悉 Daniel Povey 的人來說,他的確是個有些「古怪」的人,與此同時又不得不承認,他是既有天分又足夠勤奮的那種人。

在離開美國的半年裡,Daniel Povey 筆耕不輟。大約在近半年的時間裡,他的谷歌學術主頁就更新了 7 篇論文。

在最近上傳的一篇論文中,他和約翰霍普金斯大學的研究人員共同提出了 PyChain。對於 Kaldi 自動語音識別(automatic speech recognition, ASR)工具包中鏈式模型的端到端無網格最大交互信息(lattice-free maximum mutual information, LF-MMI)訓練,PyChain 可以實現完全並行化 PyTorch 實現。

此外,打造新一代的「Kaldi」也是他來到中國的初心。

在不久之後的 2020 年世界人工智慧大會雲端峰會開發者日專場,Daniel Povey 也會親自分享他在語音識別領域的最新思考。

世界人工智慧大會雲端峰會開發者日(以下簡稱為 WAIC 開發者日)作為 WAIC 雲端峰會主題論壇及特色活動,是 WAIC 期間唯一面向 AI 開發者的專業活動,旨在打造人工智慧領域年度最高規格、最專業、最具影響力的開發者盛會。

WAIC 開發者日將在 7 月 9 日 - 11 日舉辦 1 場主論壇、多場分論壇、及高峰對話、黑客松等活動,呈現人工智慧技術分享盛宴。期間也將進行上海白玉蘭開源開放研究院揭牌,發布《人工智慧開源開放報告》、WAIC 人工智慧青年技術人才獎。

Daniel Povey 本次將要分享的主題是 《可差分的有限狀態機在語音識別及其他序列問題中的應用(Differentiable Finite State Acceptor (FSA) Operations for Speech Recognition and other Sequence Problems)》,同時參會分享還有多位重磅嘉賓,包括 2017 年圖靈獎得主、計算機體系結構宗師 David Patterson,2007 年圖靈獎得主、歐洲科學院院士、法國科學院院士、美國文理科學院院士、美國國家工程院院士 Joseph Sifakis,雪梨大學教授、優必選 AI 首席科學家陶大程,百度集團副總裁、深度學習技術及應用國家工程實驗室副主任吳甜,多倫多大學助理教授 David Duvenaud,Julia 語言創始人之一 Viral B. Shah 等。

更多大會精彩內容將陸續對外公布,歡迎各界朋友持續關注 WAIC 開發者日活動,共同推動人工智慧開發者生態的建設和核心技術的研究與進步。

相關焦點

  • Daniel Povey 任小米語音首席科學家,明天亮相 MIDC 開發者大會
    雷鋒網消息,11 月 18 日,小米集團創始人雷軍在社交媒體上宣布,國際語音識別領域的大神級人物、前約翰霍普金斯大學(Johns Hopkins University)教授、 語音識別開源工具 Kaldi 之父 Daniel Povey 將出任小米集團語音首席科學家。
  • 將加入小米,語音識別大牛Daniel Povey宣布年底前來中國工作
    此外,他還表示自己將於 2019 年底之前前往北京工作,且會招聘一個小團隊打造新一代的「PyTorch-y」Kaldi。今年 5 月份,約翰霍普金斯大學的學生抗議事件發生後,Povey 教授因反對學生抗議遭學校停職,後來他又拒絕了 Facebook,計劃加入中國公司。
  • 圖靈獎得主論體系結構創新,自動構建知識圖譜,盡在WAIC開發者日
    在 WAIC 開發者日主論壇上,Verimag 實驗室創始人、2007 年圖靈獎得主 Joseph Sifakis 教授帶來了「是否可以信任自治系統?邊界和風險又有哪些?」的主題演講。Sifakis 首先講解了新一代自治系統的概念以及主要特徵。
  • Kaldi之父Daniel Povey博士:發布k2核心代碼
    11月15日,
  • WAIC開發者上海臨港人工智慧開發者大會正式啟動,精彩搶先看
    從「臨港新片區AI+」行動到人工智慧產業十條促進政策,臨港不斷發力助推AI產業發展,為「十四五」上海人工智慧高地建設持續蓄能。12月26日, 以「智能化轉型的技術之道」為主題的WAIC開發者·2020上海臨港人工智慧開發者大會即將震撼來襲。
  • 你是優秀開發者嗎?WAIC邀你前來認證
    在人工智慧時代,開發者扮演著重要的角色。技術開發與迭代、開源、落地實踐等,都離不開他們的身影。微軟前 CEO 史蒂夫 · 鮑爾默(Steve Ballmer)曾在開發者大會上汗流浹背地高喊「開發者、開發者、開發者、開發者、開發者、開發者、開發者、開發者……」表達他對開發者的熱愛和肯定。
  • 2020 WAIC開發者日百度公開課核心乾貨
    對於入門不久的初級開發者或者轉型中小企業來說,如何最輕鬆、最高效地進行 AI 開發和部署?2020 世界人工智慧大會雲端峰會是由上海市政府打造的國際頂級人工智慧會議,於 7 月 9 日正式開幕。「開發者日」作為 WAIC 雲端峰會主題論壇及特色活動,也是 WAIC 期間唯一面向 AI 開發者的專業活動。
  • 語音大牛Daniel Povey將亮相小米開發者大會
    今日,小米集團創始人雷軍在社交媒體上宣布,國際語音識別和AI領域的天才教授、語音識別開源工具Kaldi 之父Daniel Povey將出任小米集團語音首席科學家,他將在北京組建獨立研發團隊,匯報給集團副總裁、技術委員會主席崔寶秋,Daniel Povey將在2019年小米開發者大會首次公開亮相。
  • 「智領時代,無限可能」——2018 AIIA 人工智慧開發者大會在蘇州...
    本次大會深入貫徹落實了黨中央、國務院《新一代人工智慧發展規劃》,以及工信部《促進新一代人工智慧產業發展三年行動計劃(2018 – 2020 年》,為眾多人工智慧從業者搭建了政產學研合作的交流平臺,推動了人工智慧在眾多產業的落地應用,為中國人工智慧的發展打開了新格局。
  • Facebook 開發者大會前瞻:FB 不會放棄「糊掉」的 VR
    開發者大會第一天的扎克伯格的 keynote 演講結束,隨即上場的就是 Oculus 開發者生態系統的負責人 KaseyGalang,他將帶來「The Year Ahead in VR」的主題演講,主要介紹 VR 在未來一年內的關鍵作用。
  • 雙億升級的「星啟計劃」,讓開發者無憂創作的《迷你世界》
    處於興趣而成為開發者的《迷你世界》玩家,官方將如何給予他們幫助,從而克服創作的門檻和困境?持續更新內容的「星啟計劃」,就是《迷你世界》給出的解答。對此,《迷你世界》在「星啟計劃」中提出了「創意激勵」——一億現金+億級流量。官方通過現金和流量的雙扶持,讓開發者們沒有後顧之憂,全身心投入到創作中。「生態合伙人」之一的【櫻桃】,就將現金激勵作為女兒的教育基金;同為「生態合伙人」的【將★軍】,則用來補貼家用。
  • 拒絕Facebook Daniel Povey正式加盟小米
    前幾日,福布斯發布了全球數字經濟100強(Digital 100)榜單,本次榜單共14家中國企業上榜,小米排名56。這是小米連續第二年入選該榜單,且排名較去年大幅提升。
  • 風水輪流轉,美國高端人才紛紛轉投中國,細說這幾位頂級科學家
    2019年10月17日,Daniel Povey發推特表示自己2019年末將入職小米。 失望透頂的Daniel povey只能把目光轉向世界的另一頭中國,因為只有中國,不僅對科技非常重視,而且願意在科研研發上投入足夠多的資源,更重要的是,中國目前沒有所謂的政治幹擾,可以讓專業人才專心做自己喜歡的事。
  • Daniel Arsham 為中國打造獨家藝術平臺
    Google而此番,為了打破傳統束縛,Daniel Arsham 攜手一眾藝術家及志趣相投的品牌,為中國打造了一個獨家藝術平臺 Archive Editions。 Daniel Arsham該平臺就在今天正式上線,而線上第一件作品便是 Archive 與 Pokémon 合作的限量版藝術品之一「被侵蝕的皮卡丘」雕塑。該作品高 33 釐米,重 5.13 千克,限量發售 500 件並且均包含藏品編號。
  • 年度最有意思的AI開發者活動來了!
    12月20日,在北京 798 藝術園區 751 罐,將要舉行一場「別開生面」的 AI 開發者活動。顯然,從選址就能略知一二:15 萬立方米的巨大「工業風的時尚藝術空間」不僅容得下上千名 AI 開發者,還容得下樂隊、DJ、街舞社團和狂歡 party。
  • Valve放出新的開發者工具 讓開發者為Steam創作物品
    Valve 今日宣布,他們針對遊戲開發者推出了 Steam 點數商店開發者工具,讓符合資格的 Steam 遊戲開發者可以把自己作品製作成物品,如動畫個人圖示、邊框、貼紙新增到 Steam 點數商店。
  • 一年一度的XR開發者盛宴,第五屆VRCORE開發者大會開幕
    第五屆VRCORE開發者大會涵蓋硬體研發、時尚設計、工業生產、影視製作、遊戲研發、航空航天、線下娛樂七大XR行業細分領域,邀請了優秀研發團隊代表和來自中國、歐洲、東南亞、韓國的XR社區意見領袖,來分享自己的思考和經驗。大會分為主題演講與圓桌論壇兩大環節,期待這些演講嘉賓分享能夠為國內的開發者們了解全球行業發展趨勢,帶來新的思路和啟發。
  • 新銳品牌「俊匠」,打造中國男人的第一瓶!
    在天貓雙11第一波預售開啟首日,男性進口彩妝商品備貨同比大幅增長便超3000%。由此可以看出,越來越多的男士開始關注護膚品和穿衣打扮,而「男生也需要追求精緻」這一趨勢,也已被各大品牌嗅到了商機,新銳男性護膚品牌「俊匠」也不例外。
  • 蘋果的「封閉」是一種原罪嗎?-巔峰贅婿
    那時候開發者現場由衷的歡呼猶在耳邊,怎麼蘋果就成了「掠奪者、獨裁、暴君」的形象了?其實回溯iPhone和AppStore的歷史,封閉的基因早已根植。如果說「封閉」是一種錯,那這是不是iPhone自誕生之日就背負的原罪?用戶不關心封閉,只在乎體驗很多人已經不記得了,其實2007年,第一代iPhone問世的時候,它不支持任何第三方App。
  • VR休閒遊戲「Traffic Jams」發布最新開發者視頻
    據外媒VRFocus報導,由荷蘭遊戲工作室Little Chicken Game開發、Vertigo Games發行的VR休閒遊戲「Traffic Jams」近日發布包括遊戲開發者視頻、地圖在內的最新內容