將加入小米,語音識別大牛Daniel Povey宣布年底前來中國工作

2020-12-03 機器之心Pro

機器之心報導

參與:鄭麗慧、張倩

昨天,國際語音識別大牛、前約翰霍普金斯大學(Jonhs Hopkins University)教授、 語音識別開源工具 Kaldi 之父 Daniel Povey 在 Twitter 上表示,他將很快與小米籤訂一項工作協議,工作地點位於北京。此外,他還表示自己將於 2019 年底之前前往北京工作,且會招聘一個小團隊打造新一代的「PyTorch-y」Kaldi。

今年 5 月份,約翰霍普金斯大學的學生抗議事件發生後,Povey 教授因反對學生抗議遭學校停職,後來他又拒絕了 Facebook,計劃加入中國公司。機器之心獲知,Povey 教授曾於 9 月中旬來到中國,與多家公司進行交流,後來他宣布以兼職顧問的身份加入北京初創公司愛數智慧。從今日的信息來看,Povey 教授最終的去向也將敲定。

Twitter 信息發布後不久,就有人表示想進入小米和這位大牛共事,並問道,「小米收實習生嗎?」「和您共事需要哪些技能?」對此,Povey 回答稱:「我們可能會考慮先僱傭全職員工。一起工作需要的技能不只是 Kaldi,還要有深厚的 C++、Python 功底,而且 Python 方面的知識可能更加重要一些。」

此外,帖子底下還有一些列隊歡迎的中國網友。

這位如此受歡迎的語音識別大牛究竟是何許人?有何過人之處?我們先來看一下他的經歷。

Kaldi 之父——Daniel Povey

Danial Povey 是語音識別領域的專家,他曾主導開發了語音識別工具庫 Kaldi,該工具庫支持多種語音識別的模型的訓練和預測,很多國內外語音技術公司的研發測試都是從 Kaldi 起步的。Kaldi 目前已經擁有 6600+的 Star 量,被認為是業界語音識別框架的基石。它集成了多種語音識別的模型,包括隱馬爾可夫和最新的深度學習神經網絡,在語音識別方面有著不可撼動的地位。

Danial Povey 本科和博士都就讀於英國劍橋大學,2003 年在劍橋大學拿到博士學位。

畢業之後,他曾先後加入 IBM、微軟等科技巨頭,並於 2012 年進入約翰霍普金斯大學擔任助理教授。

他從 1999 年起就開始發表關於語音識別和處理方面的研究成果。在 Google Scholar 上,Povey 的被引用次數超過了 20000 次。

他不僅是語音識別軟體 Kaldi 的主要開發者,還是該論文的第一作者,可以說是 Kaldi 之父。這篇關於 Kaldi 的論文引用次數就已經達到了 3000 多次。

從以上履歷可以看出,由於在語音識別領域舉足輕重的地位,Povey 一直是各大科技公司和高校的青睞的人才,他的職業生涯似乎也一直是順風順水,直到今年年初捲入約翰霍普金斯大學的學生抗議事件。

因捲入學生抗議事件從約翰霍普金斯大學離職

離開約翰霍普金斯大學以前,Daniel Povey 一直負責學校(CLSP)語言語音處理中心的工作。

他突然離職的原因也是非常與眾不同:

今年 4 月,約翰霍普金斯大學校內出現了學生抗議事件。學生們抗議的目的是要求 JHU 取消最近批准的建立一支私立警察部隊計劃,終止與美國移民和海關執法部門的合同,目的是「為了保護大學裡的黑人、黃種人、同性戀者以及所有被邊緣化的人。」

學生們舉行了靜坐示威和佔領行政大樓的抗議,開展了長達一個月的靜坐示威,並封鎖了 Garland Hall——用鐵鏈鎖住門,遮住窗戶,導致大學不得不暫停或重新安排財務援助、殘疾人幫助、學術諮詢和學生籤證等服務。

關鍵是,CLSP 的機房就處在被佔領的樓中。因為缺乏維護,機器和數據都面臨被損壞危險。為了保護數據,Povey 選擇闖入機房,在此過程中與學生產生矛盾。

事件之後,校方給予 Povey 行政休假的命令,之後又宣布辭退 Povey。

對於校方的處理方式,Povey 在公開信中表達了強烈的不滿,以下為他的公開信內容:

「我將於 8 月 19 日起在西雅圖 Facebook 入職工作。我將繼續與自己的學生和合作者展開遠程合作。我將於本月 31 日正式離職霍普金斯大學。我已經有了備選工作計劃,因而會早點離開霍普金斯大學。」

鑑於這次非比尋常的離職原因,Povey 也在公開信中表達了對校方的不滿,認為校方在處理這件事情上不公平,甚至偏袒了參與抗議的學生團體。

「...... 從本質上來說,我是因為可能發生的事情被解僱的,而那些學生們卻可以不因為他們的所作所為受到懲罰。」

說不清孰是孰非,總之這件事過後,Povey 正式離開了工作 7 年的霍普金斯大學,轉投業界。

跳槽 Facebook?並沒有

但是 Povey 的跳槽之路略顯坎坷:計劃於 8 月 19 日入職的 Facebook 給他發了一封郵件說到,「通常我們不會聘請在上一份工作中因為安全問題而被解僱的人,但你作為顧問為我們工作的一年期間並沒有引發任何問題,所以我們相信自己可以做出獨立判斷,以決定你在約翰霍普金斯大學期間的行為是否會影響我們僱傭你的決定。」

安全問題?儘管這份郵件中並未收回對 Povey 的聘用,只是說要接受為期六周的獨立調查,但這種態度激怒了 Povey。

可能是因為對這種「莫須有」的懷疑太過反感,在 Povey 眼裡 Facebook 的態度和 JHU 沒有什麼區別,乾脆拒絕了 offer:

「因此我決定拒絕這一職位邀請,整個事件似曾相識(déjà vu)。」

兜兜轉轉以後,Povey 說自己考慮去中國公司或高校任職,並在 9 月中旬來到中國和多家公司進行了交流。

他選擇了中國

九月底,Daniel Povey 在社交網絡上確認自己已經加入中國創業公司愛數智慧,但並不是全職。

「已有很多報導說我加入愛數智慧,這是事實,但它不是全職工作,只是兼職顧問!我仍然沒有決定我的主要工作。」

於是 Daniel Povey 究竟會選擇哪一家中國公司成為全職僱員,成了圈內熱議的話題。

對於 Povey 入職小米的信息,機器之心也向小米公司做了確認,小米方回復稱「目前還不確定」,但同時也表示,Povey 教授中國行期間確實與小米進行過交流。

相關焦點

  • 小米如何挖到語音大牛Daniel Povey?
    上周AI圈的一則重磅新聞是Daniel Povey宣布將加盟小米,這位語音界的大牛、Kaldi 之父先是被任教的約翰霍普金斯大學開除,後收到Facebook的橄欖枝,結果他選擇拒絕Facebook的offer,來中國工作。
  • 語音大牛Daniel Povey將亮相小米開發者大會
    早前小米已經官宣,全球AI語音識別專家、前約翰霍普金斯大學教授Daniel Povey將加入小米。最新消息顯示,Daniel Povey將首次在MIDC上亮相。今日,小米集團創始人雷軍在社交媒體上宣布,國際語音識別和AI領域的天才教授、語音識別開源工具Kaldi 之父Daniel Povey將出任小米集團語音首席科學家,他將在北京組建獨立研發團隊,匯報給集團副總裁、技術委員會主席崔寶秋,Daniel Povey將在2019年小米開發者大會首次公開亮相。
  • 小米官宣Daniel Povey正式加入,全球人才加入中國科技公司又一案例
    封面新聞記者崔江 雷強10月19日,小米集團副總裁、集團技術委員會主席崔寶秋在社交媒體上宣布,國際語音識別和AI領域的知名教授、 語音識別開源工具 Kaldi 之父 Daniel Povey正式加入小米。
  • Daniel Povey出任小米首席語音科學家 向崔寶秋匯報
    來源:新浪科技新浪科技訊 11月18日下午消息,小米集團創始人雷軍今日在微博上宣布,國際語音識別和AI領域專家、語音識別開源工具Kaldi 之父Daniel Povey將出任小米集團語音首席科學家,他將在北京組建獨立研發團隊,匯報給集團副總裁
  • Daniel Povey 任小米語音首席科學家,明天亮相 MIDC 開發者大會
    雷鋒網消息,11 月 18 日,小米集團創始人雷軍在社交媒體上宣布,國際語音識別領域的大神級人物、前約翰霍普金斯大學(Johns Hopkins University)教授、 語音識別開源工具 Kaldi 之父 Daniel Povey 將出任小米集團語音首席科學家。
  • WAIC 開發者日Daniel Povey:在中國,打造新一代的「Kaldi」
    一是語音識別開源工具 Kaldi 之父的身份;二是對約翰霍普金斯大學內的學生抗議提出抗議,之後乾脆離開學界並怒辭 Facebook;三是漂洋過海來到中國,加入小米,同時被記住的還有他那雙一年四季都在穿的涼拖鞋。
  • Daniel Povey加盟小米後首次亮相,透露選擇小米的原因
    瀏覽器版本過低,暫不支持視頻播放封面新聞記者 崔江11月19日,在剛剛開幕的2019MIDC小米開發者大會上,國際語音識別和AI領域的知名專家、語音識別開源工具 Kaldi之父丹Daniel Povey在加盟小米集團後首度亮相,引發了外界的廣泛關注。
  • Daniel Povey:Kaldi 核心算法 K2 0.1 版本已發布,未來將堅持開源
    Daniel Povey博士目前擔任小米集團語音首席科學家,由他開發和維護Kaldi 集成了多種語音識別模型,是業界語音識別框架基石。加入小米一年,Daniel Povey設計並開發出了新一代Kaldi。新一代Kaldi分成三個部分,包括核心算法部分,訓練數據準備部分、示例腳本集合部分。
  • Kaldi之父Daniel Povey博士:發布k2核心代碼
    加入小米一年,Daniel Povey設計並開發出了新一代Kaldi。新一代Kaldi分成三個部分,包括核心算法部分,訓練數據準備部分、示例腳本集合部分。其中,Lhotse(訓練數據準備部分)將替代以前Kaldi中所有數據準備相關的工作,操作各種音頻和文本的元數據。Lhotse除了Kaldi本身,也適用於其他應用。而且Lhotse純Python代碼,方便易用。Icefall(示例腳本集合部分)將代替Kaldi中的示例腳本集合,並獨立成為一個單獨的子項目。
  • Daniel Povey參加INTERSPEECH愛數智慧直播 將與觀眾深度互動
    Sponsor),將於 10 月 28 日晚20:15~20: 45 在虛擬展位開設直播專場,直播主題為:Data sets your model --Which data strategy should be adopted to achieve better performance?
  • 谷歌雲更新語音API:新增時間戳檢索功能,可識別語言增至119種
    數據表明,全球語音識別市場預計將在2017年底達到61.9億美元,到2023年底將達到183億美元。簡而言之,雲語音API可以讓第三方開發人員及其公司將谷歌的智能語音識別集成到自己的產品中。例如,聯絡中心可以使用該API,通過監聽呼叫者的指令來自動將呼叫轉接到特定部門。今年早些時候,Twilio在其語音平臺上接入了該API,從而讓自己的開發用戶能在產品中將語音轉換成文本。現在,谷歌宣布了雲語音API的三個重大更新。首先是字級時間偏移量,也就是字級時間戳。
  • 大牛講堂 | 語音專題第一講,麥克風陣列的語音信號處理技術
    麥克風陣列的語音信號處理技術熟悉人工智慧的朋友一定明白,語音交互對於人機對話交互的重要意義,而一個完整的語音交互涉及到人的語音、語義,機器的麥克風、處理器、核心算法等多個部分,是一項看似簡單,實則複雜的龐大工程!當然這是以小編的粗淺理解寫成的總結,技術講解咱還得靠大牛!
  • 小蟻智能攝像機3來了,360°雲臺、人工智慧AI、語音識別三管齊下
    今日上午,小米旗下生態鏈企業小蟻科技為小米智能家居生態帶來了一位新成員「小蟻智能攝像機3雲臺版」,並將於4月28日上午10:00正式開賣,售價399元。小蟻智能攝像機3雲臺版相比於第一代的連接手機、實現通話,第二代的清晰度提升、帶來360°雲臺全景視角,第三代攝像機「小蟻智能攝像機3」則引入了人工智慧AI、語音識別技術,而且外觀更「萌」,讓攝像機「大不同」。
  • 經濟學人全球早報:小米聯手三星,機器人交警上崗,鴻蒙系統年底問世
    小米聯手三星將推6400萬/1億像素手機小米和三星聯合宣布,將在小米Redmi上首發三星的6400萬像素超清相機。同時,小米還宣布將與三星聯合推出全球首款1億像素超清相機手機。在會上,小米聯合創始人、總裁林斌還詳細講述了小米在影像技術研發的經歷以及未來小米在影像技術的布局路線。
  • 語音識別領域跑出黑馬,雲知聲發展前景淺析
    近年來,語音識別技術取得了長足發展。基於大數據積累、深度神經網絡模型的發展及算法的迭代優化,語音識別技術準確率不斷提升,甚至達到了能夠媲美人類的地步。 中國語音產業聯盟《2015中國智能語音產業發展白皮書》數據顯示,2017年全球智能語音產業規模將首次超過百億美元,達到105億美元。在語音識別領域這個賽道上,充斥著大大小小的競爭者,國外有微軟、谷歌、IBM,國內有百度、科大訊飛、思必馳、雲知聲、出門問問等等。 智能語音識別領域公司雲知聲於前段時間宣布獲得3億元人民幣戰略投資。
  • 百度語音識別系統DeepSpeech 2:算法識別中英文
    【環球科技綜合報導】據Inside Bigdata網站11月27日報導,百度研究院(baidu research)宣布矽谷人工智慧實驗室 (SVAIL)已經開發出了一種新型語音識別系統——深度語音識別系統(Deep Speech 2)。該系統能通過簡單學習算法準確的識別英語和漢語。具體細節刊登在預印本在線資料庫arXiv.org,Deep Speech 2:英漢端對端深度語言識別。
  • 小米手環4正式發布,待機20天+語音助手+50米防水,169元起
    6月11日下午,米家新品發布會在北京召開,一口氣發布了9款新品,其中有洗烘一體機、米家與鋒味打造的電磁爐、米家智能門鎖等等,不過人氣最高的還數小米手環4。全新發布的第四代小米手環,依然分為普通款和NFC款,價格分別為169元和229元,都將於6月14日上午10點開售。
  • INTERSPEECH2020口音英語語音識別技術挑戰賽 數據堂喊你開賽!
    語音技術圈頂會之一INTERSPEECH 2020,以「Cognitive Intelligence for Speech Processing」為主題,即將登陸上海。2020口音英語語音識別技術研討會暨挑戰賽(以下簡稱2020AESRC)作為本年度INTERSPEECH的旗艦技術活動,計劃於2020年10月25日在中國上海同步舉行。
  • 字節跳動AI副總裁馬維英離職,因「個人興趣」選擇加入清華...
    目前預計,清華大學智能產業研究院(AIR)將在年底正式成立。從微軟亞洲研究院到字節跳動翻開字節跳動AI Lab的大咖名單,可以發現AI技術大牛李航、李磊、郭傳雄均匯集於此,而馬維英則是AI Lab的負責人。那麼馬維英到底是何許人也?
  • 騰訊晉升首位17級傑出科學家:最高專業職級、AI大牛
    騰訊晉升首位17級傑出科學家:最高專業職級、AI大牛2021-01-09 12:58出處/作者:快科技整合編輯:佚名責任編輯:lishiye1         近日消息,騰訊宣布晉升張正友博士為騰訊 17 級研究員 / 傑出科學家,這也是騰訊首位 17 級科學家,是專業職級中最高水平了