全球最大語音識別公司Nuance的浮沉史(上)衰落篇

2021-02-15 雷鋒網


Nuance是全球最大的語音識別技術公司,這十幾年裡,其經歷了無數次起起落落:曾被蘋果、Google、三星捧在手上,被絕大多數語音公司為之朝貢。之後卻連連遭遇市值暴跌、技術瓶頸、客戶流失、離職潮、錯過最佳出售時間等,最終不得不從只專注縱向深耕算法的技術提供商轉型為橫向擴展各行業解決方案的公司。

| 「Nuance依賴症」和「Nuance恐懼症」

雷鋒網曾多次報導過關於Nuance的深度文章,文中指出Nuance第一次被眾人熟知源於他們與蘋果之間的合作。當時被譽為下一代交互系統的Siri採用了他們的語音技術後,這家名不見傳、悶聲鑽研技術的公司瞬間被各大媒體相繼曝光。其實在與蘋果合作之前,他們已經跟多家知名廠商保持合作關係,其技術被應用於手機、電視機、汽車等產品中,其中三星的語音助手S-Voice也採用了Nuance的技術。

由於整個語音技術市場Nuance一家獨大,技術遠超同類競爭對手,使得客戶群對其依賴度都非常高。

Nuance的CEO Paul Ricci是矽谷出了名的狠角,為達到目的不擇手段。在任期間他主導了60次併購,Ricci極為擅長利用訴訟手段削弱那些具有創新力的競爭對手,以便用非常低的價格對其進行收購,或讓它們破產。初創公司Vlingo的 CEO Dave Grannan說到:

和Nuance競爭就像傳染性病一樣,我們在和他們的直接競爭中處處領先,但就當你認為生活充滿了美好時,呯!好日子就這樣結束了。

而另一家初創公司Tellme的前CEO McCue曾提到,很多公司無法頂住Nuance的壓力,最終屈服,而且這樣的事情還在不斷發生。

那個時期的Nuance擁有絕對的地位和行業話語權,任何與之相聯繫的公司不得不向它俯首稱臣,巨頭們對其也禮讓三分。

然而,這個傲慢自大的語音巨擘正在面臨空前的危機,自己卻悄然不知。

| 語音帝國每況日下

之後,Nuance在短時間內同時面臨一系列的致命問題,而且問題都是連環性的,一處破裂,整個環節都有可能崩塌。

Nuance的語音技術是以統計推斷方法為基礎,著眼於音素(音節的聲音)和語境來識別話語。在識別方面,Nuance的算法和專利均領先其他競爭對手。然而語音識別技術並非高不可攀,尤其在2010年以後,專利和算法在語音應用場景中的作用越來越小。各家語音的純識別率逐漸趨於同一水平線,差距不再可感。如果繼續深耕識別技術,路會越走越窄,成本與提升的效果遠不成正比。

就在此時,深度學習空前火熱,其被廣泛應用於語音技術當中,省去很多語音模型創建環節,使得難度、成本、時間均大幅下降,一大批廠商紛紛湧入這個行業與Nuance在同一維度展開競爭。而此時蘋果、三星、Google等公司為了擺脫對Nuance的依賴,也開始著力於開發自己的語音技術,Nuance在技術上的優勢逐漸不在,客戶也慢慢流失。

流失的客戶開始聚攏人才,開發自己的語音產品,而挖Nuance牆角就是最現成的辦法。蘋果作為Nuance的戰略合作方,其挖人動作最為高調,蘋果在Nuance的老巢波士頓悄悄設立語音技術研發團隊,不僅吸納了為Siri服務的語音技術人才,更是將Nuance公司的多名高管和高級語音研究人員招募進來,其中包括Nuance前研發副總裁Larry Gillick以及語音資深科學家Gunnar Evermann、Don McAllaster等。

與此同時,Google為了避開Nuance的專利障礙,挖走在Nuance工作十年的聯合創始人Mike Cohen,讓其擔任「語音掌門」開發相應的語音識別技術。有趣的是,小米全球副總裁Hugo Barra,也曾是Nuance的產品經理,於2008年被Google招入麾下。

核心人員流失意味著Nuance的技術壁壘被變相「瓦解」,大公司對它的依賴不斷減小,這對於依靠技術輸出來獲取收入的Nuance來說,無異於滅頂之災。

賈伯斯曾提出收購Nuance的請求,但被Nuance CEO一口回絕。業界認為他們當時顯然錯過了最佳出售期。

之後在Nuance進退兩難之時,三星和百度也均流露出收購Nuance的意向。語音交互替代多點觸控已成為科技界人士的共識,語音技術對擁有過億用戶的企業來說,戰略意義往往大於其實際價值。但最後收購事項並未順利進展,分析師指出三星等公司主要考量到了這兩個問題:一個是性價比,Nuance的僱員超過15000人,如果進行收購交易規模將在50至60億美金以上,因此潛在收購者吞併體量龐大的Nuance存在是否划算的問題。

其次,三星最初構想通過收購Nuance從而在一定程度上限制蘋果、Google在相關業務方向的發展,但現實是各個公司的自有語音技術已經趨於成熟,因此「拿下Nuance,就可以制約與Nuance合作的企業」這句在以前成立的話,現在已成為偽命題。潛在收購者們只好作罷。

回顧Nuance這些年的經歷,其衰落離不開「技術」兩字。首先Nuance自己碰到了語音技術的天花板,很難再有大的突破。其次,借著深度學習大潮,使用全新算法的攪局者們的追趕速度遠遠超出Nuance的預想,變得一發不可收。而此時留給Nuance的時間似乎已經不多了。

/ 文章推薦 /


重磅:蘋果人工智慧最完整解密,iBrain早已無處不在

相關焦點

  • 產經 谷歌將開放語音識別API 對抗Nuance
    據科技博客TechCrunch報導,谷歌計劃向第三方開發者開放其語音識別API,與Nuance及其它的語音識別公司競爭。谷歌表示,谷歌雲語音API(Google Cloud Speech API)將覆蓋超過80種語言,兼容任何實時串流或者批處理模式的應用,它將為應用程式提供一整套API,給它們帶來「看、聽與翻譯」方面的功能。它基於目前驅動谷歌應用的語音搜索和谷歌鍵盤的語音輸入的神經網絡技術。它還有一些其它有趣的功能,如可在嘈雜的環境運行,支持實時運行。
  • 谷歌開放語音識別 API,與 Nuance 展開正面較量
    谷歌今天向第三方開發者開放了語音識別 API,計劃與 Nuance 和其他語音識別公司展開正面競爭。為了吸引開發者,Google Cloud Speech API 一開始將免費提供,以後再進行收費。谷歌今天在 NEXT 雲計算大會上正式宣布了這一舉措,此外它還在大會上公布了其他一些與機器學習技術有關的最新動態,但最重要的則是推出了一個新的機器學習平臺。據谷歌介紹,Google Cloud Speech API 包括 80 多種語言,將可以在實時流媒體或批處理模式下支持任意應用,為應用提供全套 API,讓它們可以「看到、聽到和進行翻譯」。
  • 最牛語音識別技術的公司
    ,世界上有超過80%的語音識別都用過Nuance識別引擎技術,其語音產品可以支持超過50種語言,在全球擁有超過20億用戶,幾乎壟斷了金融和電信行業。就算現在,仍舊是瘦死的駱駝比馬大,Nuance依舊是全球最大的語音技術公司,掌握著全球最多的語音技術專利。  國外Google、Apple、 MSRA語音識別的基礎研究做得比較久,技術上比較好。國內專門做語音識別的有「科大訊飛」和「雲知聲」,前者是上市公司,發展時間比較長。後者是新成立的公司,但技術上有獨到的地方。雲知聲目前發展很強勁,技術很厲害。
  • 郭凱明:Nuance攜領先技術助客服中心提升運營效率
    Nuance是一個高科技的美國公司,我們致力於人機互動,用更好的科技幫助機器了解人類的想法和意圖。Nuance這個英文單詞本身就是叫細微的差距,Nuance這個公司特別擅長處理聲音上的細節。有人說我們中國區沒人,實際上我們在中國區有100多人,團隊也是蠻龐大。Nuance一直專注於智能語音的識別和高科技的自助服務。實際上Nuance的方案無處不在。
  • 依圖做語音了!識別精度創中文語音識別新高點
    依圖語音識別算法在全球最大開源中文資料庫AISHELL-2上詞錯率僅3.71%,比原業內領先者提升約20%,大幅刷新現有紀錄。比對各家語音識別算法,當今智能語音戰場,英雄唯訊飛與依圖爾?2018年底,智能語音市場意外殺入一匹黑馬。素來被認為是「人臉識別獨角獸」——或者更寬泛一點說,「計算機視覺獨角獸」的依圖科技,公布了他們中文語音識別技術的最新突破,以及令人矚目的產業布局。
  • Nuance被百度收購傳言不靠譜
    昨天市場傳出消息稱百度將在幾周內收購語音識別巨頭Nuance,受此傳言影響,剛被高盛從中性降級為賣出的Nuance開盤後上揚,目前市值為44億美元。百如果這項交易果真存在,由於涉及敏感技術,還將受到監管方的嚴格審查,問題是這一消息未必屬實。 語音識別技術的現狀是,toB市場規模不大,toC市場則完全還沒做起來。市場前景不明朗,是這個產業發展的最大障礙,這也是為何擁有更高技術的IBM等巨頭在該領域做了多年研發,卻遲遲未對這些技術做進一步的產品化和商業化的原因之一。
  • 語音識別技術簡史
    語音識別的精度和速度取決於實際應用環境,但在安靜環境、標準口音、常見詞彙場景下的語音識別率已經超過 95%,意味著具備了與人類相仿的語言識別能力,而這也是語音識別技術當前發展比較火熱的原因。隨著技術的發展,現在口音、方言、噪聲等場景下的語音識別也達到了可用狀態,特別是遠場語音識別已經隨著智能音箱的興起成為全球消費電子領域應用最為成功的技術之一。
  • 谷歌語音識別技術水平超越人類?
    但是,近期語音識別和人工智慧領域取得的突破讓一項數十年前就已問世的數字神經網絡技術獲得重生。谷歌正在此神經網絡技術的基礎上開發可以整合其海量數據的語音系統,其能夠讓語音識別更為智能,大幅改善了識別質量。未來,市場上或將出現準確率與人類相當或水平更高的語音識別系統。以下是文章全文:與數字語音助手聊天產生的樂趣大概就像你努力與一個頑固的孩子講道理一樣。
  • 語音交互國內外公司盤點
    全球最大的語音技術公司,超1000項專利技術 ,一度雄霸天下。當然現在依然很牛啦。在中國,有9%的語音識別應用是採用Nuance的核心技術。它和電信、移動、聯通、網通都有合作,cctv春晚的呼叫中心也應用此技術。簡直不可撼動...
  • 語音識別系統
    更棒的語音識別體驗!  提到中文語音識別技術,科大訊飛絕對算是明星級別的企業了,也就是奇瑞智雲2.0系統的提供商,在這之前,無論是眾多合資車企的語音識別解決方案,還是智慧型手機上的靈犀語音App,都為這家企業建立了不小的名氣,不能說全球第一,但在中文語音識別領域,它確實很有一手。
  • 手機語音識別軟體哪款好用?3款語音識別app推薦
    而將人工智慧運用到語音識別領域,更是為我們的生活帶來極大的便利。這次小編精心準備了3款手機語音識別軟體,下面一起來看看吧~訊飛聽見:咪咕靈犀:《咪咕靈犀》是由國移動咪咕公司與科大訊飛聯合推出的一款人工智慧語音識別助手,它擁有著全球領先的語音識別技術,通過語音識別,它可以幫你完成問天氣、打電話、發信息、語音翻譯等功能,就算你說的是方言,它也可以通過語音識別智能轉換並且語音播報
  • 誰是世界上最聰明的公司? 這次百度位居全球第二
    MIT Technology Review在介紹百度排名的理由中說明:「百度在核心的搜索業務之外,語音識別、人工智慧技術領域的積累已經讓百度在語音識別上可與真人相媲美,並且百度在矽谷成立自動駕駛研發部門,也是視覺識別、傳感器等領域的領先企業。」從以上可以看出,百度在人工智慧領域領先於同行的研發成果已獲得MIT Technology Review的認可。
  • 其實語音輸入比打字快多了!
    現在我們手機上的很多軟體都有語音識別的功能,可是它們的口碑並不太好,少有人會真正用語音來輸入文字。
  • 全球值得關注的11家人臉識別公司與機構
    據2018年6月公司官方報告,依圖科技在千萬分之一誤報下的人臉識別準確率已經接近99%。今年11月,依圖科技啟動「AI防癌地圖」項目,計劃在未來5年內投入1億元項目資金,聯合數百家醫療機構,覆蓋全國19個省市自治區,以AI應用提升醫療機構服務供給能力,推動中國腫瘤篩查進入「AI+」時代。
  • 物聯網全景動態圖譜2.0|智能語音交互
    在人工智慧三大要素:算法、計算、數據上,都有著得天獨厚的優勢。 擁有建立在超大規模神經網絡、萬億級參數、千億級樣本上的人工智慧算法; 依託數十萬伺服器和中國最大GPU集群的計算能力; 作為全球最大的中文搜尋引擎,累計了全網萬億網頁、數十億搜索、百億級圖像視頻和定位數據;DuerOS對話式人工智慧系統,建立在語音識別、圖像識別、自然語言處理、用戶畫像等世界領先的技術能力之上,是百度技術的集大成者。
  • 深度 在語音識別這件事上,漢語比英語早一年超越人類水平(附論文)
    但微軟的成果是在英語水平上的,從部分讀者留言中我們了解到對漢語語音識別的前沿成果不太了解,這篇文章將向大家介紹國內幾家公司在漢語識別上取得的成果(文中提到的論文可點擊閱讀原文下載)。10 月 19 日,微軟的這條消息發布之後在業內引起了極大的關注。語音識別一直是國內外許多科技公司發展的重要技術之一,微軟的此次突破是識別能力在英語水平上第一次超越人類。
  • 王小川首秀搜狗語音糾錯:突破語音識別最後3%
    王小川介紹道:「目前搜狗手機輸入法日均語音輸入調用次數超過1.4億次,是中國最大的語音識別引擎,語音識別準確率已超過97%。但當前的人工智慧技術仍然無法讓語音識別達到100%的準確率。對此搜狗開發了語音修改功能,通過自然語言交互的形式修改所輸入的文字,比『將弓長張改為立早章』等,不僅解決了語音識別準確率最後3%的差距,同時解放了用戶雙手,提高了用戶輸入效率。」
  • 在語音識別這件事上,漢語比英語早一年超越人類水平
    在當時發布的博客文章中,百度表示在 2015 年 SVAIL 在改進 Deep Speech 在英語上的表現的同時,也正訓練它來轉錄漢語。當時,百度首席科學家吳恩達說:「SVAIL 已經證明我們的端到端深度學習方法可被用來識別相當不同的語言。我們方法的關鍵是對高性能計算技術的使用,相比於去年速度提升了 7 倍。因為這種效率,先前花費兩周的實驗如今幾天內就能完成。
  • 業界 國內外語音識別行業最全盤點及技術分析和預測
    本文就詳細盤點一番國內外的大型公司,並對他們掌握的技術進行分析,同時預測一下未來的語音識別趨勢,期望帶給行業內外的專業人士些許參考,藉此更進一步推進整個行業的發展。任何時候提到語音識別,都不能避過Nuance這家公司,這家公司曾經在語音領域一統江湖,世界上有超過80%的語音識別都用過Nuance識別引擎技術,其語音產品可以支持超過50種語言,在全球擁有超過20億用戶,幾乎壟斷了金融和電信行業。就算現在,仍舊是瘦死的駱駝比馬大,Nuance依舊是全球最大的語音技術公司,掌握著全球最多的語音技術專利。
  • 滴滴披露語音識別新進展:基於Attention顯著提升中文識別率
    在這篇名為《A comparable study of modeling units for end-to-end Mandarin speech recognition》的論文中,滴滴公布了其在基於 attention 的端對端中文語音識別技術上取得的最新研究成果。