【活動】三大因素促進智能語音爆發 未來能讀懂人的喜怒哀樂

2021-01-09 智東西

從10月12日開始為期七天的雙創周在全國範圍內正式拉開帷幕,深圳作為今年雙創周的主會場,匯聚了大量國內外的創業團隊及創新項目。在此期間,京東智能在深圳京東JD+智能奶茶館舉辦了 「遇見未來——智能語音應用的裂變」主題分享活動。會上,靈隆科技有限公司總經理魏強、科大訊飛高級產品經理鄒雲貴、迪韻科技聯合創始人兼CTO彭遠疆,以及智東西聯合創始人總編輯張國仁,就「智能語音未來—泛科技領域構建」為話題在圓桌論壇環節展開了深入探討。

左至右:科大訊飛高級產品經理鄒雲貴、迪韻科技聯合創始人兼CTO彭遠疆、靈隆科技有限公司總經理魏強、智東西聯合創始人總編輯張國仁

靈隆科技總經理魏強表示,智能語音的爆發源於三個因素:1,無論是近場還是遠場的語音技術,都已經非常成熟。2,網際網路公司開始在智能家居的入口上布局;3,晶片業和半導體行業飛速發展,計算能力提高非常明顯。

以下為現場文字實錄:深圳雙創周氛圍下,對創新發展有什麼樣的感受?

彭遠疆:確確實實感覺到大眾創業、萬眾創新,這次活動吸引如此多人參加是我沒想到的。
我在深圳待了差不多二十年,每年參加高交會,跟這次感覺真的完全不一樣,用一個詞來總結的話,就是「熱火朝天」。

鄒雲貴:這樣的展會我也參加了不少,像高交會我每年也都去,而當前新技術和新的創業公司像這麼蓬勃發展的還是第一次。我想這也是當前市場熱情的表現。

魏強:第一感覺是熱度高,對大眾創業、萬眾創新的熱。第二,今年做機器人的創業公司和創新產品非常多,這其實也是一個發展方向,像語音交互的、圖像的以及智能的很多產品,代表著未來一段時間智能化產品的發展趨勢。好的地方就是它能夠催生更多的人機互動的新產品的出現,同時,反過來對技術的領域有更多的促進,因為創業公司出來,對交互的技術有更高層次的要求,對技術發展也會有一定的推動作用。

導致智能語音技術在同一節點集中爆發的因素有哪些?

魏強:我有三方面的思考。第一,技術方面。現在的語音交互技術,無論是近場還是遠場,逐漸走向成熟,這是非常好的技術方面的互通。第二,網際網路浪潮的帶動,很多大的公司,像亞馬遜、Google,還有國內的一些公司,想在智能家居和物聯網家庭裡面做一個入口和布局,是整體戰略的一個體現。第三,晶片業和半導體行業的發展,現在硬體產品的成本越來越低,而且性能越來越高,為大規模廣泛的推廣基於高計算能力的智能化產品奠定了很好的硬體平臺基礎。

彭遠疆:其實語音識別,從60年代起,相關的技術開始慢慢發展,到80年代用了一些神經網絡,從那時起語音交互逐漸變得實用。大概在90年代中到90年代末,當時三星推出一款有語音播報功能的手機,當時非常火。但當時的技術確實不足以支撐智能語音的蓬勃發展,因為識別率不夠高。從2012年開始,不僅是語音識別,圖像識別以及其他技術都飛速發展。其實我從技術角度來講,這是深度學習神經網絡的一個發展,這個發展對整個智能相關的技術都有廣泛影響,不管是圖像識別還是語音識別,把識別率從以前的70%提升到現在的98%。真正使識別的效果落實到實際的應用中。這離不開技術的發展,沒有後臺構建大規模的語音模型和圖像識別模型、神經網絡模型,是沒有辦法支撐這樣高的準確識別率的。從技術角度來講,第一是神經網絡技術的發展;第二是網際網路技術的發展;第三是晶片業的發展,從這幾個方面來講,現在在智能語音交互方面是爆發點。

鄒雲貴:我覺得這個進展有三個方面:第一,我們公司選擇了正確的技術道路,眾所周知,語音識別門檻比較高,但是我們公司創業初期選擇的是語音合成,所以我們從低門檻的東西賺到錢,然後再把收到的錢投資到語音識別當中,我們才能走下來。第二,我們自從上市之後,在資本上得到了非常多的支持,並且我們資本上的局限和投入的程度也得到更大的改觀。第三,訊飛是非常專業、非常執著、非常專一的做一件事情,中國人的語音就應該由中國人掌握,我們自始至終一直做這個事情,所以我們的積累和磨鍊到今天這個程度,做到很高的一個水平。

機器人的語音識別和語氣的問題,該如何解決?

鄒雲貴:這個是語音合成的音色和角色的問題。第一個是需要有特色的聲音,跟人的名氣一樣,有特色的聲音,還要有一定名氣,這個聲音才能被大家接受。另外,也需要一定的時間才能精選出來。我們非常歡迎有實力的公司能夠推薦相應的明星,跟我們來做這種音色的定製化或者特色化。

彭遠疆:如果從成本和易用性來說,迪韻科技提供的麥克風模組,除了效果以外,考慮的就是降低成本。舉個例子,我們之前是用國外一些音頻的採購晶片,跟客戶的交接過程中,客戶不在乎是國內還是國外的,只要質量好就沒問題。所以,我們跟國內的一些廠家聯合,使用他們的一些性價比不錯的全置的採集IC。我們把一些算法嵌到裡面去,這樣整體成本會下降,對用戶或者客戶來講,價格更低,性價比更高。

叮咚(DingDong)的服務市場空間有多大?

魏強:在整個移動網際網路方面,比較熱的是助手機器人,它是一個入口或者一個平臺。目前我們在使用手機的時候,要下載很多APP。未來重要的發展趨勢,可能這些APP都不會存在了,我們手機上面可能只有一個APP或者只有一個入口,我們通過這個入口可以來聽音樂、打車和做各種各樣的功能。而所有的這些服務,都會在後臺進行。我要做的只是把手機和後臺雲端進行連接,這是目前手機上的APP重要的方向。以外的產品,比如說像我們的音箱或者其他語音交互的產品,我們能夠把所有APP裡面用語音交互比較方便、比較適合語音交互的一些功能,都集中在我們的音箱上,或者集中在我們音箱的後臺上,這樣我通過音箱就可以得到各種服務,這種交互方式將來也會給用戶帶來極大方便性。用戶不需要知道很多各種各樣的信息,將來APPStore這種應用市場可能會消失掉,取而代之的是接入更多服務的一個雲平臺,我覺得這可能是未來最重要的移動網際網路的發展方向。

想像一下有哪些場景可以用作智能語音的發揮?

魏強:叮咚(DingDong)音箱上線一年時間,我們從用戶這裡拿到各種各樣的反饋,比如說音色,也就是個性化發音,這是語音技術未來發展的方向。此外,人和人交流不僅僅基於文本,我們說話的時候還帶有很多情感色彩,一句話用不同語氣說出來表達的意思是不一樣的。目前我們的語音識別對語氣的識別和理解還處於一個研發的階段,如果將來我說出簡單的一句話,它就能知道我高興還是不高興、憤怒還是悲傷,這些通過後臺技術能夠實現,對用戶來說會是非常好的體驗。

彭遠疆:其實情感的識別很重要。從另外一個角度來,目前是語音識別或者智能語音產品使用的場景。比如說現在的會場,其實很難達到比較高的識別率。智能語音產品的使用,降噪發展到一定階段,這個產品就會有新的亮點功能。舉個例子,在銀行或者餐館接待的服務機器人,如果語音識別的技術處理好的話,這個市場會是爆發性的增長,這是一個方向。
另外,針對小孩和老人的市場空間很大。三四歲的小孩說話的時候,他有很多好奇的問題,而大人沒有那麼多時間陪他,這就催生了兒童教育市場,這是非常大的市場。從老人這邊來說,因為有些老人的普通話不標準,他的表達方式可能不是很直白、很標準的方式,很可能是本地的一種說法和表達方式,那我們的語音識別方式如果能解決的話,對老人會有幫助,另外,包括老人的陪伴和情感交流,這都是非常大的市場。

鄒雲貴:第一是OTT和智能電視,OTT是機頂盒和智能電視比較多,但是點到自己想看的內容,語音是最快的解決方式。第二是車機,開車的時候用語音操作是比較強的需求。無論你找地點、找信息,還是找餐館、加油站,通過語音進行回復是非常大的需求。接下來一個亮點是智能家居,用戶在家裡對家庭設備的設置,有很多空間可以挖掘,這些操作可以讓大家變得更舒服。相信在人機互動方面智能語音也會得到很大的發展。

相關焦點

  • 一文讀懂AI晶片:短期內GPU主導,未來三大路線並存
    當前以深度學習為代表的人工智慧迎來第三次爆發,這對底層晶片計算能力更高需求。人工智慧運算具有大運算量、高並發度、訪存頻繁的特點,且不同子領域(如視覺、語音與自然語言處理)所涉及的運算模式具有高度多樣性,對於晶片的微架構、指令集、製造工藝甚至配套系統軟體提出巨大挑戰。
  • 不但顏值高,還能讀懂你的喜怒哀樂,哈弗初戀比女朋友還貼心 - 新聞...
    尤其值得一說的是座椅的設計,座墊和靠背兩側都有較大的延伸,面料和填充物的選材也十分講究,再加上中高級車才配有的座椅加熱和通風功能,確實能給人一種與初戀愛人擁抱的感覺。 貼心的智能科技,能讀懂你的喜怒哀樂 僅從內外設計的角度來,哈弗初戀在一眾入門緊湊級SUV中已經十分突出。
  • 智能助手推動語音革命
    現在,人們與世界交互的方式也取得了新的突破,語音通信仍是其中不可分割的組成部分。sX1ednc在電話誕生後的第一個世紀裡,有線電話網絡遍及全球,將人們連接在一起。而過去50年間發生的電子革命,促進了可攜式無線語音和視頻通話的發展。最近10年,通信技術已經從人與人之間的免提通話,發展到人與機器對話。儘管只是初具雛形,但這種新型人機互動正在推動新一輪創新。
  • 多重因素助推智能穿戴爆發增長 樂心醫療打開發展新風口
    AirPods 2銷量的火爆也引發了國內企業對智能穿戴產品的追逐,包括華為、小米、漫步者(002351.SZ)、樂心醫療(300562.SZ)等在內的眾多企業都在2019年相繼發布了智能穿戴的新產品,以期在未來的市場中佔得一席之地。
  • 助力銀行數位化轉型 百融雲創智能語音機器人大展身手
    遠程銀行運營依託包括智能語音導航、智慧機器人、智能質檢等多類型智能化工具,其中一個重要的服務方式就是語音服務。  近年來,多家科技企業相繼推出智能語音機器人,大大促進了遠程銀行的到來。百融雲創作為中國領先的獨立AI技術平臺,經過多年來的研發,專注金融場景打造了智能語音機器人「百小融」,自投入使用以來,也不斷獲得業內的關注和認可。
  • 「海聚未來」平度智能製造專場活動圓滿落幕
    9月28日,「海聚未來」平度智能製造專場活動成功舉辦。本次活動採用線上直播的形式向觀眾展示了平度的投資環境及風貌,同時為平度提供了對外合作、對外展示的橋梁和窗口,使更多智能製造企業了解平度,促進企業落地,加速平度市當地產業發展。
  • AppToys,玩具行業未來最大爆發點
    現在80後90後家長,是伴隨著電子產品長大的一代,對電子智能產品認可度很高。對孩子而言,孩子天生對聲、光、電有濃厚的興趣。所以無論從玩具的本源還是從孩子的本性來看,AppToys(能和App一起玩的玩具)是玩具品牌未來最大的爆發點。
  • 能聽能寫的滑鼠—聯想小新智能語音滑鼠
    聯想小新智能語音滑鼠是一款既能聽又會寫的智能滑鼠,相信每個人在上大學的時候肯定都是火速配齊了手機、電腦這些大件兒,反而鍵盤、滑鼠這些小的東西或許是因為了解太少,而市面上各種類的滑鼠有太多了,一時間不知道怎麼選了。俗話說得好「好馬配好鞍」,滑鼠和鍵盤依舊是操作電腦最直接的方式之一。
  • 思必馳:近場多模態語音交互,改寫未來出行
    思必馳智慧城市應用事業部首席架構師張順在大會上,帶來了題為《智能語音交互在軌道交通行業的應用》的分享,全面展示了思必馳的軌交產品方案。而思必馳人工智慧技術賦能的智能語音售票機,將為乘客們帶來更智能更便捷的入站方式。
  • ai語音控制是什麼專題及常見問題 - CSDN
    那些能在此情景下崛起的品牌,在提升市場份額方面處於有利地位。此外,市面上有許多工具,讓用戶可以用最低限額的投資來輕鬆地進行語音實驗。我們的建議是儘快開始一項服務設計和聲音試驗的低投資計劃,可能還要與市場推廣活動相結合,以便讓你的品牌充分利用這項技術所帶來的機遇。
  • 升級三大版塊能力,OPPO小布助手2.0煥新登場詮釋科技硬實力
    語音助手不再局限於某款音箱產品,或者是某款手機獨有的功能,而是以強大的智能交互能力打破硬體設備的桎梏,進化成為生活場景的中樞,滿足用戶多元化的場景需求。例如全新升級的OPPO小布助手2.0,只要你身邊擁有一臺搭載小布助手的設備,呼喚一聲「你好小布」,即能喚醒整個空間的活力。
  • 釐清未來戰爭中的人機關係
    但是不管戰爭形態如何更迭,人都應該是戰爭迴路中的主體性和決定性因素。釐清未來戰爭中的「人機」關係,對於研析打贏未來戰爭的制勝要素、轉變作戰思維、研究關鍵技術等都有重要意義。  戰場信息爆發式增長,亟需高效人機互動模式,智能人機互動系統能提升作戰效率  信息化戰爭時代,戰場信息量越來越大。智能化戰爭對信息的依賴度將會更高。
  • 微鯨海報驚現神秘唱麥人 發力智能語音引外界猜想
    上海2017年4月1日電 /美通社/ -- 伴隨著科技的飛速迭代與發展,人工智慧被推上了浪潮之巔,有人說,沒有人工智慧的硬體,未來可能不配叫智能硬體,同樣,在網際網路電視領域,如果少了智能語音,同樣也不能稱之為智能電視,一臺可以聽懂人的語音的電視,可以省略冗繁的搜索路徑,讓觀看體驗變得無比簡單有趣。
  • 智能語音交互應該如何設計?
    編輯導語:隨著亞馬遜、小米、阿里巴巴等大公司都推出了智能語音產品,智能語音互動設計成為了一個值得探索的領域。語音交互如何設計才能達到更自然的交互反饋、更好的傳達情感,這是目前需要解決的問題。對於用戶來說,希望能與智能產品建立親切的信任感,越相處越好用。AI時代,深知我者,才能久居我心。
  • 玩轉語音實時轉寫!訊飛智能耳機iFLYBUDS入手小測
    其次,不同於普通TWS耳機,訊飛智能耳機iFLYBUDS有三大核心AI功能:分別是通話實時轉寫、智能語音撥號、通話譯文對照,可以輕鬆滿足商務人在多場景中解放雙手、記錄重要信息和從容溝通的需求。
  • 訊飛智能滑鼠語音黑科技「一鍵」搞定!
    其實,影響電腦工作效率的因素有很多,知識儲備不同、工作方式不同、電腦熟練程度不同等都會帶來影響。內置科大訊飛語音黑科技的訊飛智能滑鼠不僅超級能「打」,還有很多驚喜體驗,令工作更加高效,成為辦公一族的心頭好!對很多優秀的員工而言,996工作制是偶爾並非常態。究其原因是這屆員工的工作效率提升許多,原本滿滿8小時的工作,僅6小時甚至更少的時間就可以完成。
  • 巨頭們都在爭的語音入口 誰家智能音箱能C位出道?
    最近,百度全資收購「小魚在家」的消息,讓不少人的眼光再次聚焦語音AI板塊,因為,在百度收購「小魚在家」消息被傳出之後不久,「傻白甜」的騰訊鵝也被傳出投資智能語音交互公司標貝。巨頭們都想在智能語音這塊提前獲得一張入口船票。
  • 智能音箱搶灘站圓桌論壇:智能語音終極形態是什麼?
    對於Echo和國內智能音箱的差別,龍夢竹表示:「在國外來講Alexa的服務一個是有聲讀物,另一個是在個人助理類的應用,比如鬧鈴設置、語音提醒等。國內更多流行O2O、訂餐。」3-5年智能語音的交互形態?對於未來3-5年智能語音交互的最終形態如何?蜻蜓FM技術總監金鑫認為,語音交互還是很主要的一種交互方式,當然會配合圖形、圖像更好。
  • 中國正加速發展和完善智能製造,促進第四次工業革命
    而根據中國《「十三五」國家信息化規劃》可以看出,在信息高新技術產業方面,信息技術服務、信息化轉型升級等政策也在不斷提出,中國正加速發展和完善智能製造,促進第四次工業革命。而在移動網際網路、雲計算、物聯網、人工智慧等新產業方面,技術創新已經成為各國競爭的核心所在。三大技術革命,美國重壓之下不得不轉型10月25日,美國總統川普發出文件聲明,稱「北京不應該積極主動謀求重返亞太」。
  • 各路大咖共探:智能語音技術如何與家電產品深度融合?
    為促進省內家電生產企業順利轉型升級,2019年9月,在廣東省工業和信息化廳推動和指導下,中國電器科學研究院股份有限公司(簡稱:中國電研)牽頭,聯合美的、創維、大灣區集成電路、威凱檢測技術有限公司(簡稱:CVC威凱)等10多家家電及零部件產業鏈上下遊企業/科研機構共同組建了「廣東省智能家電創新中心」。