一文看懂 Echo 和 Alexa,亞馬遜如何用蘋果的玩法在玩語音?

2020-12-13 36kr

從1月份美國的 CES 電子消費展開始,每周關於亞馬遜 Echo 的報導可謂「層出不窮」,Echo 緣何如此受到無數媒體的追捧?很多同學都有點不太理解,而且中國的 AWE 家電展後,很多文章在分析中國的智能產品時,還經常拿來與 Echo 進行對比。無論是 CES 還是AWE,Echo 背後已經帶上了一層耀眼的「光環」。

當然, Echo 是一個來自美國的智能產品,所以在中國的確很難買到。 很多同學也看過多篇有關 Echo 的文章,但是並沒有體驗過這款產品, 所以經常被各種概念弄得「雲裡霧裡」,很多文章一邊說 Echo,然後又提到 Alexa,如果你在網上搜索亞馬遜 Alexa,可以發現有用戶中心,有開發者中心,甚至還有基金會。筆者希望通過本篇文章來闡述一下 Echo 系列產品的關係,以及亞馬遜的戰略,希望能夠對大家有所幫助,以下:   

1,Echo 和 Alexa 的關係:你中有我

簡單而言,其實 Echo 和 Alexa 的關係,就像 iPhone 和 Siri 的關係一樣:一個是硬體產品,一個是語音服務。Echo 音箱使用的語音服務是 Alexa, 所以 Echo 音箱的喚醒詞可以是Echo,也可以是 Alexa。值得一提的是,亞馬遜的 Alexa 是對外開放的,不僅 Echo 能用,其他硬體也有用,在今年 CES 展上很多智能硬體都在用 Alexa,這項服務對外開放使用, 開發者可以為 Alexa 開發插件,貢獻更多的功能,如果星巴克希望用戶通過 Alexa 來訂購他們家的咖啡,只需要開發一個小插件就行,現在已經有成千上萬家企業在這麼幹。

可以說,亞馬遜是在用蘋果的玩法來玩轉語音服務。如果你進入 Alexa 的開發者中心(https://developer.amazon.com/alexa),就可以清晰的看到三個大產品,包括 Alexa Skills Kit(技能插件),Alexa Voice Service(語音服務),以及 Alexa Fund(基金會) 。 他們各自都有什麼功能呢?下面一一為大家介紹。

2,Alexa Skills Kit(技能插件)

用戶剛買來 Echo 音箱時,其實功能很少,只能問問天氣(what's the weather),即不能聽歌,也不能控制家電, 這些功能都需要去 Alexa 的 APP 開啟相應技能(Skill) 才能使用。因為在美國聽歌是收費的,所以開啟聽歌的功能時,用戶就需要綁定信用卡。 Alexa APP 並未上架到蘋果 Appstore 的中國市場, 如果要體驗,可以瀏覽 Alexa 的 Web APP :http://alexa.amazon.com。   

進入 Web APP 後, 右側菜單 Music&Books 處可以設置聽音樂、聽書的功能,點擊菜單 Skills 可以設置技能插件, 這裡有上萬個技能插件,基本都是第三方開發者為 Alexa 開發的功能。

在菜單 Home 下,可以看到和音箱對話的歷史記錄,並可對每次對話的答案標記是否滿意,這樣可以幫助 Alexa 完成「機器學習」。用戶和 Alexa的聊天記錄只有自己可見,對開發者是封閉的。而國內一些語音語義平臺,能讓開發者在平臺上面就看見用戶的聊天記錄,相信很多普通用戶知道了這點,就都不敢再跟智能產品當那種「無話不談」的朋友了。

如果你希望 Alexa 智能設備能控制家裡的電器,也要開啟相應的技能插件才行。比如你用的是美國快思聰(Crestron)的智能家居系統 , 則可以開啟技能插件 Crestron Home Automation for SmartHome , 開啟時需要 Oauth 帳號授權, 這樣 Echo 音箱就能知道你家裡連接了多少Crestron 的設備,然後就可以通過語音來控制它們。而如果你是一個開發者,如何給 Alexa開發技能插件呢? 

首選,你要登錄亞馬遜的開發者中心(developer.amazon.com),進入 Alexa 的菜單後,會讓你選擇是開發插件(Alexa Skills Kit),還是接入語音服務(Alexa Voice Service)。這裡我們選擇 Alexa Skills Kit 即可,接下來按操作步驟進行即可。 

Alexa 可以開發三種類型的插件:自定義(custom)、智能家居(smart home)、快報(flash briefing) 。當然, Alexa 並不要求開發者將自己的內容資源(如音視頻、問答對等)上傳到亞馬遜, 而只是在 Alexa 中定義「意圖」,當用戶觸發「意圖」時調用開發者定義的接口,類似於微信公眾號的開發者模式, 開發者自己在接口中返回 Alexa 要回答用戶的答案, Alexa 做到了「意圖」和「回答」的分離,在 Alexa 平臺定義「意圖」,而在開發者自己伺服器上面實現回答。而國內很多語音語義平臺,沒有實現「意圖」和「回答」的分離,要求開發者將「答案」上傳到平臺,所以給開發者感覺不太好,總認為將自己的核心機密數據上傳到了第三方。

亞馬遜通過 Alexa 吸引普通用戶與它對話,同時也吸引了更多的開發者為它貢獻插件, 同時保障了普通用戶和開發者的權益,而且產品也做到了:不會「索取」開發者的核心數據,更不會把普通用戶的對話記錄開放給開發者。筆者相信,這也是 Alexa 能夠獲得成功的一個非常重要的原因。

3,Alexa Voice Service(語音服務)

如果我們想開發一款擁有像 Echo 音箱一樣,具有語音交互功能的產品,那麼,我們直接接入Alexa 的語音服務即可。產品的接入方式也十分簡單,在開發者中心創建一個語音服務的應用,就可以獲得兩個 KEY: Client ID 和 Client Secret, 這兩個 KEY 值是調用接口時需要用到的。接口地址為: https://avs-alexa-na.amazon.com ,請求接口時傳遞錄音文件, Alexa的雲端同時進行了語音識別和語義理解,將音頻文件轉換為文字,然後對文字進行理解,如果觸發了某個技能插件的「意圖」,則調用開發者的定義第三方伺服器的接口,如果是聽歌或聽書等「意圖」,則調用亞馬遜自家的資源。語義理解後 Alexa 將需要返回的文字內容合成為音頻文件,所以接口的返回內容也是音頻文件。  

Alexa語音服務這麼簡單? 核心功能就是一個接口? 沒有喚醒模塊?沒有麥克風陣列? 很多國內做開發的同學,可能會有這些疑問。其實,Alexa 並沒有像國內的語音平臺那樣,將語音、語義、喚醒、麥克風陣列打包在一起, 然後收一個很高的 License 費用。Alexa 只專注於雲端識別,而喚醒、麥克風陣列等技術是開放的。

這是官方的示例代碼 https://github.com/alexa/alexa-avs-sample-app , 示例代碼中喚醒用了Sensory 和 KITT.AI,麥克風陣列用了科聲訊的兩麥方案。Alexa 不綁定任何硬體方案,喚醒和錄音的技術方案完全掌握由開發者自己決定。Alexa 只是對錄音的質量提出要求:  

因為 Alexa 不綁定任何硬體方案,這就使得硬體成本可以降下來,Alexa 也並沒有在語音技術上收費,用戶是在使用產品過程中對內容進行付費。而國內的語音平臺總想著在語音技術本身上收費,語音技術還要綁定自家的喚醒模塊、麥克風陣列或者 SDK,也並沒有開放 API。一個 License 費用就能收 60多塊錢,這使得智能語音技術成本一直也降不下來,當然這可能因為國內外的開發環境不同,還有文化差異所導致。

筆者認為,雖然人工智慧被炒得很熱,但普通用戶目前還是嘗鮮的態度,並沒有形成強烈的剛需,市場並未打開。如果智能產品要想要打開市場,那麼應該有兩點基礎要求:第一,就是真正意義上能替代「人工」,比如工業機器人、智能客服,他們真的能替代人工,所以它們會有市場;第二點,就是讓普通用戶能夠用低成本「嘗鮮」。 很多服務機器人或者智能音箱產品就比較尷尬, 既然不能替代人工,那麼用戶只能把它作為「娛樂產品」來消遣, 但價格又這麼貴,普通用戶只能「望而卻步」了。  

4,Alexa Fund(基金會)

Alexa 基金會孵化是使用該項技術的創業項目,它要求所有項目按照他們規定的時間點進行,4月9號之前報名,7月17日開始開發, 經歷13周時間,10月12日演示產品。   

所有項目都集中在一個地方進行開發, 亞馬遜會選擇一處風景優美的地方,每年的地方都不一樣,今年在西雅圖,明年可能在紐約。在這13周的開發中,有 Alexa 官方高級技術人員在現場為項目提供技術支持。

Alexa 通過這個基金會不僅吸引很多創業項目,還能快速孵化項目,出現一批又一批基於Alexa技術的好產品。

我們再來梳理一下Alexa整個產品生態,看看亞馬遜是如何用蘋果的玩法在玩語音的。亞馬遜Alexa 通過基金會、技能插件、語音服務打造起整條的生態鏈,使得創業者、開發者、消費者都聚集在這個生態鏈中,實現了多方共贏。 

第三方產品不管是硬體產品,還是 APP 都可以通過開發者中心的語音服務接入 Alexa,消費者在使用第三方產品時同時為亞馬遜帶來用戶,相當於第三方產品又幫助推廣了 Alexa 服務,於是 Alexa 得到了迅速的傳播。  

最後做一個小小的廣告,因為 Alexa 目前還不支持中文,Echo 在國內也很難買到。為了讓大家能體驗一下 Alexa 的智能服務,智眾互動出了一款虛擬的中文 Echo,大家不用購買硬體設備,也能用中文對話的方式體驗 Echo 的功能,大家可以試一下: https://echo.zhizhongai.com/

本文作者:智眾互動 CEO 羅飛,智眾互動是一家提供人工智慧解決方案的公司,是注重早教內容沉澱的人工智慧技術公司。提供機器人或音箱的技術解決方案以及內容解決方案。羅飛的微信號:luofei614 , 歡迎加微信交流。

相關焦點

  • 亞馬遜Alexa語音助手是什麼?
    亞馬遜Alexa 要明白Alexa是什麼,首先要知道亞馬遜Echo。亞馬遜Echo可以作為智能家居的控制裝置,同時還是一款可攜式揚聲器,它的高度為10英寸,採用了圓柱形的設計,可以擺放在家中的任何位置,包括廚房。Alexa是預裝在亞馬遜Echo內的個人虛擬助手,可以接收及相應語音命令,Alexa可以被看成是亞馬遜版的Siri語音助手。
  • Briefly: 一款通過amazon alexa提升轉化率的shopify插件
    > 2020-12-15 10:00 有一種渠道絕大多數賣家應該不知道,這個就是今天我們要介紹的briefly,一款亞馬遜alexa上的skill,通過它,你能給你的用戶帶來新奇獨特的體驗,從而提高轉化~
  • 亞馬遜Alexa突然發瘋,讀著論文教主人自殺:你活著地球人口會過剩!
    新智元報導編輯:大明、鵬飛【新智元導讀】近日,一向以智能貼心著稱的亞馬遜Alexa數字助理竟然成了驚悚故事的主角。據多家英媒報導,一位用戶在使用Alexa時,後者突然失控,稱人類的存在對地球有害,並教唆用戶用刀戳刺自己的心臟自殺。亞馬遜事後回應稱,這是個錯誤,目前已經修復。
  • 阿里巴巴開發中文智能語音設備,比拼亞馬遜Echo
    7月3日消息 據外媒neowin報導,中國電商巨頭阿里巴巴正在開發中文版智能語音設備,有望近期面市,與亞馬遜Echo競爭。據悉阿里巴巴的這個新產品將僅在中國推出,且只能講普通話。IT之家中文版智能語音助手能識別中文的語音指令。
  • 亞馬遜新野心:讓Alexa掀翻蘋果谷歌的車聯網優勢
    這些努力獲得了一些成效——寶馬和奧迪今年早些時候開始銷售默認集成Alexa軟體的車型。 但亞馬遜正在進入一個已經受到谷歌和蘋果公司主導的市場,更不用說汽車製造商對將中控屏控制權拱手讓給大型科技公司的疑慮了。 雖然在一開始,佔領汽車市場可能不會帶來多少收入,但它的存在將幫助亞馬遜為即將到來的語音服務時代卡位。
  • 揭秘| 亞馬遜如何用金錢「勾引」開發者加入 Alexa 生態?
    雷鋒網按: 經過三年的成長,Alexa 已經成為亞馬遜旗下的一個語音作業系統;體現在應用生態上,目前 Alexa 已經擁有 25000 個 Skills,也能夠控制 4000 種設備,亞馬遜也從中獲取了大量的利益。但是對於 Skills 的開發者而言,如何從中獲取收入以便維持生活是一個大問題。
  • 蘋果沒做到的 亞馬遜做到了 Echo將讀懂人類情緒
    不過據科技網站MIT Technology Review報導,亞馬遜Echo將實現這一功能,目前正在開發語音助手Alexa的更新包。智能語音助手最大的問題就是可識別的人類語言有限,而且人類的語言會因為說話的語調不同,同一個詞彙或者同一句話也會有不同的含義,而智能語音助手只能識別人類語音,並不能識別其中的語調,說的簡單點就是不能理解人的情緒
  • 詳解亞馬遜Echo智能音箱的幾十種實際用途
    雖然現在的手機開箱即無說明書,iOS和Android系統已經不分伯仲的將市場佔據,其實人們在使用這兩大系統的手機時,也會忽略很多有趣的功能。作為智能家居海外欄目,我們今天見識一下智能音箱Echo的「開箱即失」功能。亞馬遜Echo是一款語音交互式藍牙音箱,可以使用內置的Alexa語音交互系統,來同步語音數據、播放音樂和進行智能家居設備控制。
  • 亞馬遜Alexa現在可以在Echo設備上實時翻譯
    亞馬遜的虛擬助手Alexa提供說不同語言的人之間對話的實時翻譯。該功能可在Echo設備上使用-目前僅限於美國-該功能支持英語和法語,德語,北印度語,義大利語,西班牙語或巴西葡萄牙語之間的翻譯。根據今天在亞馬遜博客上發布的帖子,在開始翻譯會話後,Alexa能夠自動識別所講的語言,並開始翻譯對話的雙方。
  • Echo Studio是亞馬遜迄今最出色的Alexa揚聲器
    除了較大的尺寸外,Echo Studio最具特色的功能是從底部向上一英寸左右的水平小開口。這樣可使低音揚聲器的音頻更好地散布。像在Echo上一樣,燈環環繞Studio的頂部,並在激活Alexa時變為藍色。
  • 如何通過亞馬遜Alexa語音控制遙控器
    對於我的AC,我只能提取rawData,但是對於我的電視,我獲得了有效的hexcode和rawData。您的數據可能具有不同的編碼類型和代碼。 第5步:測試IR信號 現在打開您的亞馬遜Alexa應用。並且您應該能夠發現所有新設備(IR代碼)。 只需搜索新設備,它們就會彈出(見上圖)。 現在您擁有自己的語音控制遙控器!
  • 亞馬遜首席科學家:揭秘 Alexa 語音識別技術
    Nikko Strom,現任亞馬遜首席科學家,是 Echo 和 Alexa 項目的創始成員,在語音識別技術相關領域有著資深的研究及從業經驗:aKhednc1997 年於瑞典皇家理工學院語音通信實驗室獲得博士學位,後擔任MIT計算機科學實驗室研究員;2000 年加入語音技術初創公司 Tellme Networks;2007
  • 亞馬遜智能語音助手Alexa偷取隱私:1分鐘鎖定用戶住址
    )粘貼到Google地圖中,不到一分鐘,該員工便得到了用戶房子的圖像和相應的地址。亞馬遜表示它使用行動裝置位置信息是為了給用戶提供更相關、更優質的服務。gTaednc一名亞馬遜員工稱,亞馬遜內部還有一款供更少人使用的軟體工具,用來標記錄音的轉錄本,協助Alexa對指令進行分類,並且存儲更多的個人數據。
  • 亞馬遜Alexa新突破:將縮寫符號秒轉文字,錯誤率降低81%
    舉個例子,在英語語境下,如果對亞馬遜的語音助手Alexa說:「Book me a table at 5:00 p.m.(在下午5:00給我預訂個餐位)」,這句話中的時間「5:00 p.m.」可能會被語音助手的自動語音識別器轉錄為「five p m」,並進一步轉化為「5:00PM」。
  • Alexa正式進軍智能穿戴 將從藍牙耳機開刀
    北京時間1月5日,亞馬遜公司發布了新的開發者工具,有了這些工具,Alexa甚至能用在微波爐上,這意味著,用戶通過語音命令就能給微波爐安排任務,北京時間1月6日,亞馬遜又推出了新的開發者工具,包括Alexa行動裝置套件( Alexa Mobile Accessory Kit ),這個套件能讓Alexa應用在一系列具備藍牙功能的語音設備上,例如耳機,智能手錶,運動手環還有其他的支持語音的設備等。
  • 亞馬遜首席科學家:揭秘 Alexa 語音識別技術|AI NEXT
    華人之外,還有亞馬遜 Alexa 首席科學家 Nikko Strom,微軟小娜架構師 Savas Parastatidis 等業內知名專家。大會主題是「探索 AI 的潛力,把 AI 技術應用於實用項目和服務」,對 CV、NLP、智能助手、深度學習框架均做了專題報告。其中
  • 谷歌、微軟、蘋果、亞馬遜、三星…… 哪家的語音助手支持語言種類...
    事實上,排在第一位的是漢語,第二是西班牙語,西日耳曼語排在第三位,接下來是印地語、阿拉伯語、葡萄牙語、孟加拉語和俄語。更令人意想不到的是,Google Assistant、蘋果的 Siri、亞馬遜的 Alexa和微軟的 Cortana 雖然已經無比強大,但其實只能識別這些語言當中相對較少的一部分。
  • 蘋果、Google、微軟、亞馬遜,哪家的語音助手會的語言最多,以及...
    蘋果、Google、微軟、亞馬遜,哪家的語音助手會的語言最多,以及為什麼? 2018 年 9 月,一家叫 Vocalize.ai 的人工智慧初創公司做了一項測試,它比較了 Google、蘋果和亞馬遜的智能語音助手,發現了一些有意思的事情。
  • 亞馬遜Alexa AI新突破:將縮寫符號秒轉文字,錯誤率降低81%
    舉個例子,在英語語境下,如果對亞馬遜的語音助手Alexa說:「Book me a table at 5:00 p.m.(在下午5:00給我預訂個餐位)」,這句話中的時間「5:00 p.m.」可能會被語音助手的自動語音識別器轉錄為「five p m」,並進一步轉化為「5:00PM」。再比如,「6:30PM」會被轉化為TTS系統所能識別的「six thirty p m」。