編者按
關注不了「大公館」的新朋友,您請抓緊移步 「大公館2013"(新的公眾號:DGG-668)馬上保持同步關注。而,因為「你懂的」的原因,舊朋友您一旦取消了對「大公館」本號的關注,就不可以回來再關注了喲,因此,您的關注,也是一種難得的信息特權了喲。
大公館2013(新公眾號:DGG-668)會在次日清晨發布,內容基本與舊大公館的保持一致,但或有一點點的改變(多數情況下,會多一點視頻)。那裡,是我們的新館,那裡,我們將一如既往地與大家繼續保持同步交流。謝謝關注!
也許,以後「科大訊飛」會成為一種高品質的語音入口服務標誌,類似從前的「INTEL inside」一樣,以後所有的優質手機殼上、家電上、乃至汽車裡,都會出現這麼一行字,「FLYTEK inside」。
開篇,不厭其煩,還是先來一段「舊聞」。
6月27日,2017年《MIT科技評論》評選「全球最聰明50家公司」的榜單在北京全球首發。有9家來自中國,分別是科大訊飛(第6位,002230.SZ)、騰訊(第8位,00700.HK)、曠視科技(第11位)、大疆(第25位)、富士康(第33位,02038.HK)、阿里巴巴(第41位)、HTC(第42位)、螞蟻金服(第49位)、百度(第50位)。
說到這個《麻省理工科技評論》雜誌,自1899年創刊以來,可是有一百多年的歷史了,作為最具影響力的技術商業類雜誌,每年都在推的「全球50大最聰明企業」榜單含金量自然不低。同時呢,評選標準也十分有特點,那些有能力將「高精尖科技創新」與「利益最大化」完美融合的公司,才有可能獲此殊榮,可以說這份榜單是對未來會成為行業主導公司的預測,而科大訊飛,代表了智能語音領域的未來前進方向。
除了大公司外,這份榜單上那些今年剛上榜卻野心勃勃的公司更值得關注。例如,中國方面排名最高的科大訊飛,這也是這家公司第一次上榜。《麻省理工科技評論》給予科大訊飛的上榜理由為:
「該公司旗下的語音助理技術是中國版的Siri。其實時翻譯技術則是傑出的人工智慧應用,克服了方言、俚語和背景雜音,可將漢語精準地翻譯成十幾種語言。」
在當天的榜單發布會上,科大訊飛高級副總裁江濤說到:「與其他科技公司相比,其實科大訊飛過去十幾年做的每一件事情都挺笨的。因為相比同時期創業的公司,如今科大訊飛的市值並不大,也不如其他公司那樣有著多樣的營銷模式。但這十幾年只做一件事情也有好處,這讓公司有了技術沉澱,才有了今年的爆發。」
那麼,科大訊飛究竟近期做了什麼?我們先來看下邊一段視頻:
怎麼樣,是否有一種逆天的趕腳?
一位資深投資大咖這麼評論到,「科大訊飛的這一款翻譯機(曉譯)無疑是一款現象級的世界級產品。實現了「科大訊飛」的產品與服務,從中國走向世界、世界進入中國的跨越式發展。你可以想想,每年數以幾千萬乃至過億人次級別的出入境中國遊客,每年穿梭在全球數之不盡的中外貿易商,從單機版到APP再到手機應用,——畫面太美,不忍直視。」
這位投資大咖一直很看好科大訊飛,他認為,之所以大家都一直以為科大訊飛沒有辦法實現利潤,其實是科大訊飛常年不怠地持續投入,構築了牢不可破的中文語音識別的行業壁壘,「訊飛只是一直沒有釋放業績而已,只要殺手級應用出現,只要時機成熟,這一切都是浮雲。」
「其實我們看好科大訊飛,還有其他的預期。比如說近期由APPLE新產品HOMEPOD所帶動的智能音響熱潮,以及特斯拉國產化所即將引爆的智能汽車熱潮。 ——無論如何,這些都離不開中文語音識別入口,科大訊飛都會是當然大贏家。」
「如果說,之前圖像識別行業中以海康威視(002415.SZ)為代表的龍頭企業,可以達到三千億元人民幣市值,那麼在可以預期的將來,比如說五年內吧,語音識別領域,我看,以科大訊飛為代表的龍頭企業,市值也應該可以是三千億元!」這位投資大V顯然十分看好科大訊飛。
他認為,語音識別的應用正迎來了歷史性機遇。因為智能汽車、智能家居、中外翻譯機等的出現,一系列的殺手級應用將接踵而至,執中文語音識別之行業牛耳的科大訊飛,無疑正在構築的是「音頻大入口」的應用平臺。
「如果您已經錯過了騰訊、如果您曾經錯過了海康威視,那麼您就不要再錯過科大訊飛。中國難得再次出現這麼一家世界級的聰明企業,閃電來的時候,您一定要在。訊飛的未來,是星辰大海,未來的中國IT科技界,下來可能不再是BAT,而是FAT了。——就是,訊飛(FLYTEK)、阿里、騰訊。」
下邊的文章,源自@雪球。作者是GY_GY。——等等,這麼激動人心的關頭,當然少不了要先來一段雄壯的背景音樂。
大音頻時代即將到來
今天要分享的是最近一到兩個月一直在思考的,消費級科技產品的下一個階段,誰來主導?綜合最近的思考和產業巨頭的布局來看,一個以語音為核心的大音頻系統,似乎取得了先機。
我們在日常的聊天輸入、開車等場景中,越來越多的用到語音輸入,語音交互開始取代傳統觸屏方式成為新的交互方式,而兩大切入點目前來看已經明晰。
一是以亞馬遜ECHO為首,包括蘋果剛發布的homepod在內的智能音箱,以及未來更多的智能硬體,他們主打的是家庭是客廳,試圖佔據用戶在家的時間。
二則是以蘋果在iPhone7開始應用的雙藍牙耳機——Air Pods以及未來更多移動端創新產品,在這款耳機發布後,市場中似乎是風平浪靜,全球包括國內的各大廠商一改過去蜂擁跟風策略,選擇了觀望,當所有人都認為Air Pods是一枝獨秀,將成為絕唱的時候,產業內早已是風波暗湧。
總結以及順延趨勢來看,人機互動將按照鍵盤滑鼠、觸控、全語音、腦電波的路徑發展,微軟的Windows系統統治了鍵盤滑鼠時代,蘋果統計了觸控時代,那麼下一個全語音時代呢?會是亞馬遜這類攜上遊技術過度到下遊硬體呢,還是喜馬拉雅這類攜中遊內容平臺過度到下遊硬體呢?
大音頻上遊——語音識別技術
語音交互在目前技術條件下還停留在識別層面,可以說語音識別是人機互動的入口,大公司都希望使用自己的語音識別引擎,以便在應用過程中可以收集到大量有價值的用戶數據。 ——這也是為什麼科大訊飛願意讓廠商免費使用自己的語音識別軟體,未來的大數據時代,語音數據分量不會低。
美國語音技術公司巨頭 Nuance 的產品支持超過 50 種語言,在全球擁有 20 億用戶。蘋果最早就使用了 Nuance 的技術,但並未減少在自己 Siri 上的投入,而且將 Nuance 和微軟的部分高級人才挖了過來,組建了自己的技術團隊, 在 Siri 逐步成熟後棄用外部引擎。
谷歌早期通過收購 SayNow 和 Phonetic Arts 進入語音識別領域,後來又藉助一系列其他收購逐步完善了語音識別的技術積累, 2016 年穀歌發布語音助手 Google Home 和內置的語音助手 Google Assistant,可識別四種語言。
Facebook 在 2013 年收購了語音識別公司 Mobile Technologies,其產品 Jibbigo 支持多種語言互譯,成為出國旅遊的常用工具。不久後又收購了語音識別公司 Wit.ai,該公司的技術是通過語音控制行動應用程式、穿戴設備和機器人等智能硬體。 2015 年 Facebook 還測試了旗下智能語音助手「 Moneypenny」。 Facebook 在智能語音行業布局的戰略是通過語音交互數據支持其廣告投放效率, 並將語音技術用到其將來的 AR/VR 等智能硬體產品中。
亞馬遜於 11、 12、 13 年分別收購 Yap、 Evi、 Ivona Software 三家語音識別技術公司, Kindle Fire、 ECHO 智能音箱以及個人助手 Alexa就是基於這些技術。 2016 年亞馬遜也積極擴展智能語音助手系列產品線,推出了 Tap 和 Dot 兩款新產品。
微軟在 skype 時期就著手積累語音識別技術,目前在個人助理Cortana 和微軟小冰上實現了應用。 2016 年底微軟將詞錯率降低至5.9%,首次達成與專業速記員持平而優於絕大多數人的表現。
與國外網際網路巨頭相比,國內的網際網路巨頭在語音識別上再次走在了後面,因為國內優秀的語音識別公司極為稀缺,即使有錢也找不到目標。
雖然騰訊、阿里、百度等巨頭都有自己的語音識別技術,百度還專門從 Google 挖來了人工智慧泰鬥吳恩達,但是它們在語音識別領域仍然和科大訊飛有明顯的差距。
2015 年的「寶馬全球中文語音技術測試」中,科大訊飛以車載環境下識別率超過 85%的公司的成績拔得頭籌,比第二名 Nuance 領先很多。
可能很多朋友都會說,國內搜狗、百度和科大訊飛差不多呀,其實這裡有一個誤區,平常大家在手機上使用的語音識別基本屬於近場識別,目前國內優秀的語音識別公司近場識別的準確率基本都能達到 95%-99%, 沒有很大差距。
但業內共識是遠場識別技術難度高,家居場景中格外需要其應用;相對成熟的產品只有訊飛和京東合資生產的叮咚智能音箱,同類產品在用戶體驗上相比其它公司明顯領先(據說也不怎麼樣)。
而在遠場識別的基礎上,語音識別還需要向全聲控去發展,目前市面上的所有語音輸入軟體、智能音箱也好,在進行輸入之前,都需要按下語音輸入鍵或進行其他相應操作。
而我想要的是,在廚房忙活著做頓好吃的,手上沾滿了油腥,手機放在廚臺另一端,我想給回家路上的老婆打個電話讓她帶瓶醋回來,怎麼操作?
只需要憑空喊一聲:XX,給老婆打電話,打開免提(或帶著藍牙耳機),在廚臺另一半的手機則自動識別並撥通電話,完成操作。
全聲控場景的實現基礎是遠場識別技術,即設備與人相距 3-5 米甚至更遠距離下的語音識別。相比手機放在嘴邊的近場識別,遠場識別具有很高的技術壁壘,首先需要利用麥克風陣列、回聲消除等技術將目標說話人的聲音增強,同時抑制周圍的噪聲和回聲;其次通過語音識別引擎針對麥克風陣列處理後的數據進行收集、訓練,逐步提升識別率。
15 年 3 月科大訊飛全球首發了自己的遠場識別技術,在業內處於領先。
從上遊來看,國內的科大訊飛可以說是一枝獨秀了,也是老生常談了,問題還是那些問題(變現),語音交互技術企業變現在移動端是很難實現的,重點還是應該放在行業的語音交互應用,如教育、醫療等等,以及下遊的智能硬體,這兩者更為容易。
一生好運,獨尊武神趙子龍!
百戰不殆,當成功已成為習慣。
私人洽購請致電 1333-28-77772 聯繫大公館畫廊葉小姐,或點擊本連結訪問內頁索引
大音頻中遊——內容平臺
歐美國家在音頻內容的發展相對較早,已取得一定規模:德國 2013 年購買過有聲書的人數佔總人口的 7%;美國 2014 年有聲書市場為 20 億美元,英國 2015 年達 9100萬英鎊 ,分別約合人民幣 135 億元、 8.56 億元。
而國內隨著2016年至今的自媒體之風,文化產品的豐富程度和個性化程度也大大提升,迅速吸引了大量用戶,梁宏達的自媒體欄目《老梁故事匯》在優酷網上一期點擊率即可破 500 萬。
對用戶而言,聽音頻比閱讀和看視頻輕鬆的多,同時更適合利用碎片時間;許多視頻內容都同步推出了音頻版本,並快速取得了成功;《羅輯思維脫口秀》在喜馬拉雅 FM 已獲 18971.2 萬次播放,《吳曉波頻道》擁有 124 萬粉絲,收聽累計 18365.9 萬次。
平臺類公司中喜馬拉雅在音頻行業成長最快, 2016 年 6 月估值就已超 8 億美元, 2016 年 9 月用戶量超過 3 億,活躍用戶日均使用時長達 111 分鐘。作為一代文青的啟蒙電臺——豆瓣FM挺可惜的。
而作為內容平臺必然不會甘心於純內容,未來還將把觸角向下遊延伸,從鍵盤滑鼠時代到觸控時代的經驗來看,我們可以知道只有最接近消費者才能獲益最大。
從大音頻時代的中遊來看,國內形成喜馬拉雅等為首,其中城市傳媒(600229)持有喜馬拉雅1.45%左右的股份,相信在不遠的將來,喜馬拉雅將登上國內資本市場。另外一家蜻蜓FM登上A股的意願同樣強烈,暫無A股上市公司參股資料。
大音頻時代下遊——智能硬體
既然是智能硬體,就說明不再僅僅是指智能音箱,還包括前面提到的雙藍牙耳機,汽車、電視等,總的來說就是三個場景,把用戶每天的二十四小時一網打盡。一個是在家的時間,一個是在開車的時間,一個是到了公司到下班的時間。
在智能家居這兩年火了起來,家電企業、網際網路企業、通信設備企業紛紛進入,都試圖打造自己的智能家居生態圈,然而現今還沒有企業真正成功搭建智能家居的生態圈。
而目前看得到的是智能音箱和雙藍牙耳機,智能音箱需要遠場識別,即需要更多的麥克風,所以對聲學的巨頭——歌爾股份仍是利好。而我一直耿耿於懷的是國產音箱廠商——漫步者的停滯不前,上市7年市值仍在60-70億。
從公司的互動平臺信息來看,在智能音箱的布局上似乎也不是很上心,更不用說技術含量更高的雙藍牙耳機。
智能音箱還需要更多的產品出現,未來主要關注蘋果的Homepod的銷量,繼續深挖除歌爾股份以外的產業鏈。
剩下的就是雙藍牙耳機,有的朋友會說,這有什麼技術含量?你還真別小看了,除去蘋果的Air Pods之外,我們常用的運動耳機也好,其他藍牙耳機也好,要麼只有一個,要麼兩個耳機之間總會有連接線。
大家在用無線藍牙耳機的時候有沒有想過,為什麼過去的藍牙耳機只有一個?在今年年初的CES上,索尼和三星都在耳機領域重點展出了相應成功,下圖為索尼在CES上展出的雙藍牙耳塞。
而這一項技術的提供者則是被高通收購的CSR,而無線雙藍牙耳機的未來必然還需要降噪,真正實現電影《her》裡的劇情。CSR前兩天在深圳召開了音頻開發者大會,發布了5套產品,分別針對語音識別智能藍牙揚聲器、主動降噪type c耳機、雙耳藍牙耳機、條形音箱等多個市場。
而在國內,能夠解決雙藍牙耳機技術的公司不多,其中一家在2015年底才成立的恆玄科技似乎取得了不錯的進展,據電子行業分析師孫昌旭老師的消息來看,恆玄科技已經實現了大批量的出貨,希望能快點有體驗不錯的產品上市。
作者:GY_GY,來源:雪球。點擊本頁左下角「閱讀原文」可以繼續瀏覽作者@雪球上的原文空間。
版權聲明: 「大公館2013」除發布原創市場投研報告以外,亦致力於優秀財經社會時政類文章的交流分享。部分文章推送時未能及時與原作者取得聯繫。若涉及版權問題,敬請原作者添加LJZ2228微信聯繫。謝謝!
一生好運,獨尊武神趙子龍!
百戰不殆,金融圈、商界送禮獨一無二
私人洽購請致電 1333-28-77772 聯繫大公館畫廊葉小姐,或點擊本連結訪問內頁索引