May I help you?
伍教練越來越懶了,每當有網友諮詢透析法及相關課程的時候,我連這句歡迎詞都懶得用手打出來——我會打開手機上的英文語音識別功能,直接飈英語,讓系統識別出文字。有時也不完全是懶,在只能用手機的場合,用手指在虛擬鍵盤上打字是很麻煩的,自從Steve Jobs宣稱「重新發明了手機」那天開始就一直很麻煩!
很多人不知道,語音識別技術(speech recognition,SR)在1952年誕生,經過半個世紀的發展,近年來在各方諸侯的軍備競賽中瘋狂進化。現在,SR早已不是Word 2000年代的樣子,你要對著電腦的麥克風說了一大堆話,結果只能識別「中國」等少數幾個詞。無論英文還是中文,現在在雲計算、大數據、深度神經網絡等技術的加持下,識別準確率都有了長足進步,結果讓我們的英語口語有了用武之地——不好意思跟別人說英語?至少你還可以對著手機開口。
英文語音識別怎麼玩法?你也許想到微信的聊天窗口點+可選Voice Input,但只接受普通話。蘋果的用戶也許想到語音助手Siri,但這個雞肋功能連我都不覺得有什麼實用價值。其實,現在SR的功能在很多輸入法中都實現了,基本上只要能打字的應用場合,無論是文字編輯軟體還是網頁編輯框,都能玩SR。這些功能的背後,是Google, Microsoft, IBM, Baidu, Apple, Amazon, Nuance, SoundHound, IflyTek等IT巨頭。Soon you will see!
語音識別的啟動及實測
對於各家各派的SR功力,伍教練以《懷疑論者詞典》的播客節目pseudoscience(音頻地址http://skepdic.com/UV/pseudoscience.mp3)統一做了30秒的粗略測試,方法是在安靜環境下進行近距離外部錄音。
蘋果iOS系統:選擇英文輸入法,點space鍵旁邊的麥克風鍵啟動SR。請注意,很多人在QQ的聊天窗口容易點錯QQ發送語音的麥克風鍵,這個按鍵位置相對靠屏幕中間,而SR的麥克風鍵是在屏幕底部。
●蘋果iPhone 6 Plus手機的SR效果:Is Bob Carol creator of the skeptics dictionary the clock on the actual actually going to prove welcome to another episode of a natural birch or episodes of your friends comments on topics in critical thinking skepticism and science pseudoscience the term pseudoscience like the expression is used as a pejorative know you cook something is nonsense bogus junk add swap
●安卓系統。幸好國內的安卓用戶還可以安裝訊飛輸入法、搜狗輸入法等,其英語SR也已經很強大了。訊飛在英文輸入的模式下,點輸入法的麥克風鍵或者長按空格鍵均可啟動SR。搜狗在輸入的模式下,長按空格鍵啟動SR,上滑手指選擇英語,如果還有彈窗的話選「轉換文字」。QQ的聊天窗口也有麥克風鍵混淆的問題,請注意區分。
三星Tab S2平板電腦上訊飛輸入法的SR效果:Girl there in about a natural applicant proves thinking, open to the direction of a natural, listen to those of your pension retirement and traffic and beautiful painting suggestions and china, it's stuffy, suicide, the term pseudo science like expression room, it used specially for the return the spatial think something something of this jump but
小米6手機搜狗輸入法的SR效果:Is what you're really strapped to a chair in the board an airplane accident remained open to the direction of a map approach their huge reserves of York region with bombings and property to the packing skepticism inside its target issue, said the term suicide likely expression rule is used as a pejorative for the reader's emotional eating something that doesn't produce.
●Windows系統(PC版):以WIN 10為例,在開始菜單旁邊的搜索框搜「speech recognition」啟動該功能。在輸入界面,可點開屏幕右下方的託管區,點擊SR圖標並選擇Open Speech Recognition,出來一個浮動的輸入模塊,Listening。WIN 10延續了訓練模式,我就按照提示念了10分鐘左右的英語,據說之後系統對我的口音更加適應,識別正確率相應提高。但是這種speaker dependent模式可能導致換人後識別不良,例如下面就是系統經過我這個中國人的口音訓練之後,再聽純正美國口音的SR效果,懷疑受到我的口音「汙染」,拖累了識別正確率。
聯想筆記本電腦上的WIN 10的SR效果:Skeptics during the logon debt collector can improve the two another episode of an actual perch index future episodes of your region brief comments on topics and critical thinking skepticism and cites the day’s topic is a science term sugar science like the expression who is yours is that your lip reader to restrict know that you think something is not sent brokers Joe
上面都是純種美國人Bob Carroll(能識別成Carol已經不錯)講的英語,看上去SR的效果慘不忍睹。我感覺蘋果的SR技術相對好一點,而傳說中業界最強的Google研發出CTC-trained LSTM、DeepMind等黑科技,無奈在國內用不上——國內安卓系統的Google voice typing處於無反應狀態。伍教練嘗試用iPhone 6 Plus上的Google Translate處理了一小段錄音,結果如下:
Bob Carol created the skeptic's dictionary in the blog unnatural acts that can improve your thinking (時長有限制)
準確率高得驚人,錄了兩次居然都是僅僅識別錯一個單詞(created應為creator,另一次正確識別creator,但blog被識別成plaza)。看來Google的SR真的逆天了!國內的訊飛和搜狗自稱非常牛逼,可能是中文語音識別更強吧,但英文方面還是有不小差距。
按照目前SR的技術發展速度,未來可能會進一步提高識別正確率,甚至超過母語人士的聽力理解正確率,可以取代打字錄入——2016年,牛津大學的LipNet系統就在限定條件下刷出了超越人腦的識別正確率!
語音識別的網聊實戰
SR實際使用上的效果好很多,因為你對著麥克風逐字逐句地說,清晰度和語速都受到控制,系統識別起來比自然說話容易許多。我用得最多的場景是網絡聊天,那對文字的正確性比較寬鬆,說完之後發現個別詞彙識別錯了,但只要整體意思還能看出來,我就懶得修改,而對方往往能接受。人的大腦在閱讀時就自動糾正的功能,例如網絡上流傳的——
劍橋大學研究發現:英語單詞的字母次序打亂,你依然可以看懂:
Aoccdrnig to a rscheearch at Cmabrigde Uinervtisy,it deosn't mttaer in waht oredr the ltteers in a wrod are,the olny iprmoetnt tihng is taht the frist and lsat ltteer be at the rghit pclae.The rset can be a total mses and you can sitll raed it wouthit porbelm.Tihs is bcuseae the huamn mnid deos not raed ervey lteter by istlef,but the wrod as a wlohe.
Amzanig!
標準版:
According to a research at Cambridge University,it doesn't matter in what order the letters in a word are,the only important thing is that the first and last letter be at the right place.the rest can be a total mess and you can still read it without problem.This is because the human mind does not read every letter by itself,but the word as a whole.
Amazing!
伍教練的SR實戰經驗印證了上述說法。在網絡聊天等非正式文書場合,SR是acceptable的。在SR的過程中,你還可以改進自己的發音,使之更標準、更地道。例如對搜狗輸入法的SR說May I help you? 如果我p和you不連讀的話,搜狗的SR往往處理成May I have you?(就這麼發出去的話,後果很嚴重……)只有連讀p和you才能正確識別為May I help you?(對於這句話,蘋果、谷歌和訊飛的SR無論是否連讀都不會識別錯誤。)此外還有can和can’t的發音等等,為了識別正確,你不得不強化發音,努力說得更清楚,直到系統能夠正確識別。久而久之,你的發音不就進步了麼?
事實上,SR的主要應用之一就是輔助語言學習,提升外語的發音及流利度!(For language learning, speech recognition can be useful for learning a second language. It can teach proper pronunciation, in addition to helping a person develop fluency with their speaking skills.)
語音識別輸入標點符號
會用SR聊英語的人不多,而知道SR還能輸入標點符號的人就更少了。伍教練玩了很長時間,發現SR的識別結果一律不斷句,就嘗試說標點符號的英文,竟然發現有的系統能夠識別出標點符號。我用蘋果親測成功的有:
Comma顯示,
Full-stop或period顯示.
Question mark顯示?
Exclamation mark顯示!
Dash顯示-
Colon顯示:
但是我跟蘋果說quotation mark無法顯示」,而說quotes往往只能顯示前半個",後半個引號出不來。我就找到這麼多,而網絡上早就有大神進行了全面的梳理:
CommandResult
Period (Full stop).
Comma,
Exclamation point!
Question mark?
Colon:
Semi-colon;
Dash (Hyphen)–
Forward slash/
Equal sign=
Dollar sign$
Euro sign€
Percent sign%
Registered sign®
Copyright sign©
Trademark sign™
Ampersand&
Smiley:-)
CommandResult
Open quote「
Close quote「
Open / Close paranthesis( / )
Open / Close brackets[ / ]
Open / Close curly bracket{ / }
New linenew line is created
New paragraphnew paragraph is created
Space barspace
No spaceno space between input
No space onno space between all input
No space offno space deactivated
Caps onupcoming letter with caps
Caps offupcoming letter without caps
All caps onall new letters with caps
All caps offcaps lock deactivated
No caps onno caps in entire text
No caps offno caps deactivated
這麼玩法,相當於你在進行中文語音識別的時候說:「今天的天氣很好 句號」(親測可以。)說起來感覺怪怪的,但有了標點符號的文字很容易理解,而且說多了你還能精通各種符號的英文表達exclamation mark! 相比之下,訊飛和搜狗做不到識別顯示標點符號,只能直接顯示exclamation mark等單詞,只是搜狗會在句末自動給你加個.
最後,伍教練期望有機會跟各位網友在透析法的QQ群和微信群用SR過招,既比拼口語發音,又拼手機的軟硬體,還PK對識別結果的理解——我就不打算改正識別錯誤了,笑死人不償命!
討論兒童英語母語,「把你的英語用起來」每日打卡,諮詢透析法網絡課程,請加入伍教練的Dialysis用戶群
微信群:請掃碼加伍教練的個人微信號DIALYSIS55,添加時請標明「兒童」、「打卡」、「報名」,然後我拉你入群。
QQ群:59634714或71929542
歡迎訂閱添加「透析英語」微信公眾號(微信掃碼,或者直接添加dialysis5)
「把你的英語用起來!」作者伍君儀QQ視頻直播課課程價值只需1個月,就從「學英語」質變到「用英語」!通過手機平板實現全英化生活方式,讓您讀懂英文原著,詞彙量穩步擴充到10000以上,英語考試一路通關。報讀條件testyourvocab.com自測詞彙量結果1000+課程內容課程有效期為1年,每周1次課,每次課2小時,總共100小時以上(每周2小時×52周)。「3+1」結構滾動開課,不重複乾貨內容達到30小時以上(6小時必修課+2小時選修課×12次)必修課(滾動重複)
《聽力·短讀》(正透析)
《口語·寫作》(逆透析)
《詞彙·長讀》(正透析)
選修課(每次不同)
主題包括兒童英語母語、全英化教育、英語健康養生等。
每次課程保留精華錄音,錯過上課時間還可以在QQ群內選擇上課日期立刻回聽。
伍教練24/7教學答疑及操作示範,口語圈、寫作圈實戰,每日作業指導。
報名方法向本公眾號發送報名或點擊「閱讀原文」