英文語音識別:提升口語、解放手指的黑科技(設置詳解,立即可玩)

2021-02-13 透析英語

May I help you?

伍教練越來越懶了,每當有網友諮詢透析法及相關課程的時候,我連這句歡迎詞都懶得用手打出來——我會打開手機上的英文語音識別功能,直接飈英語,讓系統識別出文字。有時也不完全是懶,在只能用手機的場合,用手指在虛擬鍵盤上打字是很麻煩的,自從Steve Jobs宣稱「重新發明了手機」那天開始就一直很麻煩!

很多人不知道,語音識別技術(speech recognition,SR)在1952年誕生,經過半個世紀的發展,近年來在各方諸侯的軍備競賽中瘋狂進化。現在,SR早已不是Word 2000年代的樣子,你要對著電腦的麥克風說了一大堆話,結果只能識別「中國」等少數幾個詞。無論英文還是中文,現在在雲計算、大數據、深度神經網絡等技術的加持下,識別準確率都有了長足進步,結果讓我們的英語口語有了用武之地——不好意思跟別人說英語?至少你還可以對著手機開口。

英文語音識別怎麼玩法?你也許想到微信的聊天窗口點+可選Voice Input,但只接受普通話。蘋果的用戶也許想到語音助手Siri,但這個雞肋功能連我都不覺得有什麼實用價值。其實,現在SR的功能在很多輸入法中都實現了,基本上只要能打字的應用場合,無論是文字編輯軟體還是網頁編輯框,都能玩SR。這些功能的背後,是Google, Microsoft, IBM, Baidu, Apple, Amazon, Nuance, SoundHound, IflyTek等IT巨頭。Soon you will see!

 

語音識別的啟動及實測

對於各家各派的SR功力,伍教練以《懷疑論者詞典》的播客節目pseudoscience(音頻地址http://skepdic.com/UV/pseudoscience.mp3)統一做了30秒的粗略測試,方法是在安靜環境下進行近距離外部錄音。

蘋果iOS系統:選擇英文輸入法,點space鍵旁邊的麥克風鍵啟動SR。請注意,很多人在QQ的聊天窗口容易點錯QQ發送語音的麥克風鍵,這個按鍵位置相對靠屏幕中間,而SR的麥克風鍵是在屏幕底部。

●蘋果iPhone 6 Plus手機的SR效果:Is Bob Carol creator of the skeptics dictionary the clock on the actual actually going to prove welcome to another episode of a natural birch or episodes of your friends comments on topics in critical thinking skepticism and science pseudoscience the term pseudoscience like the expression is used as a pejorative know you cook something is nonsense bogus junk add swap

 

●安卓系統。幸好國內的安卓用戶還可以安裝訊飛輸入法、搜狗輸入法等,其英語SR也已經很強大了。訊飛在英文輸入的模式下,點輸入法的麥克風鍵或者長按空格鍵均可啟動SR。搜狗在輸入的模式下,長按空格鍵啟動SR,上滑手指選擇英語,如果還有彈窗的話選「轉換文字」。QQ的聊天窗口也有麥克風鍵混淆的問題,請注意區分。

三星Tab S2平板電腦上訊飛輸入法的SR效果:Girl there in about a natural applicant proves thinking, open to the direction of a natural, listen to those of your pension retirement and traffic and beautiful painting suggestions and china, it's stuffy, suicide, the term pseudo science like expression room, it used specially for the return the spatial think something something of this jump but

小米6手機搜狗輸入法的SR效果:Is what you're really strapped to a chair in the board an airplane accident remained open to the direction of a map approach their huge reserves of York region with bombings and property to the packing skepticism inside its target issue, said the term suicide likely expression rule is used as a pejorative for the reader's emotional eating something that doesn't produce.

 

●Windows系統(PC版):以WIN 10為例,在開始菜單旁邊的搜索框搜「speech recognition」啟動該功能。在輸入界面,可點開屏幕右下方的託管區,點擊SR圖標並選擇Open Speech Recognition,出來一個浮動的輸入模塊,Listening。WIN 10延續了訓練模式,我就按照提示念了10分鐘左右的英語,據說之後系統對我的口音更加適應,識別正確率相應提高。但是這種speaker dependent模式可能導致換人後識別不良,例如下面就是系統經過我這個中國人的口音訓練之後,再聽純正美國口音的SR效果,懷疑受到我的口音「汙染」,拖累了識別正確率。

聯想筆記本電腦上的WIN 10的SR效果:Skeptics during the logon debt collector can improve the two another episode of an actual perch index future episodes of your region brief comments on topics and critical thinking skepticism and cites the day’s topic is a science term sugar science like the expression who is yours is that your lip reader to restrict know that you think something is not sent brokers Joe 

 

上面都是純種美國人Bob Carroll(能識別成Carol已經不錯)講的英語,看上去SR的效果慘不忍睹。我感覺蘋果的SR技術相對好一點,而傳說中業界最強的Google研發出CTC-trained LSTM、DeepMind等黑科技,無奈在國內用不上——國內安卓系統的Google voice typing處於無反應狀態。伍教練嘗試用iPhone 6 Plus上的Google Translate處理了一小段錄音,結果如下:

Bob Carol created the skeptic's dictionary in the blog unnatural acts that can improve your thinking (時長有限制)

準確率高得驚人,錄了兩次居然都是僅僅識別錯一個單詞(created應為creator,另一次正確識別creator,但blog被識別成plaza)。看來Google的SR真的逆天了!國內的訊飛和搜狗自稱非常牛逼,可能是中文語音識別更強吧,但英文方面還是有不小差距。

按照目前SR的技術發展速度,未來可能會進一步提高識別正確率,甚至超過母語人士的聽力理解正確率,可以取代打字錄入——2016年,牛津大學的LipNet系統就在限定條件下刷出了超越人腦的識別正確率!

 

語音識別的網聊實戰

SR實際使用上的效果好很多,因為你對著麥克風逐字逐句地說,清晰度和語速都受到控制,系統識別起來比自然說話容易許多。我用得最多的場景是網絡聊天,那對文字的正確性比較寬鬆,說完之後發現個別詞彙識別錯了,但只要整體意思還能看出來,我就懶得修改,而對方往往能接受。人的大腦在閱讀時就自動糾正的功能,例如網絡上流傳的——

劍橋大學研究發現:英語單詞的字母次序打亂,你依然可以看懂:

Aoccdrnig to a rscheearch at Cmabrigde Uinervtisy,it deosn't mttaer in waht oredr the ltteers in a wrod are,the olny iprmoetnt tihng is taht the frist and lsat ltteer be at the rghit pclae.The rset can be a total mses and you can sitll raed it wouthit porbelm.Tihs is bcuseae the huamn mnid deos not raed ervey lteter by istlef,but the wrod as a wlohe.

Amzanig!

標準版:

According to a research at Cambridge University,it doesn't matter in what order the letters in a word are,the only important thing is that the first and last letter be at the right place.the rest can be a total mess and you can still read it without problem.This is because the human mind does not read every letter by itself,but the word as a whole.

Amazing!

 

伍教練的SR實戰經驗印證了上述說法。在網絡聊天等非正式文書場合,SR是acceptable的。在SR的過程中,你還可以改進自己的發音,使之更標準、更地道。例如對搜狗輸入法的SR說May I help you? 如果我p和you不連讀的話,搜狗的SR往往處理成May I have you?(就這麼發出去的話,後果很嚴重……)只有連讀p和you才能正確識別為May I help you?(對於這句話,蘋果、谷歌和訊飛的SR無論是否連讀都不會識別錯誤。)此外還有can和can’t的發音等等,為了識別正確,你不得不強化發音,努力說得更清楚,直到系統能夠正確識別。久而久之,你的發音不就進步了麼?

事實上,SR的主要應用之一就是輔助語言學習,提升外語的發音及流利度!(For language learning, speech recognition can be useful for learning a second language. It can teach proper pronunciation, in addition to helping a person develop fluency with their speaking skills.)

 

語音識別輸入標點符號

會用SR聊英語的人不多,而知道SR還能輸入標點符號的人就更少了。伍教練玩了很長時間,發現SR的識別結果一律不斷句,就嘗試說標點符號的英文,竟然發現有的系統能夠識別出標點符號。我用蘋果親測成功的有:

Comma顯示,

Full-stop或period顯示.

Question mark顯示?

Exclamation mark顯示!

Dash顯示-

Colon顯示:

但是我跟蘋果說quotation mark無法顯示」,而說quotes往往只能顯示前半個",後半個引號出不來。我就找到這麼多,而網絡上早就有大神進行了全面的梳理:

CommandResult

Period (Full stop).

Comma,

Exclamation point!

Question mark?

Colon:

Semi-colon;

Dash (Hyphen)–

Forward slash/

Equal sign=

Dollar sign$

Euro sign€

Percent sign%

Registered sign®

Copyright sign©

Trademark sign™

Ampersand&

Smiley:-)

CommandResult

Open quote「

Close quote「

Open / Close paranthesis( / )

Open / Close brackets[ / ]

Open / Close curly bracket{ / }

New linenew line is created

New paragraphnew paragraph is created

Space barspace

No spaceno space between input

No space onno space between all input

No space offno space deactivated

Caps onupcoming letter with caps

Caps offupcoming letter without caps

All caps onall new letters with caps

All caps offcaps lock deactivated

No caps onno caps in entire text

No caps offno caps deactivated

這麼玩法,相當於你在進行中文語音識別的時候說:「今天的天氣很好 句號」(親測可以。)說起來感覺怪怪的,但有了標點符號的文字很容易理解,而且說多了你還能精通各種符號的英文表達exclamation mark! 相比之下,訊飛和搜狗做不到識別顯示標點符號,只能直接顯示exclamation mark等單詞,只是搜狗會在句末自動給你加個.

最後,伍教練期望有機會跟各位網友在透析法的QQ群和微信群用SR過招,既比拼口語發音,又拼手機的軟硬體,還PK對識別結果的理解——我就不打算改正識別錯誤了,笑死人不償命!

討論兒童英語母語,「把你的英語用起來」每日打卡,諮詢透析法網絡課程,請加入伍教練的Dialysis用戶群

微信群:請掃碼加伍教練的個人微信號DIALYSIS55,添加時請標明「兒童」、「打卡」、「報名」,然後我拉你入群。

QQ群:59634714或71929542

歡迎訂閱添加「透析英語」微信公眾號(微信掃碼,或者直接添加dialysis5)

「把你的英語用起來!」作者伍君儀QQ視頻直播課課程價值只需1個月,就從「學英語」質變到「用英語」!通過手機平板實現全英化生活方式,讓您讀懂英文原著,詞彙量穩步擴充到10000以上,英語考試一路通關。報讀條件testyourvocab.com自測詞彙量結果1000+課程內容課程有效期為1年,每周1次課,每次課2小時,總共100小時以上(每周2小時×52周)。「3+1」結構滾動開課,不重複乾貨內容達到30小時以上(6小時必修課+2小時選修課×12次)

必修課(滾動重複)

《聽力·短讀》(正透析)

《口語·寫作》(逆透析)

《詞彙·長讀》(正透析)

選修課(每次不同)

主題包括兒童英語母語、全英化教育、英語健康養生等。

每次課程保留精華錄音,錯過上課時間還可以在QQ群內選擇上課日期立刻回聽。 

伍教練24/7教學答疑及操作示範,口語圈、寫作圈實戰,每日作業指導。

報名方法向本公眾號發送報名或點擊「閱讀原文」

相關焦點

  • 黑科技:如何讓你的爐石隨從語音全變成英文
    」「 我可沒時間陪你玩遊戲 」「 我們要發財啦! 」等等。這些臺詞琅琅上口,加上隨從登場帶來的強力效果,丹柯每次都覺得很爽。聽久了也會有點膩,但是由於切換到其他語言可能會造成卡牌的效果不理解的尷尬場景,所以丹柯一直都沒有去下載其他地區的語音包。
  • 有趣:green fingers 不是「綠色手指」!那是什麼意思?
    本專欄旨在普及英語文化方面的知識,幫助廣大粉絲消滅中式英文及假英語。
  • 澳洲移民英文測試遭瘋狂吐槽!連母語是英文的人都考不過!甚至難倒英語國家的獸醫!簡直太坑了!
    到底入籍英文考試難到什麼程度呢?小編先拿一名學霸舉個例子。這名學霸來自愛爾蘭,以英語為母語,而且擁有歷史和政治雙學位。現在,她竟然無法說服一臺語音識別機器相信她的英語口語程度好到足以留在澳大利亞生活。這名學霸名叫34歲的露易絲·甘迺迪(Louise Kennedy),來自愛爾蘭Co Wicklow的Roundwood。
  • 印尼華人圈重大改變:英文口語『華人群』官宣,本周正式開放!
    疫情之下,為進一步緩解移民圈語言溝通難題,更快融入當地生活,跟誰學特發起「海外英文口語華人群本周正式官宣開啟,同時進行在線答疑,以期對海外同胞進行高質量的實用英文口語提升。此次華人群的建立和開放,是專為海外華人打造!基於跟誰學強大的教資實力,由從63萬老師中篩選的名師,現身直播主講。
  • 黑科技:Pokemon Go中國區下載方法,還沒玩的童鞋速度了
    不要方,要相信奇蹟是存在的,黑科技是存在的。目前有幾種方式可以下載到這個應用的ios版本。1.兔兔助手:http://www.tutuapp.com/index.php?r=site/mobileTutu2&t=ios2.同步推助手:http://tui.tongbu.com/m/?
  • 愛爾蘭移民圈重大改變:英文口語『華人抱團群』官宣,本周正式開放!
    疫情之下,為進一步緩解移民圈語言溝通難題,更快融入當地生活,跟誰學特發起「英文口語華人抱團群」!
  • 提升英文寫作的捷徑:小詞大用
    具體到英文寫作,從方法上來說,背誦和臨摹就是最好的 small steps;從內容上來說,小詞和句式就是最好的 small steps。非常同意這一點。語言學習的本質很簡單,無非是日積月累厚積薄發。以英文寫作為例,如何最有效、低成本提升英文寫作呢?
  • 全市法院首個智能語音識別庭審系統正式上線!<總第438期>
    庭審效率大大提升,整個庭審過程僅用了不到半小時。同時更標誌著興寧區法院成為全市首家引入智能語音識別系統記錄庭審的法院。「現在開庭。」隨著審判長的發話,法庭上的顯示屏上就自動出現了這兩句話,一字不差。在之後的庭審中,語音識別系統同步記錄和顯示著庭審中法官和訴訟參與人說的每一句話,而原本應該十分忙碌的書記員卻一直未碰過電腦鍵盤。一般的語音輸入,記錄時常會出現錯字。
  • 新華日報|達斯琪黑科技新品站上融交會「C位」
    10月25日,2020南京文化科技融交會新品發布會在南京國際展覽中心舉行。
  • 悲催: "出車禍" 英文怎麼說? 阿彌陀佛出行平安!「每日情景口語」
    零基礎|也能脫口而出 口語|輕課|繪本|乾貨往期節目回顧:查看公眾號首頁菜單
  • 鋒友分享:在iPhone上設置可視化語音信箱
    而什麼是可視化語音信箱呢?我們來具體了解一下。日前,鋒友 Gavin.Ding 為我們解釋了可視化語音信箱的各項功能以及具體的設置方法。目前,使用 iPhone 4s 以上機型的中國移動用戶已經可以體驗到可視化語音信箱,而電信和聯通還沒有提供此項服務。要想解釋什麼是可視化語音信箱,我們需要先說一說語音信箱業務。
  • 規範詳解: 消防規範中關於住宅設置火災自動報警系統的規定
    規範詳解:晶晶規範詳解系列120集(表單版)121.規範詳解:規範執行之消防控制室的設置位置122.規範詳解:滅火救援人員需要了解的「固定窗」123.規範詳解:商業項目消防審圖中常見錯誤124.規範詳解:汽車庫內的充電間、充電樁125.
  • 小技巧:通過「語音控制」解鎖 iPhone
    不過,如果您的 iPhone 密碼仍然是四位簡易密碼,則可以通過「語音控制」功能來解鎖 iPhone。第一步:打開 iPhone 「設置」-「輔助功能」-「語音控制」。第二步:點擊「自定命令」開始設置,由於目前「語音控制」還不支持中文,大家可以設置英文或者用拼音代替看看。
  • 規範詳解:裙房的幾個常見理解誤區(附新版圖示變更)
    在2018版《建築設計防火規範》圖示中,增加了5.5.12條中裙房設置樓梯的圖示}文字說明。我一共畫了3張簡筆畫,會在視頻中,結合簡筆畫來講解,主要從三部分來說明,【裙房的概念】、【裙房的防火分區設置】、
  • Skype實時語音翻譯技術:掃清語言障礙
    2014年12月份,Skype推出了英語和西班牙語的實時語音翻譯功能,自此,兩種語言進行無障礙切換成為現實。今天就讓我們走近Skype 實時語音翻譯技術。它可以免費高清晰與其他用戶語音對話,也可以撥打國內國際電話,無論固定電話、手機、小靈通均可直接撥打,並且可以實現呼叫轉移、簡訊發送等功能。2014年12月,Skype推出英語和西班牙語的語音實時翻譯功能,在翻譯軟體發展領域可謂是一馬當先。在Skype上應用實時語音翻譯技術時主要包括以下三個階段:假設A、B來自不同國家,雙方通過Skype進行交流。
  • 科技翻譯練習:物聯網英文介紹
    IoT:Internet of Things物聯網technology wave技術浪潮Internet connectivity網絡連接quote-unquote所謂的(多用於口語)quote-unquote smart所謂的智能parking space停車場sensor傳感器tarmac柏油馬路;此處也可理解為停車位,停車場vicinity鄰近,附近productivity生產率electricity
  • 口語100移動端:英語學習APP王中王 (The King of English Learning APPs)
    點擊上方「口語100網絡學習空間」可快速關注
  • 語音為王:科大訊飛 inside !
    同時呢,評選標準也十分有特點,那些有能力將「高精尖科技創新」與「利益最大化」完美融合的公司,才有可能獲此殊榮,可以說這份榜單是對未來會成為行業主導公司的預測,而科大訊飛,代表了智能語音領域的未來前進方向。除了大公司外,這份榜單上那些今年剛上榜卻野心勃勃的公司更值得關注。例如,中國方面排名最高的科大訊飛,這也是這家公司第一次上榜。
  • 教學黑科技:免費生成在線遊戲,一鍵轉發給學生玩
    今天要分享的這個網站絕對是重量級網站,教師可以根據自己的教學需求,傻瓜式創建在線遊戲,可用於上課,上完課還可以轉發給學生玩,重點是網站的遊戲生成全是免費
  • 通知:英文外刊閱讀學習群正式開放,掃碼進!
    所以,如果想要快速提升英語水平,跟更多小夥伴扎堆學習成長,快來掃碼搶名額,加群就能免費聽課!2、趣味學語法,生活實例解釋英文語法,讓語法不再是一個個枯燥的公式。3、了解好聽口語規律,通過口腔肌肉記憶訓練,快速學習發音秘訣,並用100個常用口語應對說不出難題有了這套有效學習法,就可能應對大部分英語難點,3分鐘嘗試輕鬆造句,4天時間學習流利說英語的正確姿勢!