識別準確率達85%、不到兩秒就能譯出來 廈大研發的「閩南話智能...

2021-01-09 廈門網

  閩南話識別系統界面。

  一位女士正對著手機用閩南話進行語音輸入。

  廈門網訊 (文/圖廈門日報記者 陸曉鳳) 用閩南話對著手機語音錄入「愛拼才會贏」,語音輸入後屏幕上立即顯示「愛拼才會贏」字樣。近期,一款名叫「閩南話識別」的軟體在網絡上走紅。只要是日常對話的語句,不管你說的閩南話是廈門口音、泉州口音,或是漳州口音,它基本都能識別出來並翻譯成文字,識別準確率高達85%。

  這款軟體是廈大信息科學與技術學院副教授洪青陽、廈大人文學院中文系助理教授許彬彬帶領的科研團隊合作研發的。目前,這一軟體已經過多階段的內部測試,並開放供廣大市民免費試用。

  記者與幾位同學分別用廈門口音、泉州口音、漳州口音的閩南話,對著軟體語音輸入:「今天天氣很好。」不到2秒,系統翻譯出了相同的對應文字。記者又以略微不同的表達方式對著軟體語音輸入「今天天氣很好」,系統依舊能準確識別。

  近日,記者採訪了軟體背後的科研團隊,為您揭秘軟體開發過程。

  調查

  採集多地語音資料連國外也不放過

  首先,該軟體背後的語音資料庫就很強大,這是基於許彬彬近10年來的研究成果。許彬彬帶領團隊借鑑、整理了大量語音資料——囊括福建省內廈、漳、泉多地的閩南方言、文本,甚至收集了國外多處講閩南話的地點的語音材料。

  除了廈大的語音資料庫外,每到寒暑假,許彬彬團隊還會去各地進行田野調查。「省內的漳浦、東山等,以及菲律賓北部城市、美國的東部地區,每一個地點至少要停留5天,儘可能全面地描寫該地區語音面貌。」她說。

  整理

  標註每個音節發音錄入不同口音

  有了豐富的「食材」,烹製好這道「菜餚」還需要「配菜」。為此,許彬彬團隊做了大量的整理工作。在許彬彬的電腦裡儲存著大量文檔。「我現在有5臺電腦,10個硬碟,全都裝滿閩南話文件。」許彬彬說,閩南話的聲母有15-18個不等,韻母有73-90個不等,聲調有5-8個不等,都要逐一整理,錄入系統。

  別以為只是簡單的標註,每個音節的發音以及發音時長,都必須詳細標註下來。以「他們坐車去臺北」為例,許彬彬就標註了16個音素,音素與發音時長還要逐一對應。而這只是一個句子的其中一種口音。

  許彬彬告訴記者,單單是廈門地區,細微的語音差別就有十幾種。「思明區鷺江街道是一種口音,廈港街道又是另外一種口音,海滄東孚街道的口音又接近漳州口音,這些都要逐一標註。」她說,系統錄入的不僅僅是廈門口音,還有泉州口音、漳州口音、潮汕口音等。

  建模

  收集十萬句日常對話邀志願者測試

  為了讓這一系統的閩南方言數據儘可能全面,洪青陽團隊又歷時一年,先後收集近十萬句閩南話日常對話。

  除了許彬彬所提供的語音資料外,測試階段,他們還邀請了幾百名志願者參與測試,讓系統「學習」不同口音的閩南話。待系統基本「學會」不同口音的閩南話後,洪青陽又給系統加大了難度——文讀和白讀都要會。

  閩南話中存在大量多音字,有著複雜的文讀白讀現象,以「大學」這一詞為例,就有文讀和白讀兩種讀法。該團隊對閩南話語音識別採取了特定規則的發音詞典標註,並用革新後的算法建立了閩南話語音識別模型。

  連結

  將實現閩南話與普通話無障礙溝通

  當發音速度不一、吞音等情況出現時,軟體如何準確識別?系統的背後還有一位「把關人」。當遇上系統無法識別的語音時,許彬彬團隊就會進行分析,把新的表達整理成文檔,擴充詞典和句子語料。與此同時,洪青陽團隊在系統後臺不斷完善算法,以學習到更多口音和生僻詞彙。現在,系統依舊在不斷完善升級。

  據了解,基於深度學習方法,他們目前正在研發閩南話合成系統,最終可以實現閩南話與普通話之間的無障礙溝通。洪青陽說,該系統預計在今年上半年上線。

展開閱讀全文

相關焦點

  • 5秒數清一池魚 這家甬企AI圖像識別技術準確率達99%
    5秒數清一池魚 這家甬企AI圖像識別技術準確率達99% 2019年03月24日 09:49:20來源:中國寧波網  記者 易鶴 通訊員 張文勝 鬱安昌 經過實測,這項AI圖像識別技術準確率高達
  • 準確率超90%、1秒發出報警:百度飛槳讓電力巡檢更快更準更輕鬆
    百度視覺團隊基於百度飛槳打造的該方案對輸電線路外破隱患的識別分析準確率已超過90%,同時實現秒級報警,可充分保障電力安全。此外,在開發過程中起到關鍵作用的模型壓縮庫PaddleSlim和端側推理引擎Paddle Lite也在當天迎來全新升級發布,進一步提升性能和易用性。
  • 手機掃一掃識蟲 江西省研發國內首款專業昆蟲識別軟體
    原標題:我省研發國內首款專業昆蟲識別軟體    今後,當你看到不認識的昆蟲,只要下載安裝「江西崑蟲」APP,手機掃一掃昆蟲,即可全面了解該昆蟲的信息。12月26日,記者獲悉,省林業局藉助人工智慧技術開展智能診斷系統「江西崑蟲」APP研發工作,該軟體已順利完成驗收,為國內首款專業昆蟲識別軟體。
  • 診斷食管癌胃癌準確率超98%
    你知道,全球有50%的上消化道癌發生在中國,  超過85%的患者在確診時,已是中晚期。  但你可能不知道,  上消化道癌早期生存率高達90%,晚期則不到10%!  癌症治療,就是與時間賽跑,跑贏了,就贏得一條生命!但,要怎麼贏?
  • 濟南「智慧幫辦系統」可滿足群眾7*24小時在線諮詢 回答準確率達90%
    對此,濟南市公安局指揮部副主任葛方強在發布會上介紹說,為及時回復群眾諮詢,濟南市公安局在「e警通」研發了「AI智慧幫辦系統」。「智慧幫辦系統」就是傳統意義上的智能客服系統,該系統使用語音識別和人工智慧技術,實現秒級響應,可以滿足群眾7*24小時在線諮詢,可實現80%的常見問題諮詢,達到90%的回答準確率,同時可解決90%的回訪及滿意度調查工作,能夠實時響應群眾諮詢和訴求,有效提升服務滿意度,保證服務內容、服務規範的一致性。
  • 半小時冷藏除臭、不到兩秒認出種類……這些創意垃圾桶竟然來自這裡
    這種問題,其實用一隻垃圾桶就能解決。由上海市綠化市容局聯合上海市教委、團市委共同發起的生活垃圾分類「小發明、好方法、金點子」徵集活動上,一大批來自上海在讀學生的創意聚焦垃圾異味處理和垃圾智能分類投放,令人耳目一新。高溫不臭的溼垃圾桶愚一小學向紅分校五(1)班的劉一睿設計製作了「小區自動感應破袋防蟲隔臭溼垃圾桶」。該垃圾桶有兩種功能:防臭和破袋。
  • 谷歌ReCaptcha系統被破解,機器語音驗證準確率高達85%
    圖片來源圖蟲:已授站長之家使用文/靈火K1 月 2 日雷鋒網報導,美國馬裡蘭大學的四位研究員開源了一個名為UnCaptcha的工具,能夠破解谷歌的驗證碼系統ReCaptcha,其進行語音驗證的準確率高達
  • 百度自稱漢語語音識別準確率97%
    近日舉行的中國人機語音交互領域權威的學術會議——全國人機語音通訊學術會議(NCMMSC2015)上,百度透露其在漢語語音識別方面獲得重大突破。據悉,百度研發出了基於多層單向LSTM(長短時記憶模型)的漢語聲韻母整體建模技術,並成功把連接時序分類(CTC)訓練技術嵌入到語音識別傳統技術建模框架中。
  • 「狗臉識別」來了!可識別化妝後的汪星人,準確率99%
    人臉識別技術正如火如荼地開展,「狗臉識別」技術也不甘落後。如何證明你的狗是你的狗呢?看鼻子!近期,支付寶開放了「寵物鼻紋識別」技術,將根據鼻紋信息創建寵物電子檔案,通俗一點講就是:狗臉識別(其實貓臉也可以),主要應用於為貓、狗等寵物投保寵物險。
  • 法媒:中國「狗臉識別」系統不只能找回寵物
    來源:環球網法國數碼世紀網7月14日文章,原題為「中國公司推出新智能程序,不只能找回丟失的寵物」。中國在人工智慧技術領域的步伐總是走得更快,英劇《黑鏡》的情節似乎已在當今中國人生活中變成現實:他們擁有防止未成年人沉溺於電腦遊戲、刷臉支付等智能系統。
  • 語音識別準確率行業第一,中英、方言混輸百度輸入法都沒在怕的!
    這時候就該「動口不凍手」的語音輸入來「大展拳腳」了,打開百度輸入法語音輸入,分分鐘就能幫你搞定各種輸入需求。最近,艾媒諮詢發布《中國第三方手機輸入法市場年度專題研究報告》(以下簡稱《報告》),指出了百度輸入法2019年在語音輸入領域的重大突破。
  • 悅保「AI+寵物識別」科技亮相CPF國際寵博會
    9月18日第11屆CPF國際寵博會正式開幕本屆展會展覽面積達55000平方米共設1500個展位CPF國際寵博會展示自主研發的寵物「面部+鼻紋」識別身份認證技術在展會現場颳起一股人工智慧的「風潮」寵物面部或鼻紋,輕鬆完成寵物信息採集、身份檔案建立、身份比對與判斷等流程,體驗AI寵物識別技術在寵物保險、寵物管理、寵物醫療、寵物用具等場景的實際應用,領略人工智慧技術如何推動寵物產業鏈的智能化升級。
  • 智能語音技術如何拯救翻譯機:翻譯機的技術抉擇和優勝略汰
    雷鋒網按:智能語音技術經年之後的不斷完善,尤其是隨著語音識別準確率的不斷提高,基於智能語音技術的智能硬體紛至沓來,除了智能音箱一再受眾人追捧外,智能翻譯機也悄然逆襲,併入這條快車道。例如搜狗在跟進transformer機器翻譯模型的同時,仍然在用CNN做語音識別上的訓練,搜狗語音交互技術中心研發總監陳偉在參加對外活動時曾提到:在做語音識別時,搜狗用50層CNN結構得到語音識別模型,基於此模型,訓練離線語音識別模型。產品形態:手機、耳機和翻譯機翻譯機的產品形態主要有三大類;翻譯機、翻譯手機和翻譯耳機。
  • 寵物「面部+鼻紋」身份識別科技搶先看
    悅保科技首次在展會展示自主研發的「寵物面部+鼻紋識別」同步認證框架,通過自研FaNl-pet深度學習框架和MSA算法,「面部+鼻紋」雙重體徵認證,能更精準地分析寵物品種和個體身份屬性,在1:1和1:N的識別場景下,均能達到98%以上的超高精確度。
  • 川農學生研發實用APP:掃一掃識別病蟲害
    僅靠肉眼的識別或是群體經驗分析的方法工程量又顯得過大……近日,四川農業大學學生研發的「川農病蟲害識別」APP採用手機拍照模式,對準病蟲害即可獲取數據分析,有效降低蟲害。據了解,該APP系由學校人工智慧病蟲害識別及防治工作室的師生共同研發,目前,正處於測試和優化階段,兩年內爭取上線,同時,基於圖像的昆蟲識別技術除了農業外,還將在延伸到森林病蟲害防治等領域的應用。
  • 杭州蕭山機場引入阿里雲ET航空大腦 人臉識別過安檢只需3秒
    昨天,記者從杭州蕭山國際機場了解到,目前機場已全面引入阿里雲ET航空大腦,25個國內安檢通道全部上線人臉識別技術,人臉判斷準確率超99.6%,旅客身份甄別速度提升3倍以上。上線一個多月來,已經成功「揪」出5名冒用身份證的旅客。
  • 搜狗智能錄音筆s1,整理翻譯一氣呵成
    工作中難免會遇到跨國會議,大家在會議上遇到的挑戰主要來自兩方面。一是會議冗長,完全記住所有細節有些困難;二是語言問題,有些專業的外語我們可能聽不懂。這兩個問題解決起來其實很簡單,洋叔今天就給大家推薦一款工作神器——搜狗AI智能錄音筆S1,它兼具錄音和翻譯量大功能,是工作的絕佳夥伴!
  • 長虹人工智慧歸來 3秒讓你愛上它
    給你3秒你會愛上它!客廳裡的電視機「能聽懂你說話、和你聊天、能為你準備喜歡的節目、能3秒內響應你的指令……」這樣的生活場景,真真切切在小編的家庭生活出現了。什麼原因呢?那是長虹50A3U成功上位了。人工智慧電視有智能和人性的內在資深產業經濟觀察家、家電/IT行業分析師梁振鵬表示,長虹在天貓首發這款人工智慧電視A3U系列新品,除了安卓系統、語音交互等最基礎的功能外,自適應、自學習、自成長是它的主要特質,在彩電產品的「交互性」、「便捷性」、「用戶體驗」方面做出了重大突破。
  • 開啟智能養豬新模式 重慶企業研發出這項「豬臉識別」技術
    華龍網1月2日18時20分訊(記者 周曉雪 實習生 邱小雅)「人臉識別」大家都不陌生,但你聽說過「豬臉識別」嗎?日前,記者從重慶小雨點小額貸款有限公司(下稱「小雨點」)獲悉,該公司自主研發的「點豬格格」技術已經在重慶等地的養殖戶中逐步推廣,可以實現「豬臉識別」,通過攝像頭實時清點豬的數量,準確率高達90%以上。
  • 可以群體識別的影子豬臉識別來了
    (影子科技CDO鏑來博士為葉貞琴副省長講解影子智能引擎和豬臉識別技術)鏑來博士介紹,影子科技是由4位矽谷回國IT精英聯合創立的產業網際網路公司,服務農場到餐桌整個產業鏈,打造影子智能引擎商業生態平臺,為產業鏈各環節提供智能化、數位化整體解決方案和服務。公司成立至今舉行了三次產品發布會,先後在全球首發影子豬臉識別、影子智能引擎和FPF未來豬場系列產品。