近日,極限元與國內某知名呼叫中心服務商達成合作,極限元通過音頻比對技術為其提供電話撥號音檢測服務,有效地提高了企業呼叫中心坐席人員的工作效率,節省了人力和時間成本。
在金融、保險、教育、諮詢類的行業中,使用呼叫中心通過人工外撥電話開拓業務依然佔據著重要的位置,頻繁的外呼電話是企業提升服務和實現業務增長的一個關鍵。比如:尋找新客戶、新客戶的信息確認及業務引導、維護老客戶、老客戶的電話回訪、再次營銷、市場調查等;新客戶的電話能否打通,老客戶的電話是否停用,或者人為掛斷等,不同的業務實現、未知的電話可能性,都是需要坐席人員去一一驗證,其中,一通外撥電話會面臨多種電話提示音,如:
您好,您撥打的用戶已關機,請稍後再撥。您好,您撥打的用戶正在通話中,請稍後再撥。您好,請不要掛機。您撥打的電話正在通話中。您好,你撥打的電話已停機。您好,您撥打的電話不在服務區您好,您撥打的電話是空號......
以上這些電話提示音,是一名坐席人員撥打一通電話要面臨的電話情況。從外呼電話,到面臨不同的電話提示音,再到電話接通後的業務溝通,這是一名坐席人員完成一個客戶所做的工作。我們按普通坐席每天8小時的工作時間計算,據統計,國內中小企業每個坐席人員每天花在電話上的時間為3.5小時(包含了撥出和回撥),有的時間利用率甚至更低。通過電話不同的提示音,判斷此電話是否是有效的信息,這種簡單又重複的動作對坐席人員是一項龐大的工作量。
極限元的電話撥號音檢測通過音頻比對技術實現了對電話提示音的自動檢測來確定有效和無效電話,做精準分類,降低了坐席人員簡單重複的勞動,提高了工作效率。
音頻比對
從音頻信號提取特徵,通過特徵進行比對的方法實現進行信息檢索的方法。該方法的核心在於提取的特徵值需要滿足一定的要求,比如抗噪性、轉換不變性、魯棒性、快速性等特點,主要是為了滿足同一音頻能夠在不同聲道下進行準確檢索。傳統的 MFCC、FBANK 等聲學特徵已經不能滿足音頻比對任務的需求。下圖是一個基於頻譜最大值來建模的音頻比對方法。在完成最大值點完成建模後,需要進行特徵的構建。而特徵構建是通過最大值點之間的距離來建模,例如兩個最大值點的距離、位置信息作為一個固定的特徵來完成音頻特徵信息的構建。有了上述音頻特徵之後,就可以對兩個不同音頻進行檢索,最大相似度的地方就是相似點,這種技術最適用於文本內容無關的錄音片段的檢索。
在提供音頻比對技術的同時,我們還提供以下相關語音檢測技術:
關鍵詞檢索
將通話錄音輸入到音頻檢索網絡,同時將指定的語音關鍵詞轉換成音素,在檢索網絡中進行匹配,輸出檢索結果。
此解決方案不僅繞開了生成文字所需的解碼過程,提高檢索效率,還能避免語音轉文字可能帶來的誤差,提高識別準確率。
儘管語音關鍵詞檢索會造成同音字的誤判,但對比語音轉文字再進行關鍵詞匹配,造成的誤差要小很多,而帶來準確率提高和效率提升的優勢卻很明顯。同時對於海量錄音數據內容審核的應用場景,也更為實用。
情感識別
情感識別解決方案通過分析不同情感狀態和語音聲學參數的關聯關係,抽取出魯棒聲學特徵參數,綜合考慮不同人對同一段語音的情感感知結果,建立語音情感識別模型。為了提高語音情感識別的魯棒性,採用非線性建模方法建立情感語音分析模型,有效的解決了噪聲環境下情感語音分析問題。針對情感識別中的時序建模問題,採用一種基於特徵層建模和決策層建模相結合的多尺度時序建模方法。在特徵層實現短粒度的時序建模。在決策層實現更長粒度的時序建模,並與特徵層的時序建模實現相互補充。通過上述改進,有效的提高了語音情感識別的準確率,可以對通話者的情感狀態進行動態的捕獲和跟蹤。此外,極限元還可以提供基於音視頻多通道情感狀態識別的解決方案。
極限元撥號音檢測把對目標客戶篩選的工作全部承擔過去,降低了坐席人員的重複性勞動,同時提高了坐席人員的工作效率。主要適用於坐席人員電話銷售、電話回訪,市場調查等多種電話溝通形式,可廣泛應用於金融、保險、教育、房地產等行業中。