當前位置:
首頁 > 科技 > 「呼叫中心錄音質檢」難題何解?極限元基於關鍵詞語音檢索方案高效破解

「呼叫中心錄音質檢」難題何解?極限元基於關鍵詞語音檢索方案高效破解

您好,很高興為您服務,請問有什麼可以幫到您的?

..........

感謝您的致電,祝您生活愉快。

這段來自呼叫中心的話術,相信大家都不陌生。對於服務行業,如:電商、金融、銀行、互聯網等,呼叫中心是一個促進企業營銷、市場開拓並為客戶提供良好的交互服務系統,其位置相當重要。為了提高客戶滿意度、完善客戶服務,同時對客服人員工作的考評,很多企業會對此採用質檢的方式來保證其服務質量。

極限元智能科技在智能語音、計算機視覺、自然語言處理、大數據分析等技術領域有多年技術積累,推出了一些系列雲端、桌面端、移動端、嵌入式端的跨平台AI技術解決方案,產品和服務廣泛應用在教育、安全、交通、泛娛樂等多個行業。其中,成熟的音頻監測技術落地場景方面更是涉及到反電信詐騙、公安技偵、互聯網音視頻有害信息檢測、呼叫中心錄音質檢等。

呼叫中心質檢內容:

為了提高客戶滿意度、完善客戶服務,為企業創造更多的利潤,通常會從以下幾個方面對客服電話內容質檢:用戶、考核、客戶問題商機。

(1)客服服務:開場白、結束語、服務態度是否良好;

(2)業務績效考核部分:業務熟悉度、基本話術、操作引導是否規範,是否使用禁語;

(3)市場拓展:對客戶的挖掘、對流失客戶的挽留、尋找商機;

傳統質檢方法

面對每日上萬條的電話錄音,質檢人員只能通過人工測聽的方式進行抽檢。一個5000人的客服團隊,需配備100人左右的質檢團隊,呼入型質檢比率至少在1%,至多不超過30%,呼出型質檢比率至少在2%,至多不超過50%。人工抽檢,工作量大、效率低、主觀性強,很難有效評價整體服務質量。

極限元基於關鍵詞語音檢索方案VS目前業內的呼叫中心質檢方案

隨著科技的發展,計算機技術的應用,目前行業內採用的是基於語音識別技術和語義分析技術來做錄音質檢,雖然節省了人力成本和提高工作效率,但是也存在一定的問題。

如:(1)錄音質檢的數據是電話錄音由語音識別技術處理後輸出的文本數據,對語音識別的準確率要求極高,如果電話錄音轉寫出來的文本跟實際內容差別太大,在此基礎上進行的關鍵詞檢索和語義分析工作就不能輸出正確的結果。

(2)電話錄音通常存在著大量的背景雜訊、方言口音、信道干擾,而且電話錄音通常採用較低的採樣率,音質不高,這些都嚴重影響到語音識別的準確率。

(3)語義分析技術需要針對業務場景訓練複雜的模型,隨著業務場景的變動,相關學習模型也要經常進行更新,維護周期長、成本高,適應業務變化的實時性不強。

(4)整個錄音質檢方案需要的複雜運算環節多,帶來了業務處理延時較高,執行效率提升有限,同時相關的軟、硬體成本偏高。

極限元錄音質檢三種解決方案組成完整體系

針對現行業內運用的質檢方式存在的一系列的問題,極限元採用了基於語音關鍵詞檢索技術、音頻對比技術、情感識別技術的錄音質檢方案,可以減少語音識別準確率不高帶來的錄音質檢誤差,有效提升了錄音質檢效率。

1.語音關鍵詞檢索

將通話錄音識別結果輸出音頻檢索網路,指定的語音關鍵詞轉換成音素,在檢索網路中進行匹配,輸出檢索結果。(如下圖)

此解決方案不僅繞開了生成文字所需的解碼過程,提高檢索效率,還能避免語音轉文字可能帶來的誤差,提高識別準確率。

例如:

客戶:最近我的電話信號不好,上不了網。

客服:什麼時候開始上不了網呢?

客戶:好久了。

客服:您地址在哪呢?

客戶:我在xxx這裡。

客服:好的,我幫您登記下,您還有別的問題么?

客戶:沒有了,

客服:謝謝您的來電,再見。

語音關鍵詞檢索伺服器可以識別出這段錄音中包含關鍵詞:上不了網,但沒有找到其他關鍵詞進行組合邏輯判斷,這條錄音的檢測結果中話務類型為「未定義」,標記為疑似不合格話術,會反饋出現關鍵詞的時間點。

儘管語音關鍵詞檢索會造成同音字的誤判,但對比語音轉文字再進行關鍵詞匹配,造成的誤差要小很多,而帶來準確率提高和效率提升的優勢卻很明顯。同時對於海量錄音數據內容審核的應用場景,也更為實用。

2.音頻對比

音頻比對是指從音頻信號提取特徵,通過特徵進行比對的方法進行有害信息檢索的方法。該方法的核心在於提取的特徵值需要滿足一定的要求,比如抗噪性、轉換不變性、魯棒性、快速性等特點,主要是為了滿足同一音頻能夠在不同聲道下進行準確檢索。傳統的MFCC、FBANK等聲學特徵已經不能滿足音頻比對任務的需求。下圖就是一個基於頻譜最大值來建模的音頻比對方法。在完成最大值點完成建模後,需要進行特徵的構建。而特徵構建是通過最大值點之間的距離來建模,例如兩個最大值點的距離、位置信息作為一個固定的特徵來完成音頻特徵信息的構建。有了上述音頻特徵之後,就可以對兩個不同音頻進行檢索,最大相似度的地方就是相似點,這種技術最適用於錄音片段的檢索。

3.情感識別

情感識別解決方案通過分析不同情感狀態和語音聲學參數的關聯關係,抽取出魯棒聲學特徵參數,綜合考慮不同人對同一段語音的情感感知結果,建立語音情感識別模型。為了提高語音情感識別的魯棒性,採用非線性建模方法建立情感語音分析模型,有效的解決了雜訊環境下情感語音分析問題。針對情感識別中的時序建模問題,採用一種基於特徵層建模和決策層建模相結合的多尺度時序建模方法。在特徵層實現短粒度的時序建模。在決策層實現更長粒度的時序建模,並與特徵層的時序建模實現相互補充。通過上述改進,有效的提高了語音情感識別的準確率,可以對通話者的情感狀態進行動態的捕獲和跟蹤。此外,極限元還可以提供基於音視頻多通道情感狀態識別的解決方案。

通過極限元錄音質檢解決方案,可以幫助客戶將客服錄音數據進行各種分析,從而針對性地改善呼叫中心的服務質量;除了對企業自身呼叫中心質檢之外,此方案還可以為企業分析客戶的反饋意見,跟蹤廣大用戶的熱點問題,從而對公司的產品和服務提出優化建議,實現更加精準的市場決策。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器人圈 的精彩文章:

在無人機資本「寒冬」的17年,這家公司又拿到了6200萬融資
斯坦福:「目標檢測」深度學習全面指南
AI取代會議同傳,還需幾步?
在分析了AI頂會上的6163篇論文後,我們能發現怎樣的發展趨勢與變化?……
蘋果發布最新AI研究,「全文」解讀iPhone如何實時識別手寫體漢字

TAG:機器人圈 |