電話客服機器人的語音后端識別處理

    后端識別處理,具有對大詞匯量、獨立于說話人的健壯識別功能,簡單來說,就是能夠滿足大詞匯量,并能適應(yīng)不同年齡、不同地域、不同人群、不同信道、不同終端和不同噪聲環(huán)境的應(yīng)用環(huán)境。
     
     
     
    1、語義置信度
    在語音識別領(lǐng)域一個很重要的因素是置信度輸出,在限定詞匯量的條件下,如果客戶的提問或回答不**出限定的詞匯,ASR識別后文本的正確率可以達到95%以上。但是,一旦問題**出限定的領(lǐng)域或者出現(xiàn)集外詞,ASR的識別性能就會嚴重下降。因此,對ASR識別結(jié)果的可信度進行度量就顯得非常重要,它可以降低集外詞(OOV)帶來的不利影響。
     
    采用的方法是利用統(tǒng)計語言模型衡量ASR識別所得到的整個句子的可信度。如果一個句子的詞誤識率比較低,構(gòu)成這個句子的眾多三元短語(W1W2,W3),會比較多的出現(xiàn)在統(tǒng)計語言模型Trigram中,如圖9所示;反之,如果出現(xiàn)較多的識別錯誤,那么句子*部分的詞W1和元短語(W1,W2)將出現(xiàn)在Unigram或Bigram中,很少有三元短語*Trigram,如圖10所示;對于一個由若干詞W1,W2,……,Wi,……,Wn構(gòu)成的句子,可根據(jù)各個詞及它所構(gòu)成的短語在統(tǒng)計語言模型中出現(xiàn)的情況對其中每個詞打分。出現(xiàn)在Trigram中的可信度高,因而得分較高,出現(xiàn)在Bigram或Unigram中的可信度低,因而得分較低。再在各個詞得分的基礎(chǔ)上得到整個句子的可信度得分。若得分**某個門限,則認為句子中包含較多的識別錯誤或者集外詞,可信度較低,應(yīng)當被拒識。
     
    ASR識別后文本是由一個個詞構(gòu)成的詞序列,其中某些詞對于理解整個句子有著非常重要的作用,這就是所說的關(guān)鍵詞。在這一步要做的就是提取出這些關(guān)鍵詞,形成一個關(guān)鍵詞串,作為下一步“問題理解”的輸入,這種處理同時也是為了降低“問題理解”時的難度,如圖11所示。可以把特定的對話節(jié)點看作一個問題域,針對該問題域設(shè)計關(guān)鍵詞表,預先規(guī)定在這一問題域內(nèi)的關(guān)鍵詞。這個關(guān)鍵詞表是ASR系統(tǒng)中相應(yīng)問題域下的詞匯表的子集,記錄了每個關(guān)鍵字的漢字串,類標識和詞序號等信息。在提取關(guān)鍵詞時,只需要在句子中進行搜索,檢測到出現(xiàn)在關(guān)鍵表的關(guān)鍵詞,記錄它們出現(xiàn)的位置和次序。比如一個句子“你好,我想問一下,我那個嗯,快遞是不是寄錯地址了?”,這里可以提取出關(guān)鍵漢字串“問一下”、“快遞”、“寄錯地址”。對于不包含關(guān)鍵詞的句子,例如“啊,可以說給我打了,里頭哭了。”,可把它視作無效或者錯誤的輸入,給出相應(yīng)的提示。
     
    以對話節(jié)點來分類語料,可較好的捕獲用戶說話的習慣和領(lǐng)域用語,某一節(jié)點場景下機器人與客戶的對話可限定在某個問題域內(nèi)進行。對句子進行準確的理解,并不需要考慮句子中的每個詞,只需對幾個蘊含關(guān)鍵概念的關(guān)鍵詞匯進行理解就能把握句子的意義。關(guān)鍵詞識別技術(shù)從語句中抽取用戶關(guān)心的關(guān)鍵信息,能夠降低對識別系統(tǒng)和環(huán)境噪聲的要求。
     
    2、語料統(tǒng)計分析
     
    利用日志數(shù)據(jù),學習用戶的語言使用習慣,從日志中自動抽取語意標注數(shù)據(jù)和構(gòu)建領(lǐng)域語言模型。以對話節(jié)點來分類語料,基于不同典型節(jié)點的語料進行詞表抽取。
     
    針對每個問題域,需要確定有限大小的“詞匯表”,并通過大量的訓練語料訓練出相應(yīng)的基于詞類的統(tǒng)計“語言模型”。“關(guān)鍵詞表”可以從“詞匯表”中提煉得到,它記錄的是對于理解問題有實質(zhì)作用的詞匯及其相關(guān)信息。此外還要在“關(guān)鍵詞表”的基礎(chǔ)上形成“關(guān)鍵詞類型組合模板庫”,其中每個模板代表問題域內(nèi)的一類具體問題,此模板庫在“問題理解”過程中使用。
     
    以快遞物流領(lǐng)域的對話語料為基礎(chǔ)。對話過程是兩個人通過電話以一問一答的形式進行的,電話一端代表客戶,另一端是智能語音客服機器人,客戶端說話方式完全是自由的和隨意的。
     
    為了表述方便,我們首先給出如下定義:
     
    定義1 對話語句(Utterance) 從對話者一方開始講話到講完停下或被對方強行打斷為止,所說的全部內(nèi)容稱作一個對話語句。
     
    定義2 對話子句(Dialog sentence) 一個對話語句中所包含的分句,稱作對話子句。
     
    例如: 嗯|你好/我想查|一下/我|那個|快遞|什么|時候|能|到/現(xiàn)在|還|沒|送來
     
    這一段文字從開始到結(jié)束是一個對話語句,在這個對話語句中包含有4個對話子句(由“/”隔開),每一個子句中包含多個詞(由“|”隔開)。
     
    其中,詞典標注采用人工方式,語料標注采用機器自動標注與人工核對相結(jié)合的方法。當**次收集語料時,詞典是不存在的,我們只需要對整理的語料進行分詞,然后提取所有的詞匯,并依據(jù)這些詞匯建立相應(yīng)的詞典。詞典一旦建立之后,當領(lǐng)域轉(zhuǎn)移或擴展時,系統(tǒng)只需將新收集的語料中在詞典中沒有的所有新詞提取出來,然后在人的輔助下決定是否將這些新詞添加到詞典中去。這樣,對于應(yīng)用領(lǐng)域接近或同一領(lǐng)域擴展時,只需要處理少數(shù)新的詞匯即可,而避免了大量的重復工作。
     

    長沙朗深信息技術(shù)有限公司專注于智能電話機器人,呼叫中心中間件,跨界呼叫中心等, 歡迎致電 13973187797

  • 詞條

    詞條說明

  • 云呼叫中心打造高效溝通,提升客戶滿意度

    隨著科技的不斷發(fā)展,云呼叫中心成為了現(xiàn)代企業(yè)提高溝通效率和客戶滿意度的重要工具。傳統(tǒng)的呼叫中心常常面臨著硬件設(shè)備、人力資源和成本等方面的限制,而云呼叫中心則通過將通信系統(tǒng)遷移到云端,為企業(yè)提供了較為靈活和高效的解決方案。??傳統(tǒng)的呼叫中心需要大量的硬件設(shè)備和維護人員,而云呼叫中心則可以通過云端服務(wù)器進行統(tǒng)一管理和維護。這意味著企業(yè)不再需要購買昂貴的硬件設(shè)備,也不需要擔心設(shè)備故障

  • 語音識別技術(shù)在電話機器人中的應(yīng)用

    隨著科技的不斷發(fā)展,電話機器人已經(jīng)成為許多企業(yè)日常業(yè)務(wù)中**的一部分。而其中較重要的技術(shù)之一就是語音識別技術(shù)。通過這種技術(shù),電話機器人可以借助人工智能的力量較加高效地執(zhí)行任務(wù),從而提高客戶體驗和整個業(yè)務(wù)系統(tǒng)的效率。??首先,語音識別技術(shù)可以幫助電話機器人快速準確地識別客戶的話語,提供針對性的服務(wù)和解決方案。無論客戶使用何種語音聲調(diào)或口音,電話機器人都能夠自動適應(yīng),從而確保每

  • 東進語音交換機

    2020年12月18日,由通信信息行業(yè)網(wǎng)站CTI論壇主辦的2020年度CTI論壇編輯推薦獎暨行業(yè)應(yīng)用及市場分析主題沙龍在京舉行。東進技術(shù)旗下基于信創(chuàng)技術(shù)的東進keygoe多媒體交換機榮獲CTI論壇2020年度編輯推薦獎。??基于信創(chuàng)技術(shù)的東進Keygoe多媒體交換機,**支持鯤鵬、龍芯、飛騰、兆芯等平臺,軟件支持統(tǒng)信、麒麟等國產(chǎn)操作系統(tǒng),在滿足PSTN/PLMN等傳統(tǒng)電信網(wǎng)絡(luò)上

  • 120急救調(diào)度指揮系統(tǒng)智能化

    120急救調(diào)度指揮系統(tǒng)是一套基于云技術(shù)應(yīng)用,集電話語音模塊、急救指揮調(diào)度模塊、車載視頻終端模塊、單兵視頻監(jiān)控采集模塊、車載導航醫(yī)助模塊、車輛定位模塊、遠程急救會診模塊、公共服務(wù)平臺模塊、遠程生命監(jiān)測模塊于一體的現(xiàn)代化綜合120急救指揮調(diào)度系統(tǒng)。??經(jīng)歷過疫情,會發(fā)現(xiàn)傳統(tǒng)的120急救指揮調(diào)度系統(tǒng)存在著明顯的不足。比如:信息互聯(lián)互通不夠完善,不足以支撐院內(nèi)的一體化就只體系;救護車車

聯(lián)系方式 聯(lián)系我時,請告知來自八方資源網(wǎng)!

公司名: 長沙朗深信息技術(shù)有限公司

聯(lián)系人: 黃建軍

電 話:

手 機: 13973187797

微 信: 13973187797

地 址: 湖南長沙岳麓區(qū)雷峰大道陽光晶城2棟1804

郵 編:

網(wǎng) 址: lioncen2018.b2b168.com

八方資源網(wǎng)提醒您:
1、本信息由八方資源網(wǎng)用戶發(fā)布,八方資源網(wǎng)不介入任何交易過程,請自行甄別其真實性及合法性;
2、跟進信息之前,請仔細核驗對方資質(zhì),所有預付定金或付款至個人賬戶的行為,均存在詐騙風險,請?zhí)岣呔瑁?
    聯(lián)系方式

公司名: 長沙朗深信息技術(shù)有限公司

聯(lián)系人: 黃建軍

手 機: 13973187797

電 話:

地 址: 湖南長沙岳麓區(qū)雷峰大道陽光晶城2棟1804

郵 編:

網(wǎng) 址: lioncen2018.b2b168.com

    相關(guān)企業(yè)
    商家產(chǎn)品系列
  • 產(chǎn)品推薦
  • 資訊推薦
關(guān)于八方 | 八方幣 | 招商合作 | 網(wǎng)站地圖 | 免費注冊 | 一元廣告 | 友情鏈接 | 聯(lián)系我們 | 八方業(yè)務(wù)| 匯款方式 | 商務(wù)洽談室 | 投訴舉報
粵ICP備10089450號-8 - 經(jīng)營許可證編號:粵B2-20130562 軟件企業(yè)認定:深R-2013-2017 軟件產(chǎn)品登記:深DGY-2013-3594
著作權(quán)登記:2013SR134025
Copyright ? 2004 - 2025 b2b168.com All Rights Reserved