本發(fā)明涉及機器人,尤其涉及一種機器人語音處理方法及系統(tǒng)。
背景技術(shù):
1、隨著人工智能技術(shù)的持續(xù)發(fā)展,語音交互技術(shù)在機器人領(lǐng)域得到廣泛應(yīng)用。當(dāng)前,機器人已具備監(jiān)聽自然人語音并進行語音對話的能力,通過語音識別、自然語言處理等技術(shù),能夠?qū)⒆匀蝗说恼Z音信號轉(zhuǎn)換為文本信息,并基于預(yù)設(shè)算法和訓(xùn)練模型生成回復(fù)語音,實現(xiàn)與自然人的基本交流。近年來,機器人自然語言處理技術(shù)取得顯著進展,在常規(guī)語句的理解與回復(fù)上,準(zhǔn)確性和流暢性大幅提升,可滿足部分日常簡單對話需求。
2、然而,盡管機器人自然語言處理技術(shù)有所進步,但在處理復(fù)雜語言表達時仍存在明顯不足。自然人在日常交流中,有些情況下,機器人無法很好的識別自然人輸入的語句,導(dǎo)致機器人的對話中斷或者機器人回復(fù)錯誤,導(dǎo)致用戶的人機對話體驗感差。
技術(shù)實現(xiàn)思路
1、有鑒于此,本發(fā)明實施例提供一種機器人語音處理方法及系統(tǒng)。本發(fā)明的技術(shù)方案是這樣實現(xiàn)的:
2、第一方面提供一種機器人語音處理方法,所述方法包括:當(dāng)?shù)谝灰娲_定接收到的第一自然語句為疑難語句時,將所述第一自然語句的語義特征提供給第二引擎;在所述第二引擎處理所述第一自然語句期間,根據(jù)提供所述第一自然語句的用戶的情緒狀態(tài)輸出第二自然語句;接收所述第二引擎提供的反饋語句;所述反饋語句針對所述第一自然語句;根據(jù)所述第二自然語句潤色所述反饋語句,輸出潤色后的第三自然語句。
3、第二方面提供一種機器人語音處理系統(tǒng),其特征在于,所述系統(tǒng)包括:
4、提供模塊,用于當(dāng)?shù)谝灰娲_定接收到的第一自然語句為疑難語句時,將所述第一自然語句的語義特征提供給第二引擎;
5、輸出模塊,用于在所述第二引擎處理所述第一自然語句期間,根據(jù)提供所述第一自然語句的用戶的情緒狀態(tài)輸出第二自然語句;
6、接收模塊,用于接收所述第二引擎提供的反饋語句;所述反饋語句針對所述第一自然語句;
7、所述輸出模塊,用于根據(jù)所述第二自然語句潤色所述反饋語句,輸出潤色后的第三自然語句。
8、本公開實施例第三方面提供一種計算機存儲介質(zhì),所述計算機存儲介質(zhì)存儲有計算機可讀指令;所述計算機可讀指令被處理器執(zhí)行之后能夠?qū)崿F(xiàn)第一方面任意技術(shù)方案提供的機器人語音處理方法。
9、本發(fā)明實施例提供的技術(shù)方案至少具有以下有益效果:
10、首先,通過第一引擎識別疑難自然語句,并將其語義特征傳輸給第二引擎,能夠快速區(qū)分復(fù)雜語句與常規(guī)語句,避免因誤判導(dǎo)致的處理錯誤,提升機器人對復(fù)雜自然語言的初步處理能力,為準(zhǔn)確理解用戶意圖提供保障。
11、其次,在第二引擎處理疑難語句時,第一引擎依據(jù)用戶情緒狀態(tài)輸出第二自然語句,填補處理等待期間的交互空白,緩解用戶等待焦慮,確保交互過程不間斷,顯著增強人機對話的流暢性與自然度,提升用戶使用體驗。
12、接收第二引擎反饋后,結(jié)合處理期間輸出的第二自然語句對回復(fù)內(nèi)容進行潤色,使最終回復(fù)既保證語義準(zhǔn)確性,又能貼合用戶情緒與表達風(fēng)格,讓機器人的回應(yīng)更具針對性,有效提高交互質(zhì)量。
13、第一引擎與第二引擎分工協(xié)作,構(gòu)建完整語音處理鏈路,第一引擎負責(zé)語句識別與初步處理,第二引擎專注復(fù)雜語義解析,二者協(xié)同工作,相比單一引擎處理模式,若單一引擎需要處理復(fù)雜語句解析還需要通過第二自然語句等輸出填補交互空白,會導(dǎo)致任務(wù)增大,進一步延長交互空白。而雙引擎的處理方式就可以很好的解決該問題,大幅提升系統(tǒng)處理復(fù)雜任務(wù)的能力與效率,優(yōu)化整體架構(gòu)性能。
1.一種機器人語音處理方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的機器人語音處理方法,其特征在于,所述第一引擎確定接收到的第一自然語句為疑難語句,包括以下至少之一:
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述方法還包括:
4.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述在所述第二引擎處理所述第一自然語句期間,根據(jù)提供所述第一自然語句的用戶的情緒狀態(tài)輸出第二自然語句,包括:
5.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述將所述第一自然語句的語義特征提供給第二引擎,包括:
6.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,根據(jù)所述第二自然語句潤色所述反饋語句,輸出潤色后的第三自然語句,包括:
7.一種機器人語音處理系統(tǒng),其特征在于,所述系統(tǒng)包括:
8.根據(jù)權(quán)利要求7所述的機器人語音處理系統(tǒng),其特征在于,所述第一引擎確定接收到的第一自然語句為疑難語句,包括以下至少之一:
9.根據(jù)權(quán)利要求7或8所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括:
10.一種計算機存儲介質(zhì),其特征在于,所述計算機存儲介質(zhì)存儲有計算機可讀指令;所述計算機可讀指令被處理器執(zhí)行之后能夠?qū)崿F(xiàn)權(quán)利要求1至6任一項所述的方法。