天眼查財(cái)產(chǎn)線索信息顯示,近日,廣州小鵬汽車科技有限公司申請的“聲學(xué)語義大模型、服務(wù)器、語音交互方法和存儲介質(zhì)”專利公布。
摘要顯示,本申請公開了一種聲學(xué)語義大模型、服務(wù)器、語音交互方法和計(jì)算機(jī)可讀存儲介質(zhì)。聲學(xué)語義大模型包括聲學(xué)編碼模塊、字符轉(zhuǎn)寫模塊、知識檢索模塊和大語言模型模塊。聲學(xué)編碼模塊被配置為根據(jù)輸入的語音請求,生成語音請求的聲學(xué)特征向量。字符轉(zhuǎn)寫模塊被配置為將語音請求轉(zhuǎn)寫為相對應(yīng)的字符序列,字符序列包括語音請求中各文字相對應(yīng)的字符。知識檢索模塊被配置為根據(jù)字符序列,自外部知識庫中,獲取補(bǔ)充信息。大語言模型模塊被配置為根據(jù)聲學(xué)特征向量和補(bǔ)充信息,確定自然語言處理結(jié)果。如此,通過端到端的聲學(xué)語義大模型,減少了多個(gè)模塊的串行處理,降低了處理語音請求的時(shí)延,提升了模型響應(yīng)速度,從而增強(qiáng)用戶體驗(yàn)。