愛(ài)數(shù)智慧致力于為人工智能提供數(shù)據(jù)解決方案,推動(dòng)人工智能技術(shù)的應(yīng)用和發(fā)展。愛(ài)數(shù)智慧曾于2017年初獲得明勢(shì)資本Pre-A輪投資。
近日,《The Silicon Review》(硅谷評(píng)論)雜志發(fā)布2020年度30家成長(zhǎng)最快的科技公司榜單,明勢(shì)資本早期項(xiàng)目「愛(ài)數(shù)智慧」入選。愛(ài)數(shù)智慧曾于2017年初獲得明勢(shì)資本Pre-A輪投資。

《The Silicon Review》雜志總部位于美國(guó)新澤西州,專(zhuān)注于發(fā)掘、報(bào)道全球各領(lǐng)域的創(chuàng)新公司。作為技術(shù)行業(yè)備受推崇的刊物,它致力于分享由知名和新貴提供商開(kāi)發(fā)的創(chuàng)新企業(yè)解決方案,其讀者群包括首席執(zhí)行官、首席信息官、首席技術(shù)官和IT專(zhuān)業(yè)人士。
《The Silicon Review》雜志中提到語(yǔ)音交互是全球范圍內(nèi)增長(zhǎng)最快的市場(chǎng)之一。在應(yīng)用人工智能技術(shù)的實(shí)際場(chǎng)景中,語(yǔ)音交互界面通常用于智能設(shè)備,提供類(lèi)似于人的服務(wù),將語(yǔ)音轉(zhuǎn)換為書(shū)面或視覺(jué)信息,以及提高通信效率。這些功能的實(shí)現(xiàn)是基于模型和算法的訓(xùn)練與大量匹配場(chǎng)景的語(yǔ)音數(shù)據(jù),數(shù)據(jù)是語(yǔ)音驅(qū)動(dòng)的人工智能技術(shù)發(fā)展中的關(guān)鍵。
以下是采訪(fǎng)部分內(nèi)容截?。?br>
Q: 如何從數(shù)據(jù)的角度提高語(yǔ)音識(shí)別的準(zhǔn)確性?
張晴晴:從機(jī)器學(xué)習(xí)的本質(zhì)來(lái)看:數(shù)據(jù)是機(jī)器學(xué)習(xí)的基礎(chǔ),標(biāo)注后的數(shù)據(jù)被稱(chēng)為“機(jī)器學(xué)習(xí)的教材”。我們已經(jīng)采集了大量多語(yǔ)種多場(chǎng)景的數(shù)據(jù)集,可以幫助用戶(hù)快速提高語(yǔ)音識(shí)別模型的性能。
數(shù)據(jù)的相關(guān)性是影響模型在特定領(lǐng)域和特定場(chǎng)景下識(shí)別準(zhǔn)確率的重要因素。比如,車(chē)載娛樂(lè)信息系統(tǒng)需要車(chē)載環(huán)境下錄制的數(shù)據(jù)集來(lái)訓(xùn)練。我們會(huì)詳細(xì)分析客戶(hù)的數(shù)據(jù)需求并根據(jù)其應(yīng)用場(chǎng)景推薦更相關(guān)的數(shù)據(jù)。
基于對(duì)行業(yè)和應(yīng)用場(chǎng)景的洞察,愛(ài)數(shù)智慧有一套實(shí)用的數(shù)據(jù)標(biāo)簽體系。在標(biāo)注中,我們根據(jù)不同場(chǎng)景和應(yīng)用為數(shù)據(jù)提供不同的標(biāo)簽,提高數(shù)據(jù)的機(jī)器可讀性。
Q: 盡管語(yǔ)音識(shí)別已經(jīng)能夠準(zhǔn)確識(shí)別出大部分英語(yǔ)單詞,但是對(duì)于人名和俚語(yǔ)依然有困難。如何降低有限詞匯對(duì)語(yǔ)音識(shí)別結(jié)果的影響?
張晴晴:OOV詞匯的識(shí)別是語(yǔ)音識(shí)別無(wú)法忽視的一個(gè)痛點(diǎn),因?yàn)樽匀徽Z(yǔ)言本身就是不斷進(jìn)化的。我們致力于通過(guò)人機(jī)協(xié)同的方式來(lái)幫助客戶(hù)解決OOV的問(wèn)題。我們研發(fā)了具有自主知識(shí)產(chǎn)權(quán)的發(fā)音詞典標(biāo)注系統(tǒng)。在這套系統(tǒng)中,機(jī)器可以基于現(xiàn)有的詞典,對(duì)新詞的發(fā)音進(jìn)行預(yù)測(cè),并將結(jié)果反饋給標(biāo)注員。這樣標(biāo)注員可以更快的進(jìn)行標(biāo)注,并將此發(fā)音加入到詞典中。通過(guò)這樣的方式,我們可以快速的對(duì)詞典進(jìn)行更新迭代,從而加快OOV的解決。
此外,語(yǔ)音是被模型需要大量的數(shù)據(jù)來(lái)學(xué)習(xí)新單詞。我們?yōu)楦鞣N語(yǔ)言提供了大規(guī)模的發(fā)音詞典和相應(yīng)的語(yǔ)音數(shù)據(jù)集,并設(shè)計(jì)了多種語(yǔ)料庫(kù)。
Q: 如何應(yīng)對(duì)數(shù)字轉(zhuǎn)型的“永不停息的變化”?
張晴晴:數(shù)字化轉(zhuǎn)型的本質(zhì)是,在數(shù)據(jù)+算法定義的世界中,以數(shù)據(jù)的自動(dòng)流動(dòng)化解復(fù)雜系統(tǒng)的不確定性,優(yōu)化資源配置效率,構(gòu)建新型競(jìng)爭(zhēng)優(yōu)勢(shì)。數(shù)字化影響著社會(huì)治理、企業(yè)運(yùn)營(yíng)、生活服務(wù)等方方面面。因此,數(shù)字化轉(zhuǎn)型也需要政府、企業(yè)、行業(yè)組織等協(xié)同發(fā)力。
數(shù)字化幫助企業(yè)更容易做出理性決策。因?yàn)閿?shù)字化讓業(yè)務(wù)場(chǎng)景互聯(lián)互通成為可能,使得企業(yè)可以將決策所需的信息(業(yè)務(wù)、場(chǎng)景、流程)集成在信息化的平臺(tái)上。
數(shù)字化幫助企業(yè)采集了大量數(shù)據(jù),如何利用數(shù)據(jù)變得更為重要。企業(yè)自發(fā)采集的數(shù)據(jù)具有多源異構(gòu)的特點(diǎn),很難發(fā)揮價(jià)值,愛(ài)數(shù)智慧為客戶(hù)提供數(shù)據(jù)清洗、分類(lèi)、標(biāo)注等服務(wù),將數(shù)據(jù)結(jié)構(gòu)化。企業(yè)以結(jié)構(gòu)化后的數(shù)據(jù)為原材料,可以開(kāi)發(fā)出更多創(chuàng)新的產(chǎn)品,滿(mǎn)足消費(fèi)者快速變化的需求。
Q: 你們有什么新的服務(wù)準(zhǔn)備推出嗎?
張晴晴:我們的產(chǎn)品和服務(wù)是緊跟市場(chǎng)和技術(shù)的變化的。隨著B(niǎo)ERT模型的發(fā)布,NLP領(lǐng)域?qū)⒂瓉?lái)里程碑式的改變。針對(duì)NLP領(lǐng)域的文本處理,愛(ài)數(shù)智慧將會(huì)開(kāi)發(fā)一套專(zhuān)門(mén)的SaaS系統(tǒng),采用人機(jī)協(xié)同的方式幫助各行各業(yè)的客戶(hù)在文本分析領(lǐng)域更快的構(gòu)建數(shù)據(jù)集。