KITT.AI聯(lián)合創(chuàng)始人、CTO陳果果先生現(xiàn)在演示了如何使用KITT.AI語音喚醒技術(shù)快速打造一個(gè)語音喚醒設(shè)備。根據(jù)陳果果先生演示,進(jìn)入Snowboy的喚起詞庫并新建喚起詞“你好景鯤”后,接著只需要說三遍“你好景鯤”,即可完成喚起詞的訓(xùn)練。在測(cè)試環(huán)節(jié),設(shè)備只會(huì)對(duì)喚起詞“你好景鯤”進(jìn)行響應(yīng)。
景鯤稱,喚醒萬物的核心三要素是要做好聽清、聽懂、滿足。聽懂是人工智能時(shí)代用數(shù)據(jù)和技術(shù)解決的關(guān)鍵問題。在這個(gè)時(shí)代,只有百度在中國市場(chǎng)是“唯一”具備聽清、聽懂、滿足的實(shí)力,打造一個(gè)開放賦能的生態(tài)系統(tǒng)。
1、“聽清”方面:百度的語音識(shí)別率做到了近場(chǎng)識(shí)別的準(zhǔn)確率97%以上,但這些在AI時(shí)代還不夠。在AI時(shí)代,技術(shù)要與場(chǎng)景相結(jié)合。我們希望把語音放到真正的場(chǎng)景里面去解決問題,研發(fā)了麥克風(fēng)陣列、回聲消除、語音喚醒、人像識(shí)別等技術(shù)。這些都是我們逐漸推進(jìn)的世界先進(jìn)技術(shù),將被放到各種場(chǎng)景中實(shí)現(xiàn)用戶聽清的需求。
2、“聽懂”方面:數(shù)據(jù)多、介入深是打造對(duì)話系統(tǒng)的必然條件,具備這兩點(diǎn)才能做好一個(gè)真正可以對(duì)話的“聽懂”系統(tǒng)。百度是具備數(shù)據(jù)量最大的公司。百度擁有億級(jí)的多輪對(duì)話數(shù)據(jù)、十億級(jí)的知識(shí)圖譜數(shù)據(jù)。
3、聽懂并滿足“聽一首某某的歌”這樣的用戶需求還不夠,真正用戶想要的是更自然、更復(fù)雜的需求,比如“我要聽我手一杯品嘗你的美這首歌”,比如“想聽哥哥的歌”,只有把用戶在真實(shí)場(chǎng)景中表達(dá)的復(fù)雜請(qǐng)求做好,才能真正做出一個(gè)真正聽懂用戶需求的產(chǎn)品。
公開資料顯示,KITT.AI公司專注于語音喚醒和自然語音交互技術(shù),此前還曾成功入選了CB Insights人工智能創(chuàng)業(yè)一百強(qiáng)。此外,Kitt.AI聯(lián)合創(chuàng)始人兼CEO姚旭晨本科畢業(yè)于南京大學(xué),并在約翰霍普金斯大學(xué)獲得計(jì)算機(jī)科學(xué)博士學(xué)位!隨著KITT AI被百度全資收購,姚旭晨或許也將成為百度在人工智能領(lǐng)域中的一員大將。
留言與評(píng)論(共有 條評(píng)論) |