轉(zhuǎn)載請(qǐng)注明出處。
機(jī)器人
雷雄國:機(jī)器人中的人機(jī)交互和后端服務(wù)
星之球激光 來源:新華網(wǎng)2016-05-04 我要評(píng)論(0 )
4月28日2016年全球移動(dòng)互聯(lián)網(wǎng)大會(huì)在北京如期舉行,本屆GMIC,集結(jié)了一大批來自移動(dòng)互聯(lián)網(wǎng),人工智能領(lǐng)域的優(yōu)秀企業(yè)代表共同亮相。而思必馳在本屆GMIC可謂是最亮眼的...
4月28日2016年全球移動(dòng)互聯(lián)網(wǎng)大會(huì)在北京如期舉行,本屆GMIC,集結(jié)了一大批來自移動(dòng)互聯(lián)網(wǎng),人工智能領(lǐng)域的優(yōu)秀企業(yè)代表共同亮相。而思必馳在本屆GMIC可謂是最亮眼的明星之一,展示的“AISpeechInside”系列智能產(chǎn)品十分豐富,攜上海慶科、大華樂橙、捷渡中國等眾多合作客戶參加,更受邀在多場(chǎng)重量級(jí)峰會(huì)上分享經(jīng)驗(yàn)。
在以“阿西莫夫的里程碑”為主題的全球智能機(jī)器人大會(huì)上思必馳副總裁雷雄國發(fā)表了題為“機(jī)器人中的人機(jī)交互和后端服務(wù)”的主題演講。演講中,雷雄國詳細(xì)介紹了思必馳在機(jī)器人領(lǐng)域的多項(xiàng)技術(shù)特色,以及自身的定位和未來發(fā)展方向。同時(shí),他還展示了最新的合作產(chǎn)品:即將正式面世的樂橙小樂機(jī)器人。雷雄國表示,現(xiàn)在的思必馳正處在人工智能快速發(fā)展的時(shí)代,挑戰(zhàn)與機(jī)遇并存是這個(gè)產(chǎn)業(yè)的主旋律,除了在語音識(shí)別和圖像識(shí)別技術(shù)上要有所突破外,思必馳還將致力于身份識(shí)別、聲源定位以及智能車載等領(lǐng)域產(chǎn)品的研發(fā),力爭達(dá)到業(yè)界領(lǐng)先水平。
以下為雷雄國演講實(shí)錄:
對(duì)于人工智能這個(gè)話題,今天來到現(xiàn)場(chǎng)我特別感慨的是,當(dāng)今是最好的時(shí)代,也是最“壞”的時(shí)代。最好的時(shí)代包括從阿爾法狗,我們現(xiàn)在這么多的創(chuàng)業(yè)者集中在AI智能領(lǐng)域,包括機(jī)器人的創(chuàng)業(yè)浪潮,我們能看到未來在機(jī)器人的時(shí)代,人工智能的時(shí)代,一定是一個(gè)正確的大的方向。
為什么說這是一個(gè)最壞的時(shí)代呢?我們發(fā)現(xiàn)確實(shí),有很多我們接觸做機(jī)器人的朋友,他們?cè)诹奈磥頇C(jī)器人,包括當(dāng)前機(jī)器人做成什么樣?有什么樣的商業(yè)模式?以及在機(jī)器人產(chǎn)品里面未來的一些核心方向?可能都不是特別清晰。
在當(dāng)今的時(shí)代,思必馳在人工智能這塊一直在做自己的探索。所以我們也非常高興生活在這個(gè)時(shí)代,能夠在人工智能的這條道路上一起努力,去解決在這個(gè)道路上面與我們所能遇到的很多技術(shù)上和商業(yè)模式上的,一一系列的困難,推動(dòng)人工智能走進(jìn)千家萬戶。
思必馳2007年開始做人工智能,從最初做教育到做移動(dòng)互聯(lián)網(wǎng),再做車聯(lián)網(wǎng),以及目前的智能方面。我們有幸能夠看到包括國際國內(nèi)已經(jīng)涌現(xiàn)出非常多的,優(yōu)秀的,我們能夠看得到的機(jī)器人產(chǎn)品,我們也在跟一些國內(nèi)比較大的機(jī)器人廠商做深度合作。
其實(shí)在機(jī)器人這塊,如果從產(chǎn)品的角度來看,剛才我們提到產(chǎn)品的核心定位的需求是非常關(guān)鍵的。從核心的人機(jī)交互的角度來看,語音技術(shù)、圖像識(shí)別技術(shù),以及體感等等一系列的多模塊的發(fā)展是非常關(guān)鍵的。我們希望以語音、人臉、圖像等等一系列作為核心的交互手段的這么一些多模態(tài)交互的算法,以及產(chǎn)業(yè)化的進(jìn)方面,我們也在做相關(guān)的努力。
首先,從人跟人的交互來看,最自然的是語音的交互。我們延伸到人跟機(jī)器的交互,其實(shí)語音也是最自然的入口。比較接地氣的說法是,我們和100多家機(jī)器人廠商交流,他們提出來一個(gè)核心的需求,對(duì)于語音的交互是非常感性的,我們能夠看到在這里面,語音技術(shù)確確實(shí)實(shí)是一個(gè)在這個(gè)領(lǐng)域里面非常重要的一點(diǎn)。
在機(jī)器人的交互方面思必馳有一些具有突破性的進(jìn)展,我們可以演示一下,機(jī)器在說話的過程中,作為一個(gè)語音合成的技術(shù)是非常成熟的。傳統(tǒng)的語音合成會(huì)比較機(jī)械一些,我們?cè)跈C(jī)器人的交互里面,機(jī)器人可能首先是個(gè)人,在這方面的需求它所發(fā)出的聲音,我們希望它盡量有感情,有韻律。
其次,從人機(jī)交互的角度來看,核心技術(shù)的推動(dòng),以及對(duì)于人機(jī)交互更自由的使用場(chǎng)景其實(shí)要求非常高。對(duì)于機(jī)器人上面,其實(shí)機(jī)器人往往有可能會(huì)動(dòng),甚至離你有一定距離的產(chǎn)品,這樣的話它對(duì)于語言識(shí)別、人機(jī)交互的難度會(huì)大大增加。這是第二點(diǎn)在技術(shù)的角度。
第三,機(jī)器人的交互需要深度的理解他的對(duì)話,以及深度理解以后給出一些反饋。
第四,目前在機(jī)器人行業(yè)里面,大家會(huì)發(fā)現(xiàn),每一類的機(jī)器人都會(huì)有自己定位準(zhǔn)確的應(yīng)用領(lǐng)域。有的在銀行,有的在商場(chǎng),還有一些針對(duì)小孩,還有一些針對(duì)老人。其實(shí)語音識(shí)別的定制以及語意的定制還有對(duì)話的定制就非常重要的。同時(shí)在定制的過程當(dāng)中,包括有一些喚醒功能的定制也很有必要。
第五,本地識(shí)別。我們很多產(chǎn)品在使用的時(shí)候會(huì)受到網(wǎng)絡(luò)的限制,甚至沒有網(wǎng)絡(luò)。我們希望我們的機(jī)器人不至于變成一個(gè)“傻”玩具。這里面需要在技術(shù)上提供云端跟本地相結(jié)合的混合引擎。
第六,為什么很多人認(rèn)為機(jī)器人就是一個(gè)加了殼的平板,里面缺靈魂。那么這個(gè)機(jī)器人到底能給我?guī)硎裁幢憷??這里面涉及到一些后端服務(wù)的整合。我們希望打造成一個(gè)比較完整的解決方案,這個(gè)是在做人工智能的時(shí)候需要去深度研究的事情。
從人工智能技術(shù)的角度講,這是一個(gè)技術(shù)性非常強(qiáng)的行業(yè),我們思必馳在這個(gè)領(lǐng)域,對(duì)于技術(shù)研發(fā)的投入,包括未來的方向我們有自己的一些看法,核心的幾個(gè)點(diǎn),一個(gè)在對(duì)話交互方面,在對(duì)話的交互里面,上下文的理解非常重要。第二是情緒的合成,我們需要一些有情緒,有韻律的機(jī)器人,而不是非常干巴巴的機(jī)器人。
免責(zé)聲明
① 凡本網(wǎng)未注明其他出處的作品,版權(quán)均屬于激光制造網(wǎng),未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用。獲本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使
用,并注明"來源:激光制造網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其相關(guān)責(zé)任。
② 凡本網(wǎng)注明其他來源的作品及圖片,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本媒贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),版權(quán)歸原作者所有,如有侵權(quán)請(qǐng)聯(lián)系我們刪除。
③ 任何單位或個(gè)人認(rèn)為本網(wǎng)內(nèi)容可能涉嫌侵犯其合法權(quán)益,請(qǐng)及時(shí)向本網(wǎng)提出書面權(quán)利通知,并提供身份證明、權(quán)屬證明、具體鏈接(URL)及詳細(xì)侵權(quán)情況證明。本網(wǎng)在收到上述法律文件后,將會(huì)依法盡快移除相關(guān)涉嫌侵權(quán)的內(nèi)容。
相關(guān)文章
網(wǎng)友點(diǎn)評(píng)
0 條相關(guān)評(píng)論
熱門資訊
精彩導(dǎo)讀
關(guān)注我們
關(guān)注微信公眾號(hào),獲取更多服務(wù)與精彩內(nèi)容