閱讀 | 訂閱
閱讀 | 訂閱
3D新聞

科學(xué)家借用3D打印技術(shù)解決“雞尾酒會問題”

星之球激光 來源:天工社2015-08-13 我要評論(0 )   

在計算機語音識別領(lǐng)域有一個著名的難題雞尾酒會問題(Cocktail Party Problem),說的是當前語音識別技術(shù)已經(jīng)可以以較高精度識別


在計算機語音識別領(lǐng)域有一個著名的難題——“雞尾酒會問題(Cocktail Party Problem)”,說的是當前語音識別技術(shù)已經(jīng)可以以較高精度識別一個人所講的話,但是當說話的人數(shù)為兩人或者多人時,語音識別率就會極大的降低。計算機無法將目標聲音與其他人同時發(fā)出的聲音區(qū)別開來。

如今,來自美國杜克大學(xué)的科學(xué)家們使用一種簡單的3D打印裝置,巧妙地解決了這個問題??茖W(xué)家們?yōu)榇嗽凇?/span>Proceedings of the National Academy of Sciences》雜志上發(fā)表了一篇論文介紹了這個奇妙的3D打印解決方案。

他們首先制造出了一個又大又厚的3D打印塑料盤,在塑料盤的一面有36個開口,以及許多蜂窩狀的通道通向塑料盤中心的一個麥克風(fēng)。它本質(zhì)上是一個結(jié)合了聲學(xué)超材料和壓縮傳感技術(shù)的單一傳感器聽音系統(tǒng)。

 

“與以前的研究通常依賴于信號和語音處理技術(shù)來解決“雞尾酒會”問題不同,我們提出的方法是一個獨特的基于硬件的方法,主要利用了經(jīng)過精心設(shè)計的聲學(xué)超材料。”研究人員寫道,“我們堅信,這一方法不僅能夠解決過去數(shù)十年來各個領(lǐng)域的研究人員一直孜孜以求的雞尾酒會聽音問題,而且這種將物理層的設(shè)計與計算感知相結(jié)合的系統(tǒng)設(shè)計方法將會對傳統(tǒng)的聲學(xué)傳感和成像方式產(chǎn)生影響。”

這項研究是在Steven CummerYangbo Xie的領(lǐng)導(dǎo)下進行的。

 

那么它的工作原理到底是什么呢?研究人員稱,這36個通向麥克風(fēng)的通道每個都有著獨特的3D打印形狀導(dǎo)致其功能特性有所區(qū)別,使得聲音傳向中心的方式有著微妙的不同,因而可以彼此區(qū)分,并被單個傳感器接收。Yangbo Xie稱,我們?nèi)祟悷o法區(qū)分其中的差別,但是基于該傳感器的算法幾乎總是可以告訴我們這些聲音是從哪個想來的。

 

至于該解決方案的正確性。研究人員在其論文中宣稱:“這款帶有共振超材料緊湊陣列的設(shè)備被證明可以區(qū)分識別來自三個獨立來源的重疊音頻,正確率高達96.67%。”。這個簡單、但有效的方法已被人們譽為一個優(yōu)秀的解決方案。不過目前唯一的問題是它的大小——它大約相當于一個很厚的比薩,但是顯然它具有足夠的空間優(yōu)化設(shè)計,并用于進一步的應(yīng)用。杜克大學(xué)的科學(xué)家們表示,它可以適用于助聽器等聲學(xué)成像和傳感應(yīng)用,所以我們可能會在不久的將來看到這項技術(shù)的一個更小版本。

轉(zhuǎn)載請注明出處。

3D打印計算機語音識別“雞尾酒會問題”
免責(zé)聲明

① 凡本網(wǎng)未注明其他出處的作品,版權(quán)均屬于激光制造網(wǎng),未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用。獲本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使 用,并注明"來源:激光制造網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其相關(guān)責(zé)任。
② 凡本網(wǎng)注明其他來源的作品及圖片,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本媒贊同其觀點和對其真實性負責(zé),版權(quán)歸原作者所有,如有侵權(quán)請聯(lián)系我們刪除。
③ 任何單位或個人認為本網(wǎng)內(nèi)容可能涉嫌侵犯其合法權(quán)益,請及時向本網(wǎng)提出書面權(quán)利通知,并提供身份證明、權(quán)屬證明、具體鏈接(URL)及詳細侵權(quán)情況證明。本網(wǎng)在收到上述法律文件后,將會依法盡快移除相關(guān)涉嫌侵權(quán)的內(nèi)容。

網(wǎng)友點評
0相關(guān)評論
精彩導(dǎo)讀