近些年來, Google、Microsoft和Facebook等幾大玩家都創(chuàng)建了自己的AI研發(fā)團隊,并取得了一些令人矚目的成果。
2015年11月9日,谷歌宣布TensorFlow開源,這是一個在GPU上進行快速梯度式機器學習的巨大數(shù)據(jù)庫。一些文章推測TensorFlow會帶來一場人工智能革命,稱谷歌的這一舉動很大膽,因為Torch(由Facebook人工智能實驗室的Ronan Collobert維護)已經(jīng)提供了相似的深度學習開放資源,同時Yoshua Bengio教授的實驗室對Theano(深度學習領域的先驅,一個適合普通大眾的革命性軟件)已經(jīng)進行了長期的維護開發(fā)。在Wired的一篇文章中,Cade Metz把TensorFlow描述成谷歌的”人工智能引擎“。
這篇文章講的是進行線性代數(shù)和求導計算的開源數(shù)據(jù)庫,甚至標題也十分夸張。許多其他新聞報道中,卻對谷歌把代碼設為公開資源感到驚詫。從更加技術的一方來看,從夸張的贊揚到潑冷水,各種反響都有。Soumith Chintala發(fā)布了一套應對所有競爭軟件包的標準,為人們提供了一種定量的評價,它顯示TensorFlow的首個版本落后于Torch和Caffe,特別在卷積神經(jīng)網(wǎng)絡方面。
神經(jīng)網(wǎng)絡使用硬件和軟件搭建出了類似于人腦的神經(jīng)元網(wǎng)絡,這可以追溯到上世紀80年代,但直到2012年,Krizhevsky和Hinton才開始發(fā)明在圖形處理器(GPU)上運行神經(jīng)網(wǎng)絡的技術。GPU原本是為游戲和其它高性能圖像軟件設計的專用處理芯片,但事實證明,它們也非常適合驅動神經(jīng)網(wǎng)絡。
谷歌、Facebook、Twitter、微軟和其它許多公司現(xiàn)在都使用GPU驅動的人工智能來處理圖像識別等多種任務,包括互聯(lián)網(wǎng)搜索和安全應用等。Krizhevsky和Hinton后來加入了谷歌。
微軟的一個研究團隊設計了一個遠比“典型設計”復雜的神經(jīng)網(wǎng)絡,該網(wǎng)絡能夠進行多達152層的復雜數(shù)學運算,而典型設計一般只有六到七層。這預示著未來幾年,微軟這樣的公司將能使用GPU及其它專用芯片的龐大集群來極大提升包括圖像識別在內的各種各樣的人工智能服務,包括識別語音甚至理解人類自然表達的口語。但是建造這樣的大型神經(jīng)網(wǎng)絡是極其困難的。
為了確定每一層的工作模式以及與其它層的通信方式,需要將不同的特定算法部署到每一層上,但這卻是一個極其艱難的任務。但微軟在這里也有技巧。他們設計了一個能夠幫助他們建造這些網(wǎng)絡的計算系統(tǒng)。研究人員可以識別一些可能有用的大型神經(jīng)網(wǎng)絡部署方式,然后該計算系統(tǒng)可以在一系列的可能性上對此進行循環(huán)計算,直到確定出最佳選擇。
據(jù)深度學習創(chuàng)業(yè)公司Skymind的首席研究專家Adam Gibson介紹,類似的做法現(xiàn)在越來越普遍。這被稱為“超參數(shù)優(yōu)化”(hyper parameter optimization)。
他說:”人們可以讓一群機器跑起來,一次運行10個模型,然后找出最好的那個使用就行了。他們可以輸入一些基本參數(shù)(基于直覺確定),然后機器在此基礎上確定什么才是最好的解決方案。“Gibson說,去年Twitter收購的一家公司W(wǎng)hetlab就提供了類似的”優(yōu)化“神經(jīng)網(wǎng)絡的方法。
預計2016年將會是機器情緒識別的分水嶺,而且情緒會成為我們與機器交互的強有力的新通道,并且由于照相機技術和計算機視覺算法的發(fā)展,未來機器通過我們人類的面部表情、眼動方式、肢體語言、說話方式甚至抬頭等理解我們的能力會大大提高。
卡耐基梅隆大學機器人研究所的Fernando De la Torre發(fā)明了特別強大的面部識別軟件,被稱作 IntraFace。他的團隊采用機器學習的方法來教IntraFace如何以一種適用于大多數(shù)面孔的方式來識別和追蹤面部表情。然后他們創(chuàng)建了個性化算法能夠讓軟件對個人進行情感表達分析。不僅準確,而且高效,該軟件甚至能在手機上運行。
未來機器能更加理解我們的情緒,我們與機器的交互也會變得更加豐富。卡耐基梅隆大學的Justine Cassell研究虛擬同伴在教育行業(yè)的應用,她發(fā)現(xiàn)當虛擬同伴能對學生們的情緒狀態(tài)做出適當反應,甚至在某些場合嘲笑他們時,學生們會更積極地參與也會學得更好。不難想象商業(yè)領域會多么喜歡用這個功能,廣告人、營銷人以及電影制片人能得到客戶群體更為具體的信息。
在醫(yī)療與AI的結合方面,目前醫(yī)生問診的依據(jù)主要是病人當次檢查留下的醫(yī)學影像信息,而在確診時幾乎忽略了既往病史、家族病史和測試結果的影響。但試想一下,如果病人的各項身體數(shù)據(jù)都可以被實時地、連續(xù)地記錄,并且有一個足夠智能的醫(yī)療診斷系統(tǒng)可以將這些數(shù)據(jù)與全世界范圍內有相似癥狀病人的數(shù)據(jù)進行比較,在此基礎上加以當前臨床醫(yī)學的研究和指導,綜合給出診斷建議的話,是不是會精確和科學許多?
一家名為Sentrian的生物傳感器研究公司已經(jīng)研發(fā)出可以完成上述操作的醫(yī)療系統(tǒng)。該公司總部位于美國佛羅里達州,致力于機器學習的相關研究,目前該智能醫(yī)療系統(tǒng)已進入臨床測試階段。他們希望創(chuàng)建一個讓醫(yī)生實時關注病人身體數(shù)據(jù),進而做出具有更好、更早、更加個性化診斷方案的醫(yī)療系統(tǒng)。
現(xiàn)在利用無線生物傳感器可以收集一些簡單或者較為復雜的身體信息,例如體溫,心率,血氧飽和度和血鉀含量等等。通常,每名遠程病人每次只佩戴一至兩個傳感器,他們的數(shù)據(jù)就可以被醫(yī)生直接分析。如果病人持續(xù)佩戴多個傳感器,產生的數(shù)據(jù)就會非常龐大。
Sentrian公司的醫(yī)療系統(tǒng)收集完病人數(shù)據(jù)后利用機器學習算法進行分析。該系統(tǒng)內包含慢性疾病(包括心臟病,糖尿病,慢性阻塞性肺疾病等等)的身體數(shù)據(jù)變化信息,病人的信息將會與這些信息進行匹配比較,系統(tǒng)通過觀察細微的關聯(lián)進行早期確診。心率、血壓、血氧飽和度等信息也會被傳至云端進行分析,在必要時通知醫(yī)生。