作者: Cade Metz 機(jī)器之心編譯 參與:馬世豪、李亞洲
構(gòu)建人工智能系統(tǒng)太難了,于是 Faceook 開發(fā)了一個(gè)人工智能系統(tǒng)自己構(gòu)建人工智能。
深度神經(jīng)網(wǎng)絡(luò)正在重塑互聯(lián)網(wǎng)。這樣的人工智能系統(tǒng)因?yàn)橛辛送ㄟ^分析海量數(shù)據(jù)學(xué)習(xí)每樣人類任務(wù)的能力,從而為網(wǎng)絡(luò)在線服務(wù)注入了以前無法實(shí)現(xiàn)的新力量。它們能在照片中識(shí)別人臉、識(shí)別智能手機(jī)的語音指令、還能進(jìn)行機(jī)器翻譯。它們甚至在幫助谷歌選擇搜索結(jié)果。這些我們都知道,但往往較少提及的是互聯(lián)網(wǎng)巨頭們?nèi)绾稳ソㄔ爝@些相當(dāng)了不起的人工智能引擎。
其中一個(gè)做法是,谷歌和 Facebook 這樣的公司花高價(jià)聘請(qǐng)那些頂級(jí)聰明的人。地球上只有幾百人有這樣的天賦和技能來真正推動(dòng)人工智能事業(yè)的發(fā)展。在這些頂級(jí)大腦上的投入抵得上一個(gè) NFL(美國橄欖球聯(lián)盟) 四分衛(wèi)的工資。這是人工智能不斷發(fā)展進(jìn)步的一個(gè)瓶頸,而且這并不是唯一一個(gè)瓶頸。即使是頂尖的研究者們,在沒有大規(guī)模反復(fù)試驗(yàn)的情況下,也無法建立這樣的人工智能服務(wù)。要構(gòu)建一個(gè)解決人工智能難題的深度神經(jīng)網(wǎng)絡(luò),研究人員在成功前一定會(huì)嘗試無數(shù)種方式,并一個(gè)一個(gè)的在幾十、幾百個(gè)機(jī)器上運(yùn)行。
Google 旗下 DeepMind 公司的聯(lián)合創(chuàng)始人Demis Hassabis 說,「這更像是做教練而不是球員,你忽悠著把這些東西傳達(dá)出來,而不是直接告訴機(jī)器做什么!
這就是為什么許多公司現(xiàn)在正試圖把反復(fù)試驗(yàn)(trial and error)的過程自動(dòng)化,或至少使其一部分自動(dòng)化。如果你把核心關(guān)鍵自動(dòng)化了,你可以更快速地將最新的機(jī)器學(xué)習(xí)推廣到普通工程師手中,頂級(jí)天才將會(huì)有更多的時(shí)間思考更好的想法、解決更困難的問題。反過來,這也會(huì)加速我們?nèi)粘J褂玫木W(wǎng)絡(luò)服務(wù)和 App 背后的人工智能的進(jìn)程。
換句話說,要讓計(jì)算機(jī)變得更聰明、更快,電腦本身必須處理更繁重的工作;ヂ(lián)網(wǎng)巨頭們正在制造能夠替代工程師測(cè)試無數(shù)機(jī)器學(xué)習(xí)算法的計(jì)算系統(tǒng),并且這種系統(tǒng)自身能夠不斷測(cè)試各種可能性。更好的是,這些公司正在開發(fā)可以幫助建立人工智能算法的人工智能算法。這并非開玩笑。在Facebook內(nèi)部,工程師們已經(jīng)設(shè)計(jì)一個(gè)他們稱之為「自動(dòng)機(jī)器學(xué)習(xí)工程師」的人工智能系統(tǒng),一個(gè)幫助開發(fā)人工智能系統(tǒng)的系統(tǒng)。雖然離完美還有很大距離,但最終目標(biāo)是用盡可能少的人力工作創(chuàng)造新的人工智能模型。
感受下 Flow
在 Facebook 2012 年 1040 億美元的 IPO 之后,F(xiàn)acebook 廣告團(tuán)隊(duì)的 Hussein Mehanna 和其他工程師在改良公司的廣告定位上倍感壓力,因?yàn)樗鼈冃枰_地把廣告和數(shù)以百萬計(jì)使用社交網(wǎng)絡(luò)的用戶匹配起來。這意味著構(gòu)建的深度神經(jīng)網(wǎng)絡(luò)和其他機(jī)器學(xué)習(xí)算法需要更好地利用 Facebook 收集到的大量數(shù)據(jù)。這些數(shù)據(jù)來源于數(shù)以百萬計(jì)的用戶的特性和行為愛好。
據(jù) Mehanna 所說,F(xiàn)acebook 工程師們?cè)谙氤鲂碌娜斯ぶ悄茳c(diǎn)子上毫無壓力,但測(cè)試這些想法卻又是另一回事。于是他和他的團(tuán)隊(duì)開發(fā)了一個(gè)叫做 Flow 的工具。Mehanna 說,「我們想建立一個(gè)機(jī)器學(xué)習(xí)裝配線,讓 Facebook 所有的工程師都可以使用!乖O(shè)計(jì) Flow 的目的是幫助工程師大規(guī)模的開發(fā)、測(cè)試和執(zhí)行機(jī)器學(xué)習(xí)算法。這是一個(gè)廣泛的技術(shù),涵蓋了完成自我學(xué)習(xí)任務(wù)的所需的所有服務(wù),也幾乎包括了任何形式的機(jī)器學(xué)習(xí)技術(shù)。
基本來說,工程師們可以很容易地測(cè)試公司龐大的計(jì)算機(jī)數(shù)據(jù)中心網(wǎng)絡(luò)層出不窮的想法。他們可以運(yùn)行測(cè)試各種算法的可能性,這些算法所涉及的不只是深度學(xué)習(xí),還有其他形式的人工智能,包括對(duì)數(shù)幾率回歸到 Boosted 決策樹,而測(cè)試的結(jié)果還可以提供更多的想法。Mehanna 說,「嘗試越多的點(diǎn)子、越多的數(shù)據(jù)就越好。」這也意味著工程師們可以很容易地對(duì)其他人寫的算法進(jìn)行再利用,對(duì)這些算法進(jìn)行微調(diào)然后應(yīng)用到其他任務(wù)。
很快,Mehanna和他的團(tuán)隊(duì)在全公司推廣使用 Flow。在其他團(tuán)隊(duì)里,它可以幫助生成各種算法:選擇 Facebook News Feed 的連接、識(shí)別發(fā)布到社交網(wǎng)絡(luò)照片里的面孔、為照片生成音頻描述從而讓盲人理解照片內(nèi)容。它甚至可以幫助公司確定世界的哪些部分還需要接通互聯(lián)網(wǎng)。
Mehanna 說,在 Flow 的幫助下,F(xiàn)acebook 每個(gè)月訓(xùn)練和測(cè)試約 30 萬個(gè)機(jī)器學(xué)習(xí)模型。曾經(jīng) Facebook 每 60 天左右才把一個(gè)新的人工智能模型推送到其社交網(wǎng)絡(luò)上,而現(xiàn)在每周就可以推送幾個(gè)新的模型。
下一個(gè)前沿
這個(gè)想法要比 Facebook 本身重要的多。這是全球深度學(xué)習(xí)領(lǐng)域共同的實(shí)踐。去年,Twitter 收購了一個(gè)叫做 Whetlab的創(chuàng)業(yè)公司,專門從事這樣的工作。最近,微軟也透露出其研究人員如何使用一個(gè)系統(tǒng)測(cè)試海量的人工智能模型。微軟研究人員 Jian Sun 把它稱之為「人類輔助搜索。」
Mehanna 和 Facebook 想要加快這個(gè)進(jìn)程。公司計(jì)劃最終把 Flow 開源,與世界分享 Flow。據(jù) Mehanna 所言,諸如LinkedIn、Uber 和 Twitter 都對(duì)使用 Flow 感興趣。Mehanna 和他的團(tuán)隊(duì)還開發(fā)了一個(gè)工具叫 AutoML,可以減去工程師們更多的負(fù)擔(dān)。與 Flow 同時(shí)運(yùn)行的 AutoML 可以在沒有任何人為干預(yù)的情況下,自動(dòng)「清除」用來訓(xùn)練神經(jīng)網(wǎng)絡(luò)的和其他的機(jī)器學(xué)習(xí)算法的數(shù)據(jù),并做好測(cè)試準(zhǔn)備。Mehanna 設(shè)想的未來版本甚至可以收集自己的數(shù)據(jù)。但更有趣的是,AutoML 使用人工智能幫助開發(fā)人工智能。
正如 Mehana 所說,F(xiàn)acebook 每個(gè)月訓(xùn)練和測(cè)試約30 萬個(gè)機(jī)器學(xué)習(xí)模型。AutoML 可以使用這些測(cè)試結(jié)果來開發(fā)另一個(gè)機(jī)器學(xué)習(xí)模型,這個(gè)模型可以優(yōu)化整個(gè)機(jī)器學(xué)習(xí)模型的開發(fā)流程。是的,這可能讓你感到困惑。Mehana 把它與《盜夢(mèng)空間》相比,但它是行得通的。該系統(tǒng)可以自動(dòng)選擇行得通的算法和參數(shù)。「這幾乎可以在開發(fā)前就能預(yù)測(cè)到結(jié)果,」Mehana 如是說。
在 Facebook 的廣告團(tuán)隊(duì)里,工程師們甚至還開發(fā)了叫做 ASIMO 的「自動(dòng)機(jī)器學(xué)習(xí)工程師」,這個(gè)工具已經(jīng)推廣到公司的其他部門。據(jù) Facebook 表示,在有些情況下,它可以自動(dòng)增強(qiáng)和改進(jìn)現(xiàn)有模型,工程師可以把改進(jìn)后的模型立即應(yīng)用到網(wǎng)絡(luò)里。Mehanna 說,「它還不足以發(fā)明一種新的人工智能算法,但沿著這條路一直走下去誰又知道會(huì)怎樣!
這確實(shí)是一個(gè)很有趣的想法,一個(gè)讓科幻作家為之癡迷幾十年的想法:一個(gè)會(huì)自我建造的智能機(jī)器。其實(shí) ASIMO 并沒那么先進(jìn),但這確實(shí)是走向未來世界一大步。在未來,開發(fā)人工智能的人里面,不僅會(huì)有絕頂聰明的天才,還會(huì)有一些非人類的存在。
本文由機(jī)器之心編譯
|