作者:ADRIENNE LAFRANCE
機器之心編譯出品
編譯:吳攀,賽坡
人類越來越傾向于依賴機器作為認識自己的方式。長期以來機械世界都為人體的工作方式提供著類比。
「在嘗試解釋生物學(xué)上,我們一直有技術(shù)上的類比,」卡內(nèi)基梅隆大學(xué)機器人學(xué)家Chris Atkeson 說,「有一種關(guān)于大腦如何工作的想法是覺得大腦是液壓的。人們描述液壓時鐘和心臟泵血。然后我們有了蒸汽機作為(我們身體)工作方式的類似。再然后我們有了電。」
1948 年,數(shù)學(xué)家和哲學(xué)家諾伯特·維納 出版了他的著作《控制論》,進一步擴大了這個傳統(tǒng);這本書使用計算機-大腦的類比奠定了人們現(xiàn)在思考信息時代的基礎(chǔ)。
當然,今天計算機已經(jīng)在解釋生命系統(tǒng)中占據(jù)了突出的位置。人們常常將大腦描述成計算機一樣,就好像我們的記憶是存儲在灰質(zhì)做成的硬盤中一樣。仔細審視一下,可以發(fā)現(xiàn)這樣類比的拙劣程度并不比其之前的比喻性的比較更少。而這樣的比喻的局限性是雙向的。機器學(xué)習(xí)是一種通過向計算機展示圖像或其它信息的大數(shù)據(jù)集來訓(xùn)練其識別模式的方法,該方法常被描述是以一定的方式教育計算機大腦「看見」世界。這就意味著:機器與人類都是在過去見過的事物的基礎(chǔ)上積累知識。
「計算機『看見』的每一樣事物都基于它『知道』什么……依賴于你的『看見』是什么含義!筰Robot 的軟件工程師 Emily Pittore 在給我的一封電子郵件中寫道,「我使用著重引號是因為我對過于隨意地將人類認知的語言應(yīng)用到計算機上有些猶豫!
「如果你說的『看見』是指『光學(xué)輸入』,那么計算機總是看見相同的事物,」她說。換句話說,機器會忽略輕微的美學(xué)亮點和傳感器噪聲,而「人類有一個遠遠更復(fù)雜的傳感器——眼球和大腦!
人類的視覺處理也會受到他們已知事物的嚴重影響——但他們實際看見或感知的可能會相差很大,甚至當輸入相同時也一樣。這是根據(jù)上個月發(fā)表在 Journal of Experimental Psychology 期刊上的一篇題為《人類感知和表現(xiàn)》的文章所得出的結(jié)論,該研究基于約翰霍普金斯大學(xué)研究者的發(fā)現(xiàn)。這些研究者進行了一系列實驗,以找到對阿拉伯字母的預(yù)先知識對不同的人感知阿拉伯字母的方式有怎樣程度的影響。
研究人員發(fā)現(xiàn),同樣的字母在不同的人看來是不同的,這依賴于他們是否能夠閱讀阿拉伯文。而盡管他們評估的關(guān)注點是字母,但研究者表示,這些發(fā)現(xiàn)也可適用于任何事物——物體、照片、插圖等等。總而言之結(jié)論是:你已知曉的東西將會極大影響你看事物的方式。這聽起來很直觀,對嗎?但是這些發(fā)現(xiàn)比它們看起來更為微妙。
「我們不只是說,『噢,你是專家,所以你看事物不一樣』!辜s翰霍普金斯大學(xué)認知科學(xué)研究生、該研究的主要作者 Robert Wiley 說,「微妙的一點是不只是你的顯性知識(explicit knowledge)會真正改變你的視覺系統(tǒng)。還有一些意識都無法觸及的事物。」
這就是為什么人類無法真正完全忘記事情的原因。因為我們首先就不知道怎么就解開所見與如何看見之間的連接。你可能會忘記一個事實或失去你曾擁有的某個技能,但卻沒有辦法探查——也就沒有辦法刻意改進——其發(fā)生的方式,在此過程中暴露給特定的輸入已經(jīng)改變了你的感知。
但是機器可以忘記。
事實上,一些計算機科學(xué)家表示為此目的而設(shè)計計算機正越來越重要。機器學(xué)習(xí)系統(tǒng)的部分承諾是計算機將有能力處理海量的數(shù)據(jù)流,比如類似人臉識別中的海量數(shù)據(jù)。在這些計算能力的作用下,整個產(chǎn)業(yè)都在發(fā)生改變。隨著通過龐大的網(wǎng)絡(luò)的敏感數(shù)據(jù)的激增,人類需要能夠告訴計算機什么時候和確切地怎樣忘記被稱為數(shù)據(jù)沿襲(數(shù)據(jù)沿襲,指的是記錄有關(guān)每個數(shù)據(jù)塊的包執(zhí)行和數(shù)據(jù)轉(zhuǎn)換的歷史紀錄)的海量信息,包括復(fù)雜信息、計算記錄以及由類腦計算網(wǎng)絡(luò)衍生出的信息。
「這樣的忘記網(wǎng)絡(luò)(forgetting system)必須仔細跟蹤數(shù)據(jù)沿襲,甚至需要跨統(tǒng)計處理或機器學(xué)習(xí),并使該沿襲對用戶可見,」來自利哈伊大學(xué)和哥倫比亞大學(xué)的計算機科學(xué)教授 Yinzhi Cao 和 Junfeng Yang 寫道,「他們讓用戶使用不用的粒度(granularity)水平指定要遺忘的數(shù)據(jù)……然后這些系統(tǒng)移除這些數(shù)據(jù)并還原其所帶來的影響,這樣今后所有的操作都會像該數(shù)據(jù)從未存在過一樣。」
Cao 和 Yang 在 2015 年的一篇論文中闡述了他們對該系統(tǒng)的想法,該論文與2015年發(fā)表在IEEE的期刊 Security & Privacy上。他們說,從一個更大的集合中擦除一個單獨的數(shù)據(jù)線程具有很多潛在的效益。一些人可以從一臺機器上移除他們的敏感個人數(shù)據(jù)。學(xué)者可以使用忘記(unlearning)來清理或矯正分析數(shù)據(jù),從而開發(fā)出更為精確的預(yù)測算法。
這種操作數(shù)據(jù)的能力可以被看做是它自身的安全威脅——比如說,如果數(shù)據(jù)被惡意篡改——但 Cao 表示,將有保護措施。比如:「在歐盟,移除與某人相關(guān)的的搜索結(jié)果之前,谷歌需要請求者的帶照片的身份證明的掃描件。」他在一封電子郵件中說,「這只是驗證的一種方法,還有其它方法涉及到用戶名/密碼、雙因素認證、指紋等等!
這一想法已經(jīng)讓計算機科學(xué)家們感到興奮了。Cao 和 Yang 接受了美國國家科學(xué)基金會 120 萬美元的資助以進一步發(fā)展這一概念。如果他們?nèi)〉昧顺晒,并且如果機器忘記真的可以像 Cao 和 Yang 建議的那樣,變成了一個至關(guān)重要且無處不在的計算功能,那么忘記系統(tǒng)(forgetting system)對人們思考人腦處理功能的方式又意味著什么呢?大概并不會有太多含義,直到新技術(shù)出現(xiàn)并提供一個更具說服力的類比。
「我們對大腦還有很多不理解,但我們確實知道他們并不神奇!辜~約大學(xué)心理學(xué)和神經(jīng)科學(xué)教授 Gary Marcus 去年在《紐約時報》上寫道,「它們只是物質(zhì)的異常復(fù)雜的排布。飛機可能飛起來并不像鳥,但它們都遵循于同樣的力進行升降。同樣道理,也沒有理由認為大腦可以免受計算定律的約束!
人類-機器的比喻從不完美,但它們可以是有用的,即使計算機可以以人類所不能的方式學(xué)習(xí)和忘記。「我們想用由這些巨型計算機器提供的概念模型做更多事,」文化人類學(xué)家 Margaret Mead 在 1948 年談?wù)撚嬎銠C時說道,據(jù) Ronald Kline 的著作 《The Cybernetics Moment》,「說人的身體是一臺機器沒有什么陷阱,而只是這些方法,尤其是數(shù)學(xué)家在這些機器問題中所使用的方法,可能是可用于更精確思考人類行為的工具。」
本文由機器之心原創(chuàng)
|