版權歸原作者所有,如有侵權,請聯(lián)系我們
前言
想象一下,在緊張刺激的賽車(chē)游戲中,人類(lèi)需要迅速而精準地判斷何時(shí)踩下油門(mén)、何時(shí)巧妙地轉彎。在根據路況不斷改變行駛路徑的過(guò)程中,人類(lèi)大腦可以展現出敏捷的決策能力和反應速度。
然而,在人類(lèi)應對自如的賽車(chē)游戲中,傳統的神經(jīng)網(wǎng)絡(luò )模型只能做出確定性的決策,尚不具備人類(lèi)的感知行為能力。模擬人類(lèi)大腦的決策過(guò)程,始終是人工智能(AI)領(lǐng)域的一大挑戰。
如今,一種新型神經(jīng)網(wǎng)絡(luò )模型,有望讓 AI 系統像人類(lèi)賽車(chē)手一樣,權衡各種選擇,做出迅速、精準的決策。
近日,來(lái)自佐治亞理工學(xué)院的研究團隊便提出了一種神經(jīng)網(wǎng)絡(luò )模型 RTNet,這一模型不僅能夠生成隨機決策,還能達到類(lèi)似人類(lèi)決策的響應時(shí)間分布。
研究團隊通過(guò)全面的測試發(fā)現,RTNet 能夠再現人類(lèi)在準確性、響應時(shí)間和置信度上的所有特征,而且表現優(yōu)于多個(gè)當前先進(jìn)的神經(jīng)網(wǎng)絡(luò )模型。
相關(guān)研究論文以“The neural network RTNet exhibits the signatures of human perceptual decision-making”為題,發(fā)表在科學(xué)期刊 Nature Human Behaviour 上。
研究團隊表示,即使是功能強大的大語(yǔ)言模型(LLM)也會(huì )因為幻覺(jué)編造一些不切實(shí)際的回答,因此開(kāi)發(fā)一種更接近真實(shí)人腦的神經(jīng)網(wǎng)絡(luò )可能會(huì )使 AI 系統更加可靠。
像人類(lèi)一樣感知決策
近年來(lái),卷積神經(jīng)網(wǎng)絡(luò )(CNN)在 AI 圖像處理方面取得了很大進(jìn)展,甚至在醫學(xué)圖像處理等領(lǐng)域超過(guò)了人類(lèi)的水平,但在感知決策的認知模型中與人類(lèi)的表現仍相較甚遠。
傳統的 CNN 面對相同的輸入信號時(shí),輸出的結果總是確定的,而且在處理復雜度不同的圖像時(shí),花費的計算時(shí)間總是不變的。這也決定了 CNN 模型很難實(shí)現人類(lèi)大腦的感知決策水平,無(wú)法根據任務(wù)的復雜程度調整反應時(shí)間和準確度。
此前,為了解決這些問(wèn)題,一些研究團隊曾嘗試為神經(jīng)網(wǎng)絡(luò )引入隨機性和動(dòng)態(tài)性,開(kāi)發(fā)能夠生成動(dòng)態(tài)響應時(shí)間的神經(jīng)網(wǎng)絡(luò ),但這些模型無(wú)法處理復雜的圖像輸入,結果也是確定性的,還是沒(méi)有達到人類(lèi)的感知決策能力。
Google Research 和科羅拉多大學(xué)的研究團隊曾通過(guò)在深度神經(jīng)網(wǎng)絡(luò )的前饋網(wǎng)絡(luò )中引入傳播延遲來(lái)構建級聯(lián)網(wǎng)絡(luò ),產(chǎn)生了圖像可計算的動(dòng)態(tài)網(wǎng)絡(luò ),其通過(guò)決策計算資源隨時(shí)間增加的機制生成響應時(shí)間,從而允許響應通過(guò)每個(gè)處理步驟進(jìn)行不斷地演變。雖然模型可以模擬人類(lèi)感知決策的速度和準確度,但輸出結果還是確定性的,距離人類(lèi)的感知決策水平還有相當大的距離。
在這項研究中,Farshad Rafiei 等人將現代 CNN 與傳統認知模型相結合,創(chuàng )建了一個(gè)可進(jìn)行圖像計算、隨機且動(dòng)態(tài)的模型。因為該模型能夠模擬人類(lèi)的行為決策響應時(shí)間,故將它命名為 RTNet。
圖 | 模型的架構(來(lái)源:該論文)
他們通過(guò)對貝葉斯神經(jīng)網(wǎng)絡(luò )進(jìn)行采樣,獲得深度神經(jīng)網(wǎng)絡(luò )噪聲權重,然后在每個(gè)處理步驟,從這些有噪聲的權重分布中進(jìn)行采樣,來(lái)模擬神經(jīng)響應的隨機性。RTNet 也會(huì )積累每個(gè)選擇對應的輸出,直到其中一個(gè)選擇達到預定義的閾值。
為了驗證 RTNet 能夠適用于各種感知任務(wù),并做出類(lèi)似人類(lèi)感知決策的一些基本特征,他們對 RTNet 進(jìn)行了全面的評估測試。
他們設計了 “二選一” 的決策任務(wù),通過(guò)人為改變任務(wù)難度,來(lái)對比 RTNet 模型與 60名 參與者進(jìn)行決策判斷的響應時(shí)間和準確度,從而驗證 RTNet 在模擬人類(lèi)行為方面的出色表現。
人類(lèi)行為的一個(gè)核心特征就是決策具有隨機性,面對同樣的情況可能做出不同的決策,研究人員將人類(lèi)行為與 RTNet、CNet、BLNet 和 MSDNet 的行為進(jìn)行了比較。
實(shí)驗充分考慮了人類(lèi)決策的隨機性、增加響應時(shí)間帶來(lái)的準確性下降、復雜度高的決策導致的準確性降低等干擾因素,來(lái)驗證 RTNet 在決策上的隨機性是魯棒、可靠的。
圖 | 實(shí)驗參與者和四個(gè)神經(jīng)網(wǎng)絡(luò )模型在決策隨機性的表現(來(lái)源:該論文)
研究發(fā)現,模型表現出的決策隨機性隨著(zhù)任務(wù)難度的增加而增加,在 20% 的試驗中,RTNet 對兩個(gè)圖像表現出了不同的響應。雖低于人類(lèi)的反應水平,隨著(zhù)任務(wù)難度和速度要求的提高,RTNet 決策的隨機性也在提高。
與之相反,對于固定的任務(wù),CNet、BLNet 和 MSDNet 的決策是完全確定性的,并且沒(méi)有表現出任何隨機性。RTNet 在捕獲感知決策特征方面表現出優(yōu)于 CNet、BLNet 和 MSDNet 的特征,RTNet 也是唯一一個(gè)能夠模擬時(shí)間響應分布形狀和偏度,以響應任務(wù)難度進(jìn)行不同操作的模型。
不足與展望
總的來(lái)說(shuō),RTNet 表現出了類(lèi)人感知決策的關(guān)鍵特征,具有廣泛的應用前景。此外,RTNet 也為開(kāi)發(fā)更加逼真的 AI 模型提供了新的思路,未來(lái)在醫療診斷、自動(dòng)駕駛和人機交互等領(lǐng)域將發(fā)揮重要作用。
研究人員推測,RTNet 能夠匹配觀(guān)察到的人類(lèi)行為模式,主要是因為其內部機制更接近人類(lèi)產(chǎn)生響應時(shí)間的真實(shí)機制。RTNet 通過(guò)模仿重復呈現相同刺激的神經(jīng)元反應,在證據積累的過(guò)程中,自然地產(chǎn)生持久的神經(jīng)元激活,所以模型的輸出本質(zhì)上是隨機的。
但 RTNet 也存在一定的局限性,它在每次從選擇中進(jìn)行證據采樣的機制不是最佳的,且前饋路徑的每次掃描都獨立于先前的狀態(tài),但人腦一般當前的狀態(tài)會(huì )受到其先前狀態(tài)的影響。
研究人員表示,未來(lái)的研究可以進(jìn)一步優(yōu)化 RTNet 的生物學(xué)合理性,例如引入遞歸處理機制,并使用其他方法來(lái)設置每個(gè)連接的噪聲級別,來(lái)更好地模擬人類(lèi)大腦的處理方式。
歡迎掃碼關(guān)注深i科普!
我們將定期推出
公益、免費、優(yōu)惠的科普活動(dòng)和科普好物!