一文讀懂神經AI

2022年09月14日 09:35:21 來源：微信公眾號：紅杉匯

　　在科學家研究AI的時候，一般會試圖模仿大腦的運作來制造智能機器。在這個過程中，他們發現可以借助AI的力量來反向研究大腦的結構。這一新興的AI技術被稱為“神經AI(neuroAI)”。

　　試想一下，十年后，我們能夠通過下載的方式來讓大腦調用不同的AI模型，從而直接完成物體識別或者像AI一樣便捷地處理自然語言，就好像租用了一個更高效的大腦。實現這一切，只需要科學家們能夠利用AI打造出更精細的硅基大腦模型。到那時，作為人類的我們，看東西、感知世界的方式將變得與眾不同。

　　另外，神經AI還能夠在工業、藝術創意、健康改善等領域大放異彩。比如，神經AI通過生成正確的圖像和聲音，將幫助剛做完準分子激光手術或人工耳蝸植入手術的人更快恢復視力或聽力，甚至幫助醫療衛生領域實現新的突破。這些創新還將有益于其他新技術的發展，如增強現實(AR)與腦機接口(BCI)將會因此變得更加強大。

　　在這篇文章中，你將會了解什么是神經AI，它將如何進化并開始影響我們的生活、如何支撐其他創新與技術的發展，以及我們還需要做些什么來推動它更好發展。

　　每期監測和精編中文視野之外的全球高價值情報，為你提供先人一步洞察機會的新鮮資訊，為你提供升級思維方式的深度內容，是為[ 紅杉匯內參 ]。

　　什么是神經AI？

　　神經AI是一門新興學科，旨在：1)通過研究人的大腦來促進AI技術發展;2)利用AI來更好地研究人的大腦。神經AI的核心工具之一是使用人工神經網絡來創建特定大腦功能的計算機模型。這種方法始于2014年，當時麻省理工學院和哥倫比亞大學的研究人員發現，深度人工神經網絡可以解釋大腦的物體識別區域——顳下皮層(IT)的反應過程。于是他們引入了一個基本的實驗方法：將人工神經網絡與大腦進行比較。然后反復迭代測試各種大腦反應過程：形狀識別、運動處理、語音處理、手臂控制、空間記憶等，并相應建立各個反應對應的大腦處理模型。

　　1. 訓練硅基人工神經網絡來解決如物體識別之類任務。由此產生的網絡被稱為任務向神經網絡。重點是，它通常只需要圖像、影片和聲音來訓練模型，而不需要大腦數據。

　　2. 使用如線性回歸或表征相似性分析之類的統計分析法，來比較訓練后的人工神經網絡的中間激活值與真實的大腦數值。

　　3.選擇表現*的模型作為當前大腦區域的*模型。

　　該方法中的真實大腦數據，可通過單個神經元獲得，或以非侵入性技術如腦磁圖(MEG)或功能性磁共振成像(fMRI)來收集大腦內部數據。

　　大腦部分區域的神經AI模型有兩個關鍵特征。首先它是可計算的——給這個計算機模型提供刺激變量，它將能算出相應的大腦區域會如何反應。其次它也是可微分的——它是一個深度神經網，我們可以運用和研究視覺識別與自然語言處理模型相同的方式進行優化。也就是說，神經科學家可以借助所有推動深度學習革命的強大工具來更好做研究，包括PyTorch和TensorFlow等張量代數系統。

　　這意味著，我們將實現巨大的技術跨越——從不了解大腦的大部分運作機理，到能做出可下載的部分區域的模型。

　　神經AI的應用領域

　　藝術和廣告

　　我們感知各種媒體，99%是通過眼睛和耳朵。眼睛和耳朵本身并不負責解釋體驗，它們只是傳感器：是我們的大腦在處理和理解這些信息。面對不同的傳媒內容，我們大腦會根據我們的所見所聞解析出不同的思考與情感，但是被解析出的結果，不一定是創作者想要傳達的、被受眾接受的。

　　所以，如果想要確定一個作品中預留的信息是否如預期那樣被受眾接收，就需要不斷地測試。一些互聯網公司中，比較流行的解決辦法是使用“A/B測試”。比如，谷歌曾測試過50種不同深淺的藍色用在顯示搜索結果的超鏈接上，最終他們找到的*解使谷歌的收入比基線提高了2億美元，約占當時谷歌收入的1%;Netflix會為用戶調整影片縮略圖以優化用戶體驗。

　　但是，如果我們能在不經過大流量測試，未獲得任何測試數據之前就能預測人們對某一媒體的反應呢?那樣，企業就能在未獲得太多關注之前更好地優化其書面材料和網站。神經AI在預測人們對視覺材料的反應方面已經做得越來越好。例如，Adobe的研究人員就正在研究相關的視覺設計工具，幫助設計人員更好地預測和引導人們的注意力。例如，通過編輯照片，使其在視覺上更令人難忘或更具美感。

　　另外，人工神經網絡甚至可以找到比現實圖像更有效地傳達信息的方法。OpenAI的CLIP工具便可以幫助你找到與想要傳達的情感相一致的圖像;再比如OpenAI和谷歌，可以根據文字提示生成逼真的圖像。

　　目前在優化視聽媒體、網站，尤其是廣告方面存在巨大的市場需求，而我們其實早就已經開始將神經AI和算法藝術引入這一過程了。巨大的市場需求會催生良性的發展循環，隨著越來越多的資源被投入到實際應用中，神經AI也將變得更好、更有用。作為副產品，因為獲得了更好的大腦模型，廣告以外的其他領域也將能一起受益。

　　可及性與算法設計

　　神經AI最令人興奮的應用之一是提高產品的可及性。

　　大多數媒體其實是為“一般普通人”設計的，然而每個人處理視聽信息的方式卻各不相同。比如有色盲困擾的人群和一般人群的信息處理方式是不同的，因此大量的媒體并不適合他們。雖然如今有不少產品可以模擬色盲效果，但需要一個色覺正常的人先為產品做解釋，然后才能去做相應的調整改變。直接做靜態的顏色重映射無法滿足他們需求，是因為有些材料在顏色重映射后語義會發生變化(例如，圖表會變得難以讀懂)。但有了神經AI之后，我們就可以在保持現有圖形語義的情況下，自動生成適合色盲閱讀的材料和網站。

　　另一個例子是，幫助有學習障礙的人，如閱讀障礙人群。閱讀障礙的一個深層原因是對擁擠十分敏感，因此難以識別具有相似基本特征的形狀。而麻省理工學院正在研究一種閱讀障礙者的視覺系統神經AI模型，可以幫助設計既美觀又能讓他們順利閱讀的字體。這些都是潛在的、亟待實現的生活質量的巨大改善。

　　健康

　　許多神經科學家在進入這一領域時，都希望自己的研究能對人類健康產生積極影響，特別是對患有神經系統疾病或精神健康問題的人。利用神經AI模型，有機會開啟新的療法——獲得優良的大腦模型后，便可以精心設計正確的刺激，來傳遞相應的信息，就像鑰匙和鎖的匹配一樣。從這個意義上說，神經AI的應用類似于算法藥物設計，但我們在人體內釋放的不是藥物小分子，而是圖像和聲音。

　　眼睛和耳朵的感受器方面的問題是最有可能先被解決的，因為這些感受器目前已經有了很好的建模。比如人工耳蝸植入手術可以在神經AI大腦模型的幫助下，優化植入物的刺激模式，放大語音來優化助聽效果。

　　許多人在一生中都會經歷感官系統的變化，比如近視。在變化之后，人會通過不斷學習來讓大腦重新適應這個世界，更好地理解新的知覺信息，這種現象稱為知覺學習。神經AI能夠放大這種知覺學習，讓人們能更快更有效地恢復感知技能。類似的，還有通過神經AI技術幫助那些在中風后失去流暢移動四肢能力的人;優化健康人類的感官體驗——比如輔助棒球運動員、弓箭手或病理學家的訓練等。

　　最后，我們發現這些技術在情緒障礙的治療方面也能大有所為。我們可以通過感官體驗來治療情緒障礙。比如我們知道，用電刺激控制大腦特定部位的活動可以緩解“頑固型抑郁癥”(treatment-resistant depression)，有了神經AI后，或許通過感官間接控制大腦的活動也可以獲得類似的效果。

　　增強現實

　　一個將使神經AI應用變得更加強大的技術是AR眼鏡。因為可以*融入到我們的日常生活中，AR技術具備著成為無處不在的計算平臺的潛力。眾多科技巨頭、互聯網巨頭都在加快步伐研究更高階的AR眼睛，所以在供應方面就已經有巨大的推動力在助推其發展。而這將使人們廣泛使用上一種比今天的靜態屏幕強大得多的顯示設備。

　　如果參照VR設備的發展軌跡，它最終還會將眼球追蹤功能集成進來。也就是說，我們可以遠遠超越目前可能的技術手段，以更可控的方式實現更廣泛的視覺刺激。另外這些設備在健康領域也將具有非常深遠的應用前景。

　　腦機接口（BCI）

　　有了出色的顯示器(圖像)和揚聲器(聲音)，我們可以精確控制大腦的主要輸入信號。而通過感官傳遞刺激的下一個更強大的階段，是通過只讀的腦機接口(BCI)驗證大腦是否以預期的方式做出反應。如此一來，我們便可以評估刺激對大腦的影響，如果不符合預期，還可以在所謂的閉環控制中做相應的調整。

　　我們并不需要在顱內植入芯片或者深層腦刺激器，因為這樣簡單的評估，在顱外以非侵入性的方式測量大腦活動已經足夠了。我們也不需要通過BCI直接刺激大腦，眼鏡和耳機就能控制大腦的大部分輸入。目前，有許多非侵入性只讀BCI已經商業化或正在籌備中，可用于閉環控制。一些例子包括：

　　•腦電圖(EEG)。腦電圖測量的是顱骨外的大腦電活動。由于頭骨相當于一個容積導體，因此腦電圖的時間分辨率很高，但空間分辨率很低。當我們獲得了刺激的控制權，腦電圖便能發揮更強大的作用——比如可以將刺激與腦電圖信號關聯起來，然后解碼什么刺激能吸引注意力(誘發電位法)。

　　•功能性磁共振成像(fMRI)。fMRI測量的是與神經活動相關的血氧含量的微小變化，它是*能夠以空間上精確的方式非侵入性地讀取大腦深處活動的技術。對于閉環神經控制方面來說，有兩種范式相對成熟。*種是基于fMRI的生物反饋;第二種是皮質圖譜。這兩種方法都表明，想要評估神經AI對大腦的刺激效果完全是有可能的。

　　•近紅外腦功能成像(fNIRS)。fNIRS通過漫射光來測量發射器與接收器之間的腦血容量。傳統的近紅外成像的空間分辨率較低，但通過時間門控(TD-NIRS)和大規模超采樣(漫反射光學斷層成像)，空間分辨率會有一定提升。在學術方面，WUSTL的Joe Culver小組已經實現了對視覺皮層的影片解碼。而在商業方面，Kernel現在正在制造和銷售TD-NIRS頭盔，這是十分驚人的工程壯舉。這是一個人們不斷推動的領域，而且進展迅速。

　　•腦磁圖(MEG)。腦磁圖通過測量磁場的微小變化來定位大腦活動。MEG與EEG類似，它測量電磁場的變化，但它可以不受容積導體的影響，因此具有更好的空間分辨率。人們在光泵磁強計(optically pumped magnetometers，OPM)方面也正不斷取得進展，將來我們將有可能在公開市場上購買單個OPM傳感器。

　　除了這些比較知名的技術外，一些黑馬技術，如數字全息技術(digital holography)、光聲斷層掃描技術(photo-acoustic tomography)和功能性超聲技術(functional ultrasound)，則可能會極大加速這一領域的范式轉變。

　　雖然消費級的非侵入式BCI仍處于起步階段，但圍繞著AR用例的旺盛需求將不斷推動市場將蛋糕做大。我們可能會看到低維BCI的迅速發展，上面提及的各種神經AI應用就很有可能成為真正的現實。

　　文章內容僅供閱讀，不構成投資建議，請謹慎對待。投資者據此操作，風險自擔。

海報生成中...