人工智能的邊界和挑戰(zhàn)是什么?現(xiàn)在走到了哪里,又該向何處去?5月24日-25日在成都舉辦的CCF年度盛會(huì)——2019 CCF青年精英大會(huì)(YEF 2019)上,人工智能領(lǐng)域?qū)<覀冋归_了討論,中國(guó)科學(xué)院張鈸院士給出的答案是“人工智能剛剛起步,現(xiàn)在離起點(diǎn)不遠(yuǎn),人工智能之路還很長(zhǎng),并且永遠(yuǎn)在路上。”
雖然人工智能技術(shù)的行業(yè)應(yīng)用越來越廣泛,仿佛真的站在風(fēng)口準(zhǔn)備擁抱下一場(chǎng)革命,但正如專家們所言,對(duì)于人工智能的發(fā)展,應(yīng)該保持謹(jǐn)慎的樂觀態(tài)度。當(dāng)前人工智能還面臨諸多挑戰(zhàn),例如數(shù)據(jù)孤島問題、隱私保護(hù)問題、安全問題、如何從感知智能發(fā)展到認(rèn)知智能再到更遠(yuǎn)的讓機(jī)器擁有自我認(rèn)知等等,突破這些瓶頸,或許才是人工智能走得更遠(yuǎn)的關(guān)鍵。
其中數(shù)據(jù)孤島和隱私保護(hù)問題是當(dāng)前人工智能大規(guī)模產(chǎn)業(yè)化應(yīng)用過程中遇到的突出問題。對(duì)此,人工智能國(guó)際專家、微眾銀行首席人工智能官楊強(qiáng)教授在大會(huì)上發(fā)表了題為《用戶隱私,數(shù)據(jù)孤島和聯(lián)邦遷移學(xué)習(xí)》的特邀報(bào)告,他的答案是:開展新一代的人工智能算法研究,突破數(shù)據(jù)孤島和小數(shù)據(jù)的限制,同時(shí)保護(hù)數(shù)據(jù)安全和用戶隱私。這個(gè)答案的背后是一項(xiàng)新的領(lǐng)先全球的技術(shù),叫做“聯(lián)邦遷移學(xué)習(xí)。”

大數(shù)據(jù)時(shí)代并未真正到來,小數(shù)據(jù)和數(shù)據(jù)孤島林立
楊強(qiáng)教授指出,人工智能發(fā)展離不開大數(shù)據(jù),人工智能技術(shù)如果是火箭引擎,大數(shù)據(jù)就是燃料,但是數(shù)據(jù)量的激增并不意味著真正的“大數(shù)據(jù)”時(shí)代到來。多數(shù)行業(yè)中是數(shù)據(jù)質(zhì)量不高的“小數(shù)據(jù)”,是一個(gè)個(gè)數(shù)據(jù)孤島,數(shù)據(jù)割裂嚴(yán)重。
例如在法律領(lǐng)域,如果想得到一個(gè)非常好的樣本,需要經(jīng)歷很長(zhǎng)的鏈條,經(jīng)過很長(zhǎng)時(shí)間,有法官、律師等多方參與,才能把一個(gè)樣本標(biāo)注好,這導(dǎo)致有標(biāo)注的高質(zhì)量數(shù)據(jù)并不多,并且分散在各地的各級(jí)法院。而在醫(yī)療領(lǐng)域這種數(shù)據(jù)孤島更加嚴(yán)重,例如醫(yī)療影像往往分散在各個(gè)醫(yī)院。導(dǎo)致這種結(jié)果的原因很多,包括監(jiān)管原因、機(jī)構(gòu)各自的利益、流程制度限制等。
從遷移學(xué)習(xí)到聯(lián)邦學(xué)習(xí),打通數(shù)據(jù)孤島
能否從技術(shù)角度尋求解決方案?作為國(guó)際人工智能界“遷移學(xué)習(xí)”(transfer learning)領(lǐng)域的發(fā)起人和帶頭人,楊強(qiáng)教授從遷移學(xué)習(xí)中找尋問題的答案,首先想到通過知識(shí)遷移解決“小數(shù)據(jù)”問題。如果面臨的是“小數(shù)據(jù)”,就找到一個(gè)類似的“大數(shù)據(jù)”,舉一反三,幫助只有小數(shù)據(jù)的任務(wù)運(yùn)用來自其他相關(guān)任務(wù)的大數(shù)據(jù),從而獲得更好的表現(xiàn),使得建立的模型能夠更可靠,魯棒性好,不受外界干擾,平穩(wěn)運(yùn)行,這在人工智能落地的應(yīng)用上是非常重要的一個(gè)特性,同時(shí)也能夠防止隱私泄露。這種從源領(lǐng)域遷移到目標(biāo)領(lǐng)域的方式,在金融、工業(yè)、信息流推薦等領(lǐng)域都有應(yīng)用,例如貸款風(fēng)控策略在不同用戶類別間的遷移、推薦系統(tǒng)中推薦策略遷移、輿情分析系統(tǒng)中的關(guān)鍵詞遷移等。
雖然遷移學(xué)習(xí)可以有效解決“小數(shù)據(jù)”的問題,但是實(shí)際上現(xiàn)在面臨的不僅僅是“小數(shù)據(jù)”的問題,而是“數(shù)據(jù)割裂”、“數(shù)據(jù)孤島”。這不僅僅是技術(shù)的問題,不能通過簡(jiǎn)單的數(shù)據(jù)整合(Data integration)解決,而是要克服政策、監(jiān)管、技術(shù)等多維度難題。此時(shí)“聯(lián)邦學(xué)習(xí)”(Federated Learning)提供了新的思路,讓多方參與,共同建模。
從聯(lián)邦學(xué)習(xí)到聯(lián)邦遷移學(xué)習(xí),保護(hù)數(shù)據(jù)隱私
打通數(shù)據(jù),共同建模,這本是一個(gè)美好的期望方向,但數(shù)據(jù)隱私保護(hù)的日益嚴(yán)格帶來了嚴(yán)峻挑戰(zhàn),歐盟數(shù)據(jù)隱私保護(hù)法GDPR(The General Data Protection Regulation )作為“史上最嚴(yán)厲”的數(shù)據(jù)隱私保護(hù)法案成為一個(gè)信號(hào),全世界都在加強(qiáng)數(shù)據(jù)隱私保護(hù)方面的立法建設(shè),那么是否可以讓聯(lián)邦學(xué)習(xí)參與方只交換模型而不交換數(shù)據(jù)?讓數(shù)據(jù)不出本地,從而保護(hù)數(shù)據(jù)隱私?據(jù)楊教授介紹,數(shù)學(xué)家們提供了新思路——將同態(tài)加密技術(shù)(Homomorphic Encryption,HE)融入聯(lián)邦學(xué)習(xí),其核心思想并不復(fù)雜,假設(shè)A加B是一個(gè)公式里的兩項(xiàng),對(duì)整個(gè)公式加密,那么HE就可以把它表達(dá)成對(duì)A的加密加上對(duì)B的加密。這樣可以讓參與方不上傳數(shù)據(jù),只上傳加密的算法模型參數(shù)而進(jìn)行共同建模,在這個(gè)過程中,即使通過多次交換,也不能重構(gòu)出另一方的數(shù)據(jù),真正實(shí)現(xiàn)數(shù)據(jù)不泄露。
在實(shí)際應(yīng)用中,有基于同一特征維度,不同用戶群體的“橫向聯(lián)邦”,例如谷歌的手機(jī)終端聯(lián)邦學(xué)習(xí),微眾銀行聯(lián)合多家銀行建立的反洗錢模型,以及針對(duì)同一用戶群體,不同特征維度的“縱向聯(lián)邦”,例如根據(jù)用戶在銀行的信用表現(xiàn)進(jìn)行個(gè)性化保險(xiǎn)定價(jià)。除此以外,微眾銀行AI團(tuán)隊(duì)首次提出了“聯(lián)邦遷移學(xué)習(xí)”,將“聯(lián)邦學(xué)習(xí)”和“遷移學(xué)習(xí)”相結(jié)合,即使是在用戶群體和特征維度重合都小的情況下,也可以進(jìn)行合作,這意味著無論是政府機(jī)構(gòu)和金融機(jī)構(gòu)之間,還是互聯(lián)網(wǎng)機(jī)構(gòu)和金融機(jī)構(gòu)之間,或者是其他各領(lǐng)域之間,都可以實(shí)現(xiàn)跨界合作。

聯(lián)邦學(xué)習(xí)不僅是技術(shù)方向,更是社會(huì)問題
楊強(qiáng)教授提到,雖然有了技術(shù)工具,微眾銀行也對(duì)外開源了通用的聯(lián)邦學(xué)習(xí)框架平臺(tái)Federated AI Technology Enabler(FATE),但如何設(shè)立激勵(lì)機(jī)制吸引機(jī)構(gòu)進(jìn)入聯(lián)邦,形成良性生態(tài),則包含博弈論、機(jī)制設(shè)計(jì)、法律等多領(lǐng)域,聯(lián)邦學(xué)習(xí)不僅是能解決數(shù)據(jù)孤島和數(shù)據(jù)隱私保護(hù)的技術(shù)方向,更是一個(gè)復(fù)雜的社會(huì)協(xié)同治理問題。除了吸納更多企業(yè)加入聯(lián)邦生態(tài),微眾銀行AI團(tuán)隊(duì)也在積極推動(dòng)聯(lián)邦學(xué)習(xí)國(guó)際標(biāo)準(zhǔn)IEEE標(biāo)準(zhǔn)的制定,這一標(biāo)準(zhǔn)有望在兩年內(nèi)出臺(tái),為立法和監(jiān)管提供更多技術(shù)依據(jù)。

聯(lián)邦學(xué)習(xí)將走向何方?人工智能將走向何方?楊強(qiáng)教授的觀點(diǎn)是,數(shù)據(jù)可以不出本地,各個(gè)數(shù)據(jù)擁有方可以在安全、保密的前提下交換人工智能模型的參數(shù),以達(dá)到聯(lián)合建模的目的。這種不同學(xué)科的交叉融合是趨勢(shì),聯(lián)邦學(xué)習(xí)和遷移學(xué)習(xí),或者是其他機(jī)器學(xué)習(xí)方法,都可以相互融合,發(fā)揮各自的特點(diǎn),從一個(gè)領(lǐng)域下的人工智能算法理論邁向多個(gè)領(lǐng)域,這才是更有價(jià)值的研究。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
海報(bào)生成中...
海藝AI的模型系統(tǒng)在國(guó)際市場(chǎng)上廣受好評(píng),目前站內(nèi)累計(jì)模型數(shù)超過80萬個(gè),涵蓋寫實(shí)、二次元、插畫、設(shè)計(jì)、攝影、風(fēng)格化圖像等多類型應(yīng)用場(chǎng)景,基本覆蓋所有主流創(chuàng)作風(fēng)格。
9月9日,國(guó)際權(quán)威市場(chǎng)調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布了《中國(guó)AI云市場(chǎng),1H25》報(bào)告。中國(guó)AI云市場(chǎng)阿里云占比8%位列第一。
9月24日,華為坤靈召開“智能體驗(yàn),一屏到位”華為IdeaHub千行百業(yè)體驗(yàn)官計(jì)劃發(fā)布會(huì)。
IDC今日發(fā)布的《全球智能家居清潔機(jī)器人設(shè)備市場(chǎng)季度跟蹤報(bào)告,2025年第二季度》顯示,上半年全球智能家居清潔機(jī)器人市場(chǎng)出貨1,2萬臺(tái),同比增長(zhǎng)33%,顯示出品類強(qiáng)勁的市場(chǎng)需求。