2021年6月5日-6日,由中國科學技術協會、中國科學院、中國工程院、浙江省人民政府指導,中國人工智能學會、杭州市人民政府主辦,杭州市余杭區人民政府籌備組承辦,浙江杭州未來科技城管理委員會執行的2021全球人工智能技術大會(GAITC 2021)在杭州舉辦。此次大會集會、展、賽為一體,進一步促進人工智能領域的技術創新、應用創新、成果轉化、產業鏈協同。
大會邀請31位中外院士齊聚線上線下,與260多位海內外人工智能專家學者、技術領軍者,圍繞人工智能的理論、技術、應用、倫理、安全等議題展開思想探討與觀點碰撞;通過22場專題論壇全面梳理智能科技的產業脈絡與未來趨勢。
其中,一場關于深度探討AI領域的難點技術“自然語言處理理解專題論壇”于6日上午舉行,線下線上累積觀看超過400000人次。論壇由世界頂級的AI科學家,自然語言處理領域代表人物、創新工場首席科學家、ACL前主席、CCF Fellow周明博士和京東集團副總裁、AI研究院常務副院長、IEEE/CCF Fellow何曉冬博士聯袂主持。來自亞馬遜、百度、微軟、北京大學、蘇州大學、字節跳動的大咖嘉賓展開了不同角度的技術專題報告及圓桌對話。

中國人工智能學會多語種智能信息處理專委會第一屆委員合影留念
自然語言處理是人工智能領域重要的分支,也是支撐機器翻譯發展的關鍵硬技術。周明博士在開場便表明:“自然語言理解是人工智能皇冠上的明珠。NLP是人工智能賦能社會和賦能行業的硬核科技。它的重要性比肩芯片、操作系統。”自然語言處理屬人工智能四大層級中的第三層“認知智能”,是“感知智能”基礎上重要且難點的技術。
它的進步將推動推理、決策、問題求解等技術,推動人工智能的理論和技術發展,賦能數字化轉型,提高企業和社會效率。近年隨著自然語言處理技術在Transformer和預訓練,機器翻譯、問答、搜索等的大幅度提升。機器翻譯甚至在通用領域和新聞領域接近或者達到人類水平。

今天,人與機之間的自然語言交互已經被廣泛應用在多種智能終端上,服務智能家電、交通、城市基礎設施等交互場景中,使之具備基本語言交流能力。亞馬遜Alexa AI 高級首席科學家、IEEE/ISCA Fellow,Dilek Hakkani-Tur教授結合自身研究方向,從整合任務導向與社交閑聊對話系統的方向介紹了自然語言處理進展與成果。
百度技術委員會主席吳華,就開放域對話最新進展及遇到的問題、通過知識驅動的對話系統的解決方案、以及對對話數據集、對話挑戰與未來發展方向的四個方面展開報告,在報告中吳老師談到即便預訓練規模已接近100億,在開放域對話里還是看到一些問題,在開放域對話時不能主動規劃對話內容、有些對話主題空泛甚至不連貫、以及預訓練知識在開放域對話中匹配不準確性。都說明“語言”在不同場景下的多變性,使得自然語言處理技術研究相較其他人工智能技術更復雜。
微軟亞洲研究院首席研究員韋福如先生,針對預訓練模型領域從概念,技術,成果及未來發展方向展開報告。其中談到:一個足夠好的預訓練模型可以支撐下游所有的任務,但在訓練這個模型時需要海量的數據資源和相對長的時間。
北京大學王選計算機研究所的萬小軍教授,通過自然語言理解和自然語言生成兩個方面展開,闡明為什么人機圍棋之戰,機可勝人,而自然語言處理領域,機不可勝。其難點就在于自然語言處理的搜索空間巨大以及客觀評價困難。在文本生成中機器的理解不等于人類的理解,神經網絡文本生成的挑戰,在于生成結果質量不可控,如果內容覆蓋行不夠,篇章連貫性不佳、語議一致性不好等等。
蘇州大學計算機學院/軟件學院院長、教授、國家杰出青年獲得者張民教授結合語篇和機器翻譯領域展開對自然語言處理的本質問題探究。他說道一個最經典的理論:所有的語言現象蘊含在數據當中,知識必須從數據到信息凝練出來。人類要解決自然語言處理的終極問題就在于解決篇章的問題。篇章具備銜接性、連貫性、意圖性、情景性等,是句子間語言邏輯關系的理解。因此在機器翻譯中只翻譯正確單個的字詞、句子依然是遠遠不夠的。
字節跳動人工智能實驗室總監李磊博士就語音翻譯的研究及產品創新性展開。聲音和文本本身存在語義空間上、長度上,表述上等很大差別,尤其在同傳翻譯中,翻譯很難做到完全和說話時時同頻,通過端到端的模型測試有顯著提升。
通過論壇各位與會嘉賓代表的報告與對話交流中,不難感受到在自然語言理解的探索之路上仍然因為語言的多變性、生動性、創新性等天然屬性存在極大的技術挑戰,但自然語言處理技術的前進無疑將大大推進整個人工智能領域的更高程度發展。我們期待著自然語言處理領域涌現更多獨角獸企業。
語言是人類最偉大的發明之一,是人類思考、交流、溝通的主要載體。人類文明產生的文字記載可以脫離生命體而獨立存在,才讓各民族文明得以傳承與傳播。李德毅院士說到:人類誕生后有了語言才有了文字,有了文字才有了歷史,有了歷史才有了文化,有了文化才有了文明,文明是智能的生態。
展望20年后,無論人工智能發展到什么階段,多少工作被人工智能所替代,語言文字的工作仍舊無可被替代。因此多語種智能信息處理專委會的成立至關重要。傳神語聯作為中國最大的、以技術驅的人工智能語言服務平臺,在6月5日召開的閉門選舉會議中,入選為中國人工智能學會發起的 “多語種智能信息處理專業委員會”常委單位。致力推動行業數字化轉型,通過語聯網開放平臺,整合語言服務行業數據、信息、人才資源,將整合的資源與先進的AI技術融合為行業賦能釋放更大能量。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。