AI的問題,用AI來解決。
在過去的十年里,人工智能(AI)技術已經從理論研究和小規模應用邁向全球性的技術革命,徹底改變了我們生活和工作的方式。無論是智能手機上的語音助手,還是復雜的數據分析和自動化生產線,AI 的影響無處不在,其帶來的效率提升和成本降低正推動著一場前所未有的生產力革命。
為了搶占 AI 生產力的先機,不少品牌都快馬加鞭拿出了自己的 AI 硬件:有的手機品牌利用 AI 技術消除拍攝照片時的運動拖影,有的用 AI 去除圖片中不想要的元素,有的企業更是搶先一步發布所謂的「AI PC」標準。
這么一對比,低調行事、默默耕耘的 NVIDIA 似乎有些不合群。為了改變這一「酒香巷更深」的局面,NVIDIA 近年來也在努力增加自己在 AI 領域的曝光機會,想辦法讓更多的用戶意識到 NVIDIA 在游戲顯卡之外的領先技術——2024 年 4 月 24 日,NVIDIA 在深圳舉辦了名為 RTX For AI 的線下交流會,讓大家能親身體會 NVIDIA 是如何「撐起 AI 半壁江山」的。
盡管 NVIDIA 不是第一個提出 AI 這一概念的企業,但從產品和技術的角度看,包括 AI 在內的眾多計算機歷史性節點,背后都或多或少有著 NVIDIA 的支持:2008 年,NVIDIA發布了 GeForce 8800 GTX 顯卡。
很顯然這張顯卡的性能放在現在早已不值一提,但這張顯卡上,NVIDIA 提出了「CUDA」(統一計算架構)這一概念。CUDA 的出現讓 GPU 不僅可以用來處理圖形運算,還可以用來執行、加速基于 CUDA 的通用計算,讓電腦成為真正的「通用工具」。
除了 CUDA 外,NVIDIA 在 2018 年還進一步對 GPU 的算力進行「細化」,引入了RT Core、Tensor Core 的概念,讓光線追蹤和專門的 ML 計算成為可能——Tensor Core 通過高效執行大規模矩陣運算,顯著加快了 AI 模型的訓練和執行速度。深受 NVIDIA 用戶喜愛、可以顯著提高游戲 FPS 的 DLSS,就基于 Tensor Core 來實現,可以說是廣大游戲玩家最早接觸到的「真 AI」用例了。
算力是一切 AI 的基礎
在 AI 時代出現之前, NVIDIA 就開始想辦法用 Tensor Core 實現 AI 功能,加速了 AI 時代的到來;那么和 6 年前的自己相比,現在的 NVIDIA 在 AI 領域又實現了怎樣的技術飛躍呢?
根據 NVIDIA 的介紹,現階段 RTX AI 已經對 10 種不同的 AI 場景實現覆蓋,分別為:AI 繪畫、AI 平面設計、AI 視頻編輯、AI 3D 創作、AI 視頻體驗、AI 會議、AI 文檔助手、AI 應用開發、AI 游戲和 AI 游戲開發。
盡管這十大場景各有不同,但他們對電腦卻有著一個共同的需求:算力。而出色的算力,恰恰就是 RTX 硬件的最廣為人知的特性。
毫無疑問,和 6 年前剛剛發布 RTX 顯卡、引入 Tensor Core 時相比,性能是 NVIDIA 在 AI 領域最容易看到的提升。以最常見的文生圖(T2I)用例為例,有試過在自己電腦上部署 StableDiffusion 等模型的朋友應該知道,當前絕大多數模型或多或少存在「命中率低」的問題,導致用戶需要用同一組關鍵詞反復生成圖像,用類似手游「抽卡」的方式來生成自己想要的圖片。
針對這種「抽卡」的場景,NVIDIA就在分享會上展示了其旗艦消費級顯卡 RTX 4090D 的強大性能:基于 TensorRT 的加速功能,RTX 4090D 最快可以實現 120fps 的 StableDiffusion 圖像生成。
精細控制是 AI 生產力的標志
不知道大家有沒有發現一個細節,在剛剛提到的十大場景中,NVIDIA 把 AI 繪畫和 AI 平面設計區分開了。這并不是 NVIDIA 想用更多的用例撐場面,而是因為 AI 繪畫與 AI 平面設計其實標志著 AI 技術的兩個不同的階段:
以文生圖為代表的 AI 繪畫,由于命中率較低,用戶需要不斷生成大量圖片來「抽卡」,才有可能得到自己想要的成品。而這種「不可控性」意味著這些 AIGC 作品的用途非常有限:要么用于娛樂,要么用來給設計師找靈感,或者充當訓練 AI 的物料。
但真正用于「生產力」的 AIGC 卻容不得這種「不確定性」,畢竟誰也不想用 AIGC 向客戶展示時裝上身效果時,AI 在衣服上生成三只手;或者設計師用 AI 向客戶講解室內裝潢風格時 AI 把屋頂復式豪宅畫成地下室。
換句話說,能否實現對 AIGC 的精細控制,會是區分「娛樂 AI」與「生產力 AI」的最大區別。
我們知道,「娛樂 AI」主要用于提升用戶體驗和互動性。例如,在視頻游戲、社交媒體和在線娛樂等領域,AI 被用來推薦內容、生成音樂、模擬對話等。這類 AI 的核心目標是增強娛樂性和參與度,而不那么側重于輸出的嚴格性和可預測性。這類 AI 生成的藝術作品或音樂不需要符合嚴格的商業應用標準,其創造性和新穎性更為重要。
相比之下,「生產力 AI」則應用在更為嚴格和要求高的商業及工業環境中,如制造業、醫療、金融分析等。在這些領域中,AI 的任務是提高效率、減少成本和錯誤率,以及提供可靠的決策支持。比如利用 AI 在醫療診斷中用于分析影像和識別疾病模式,這要求極高的準確性和可靠性。在這些應用中,精細控制不僅關乎 AI 系統的效能,更關乎其決策質量對人類生活的直接影響。
在分享會上,NVIDIA 也演示了一個「生產力 AI」應有的樣子——即致 AI。作為一款面向建筑設計領域的 AI 應用,即致 AI 提供了多種適用于不同建筑風格、場景的預訓練 AI 模型,同時基于 RTX 硬件的強大性能,即致 AI 能以近乎零時延的速度對設計師的導入草圖或繪制的線條進行 AI 生成,用近乎實時的方式為客戶講解建筑外部設計內部裝修風格。
AI 遇到的問題,應由 AI 來解決
當然了,剛剛提到的用例只不過是 NVIDIA RTX 在 AI 領域應用的一小部分。從偏向娛樂性質的文生圖、DLSS 3.5,到改變游戲交互方式的 NVIDIA ACE、聲音克隆,再到改變創作模式的 AI 視頻剪輯、改變工作模式的 Chat with RTX,無論是游戲還是工作,AI 技術早已滲透到我們生活的方方面面。
![]()
在分享視頻創作過程中 AIGC 的具體應用時,著名視頻特效團隊「特效小哥 Studio」也提到了一個非常有趣的觀點——用 AI 來解決 AI 遇到的問題。據他們分享,在重建 AIGC 圖片的景深時,他們沒有選擇用傳統的人工標記深度圖,而是直接把圖片丟給 AI,讓 AI 繪制 AIGC 的深度圖,并將結果輸出給另一個 AI 模型。
這種「用魔法打敗魔法」的解決方案,在我看來不僅僅是 AIGC 行業化,正規化的標志,同時也是未來 AI 的發展方向之一。
首先,AI 模型的訓練需要大量的計算資源,由于高質量數據的獲取往往成本高昂且不易實現,使用合成數據生成技術如生成對抗網絡(GANs)可以創造大量逼真的訓練數據,這對于提升 AI 系統的訓練效率和效果非常有幫助。此技術不僅可以用于生成圖像數據,也能擴展到文本、音頻甚至是虛擬環境的生成,極大地豐富了數據來源,為AI訓練提供了更多可能。
其次,AI 模型的解釋性也是一個重要的技術挑戰,因為許多高效的模型如深度神經網絡往往像黑盒一樣,難以理解其內部的決策邏輯。通過發展解釋性 AI 技術,可以使模型的決策過程更加透明,增加用戶的信任,同時也方便開發者找到并改進模型的不足。
從長遠的角度看,解決這些技術性挑戰不僅需要更先進的算法和模型設計,還需要在數據處理、模型訓練和實際應用之間找到一個平衡點,這將是推動 AI 技術未來發展的關鍵。我們期待 AI 能帶來更多便捷,同時也期待它幫助我們以全新的方式解決老問題。
而當 AI 真正徹底解放人類生產力后,擁有無盡想象力的創作者與 AI,一定能讓更多天馬行空的創意成為現實。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。