大模型“聚會”：國內卷價格，國外卷能力

2024年05月15日 20:10:00 撰文 | 曹雙濤編輯 | 楊博丞來源：

　　在中美AI大模型的競爭上，正衍生出兩種不同的路徑。

　　繼北京時間5月14日凌晨OpenAI春季發布會上，OpenAI推出兼具聽、看、說能力的GPT-4o后。北京時間5月15日凌晨谷歌I/O開發者大會上，谷歌CEO桑達爾·皮查伊發布數十款Google和AI 結合產品，堪稱“全家桶”級別，全面圍剿Open AI。

　　其中包括支持200萬token長文本的Gemini 1.5 Pro和 Gemini 1.5 Flash，對標Sora的Veo，開源模型Gemma 2，支持生成式搜索的AI Overviews、第六代TPU等。

　　整場開發者大會最大的看點為，谷歌推出的AI語音助手——Astra，它能夠通過攝像頭識別物體、代碼和各種東西。現場演示視頻中，用戶要求Astra在看到發出聲音的東西時告訴她，助手回答說，它可以看到一個發出聲音的揚聲器。對于一閃而過的蘋果，Astra居然也能夠準確回答出在眼鏡旁邊。

　　除Astra外，谷歌還推出基于Gemini的多款通用AI Agent子系列產品。如音頻的NotebookLM、音樂的Music AI Sandbox、視頻的Veo、圖像的Imagen 3，直接對標OpenAI發布的GPT-4o、Dall-E和Sora。

　　和谷歌、OpenAI圍繞技術之爭不同的是，國內大模型或將迎來價格戰時代。在5月15日字節舉辦2024春季火山引擎Force原動力大會上，字節推出3款AI產品，包括AI生圖產品 PicPic、AI 教育產品河馬愛學、AI 劇情互動產品貓箱。

　　除這三款產品外，字節面向TOC端的產品還包括定位AI教育的Gauth，定位AI對話的豆包和CiCi;定位AI工具的小悟空ChitChop;定位Al Bot創建平臺的Coze和扣子;定位AI互動劇情的BagelBel等。

　　但字節率先啟動行業價格戰，火山引擎總裁譚待表示，豆包大模型將開啟付費商業化，且定價遠低于行業價格。以豆包通用模pro-32k版為例，模型推理輸入價格僅為0.0008元/千Tokens。市面上同規格模型的定價一般為0.12元/千Tokens，是豆包模型價格的150倍。

　　字節本輪降價后，后續國內其他大模型廠商或將跟隨。但降價能否幫助國內大模型廠商帶來更多新增用戶和付費用戶，仍值得商榷。

　　GPT-4o和谷歌Gemini不斷宣傳現階段AI能力大幅度提高，兩家誰的大模型能力更強呢?基于此，我們也對GPT-4o和Gemini展開了多維度的測試。

　　一、文本輸出：Gemini和GPT-4o愈發接近，部分能力已趕超

　　因GPT-4o和Gemini均屬于世界TOP級的大模型，在測試兩家大模型的文本輸出能力上，我們直接將難度升級。

　　為什么很多國家仍以油車為主?你覺得影響新能源汽車海外滲透率提高的因素有哪些?我們將這一問題同時給到GPT-4o和Gemini，二者均指出充電基礎設施建設、購置成本、技術進步、政策支持、消費者文化習慣是很多國家仍以燃油車為主的原因。

　　但相較于GPT-4o，Gemini不僅識別到我們提問的是兩個問題，且均給出答案，也回答出GPT-4o沒有指出的車企方面、宣傳教育方面的問題。也就是說，Gemini的回答可能更為完整。

　　圖源：基于Gemini和GPT-4o生成內容整理 DoNews制圖

　　我們繼續追問要求兩個大模型同時給我們撰寫一份10000字全球新能源汽車報告，并要求報告中需要包括行業價格戰、電池技術、未來發展方向、產業趨勢。

　　但此時兩個大模型的表現已經出現明顯差異，GPT-4o給我們生成七大章節的框架，每個框架下也要對應的小框架。但就是不輸出我們要求的內容，這或許和當前GPT-4o在長文本能力上的欠佳有關。

　　圖源：GPT-4o官網

　　Gemini雖給我們具體的文本內容，但全文1679字和我們要求的萬字報告差距較大。內容被大幅度壓縮后，整個內容質量也相對欠佳。

　　如在提到新能源汽車產業趨勢發展上，Gemini給出的內容為產業鏈整合、跨界合作、國際化競爭，每條內容僅有一句話進行概括。換言之，在真正涉及行業專業性問題上，Gemini和GPT-4o均存在不同程度的短板。

　　圖源：Gemini官網

　　當我們將難度繼續提高后，詢問為什么今年以來全球大宗商品價格持續上漲?這種漲幅帶來的影響有哪些?未來價格是否會回落?在首問中GPT-4o和Gemini給出的答案有所相同，均指出和供應鏈、地緣沖突、全球經濟等因素有關。且在未來價格走勢預測中，兩者給到的答案也基本相同。

　　但在漲幅所帶來的影響上，Gemini給出的答案可能更為完整。尤其是在金融、企業利潤、社會等方面的影響，GPT-4o并未指出。

　　圖源：基于Gemini和GPT-4o生成內容整理 DoNews制圖

　　在文本內容快速分析上，我們讓兩款大模型同時給我們分析安克創新2024年Q1財報中存在的風險點，GPT-4o生成的風險點包括現金流減少、高額的銷售費用和管理費用、財務費用大幅度波動、公允價值帶來損失這四點。

　　圖源：GPT-4o官網

　　但Gemini給出的內容卻包括營收增速放緩、經營活動大幅度下降、銷售費用和管理費用大幅度增加、存貨跌價損失增加、匯兌大幅度增加、對政府補助依賴這六點。這也不能看出，Gemini的回答更為完整。

　　圖源：Gemini官網

　　而當我們要求兩款大模型同時以如何幫助失戀的人走出陰影，寫一篇2000字的文章。要求文章有觀點，并且文章內需要配上對應的圖片和音頻，Gemini的表現可以說完全吊打GPT-4o。

　　在文章開頭，Gemini直接放入一曲舒緩的音樂，且這個音樂也支持播放。每個細分章節下，Gemini直接從網站上檢索到和內容相關的圖片，實現OpenAI提到的文本、音頻、圖像的任意組合。

　　圖源：Gemini官網

　　對比之下，GPT-4o給到的內容就有些遜色。除文章開始處能看到圖片外，其余正文處均未看到任何和內容相關的圖片，且全文中也看不到音頻。

　　圖源：GPT-4o官網

　　整體測試下來后我們發現，谷歌在生成式AI領域尤其在文本能力輸出上已經從“落后”到追趕，甚至內容質量上、內容組合等能力上已經超過GPT-4o。

　　二、對比之下，Gemini綜合能力不容忽視

　　在測試過程中，我們發現Gemini不僅支持文本內容提問，且也支持語音提問。但因國內網絡受限，暫無法對語音功能進行測試，也無法判斷這是否為谷歌發布會上提到的Astra。相較于谷歌的快速，GPT-4o目前仍是支持單一的文本內容提問。

　　文章內容僅供閱讀，不構成投資建議，請謹慎對待。投資者據此操作，風險自擔。

海報生成中...

即時

全球頂級AI創作社區回歸！海藝AI國內首發“全民娛樂化創作

海藝AI的模型系統在國際市場上廣受好評，目前站內累計模型數超過80萬個，涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景，基本覆蓋所有主流創作風格。

OPPO A6l發布：售價1799元搭載六年長壽大電池

華為Mate X7今日開售：售價12999元起

新聞

市場占比高達35.8%，阿里云引領中國AI云增長

9月9日，國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場，1H25》報告。中國AI云市場阿里云占比8%位列第一。

企業IT

華為坤靈發布IdeaHub千行百業體驗官計劃，助力中小企

9月24日，華為坤靈召開“智能體驗，一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

3C消費

雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

雅馬哈昨日宣布推出兩款頭戴式耳機，分別是平板振膜的YH-4000和動圈原理的YH-C3000。

研究

IDC：2025上半年全球智能家居清潔機器人出貨量同比暴

IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告，2025年第二季度》顯示，上半年全球智能家居清潔機器人市場出貨1,2萬臺，同比增長33%，顯示出品類強勁的市場需求。

專題

禮儀主持_商業活動模特演藝服務公司
九章智算云Alaya NeW Cloud 2.0發布
中文科技資訊旗下IB科技資訊上線專
中文科技資訊關于我單位網站被仿冒一

返回主頁 ┊ 關于我們 ┊ 內容聯系 ┊ 聯系我們 ┊ 免責聲明 ┊ 原創新聞 ┊ 門戶版

大模型“聚會”：國內卷價格，國外卷能力

最新新聞

熱門新聞

即時

全球頂級AI創作社區回歸！海藝AI國內首發“全民娛樂化創作

新聞

市場占比高達35.8%，阿里云引領中國AI云增長

企業IT

華為坤靈發布IdeaHub千行百業體驗官計劃，助力中小企

3C消費

雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

研究

IDC：2025上半年全球智能家居清潔機器人出貨量同比暴

專題

大模型“聚會”：國內卷價格，國外卷能力

擴展閱讀

最新新聞

熱門新聞