行業大模型卷卷更健康

2023年06月15日 18:07:56 周享玥‍‍ 編輯：趙艷秋來源：微信公眾號：數智前線

　　無論是巨頭，還是有點規模的企業，都在做行業大模型，未來幾個月將迎來密集發布期。但不得不正視的一個現實時，大多其實都還停留在講概念、講技術、進行內部測試或項目定制的階段。

　　本周，一位互聯網人士分享了一個小故事——幾天前，他曾遇見一幫創業青年，在交流的過程中，對方告訴他，他們搜集了一大堆修車相關的案例和知識，想問問他能不能提供通用大模型的能力基礎，來幫助他們去訓練一個修車行業的大模型出來，以便讓中國1000萬修車工都能擁有20年老師傅的功力。

　　“這是一個典型的行業的能力。”在他看來，今天有太多垂直領域，其實是ChatGPT等通用大模型解決不了的，例如面對修車問題，他們都只能泛泛而談，“未來大模型這個產業怎么發展，我覺得還得往垂直化、產業化、企業化，甚至個人化發展”。

　　實際上，相關企業都已摩拳擦掌。互聯網大廠百度、阿里紛紛官宣伙伴計劃和工具鏈，聲稱要讓每一個行業都能夠用上自己的大模型。各行各業的龍頭企業、創業公司，同樣馬力十足。金融、教育、醫療、自動駕駛、智能物流、安防等多個領域的行業公司都已相繼傳出要推行業大模型的消息。

　　“全國都在大煉行業大模型”， “現在只要是上市公司或規模稍微大一點的企業，他們都會有。”相關推出行業大模型的企業的多位員工告訴數智前線。“預計幾個月后，行業大模型將會迎來一波密集發布的小高潮。”多位業界人士稱。

　　大模型的戰事，已經開始從通用大模型，迅速卷向面向垂直領域的行業大模型。

　　01 行業大模型卷起來了

　　“現在我們去跟客戶談，很多客戶也不太了解什么是行業大模型，但是一上來就說，我需要你們的行業大模型。”百度智能云AI平臺副總經理李景秋告訴數智前線。

　　她最近和很多企業進行過溝通，發現一般會存在兩種情況，一種需要的是SFT（有監督精調）的大模型，只需基于工具鏈去標注幾百到幾千或者上萬條數據，就已經能達到企業需要的效果。但還有一種，一定需要構建行業的預訓練模型才能解決，也即打造一個行業大模型。

　　李景秋發現，尤其是教育、金融、能源方向，很多有行業數據和場景積累的龍頭企業都希望和大廠合作，構建行業大模型，并進一步孵化行業應用，廣泛去服務上下游相關企業。

　　行業大模型的重大意義在于，通用大模型雖然具備涌現的能力，但如果原始數據里一點行業數據都沒有，那它對行業理解還是會存在局限性，而一旦存在知識上的局限性，行業大模型一定會有需求。“而且國內的數據生態沒有那么開放，每個企業都有大量沉默的行業數據，這些數據的價值，要通過行業大模型才能激活并發揮出來。”李景秋解釋稱。

　　中科深智CTO宋健認為，不管是從一些行業對專業知識的要求，還是從安全性、成本和效率問題來看，行業大模型都是必然存在的。“尤其對我們數字人領域來講，實時性非常關鍵，用戶問的問題它要在一秒以內能回答，這個是通用大模型達不到的。”

　　但生成式AI大模型的確為數字人這個行業帶來了巨大的想象空間。宋健透露，之前，一套好用或者可以達標的數字人后端對話系統，對他們來說一直是道難題，數字人一般只能做到有一套簡單的問答系統，很難滿足用戶需求。例如在電商直播間，用戶能問的問題和問法基本是被限制的，一旦說法發生變化，后端的問答系統可能就無法匹配。但大模型強大的語義理解能力為這個問題提供了解決方案，讓用戶可以從“和一個很傻的白癡在聊天”，進化到“可能跟一個比較聰明的正常人在聊天”。

　　“這個區別是非常大的。”宋健告訴數智前線，這也是他們為什么從3月份開始做相關準備，并在5月正式推出面向虛擬人這一垂直領域的行業大模型——數智姜尚的原因。中科深智是國內一家虛擬人公司，有數據顯示，其虛擬主播產品已服務超2000家客戶，占據主流電商平臺虛擬主播近70%的份額。

　　無獨有偶，大量的行業企業也已經開始行動。

　　今年6月初舉行的2023國際通信展上，中國移動在展臺上，展出了他們的“九天”行業大模型在網絡運維領域的應用。現場工作人員演示，在有多個線頭交錯的一臺電信設備中，行業大模型可以識別幾百個插線接口的情況，從而讓運維人員可快速進行光纖線纜的接插。同時，中國移動也正在研發和內測的一個客服的行業模型，未來可能會對外提供，帶頭人是中國移動首席科學家馮俊蘭。后者自2013年9月加入移動以來，就創建并帶領了中國移動人工智能團隊 “九天”，至今已近10年。

　　而在此前的5月29日，中國聯通研究院副院長、首席科學家唐雄燕也曾向外透露，中國聯通正在打造一個通用的、可適用于各網絡體系的通信大模型。中國電信更是早在4月底召開的2023云生態大會上就表示，天翼云正在自研預訓練大模型，并已進入內部測試階段，將在近期適當時候面向市場發布。

　　安防行業的企業們同樣動作頻頻。前不久的2023安博會上，AI大模型的身影堪稱“扎堆涌現”。據不完全統計，現場至少有包括商湯科技、宇視科技、360智慧生活、熵基科技、聯匯科技、算能等在內的6家不同賽道的頭部企業，都展示了自己的通用或行業大模型，及相關的應用Demo。

　　安防行業“海大宇”三巨頭中的宇視科技在5月推了宇視AIoT行業大模型“梧桐”，并在此次安博會上展示了該行業大模型在Vlog等場景的應用。它可將景區專業設備抓拍的游客游覽視頻，自動生成vlog，配上文字和表情包。

　　多模態生物識別企業熵基科技設了一個自研大模型及技術專區，專門展示自己涵蓋了140億、70億、13億等多個參數規模版本在內的BioCV大模型矩陣;人工智能企業聯匯科技也用了大量筆墨介紹自己百億級參數的視覺語言大模型OmModel，并表示下半年還會有一個V3(OmModel V3 )版本的發布;算力提供商算能則專門用了一個位置，來展示其與算法合作伙伴千視通合作推出的AI大模型訓推一體機，并將應用場景定位在了智慧網點、智慧職場、智慧巡檢、風控監督。

　　而在金融領域，包括中國農業銀行、江蘇銀行、度小滿、奇富科技等都宣布推出了行業大模型。教育領域傳出過要推行業大模型的也不在少數，包括網易有道、學而思、淘云科技、孩子王等。6月11日，中公教育也宣布要與新華網聯合推出全三維數智人及職業教育行業大模型。

　　自動駕駛、醫療、房產經紀、智能物聯等多個領域也相繼有行業大模型涌出。4月，毫末智行宣布發布全球*自動駕駛生成式大模型DriveGPT;5月，我愛我家宣布聯合第四范式推出行業*房產經紀大模型1.0版本，深信服也將自己自研的安全GPT大模型進行了首秀;同月底，互聯網醫療公司醫聯發布自研的醫療大語言模型MedGPT……

　　一場行業大模型熱潮正在快速到來。

　　02 用開源還是自研？

　　當市場在短短幾個月內，迅速涌現出大量通用大模型和行業大模型時，一些變化也在悄然發生。

　　"GPT的API調用成本在3月份之后下降到了1/10，更重要的是，開源業界在過去幾個月里變得特別繁榮。”云蝠智能創始人魏佳星告訴數智前線，大量開源大模型的出現，讓他們在打造面向智能客服領域的行業大模型時有了幾種不同的路徑選擇方案——要么自研，要么基于開源大模型進行微調，又或是采用閉源但接口價格不貴的大模型。

　　在對比了市場上的各類開源和閉源大模型的使用效果及成本后，云蝠智能最終采用了“自研小模型+開源大模型+垂直語料”的路徑，于近期上線了10億參數的NLP神鶴大模型，可支持問法自動擴寫，大幅提高智能客服回復邏輯的完善度。其中，自研小模型主要負責核心的匹配邏輯，清華系公司智譜AI的ChatGLM-6B開源大模型則用于支撐小模型完成不了的邊緣部分工作，例如對問題相似度算法進行支撐。

　　也有不少公司選擇“幾條腿一起走路”。

　　“百度文心一言，以及其他的一些模型，我們也都在用，只是用的地方不太一樣。”中科深智CTO宋健告訴數智前線，在一些實時性、專業性以及數據安全性等要求較高的場景，例如虛擬助播，他們一般會用上自己自研行業大模型，但在一些通用場景，也會用到文心一言或其他大模型。

　　“這并不矛盾，這些大的互聯網公司的千億級通用大模型還是有它的優勢的，我們并不會把所有的需求都在我們自己的模型上去滿足。”宋健說。在他看來，在這個各種商業模型剛推出不久，尚未十分成熟的階段，很多企業都會去考慮“還有沒有其他選擇”。

　　熵基科技的一位人士也告訴數智前線，他們目前的行業大模型打造路徑，既有自研的，也會基于開源大模型進行微調，二者“互相借鑒”。

　　值得一提的是，多位業內人士均認為，在當下的情況下，出于對成本、進入門檻和速度等的考慮，開源大概率會成為接下來一個非常關鍵的領域。一方面，從事大模型開源的可能會越來越多;另一方面，在開源大模型的基礎上去調試自己的東西，也會成為一個主流。

　　“我覺得90%以上的在未來都會用開源模型。”一位業內資深人士表示，這就像當初的Web服務器、數據庫等互聯網基礎設施，最后在市場上留下來的，除了少量私有，其余絕大部分場景用的都是開源的。

　　“但就現階段而言，你也不能對某個大模型依賴過重，畢竟戰局還沒有最后確認下來。”魏佳星強調，這就好比10年前安卓、塞班、黑莓等一堆底層操作系統廠商在干架，一旦某家企業對某個操作系統過于依賴，后期它的方案又長期跟不上迭代，這家企業就會吃虧。

　　在他看來，基于開源大模型做行業大模型的企業，在盡可能跟市場上這些開源大模型結合的同時，又要解耦。他舉例稱，云蝠智能的行業大模型雖然與GLM是對接的，但都是用的提示詞的形式來對接，耦合度很低的，“我隨便換一個模型，一下就能換掉”。

　　上述熵基科技的人士也透露，他們自研的大模型參數目前會相對小一點，但其會將基于開源大模型微調的模型作為老師或參照物，在對比學習中持續進步，避免對開源大模型形成過度依賴，且最終落到產品里面的，都會是他們的自研大模型。

　　在終局到來之前，行業大模型市場的玩家們都需要在謹慎中前行。

　　03 故事剛剛開始

　　搞行業大模型的玩家一個接著一個，但就目前來看，大多其實都還停留在講概念、講技術、進行內部測試或項目定制的階段。

　　上述熵基科技的人士告訴數智前線，他們目前在探索落地上都還是項目制的，比如他們正和一家醫院一起，用自研大模型，做一個導診臺的問詢機器人，但現在具體的成熟產品還沒有，“還在測”。而在2023安博會上，數智前線發現，現場強調了自己的大模型能力的企業，也大多只展示了他們的大模型技術或相關應用場景的Demo。

　　一位互聯網大廠資深人士也透露，他們目前基本上都還在項目定制階段，著重在提煉需求，積累數據。

　　百度智能云AI平臺副總經理李景秋則表示，現在來找到他們做行業大模型的，都是行業內的龍頭，百度雖然在19年就和浦發銀行、國家電網一起推出了金融、能源行業大模型(非生成式)，且目前已有11個行業大模型(非生成式)的輸出，但具體到最新的生成式行業大模型的應用落地上，還得等幾個月時間，預計會在今年之內實現。

　　一個毋庸置疑的事實是，即使離落地還有一段距離，但大家的確都在奔著這一方向去努力。畢竟，國內絕大部分企業的一大特色正是需要*時間考慮落地問題，將做的東西盡快變現。而大模型也只有跟用戶的場景去進行大量結合，才能不斷自我進化、修正和完善。正如科大訊飛董事長劉慶峰在6月9日的一場發布會上的斷言，在大模型領域，“誰能在具備社會剛需的應用場景落地，誰就能*形成自我造血的良性循環。”

　　“我們首先要把目前已經達到的能力，盡快去落地，其次則是在語言模型的基礎上去做多模態的擴充。”宋健告訴數智前線，這是他們現階段*先級要解決的兩大問題。為此，他們最近已經在將一款基于自研大模型的產品——虛擬助播進行市場推廣。據介紹，基于自有大語言模型GenSense數智姜尚，虛擬助播將可以與主播及評論區進行順暢對話，并保證快速抓屏回答問題、反饋低延時和高識別準確率。

　　不過，宋健也發現，在行業大模型落地的過程中，仍然有不少困難和挑戰需要去解決。其中最關鍵的就在于，當把大模型的能力落到某個實際場景的應用產品上時，由于沒有參照，其實是并不好判斷具體該如何用這些模型的，“還是要做非常多的方法的革新，以及處理方式的變化”。

　　例如在將虛擬助播這個產品用到電商直播場景時，由于每個直播間并不一樣，賣的產品品類也不盡相同，進而導致促銷方式也大為不同，因此往往需要精確挖掘每個直播間的需求，探索在成本可控的情況下，如何更好地讓不同直播間的數據和語言大模型去做結合。“是利用微調，還是用外部數據，又或是通過插件的方式進行，這些東西在不同場景下，用法其實是不一樣的，得到的結果也不一樣。”宋健解釋說。

　　他判斷，在今年下半年，大部分的行業企業可能都會將主要的時間花在如何把大模型用下去上，反而是大模型本身怎么煉制這些東西不再是重點。

　　當然，行業大模型的故事其實才剛剛開始。各行各業的玩家們，都對它寄予了不小的期望。

　　宋健所在的數字人行業，寄希望于大模型能夠讓數字人成功邁入下一階段，即變得具有成長性、全面個性化，而不是像以前一樣“千篇一律”。而魏佳星認為，大模型短期內有望提高智能客戶的智能度，并提高增強其事后的BI能力，長期則有可能形成完全基于生成式的AI智能客服。更多的人，希望它能賦能工業質檢、醫療導診、教學等諸多更廣泛的場景。

　　“但從邏輯上講，行業大模型一定會是在精度相對較低、容錯率較高的行業先引用，再到精度要求高的地方去。”魏佳星表示。

　　文章內容僅供閱讀，不構成投資建議，請謹慎對待。投資者據此操作，風險自擔。

海報生成中...