降低數據治理門檻,降低企業用好數據資產的門檻,讓企業數據消費更便捷。
文|徐鑫 游勇
過去,數據中臺面臨一些挑戰和誤解。由于動輒投入成百上千萬元,數據中臺曾給人留下了又貴又重的印象。高昂的建設成本,成了數據量不大的中小企業的攔路虎,但同時,這些企業對數據建設和治理有旺盛需求。
更大的問題在于,狂飆猛進的技術演進對企業數據治理框架的可擴展性提出了新的挑戰。Gartner報告就指出,到2028年,50%構建于2023年之前的中國數據分析和AI平臺,也將因為與生態系統脫鉤而過時。數據建設領域正呼喚一場革新。
日前,阿里巴巴集團副總裁、瓴羊CEO朋新宇在云棲大會瓴羊Data×AI專場論壇中指出,企業要擁抱AI時代,需要完成場景解構、業務重構。其中,數據基礎設施領域也正在迎來一波重構浪潮。
針對行業里數據治理高成本和難擴展等建設難題,瓴羊Dataphin產品全面升級,新推出的敏捷版用以解決企業數據量不大但需構建數據的場景問題,Dataphin可演進擴展的數據架構體系為企業數據治理預留發展空間,基于大模型打造的DataAgent更是為企業用好數據資產提供了便利。
01
數據治理正當時
數據建設和治理,最為人熟知的概念可能就是數據中臺。
幾年前,大數據浪潮席卷全球,各行各業的先鋒企業都十分重視挖掘企業的數據價值。2017年時,《經濟學人》還在一篇封面文章提及,數據已取代石油,成為世界最有價值的資源。
當時,一批積攢了大量數據的先鋒企業率先意識到,要打破企業內的數據孤島,集中管理、統一處理企業內部數據的重要性,“數據中臺”概念應時而出,阿里作為數據中臺理念的提出者也率先在企業內建設數據中臺并面向企業提供產品和服務。一批傳統行業的龍頭企業,也從戰略布局、積極求變的角度,將數據中臺建設作為整合內部海量數據資產,充分發揮數據價值的重要抓手。
也由于先期入局者自身的數據復雜度高,規模體量大,在數據治理和建設時,投入巨大,建設周期也比較長。這使得行業內也產生過一些爭議,比如一位行業內人士就曾觀察,數據中臺投入大,效果難量化,在一般規模的企業難落地。
今年Gartner在《中國數據分析及人工智能成熟度周期》報告里就把“數據中臺”概念列為逐步過時的技術發展區間。
不過,行業資深人士認為,不能僅從產品和工具的層面來理解“數據中臺”,也不能僅從概念熱度來看“數據中臺”的價值。
“數據中臺更是一種理念和模式,它意味著,對一家企業來說,數據資產是企業資產的重要組成部分。對于這一重要資產,企業需要有一種方式,把數據整合,統一清洗、加工和治理,從而形成便于利用的數據資產。”上述人士說。
Gartner在報告里也提到,當下的技術浪潮下,圍繞著數據集成、元數據管理和數據質量等技術能力建設相關的“數據基建”正處于快速上升期,它將是企業內數據分析和AI應用的可復用基座。“數據中臺”所代表的理念仍然在引領行業發展,同時技術層面也在繼續高速演進。
另外,國家政策層面推進數據要素市場化,也在讓廣大企業加速構建更全面的數據治理和應用能力。
今年1月1日,《企業數據資源相關會計處理暫行規定》(以下簡稱《暫行規定》)正式實施,上市公司的數據資源作為新增會計科目列示在資產負債表下,構成股東權益的一部分。據中國證券報統計,截止今年8月31日,39家上市公司披露數據入表相關情況,總金額達到13.57億元。對不少企業而言,如何實現全域的數據治理,構建數據資產,甚至成為一道必答題。
業界的共識是,這些走在前列的企業,之所以能率先實現數據資產入表,與它們對數據治理工作的長期且持續的重視密不可分。
在宏觀政策和科技浪潮的推動下,以數據驅動業務發展的理念日益深入人心,越來越多的企業意識到了數據治理平臺和數據資產建設的重要性。
在這股浪潮里,中小企業的需求也已經不容小覷。比如瓴羊副總裁王賽就看到,中小型企業有強烈的數據治理及數據資產建設的需求。“企業的數據量相比龍頭企業們可能不是很大,但有復雜度和多樣性,這些企業需要把這些數據做一些輕度的治理。”
但這些企業的數據治理之路面臨不少問題。“中小企業大數據相關的人才儲備可能不足,也沒有太多的預算投入到數據治理領域。”一位資深人士認為,許多企業還對數據資產建設和數據治理的認知也有所欠缺。
基于這些痛點,瓴羊把基于阿里巴巴內部數據治理的經驗,加之服務外部大型企業客戶打造推出的智能數據建設與治理平臺Dataphin,進行了輕量化改造,推出Dataphin敏捷版。
在新推出的Dataphin敏捷版中,產品的架構變得更輕量,能夠幫助中小型企業更低成本地啟動數據治理。以對操作人員的要求為例,Dataphin的敏捷版能兼容關系型數據庫,企業的數據管理人才無需掌握大數據前沿技術,只需掌握SQL就能操作,后續的運維難度也很小,大大降低了數據治理的人才門檻。

“企業最低只需要投入三臺硬件設備,投資僅二三十萬元就能基于Dataphin敏捷版,啟動數據治理工作。”瓴羊數據系統產品線總經理董芳英告訴數智前線。這也意味著,相比于之前功能強大、架構復雜的Dataphin版本,廣大中小企業現在多了一個選擇。
02
數據治理,如何兼顧當前和長遠
當數據量較小的企業,在開啟數據治理工作后,都會考慮一個問題:隨著業務發展,數據量變得龐大之后,是否需要重新更換一套系統?是否會給未來的數據治理留下麻煩?
比如國內一家頭部零售企業,這些年遇到了“成長的煩惱”。由于業務布局廣泛,企業數據需求的復雜程度和處理難度變得極高。
此前,他們基于業務的實際需求,構建了許多不同功能的業務應用系統。但由于企業發展多品牌多渠道,數據量變得極為龐大。同時,不同的業務數據在不同的系統里,存在數十個獨立的數據煙囪。另外,不同的業務線的數據定義還不一樣,數據治理的難度變得極大。
之所以出現這種情況,與企業缺乏長期的數據治理視角有關,此前的數據架構都是從孤立的業務需求出發。這家企業的數據負責人也把數據中臺建設當成了一項長期工作,為此他們還形成了未來三到五年的規劃,來建設企業的數據中臺。
無獨有偶,另一家消費金融企業的數據負責人也察覺到了數據治理的建設思路需要發生變化,“之前更重視產生了什么數據,哪些業務流程是可以數字化的,以及數據合規問題”,但他發現往后看5年,隨著企業數據量越來越大,傳統的數倉建設思路已經不能再支撐企業的存數、管數、用數的需求。
這也是不少企業在數據治理中的共性問題——數據架構如何為未來的發展預留出空間,從而滿足未來更多更復雜的數據治理需求。
基于這一行業普遍痛點,瓴羊的Dataphin產品創新性推出了數據系統的全新架構。這套架構的一個核心特點是可擴展、可演進。
簡單來說,小企業可以基于自身的考量,在早期選擇輕量化且低成本的Dataphin敏捷版產品。而隨著企業的規模擴大,企業可以擴展底層的算力引擎,自如地向上升級,平滑演進,滿足未來的數據治理需求和企業業務發展需要。而這得益于Dataphin敏捷版和原生版本之間采用了同一套底層架構。
這有利于滿足企業數據規模擴大后更復雜的數據治理需求。從敏捷版升級到Dataphin智能研發版后,底層的數據庫可從關系型擴展為交互式、MPP類數據庫,比如StarRocks、ClickHouse、Hologres、Lindorm、Impala等分析能力更強,算力更強的數據庫等,從而支撐起更多維的數據調度和運維等治理任務。

而隨著企業規模的進一步擴大,企業底層的數據支撐還能進一步升級成大數據引擎,甚至可擴展支持湖倉一體。“小型、中型和大型,我們都在一套部署結構之下,可以幫助企業無縫升級。”王賽說。
這考慮到了企業數據治理的長期發展特性,企業可以自如地基于自身的數據規模和治理要求,選擇合適的產品。
另外,在數據治理和運營領域,企業還面臨另一大問題,朋新宇將之界定為個性化和和性價比之間的矛盾。大企業基于自身的業務需求,往往追求私有化部署,但這也意味著更高成本。而標準化的云產品明顯更便宜,但也失去了個性化配置的能力。
針對這個問題,瓴羊Dataphin的解題思路是,在傳統的公共云租戶模式和私有化部署之外,給企業提供“半托管”模式,既能獨享可控的環境,又能享受公共云的彈性調度。
比如,一些集團型企業,不同的業務模塊或者子業務的數據處理要求不一樣。一些財務類、會員類的數據要求本地運行計算,另外一些安全敏感性不高的數據可以上云,與云上業務聯動及數據處理。
這類企業就適合半托管模式,相比公共云模式的“租公寓”式服務,和獨立物理部署的“造別墅”式服務,半托管類似于“租獨棟別墅”,既能滿足這些希望提升數據處理能力,具有個性化定制需求,但同時考量經濟性的企業的需求。

總體而言,在數據治理和數據運營領域,Dataphin正基于阿里巴巴集團多年數據治理的系統化建設經驗,為大中小不同規模的企業,提供橫跨多類引擎,適應多種環境要求的,可擴展可升級的產品。
數據治理領域,企業正迎來按需采購、自如升級的新階段。
03
AI時代,如何讓數據真正用起來
董芳英看過很多數據治理平臺的項目,她發現一個規律,如果對方是一個純IT團隊,沒有數據資產運營的理念,這類項目的成功率往往不會很高。
數據如果只存儲在數據庫里,只會成為成本和負擔。“我們刻在骨子里的理念就是數據構建好之后,一定要把數據用起來。”董芳英告訴數智前線。所以,瓴羊非常強調資產運營,光把數據聚合在一起還不夠,還要讓數據更好地用起來。
而要讓企業用好數據,客觀存在著一個巨大的鴻溝。董芳英發現,表面看企業有數據,業務有問題,把二者匹配就解決了問題,但兩者如何連接起來面臨巨大的考驗。
對業務人員而言,理解業務和理解數據是兩碼事。很多時候業務人員缺乏數據思維,數據獲取依然要求助于數據專家,這面臨著大量的溝通和時間成本。
而在具體的獲取數據環節,數據團隊壓力也很大。他們經常會面臨大量的關于數據在哪里、數據是什么意思、該如何使用、在哪里使用的咨詢。并且,要在海量的數據資產中找到想要的數據,也并不容易。
這反映出,企業用數需求,不止是從Chatbot中獲得一個具體的數據結果,還涉及到基于業務去找到和使用好內部的數據資產的需求。董芳英提到一個具體的例子,她經常碰到客戶提這樣的問題:企業的商機轉化率低,有什么樣的數據能解決問題?
解決問題的核心在業務流程里,先回到業務中,問題涉及哪些人員和組織,涉及哪些流程,這樣才有可能給用戶有價值的指導,而不是就數據返回一個數據結果。
從這一痛點出發,瓴羊今年推出業內首個數據資產智能體——Dataphin·DataAgent,在大模型的加持下,用戶能自定義專屬的Agent,業務人員能更便捷實現從問題到思路、數據、用法的全鏈路自助化操作。
“未來每個人都有一個專屬的數據助手。”王賽說,它不只是工具層面幫用戶取數,還能幫助連接業務,輸入問題后直接給到數據視角的內容。
某一家頭部乳業品牌的數據中臺已經建設多年,形成了超過20個數據域,上千指標,幾百用戶標簽和近百個應用。但目前業務的需求總是通過數據工程師人工滿足,業務人員覺得響應慢,而工程師又被壓得喘不過氣來。現在通過Dataphin的智能DataAgent,每次都能快速找到資產,研發效率翻倍。
這個過程里,Dataphin·DataAgent的三大能力也展露無遺。首先是基于全域的數據資產,可以快速便捷幫助企業構建向量數據庫,完成知識庫的搭建;其次是,基于對知識庫的理解,提供了不少輔助工具和元素化的交互能力,加速智能體的設計和編排;再次,數據智能體一鍵發布,能幫助企業更方便去消費數據。

DataAgent平臺背后,瓴羊還提供了一整套解決方案,底層是基于Dataphin的全域資產,這也是區別一般智能Agent之處。模型能力上,接入了通義千問模型,用戶還可基于百煉平臺按需求選擇其他模型。
大模型升級后,效果也非常明顯。以前在數據資產平臺搜索,只能進行關鍵詞關聯,現在通過Dataphin·DataAgent不僅僅可以把相關數據一并列出,還能基于業務需求,挖掘數據資產,把關鍵數據信息一目了然呈現。
從降低中小企業啟動數據治理的門檻,到降低企業兼具個性化和性價比的前提下用好數據資產的門檻,到基于DataAgent智能體更便捷地消費和使用數據,瓴羊的數據產品和服務正在重構企業數據服務的價值。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。