" />

国产无遮挡免费视频_热久久99这里有精品_无码内射中文字幕岛国片_4hu四虎永久在线影院成人_国产精品麻豆一区_欧美成人亚洲成人_亚洲黄色在线免费观看_精品久久久久久中文字幕动漫_中文字幕久久午夜不卡_日韩中文字幕在线视频播放_五月激情五月婷婷_日本美女视频一区二区

2026跨年去哪玩、怎么玩?問一問小藝,get超全攻略聯(lián)想全新鍵鼠產(chǎn)品陣容曝光:可自適應(yīng)調(diào)整鍵程,CES 2026有望亮相消息稱三星明年推“闊折疊”手機(jī),與蘋果iPhone Fold競(jìng)爭(zhēng)產(chǎn)業(yè)筑基 陜耀未來—2025未來產(chǎn)業(yè)系列對(duì)接活動(dòng)(陜西行)即將啟幕消息稱 OpenAI 算力利潤(rùn)率攀升至 70%,相比去年底大幅增長(zhǎng)新款一汽豐田卡羅拉上市 廠家直銷價(jià)9.9萬(wàn)元起,五大黃金AI服務(wù)功能加持,想幫幫服務(wù)智能體摘得2025 EDGE AWARDS「最佳AI創(chuàng)新應(yīng)用」桂冠內(nèi)存“換軌時(shí)刻”:DDR5成數(shù)字產(chǎn)業(yè)邁向高可靠、高能效的新引擎擔(dān)心寬帶速度縮水 來京東免費(fèi)預(yù)約“寬帶測(cè)速”服務(wù) 專家上門解決網(wǎng)絡(luò)難題京東MALL現(xiàn)場(chǎng)直擊多款多噴頭3D打印機(jī)實(shí)操評(píng)測(cè) 消費(fèi)級(jí)3D打印機(jī)迎來新突破里程碑時(shí)刻!縱橫第100家體驗(yàn)中心榮耀啟幕,筑牢中國(guó)豪華越野品類生態(tài)根基惡意利用“七無天無理由退貨”政策法律不予支持!央視曝光“摸摸黨”拼多多聯(lián)席董事長(zhǎng)趙佳臻:Temu將All In中國(guó)供應(yīng)鏈以科技守味非遺!卡薩帝冰箱冬至將全國(guó)啟幕「好好吃」餃子館字節(jié)TRAE,正悄悄“解放”600萬(wàn)工程師酷開再獲國(guó)家級(jí)“信任牌照”:數(shù)據(jù)安全彰顯戰(zhàn)略定力ThinkPad 2025黑FUN禮——了不起的offer,企業(yè)采購(gòu)專享狂歡來襲!拼多多宣布實(shí)行聯(lián)席董事長(zhǎng)制度 下一個(gè)三年?duì)幦≡僭煲粋(gè)拼多多菜鳥將入股九識(shí)智能 無人車業(yè)務(wù)有望大整合抖音上線“長(zhǎng)輩防走失模式”
  • 首頁(yè) > 企業(yè)IT頻道 > 大數(shù)據(jù)

    AI 算法在大數(shù)據(jù)治理中的應(yīng)用

    2023年03月13日 16:17:19 來源:IT168

      導(dǎo)讀:本文主要分享 Datacake 在大數(shù)據(jù)治理中,AI 算法的應(yīng)用經(jīng)驗(yàn)。本次分享分為五大部分:第一部分闡明大數(shù)據(jù)與 AI 的關(guān)系,大數(shù)據(jù)不僅可以服務(wù)于 AI,也可以使用 AI 來優(yōu)化自身服務(wù),兩者是互相支撐、依賴的關(guān)系;第二部分介紹利用 AI 模型綜合評(píng)估大數(shù)據(jù)任務(wù)健康度的應(yīng)用實(shí)踐,為后續(xù)開展數(shù)據(jù)治理提供量化依據(jù);第三部分介紹利用 AI 模型智能推薦 Spark 任務(wù)運(yùn)行參數(shù)配置的應(yīng)用實(shí)踐,實(shí)現(xiàn)了提高云資源利用率的目標(biāo);第四部分介紹在 SQL 查詢場(chǎng)景中,由模型智能推薦任務(wù)執(zhí)行引擎的實(shí)踐;第五部分展望了在大數(shù)據(jù)整個(gè)生命周期中,AI 的應(yīng)用場(chǎng)景。

      01 大數(shù)據(jù)與 AI

      普遍觀念認(rèn)為,云計(jì)算收集存儲(chǔ)海量數(shù)據(jù),從而形成大數(shù)據(jù);再經(jīng)過對(duì)大數(shù)據(jù)的挖掘?qū)W習(xí),進(jìn)一步形成 AI 模型。這種觀念默認(rèn)了大數(shù)據(jù)服務(wù)于 AI,但忽視了其實(shí) AI 算法也可以反哺于大數(shù)據(jù),它們之間是一個(gè)雙向、互相支撐、依賴的關(guān)系。

      大數(shù)據(jù)的全生命周期可以分成六個(gè)階段,每個(gè)階段都面臨一些問題,恰當(dāng)?shù)厥褂?AI 算法有助于這些問題的解決。

      數(shù)據(jù)采集:這個(gè)階段會(huì)比較關(guān)注數(shù)據(jù)采集的質(zhì)量、頻率、以及安全性,例如采集到的數(shù)據(jù)是否完整,采集數(shù)據(jù)的速度是否過快或者過慢,采集的數(shù)據(jù)是否經(jīng)過脫敏或者加密等。這時(shí)候 AI 可以發(fā)揮一些作用,比如基于同類應(yīng)用來評(píng)估日志采集的合理性、使用異常檢測(cè)算法來發(fā)現(xiàn)數(shù)據(jù)量暴增或驟減等情況。

      數(shù)據(jù)傳輸:這個(gè)階段比較關(guān)注數(shù)據(jù)的可用性、完整性和安全性,可以使用 AI 算法來做一些故障的診斷和入侵檢測(cè)。

      數(shù)據(jù)存儲(chǔ):這個(gè)階段比較關(guān)注數(shù)據(jù)的存儲(chǔ)結(jié)構(gòu)是否合理、資源占用是否足夠低、是否足夠安全等,同樣可以用 AI 算法來做一些評(píng)估以及優(yōu)化。

      數(shù)據(jù)處理:這個(gè)階段是影響及優(yōu)化收益最明顯的一個(gè)階段,其核心問題就是提高數(shù)據(jù)的處理效率且降低資源的消耗,AI 可以從多個(gè)著手點(diǎn)進(jìn)行優(yōu)化。

      數(shù)據(jù)交換:企業(yè)之間的合作越來越多,這就會(huì)涉及到數(shù)據(jù)的安全性問題。算法在這方面也可以得到應(yīng)用,比如時(shí)下熱門的聯(lián)邦學(xué)習(xí)就可以幫助更好更安全地進(jìn)行數(shù)據(jù)的共享。

      數(shù)據(jù)銷毀:數(shù)據(jù)不可能只存不刪,這就需要考慮什么時(shí)候可以去刪數(shù)據(jù)、是否有風(fēng)險(xiǎn)。在業(yè)務(wù)規(guī)則的基礎(chǔ)上,AI 算法可以輔助判斷刪除數(shù)據(jù)的時(shí)機(jī)及關(guān)聯(lián)影響。

      整體來看,數(shù)據(jù)生命周期管理有三大目標(biāo):高效、低成本,以及安全。以往的做法是依靠專家經(jīng)驗(yàn)來制定一些規(guī)則策略,其弊端非常明顯,成本高、效率低。恰當(dāng)?shù)夭捎?AI 算法可以避免這些弊端,反哺于大數(shù)據(jù)基礎(chǔ)服務(wù)的建設(shè)。

      02 大數(shù)據(jù)任務(wù)健康度評(píng)估

      在茄子科技,已經(jīng)落地的幾個(gè)應(yīng)用場(chǎng)景,首先是大數(shù)據(jù)任務(wù)健康度的評(píng)估。

      在大數(shù)據(jù)平臺(tái)上,每天運(yùn)行著成千上萬(wàn)的任務(wù)。但是很多任務(wù)僅停留在能正確產(chǎn)數(shù)階段,對(duì)于任務(wù)的運(yùn)行耗時(shí)、資源消耗等并未給予關(guān)注,導(dǎo)致很多任務(wù)存在效率低下、資源浪費(fèi)的情況。

      即使有數(shù)據(jù)開發(fā)者開始關(guān)注任務(wù)健康度,也很難準(zhǔn)確的評(píng)估任務(wù)究竟健康與否。因?yàn)槿蝿?wù)相關(guān)的指標(biāo)非常多,失敗率、耗時(shí)、資源消耗等,況且不同任務(wù)的復(fù)雜度及處理數(shù)據(jù)的體量存在天然差別,因此簡(jiǎn)單選擇某項(xiàng)指標(biāo)的絕對(duì)值作為評(píng)估標(biāo)準(zhǔn)顯然是不合理的。

      沒有量化的任務(wù)健康度,就很難確定哪些任務(wù)不健康、需要治理,更不知道問題在哪里、從哪著手治理,即使治理完也不知道效果如何,甚至出現(xiàn)某項(xiàng)指標(biāo)提升但別的指標(biāo)惡化的情況。

      需求:面對(duì)上述難題,我們急需一種量化指標(biāo)來準(zhǔn)確反映任務(wù)的綜合健康狀況。人工制定規(guī)則的方式效率低且不全面,因此考慮借助機(jī)器學(xué)習(xí)模型的力量。目標(biāo)是模型能給出任務(wù)的量化評(píng)分及其在全局分布中的位置,并且給出任務(wù)的主要問題及解決方案。

      對(duì)此需求,我們的功能模塊方案是,在管理界面顯示 owner 名下所有任務(wù)的關(guān)鍵信息,如評(píng)分、任務(wù)成本、CPU 利用率、內(nèi)存利用率等。這樣任務(wù)的健康度一目了然,方便后續(xù)由任務(wù) owner 去做任務(wù)的治理。

      其次,評(píng)分功能的模型方案,我們是把它作為一個(gè)分類問題來處理。直觀來看,任務(wù)評(píng)分顯然是一個(gè)回歸問題,給出的應(yīng)該是 0 到 100 之間的任意實(shí)數(shù)。但這樣的話就要求有足夠多的帶評(píng)分的樣本,人工標(biāo)注成本高且不可靠。

      因此我們考慮將問題轉(zhuǎn)化為分類問題,分類模型給出的類別概率可以進(jìn)一步映射為實(shí)數(shù)分值。我們將任務(wù)分為好任務(wù) 1 和壞任務(wù) 0 兩類,由大數(shù)據(jù)工程師標(biāo)注。所謂好任務(wù),通常是指同等任務(wù)量與復(fù)雜度的情況下,耗時(shí)短、資源消耗少的任務(wù)。

      模型訓(xùn)練過程為:

      首先是樣本準(zhǔn)備,我們的樣本來自于歷史運(yùn)行的任務(wù)數(shù)據(jù),樣本特征包括運(yùn)行時(shí)間、使用的資源、是否執(zhí)行失敗等等,樣本標(biāo)簽是由大數(shù)據(jù)工程師根據(jù)規(guī)則或經(jīng)驗(yàn)標(biāo)注成好、壞兩類。然后就可以訓(xùn)練模型了,我們先后嘗試過 LR、GBDT、XGboost 等模型,理論及實(shí)踐均證明 XGboost 具有更好的分類效果。模型最終會(huì)輸出任務(wù)為“好任務(wù)”的概率,該概率越大,最終映射出的任務(wù)評(píng)分就越高。

      經(jīng)過訓(xùn)練之后,從最初將近 50 個(gè)原始特征里面篩選出 19 個(gè)特征,這 19 個(gè)特征基本上能夠決定一個(gè)任務(wù)是否是一個(gè)好的任務(wù)。比如失敗次數(shù)多的任務(wù)、資源利用率低的任務(wù),大部分得分不會(huì)太高,與人工的主觀感受基本一致。

      使用模型對(duì)任務(wù)打分后可以看到,在 0 到 30 分以下屬于不太健康的、急需要治理的任務(wù);30 到 60 之間的是健康度尚可的任務(wù);60 分以上的是健康度比較好的,需要保持現(xiàn)狀的任務(wù)。這樣有了量化指標(biāo),就可以引導(dǎo)任務(wù) owner 去積極地做一些任務(wù)的治理,從而實(shí)現(xiàn)降本增效的目標(biāo)。

      模型應(yīng)用之后給我們帶來了如下收益:

      ① 首先,任務(wù) owner 對(duì)其名下任務(wù)的健康度可以做到心中有數(shù),通過分?jǐn)?shù)、排名就能夠知道任務(wù)是否需要治理;

      ② 量化的指標(biāo)為后續(xù)開展任務(wù)治理提供了依據(jù);

      ③ 任務(wù)治理完成之后取得了多大的收益,有多少提升,同樣可以通過分?jǐn)?shù)得到量化的展示。

      03 Spark 任務(wù)智能調(diào)參

      第二個(gè)應(yīng)用場(chǎng)景是 Spark 任務(wù)的智能調(diào)參。Gartner 的一項(xiàng)調(diào)研揭示,云用戶消耗的 70% 的云資源都存在不必要的浪費(fèi)。在申請(qǐng)?jiān)瀑Y源時(shí),很多人為了確保任務(wù)的成功執(zhí)行,可能會(huì)去多申請(qǐng)一些資源,這就會(huì)造成不必要的浪費(fèi)。還有很多人在創(chuàng)建任務(wù)時(shí)采用了默認(rèn)配置,但其實(shí)這并不是最優(yōu)配置。如果能夠認(rèn)真配置,可以達(dá)到非常好的效果,既能保證運(yùn)行效率,又能保證運(yùn)行成功,同時(shí)還能夠節(jié)省很多的資源。但任務(wù)參數(shù)配置對(duì)用戶有很高的要求,除了了解配置項(xiàng)的含義,還需要考慮配置項(xiàng)之間的關(guān)聯(lián)影響。即使依賴專家經(jīng)驗(yàn)也很難達(dá)到最優(yōu),而且規(guī)則類的策略難以動(dòng)態(tài)調(diào)整。

      這就提出一個(gè)需求,希望由模型智能地推薦出任務(wù)運(yùn)行最優(yōu)的參數(shù)配置,使得在保持任務(wù)原有運(yùn)行時(shí)間不變長(zhǎng)的前提下,提高任務(wù)云資源的利用率。

      對(duì)于任務(wù)調(diào)參功能模塊,我們?cè)O(shè)計(jì)的方案包含兩種情況:第一種是對(duì)于已經(jīng)在線上運(yùn)行了一段時(shí)間的任務(wù),模型要能夠根據(jù)任務(wù)歷史運(yùn)行情況推薦出最合適的配置參數(shù);第二種情況是對(duì)于用戶還沒上線的任務(wù),模型要能夠通過對(duì)任務(wù)的分析給出合理的配置。

      接下來就是訓(xùn)練模型了,首先要確定模型的輸出目標(biāo)。可配置項(xiàng)有三百多條,不可能都由模型給出。經(jīng)過測(cè)試與調(diào)研,我們選擇了三項(xiàng)對(duì)任務(wù)運(yùn)行性能影響最大的參數(shù),分別是執(zhí)行器 executor 的 cores 核心數(shù)、memory 內(nèi)存總量、instances 實(shí)例個(gè)數(shù)。每個(gè)配置項(xiàng)都有其默認(rèn)值及可調(diào)范圍,其實(shí)就是給定了一個(gè)參數(shù)空間,模型只需要在這個(gè)空間里去尋找更優(yōu)解即可。

      訓(xùn)練階段,有兩種方案來進(jìn)行。方案一是學(xué)習(xí)經(jīng)驗(yàn)規(guī)則:前期采用規(guī)則的方式推薦參數(shù),上線之后效果還不錯(cuò),因此先讓模型來學(xué)習(xí)這套規(guī)則,從而達(dá)到快速上線的目標(biāo)。模型訓(xùn)練樣本是之前根據(jù)規(guī)則計(jì)算出來的七萬(wàn)余條任務(wù)配置,樣本特征是任務(wù)的歷史運(yùn)行數(shù)據(jù)(比如任務(wù)處理的數(shù)據(jù)量、資源的使用量、任務(wù)耗時(shí)等),以及一些統(tǒng)計(jì)信息(比如過去七日的平均耗量、最大耗量等)。

      基礎(chǔ)模型我們選擇了多因變量的多元回歸模型。常見的回歸模型是單輸出的,有很多自變量但只有一個(gè)因變量。這里我們希望能輸出三個(gè)參數(shù),所以采用的是多因變量的多元回歸模型,它的本質(zhì)還是一個(gè) LR 模型。

      上圖展示的是這個(gè)模型的理論基礎(chǔ)。左側(cè)是一個(gè)多標(biāo)簽,就是三個(gè)配置項(xiàng),β 是每個(gè)特征的系數(shù),Σ 是誤差。訓(xùn)練方式和一元回歸一樣,用最小二乘法去做估計(jì)使得 Σ 中各元素的平方和達(dá)到最小。

      方案一的好處,就是能快速學(xué)到規(guī)則經(jīng)驗(yàn),成本也是比較小的。缺陷是其優(yōu)化上限最多能達(dá)到和規(guī)則一樣好的效果,但如果想超過會(huì)比較困難。

      第二種方案是貝葉斯優(yōu)化,其思路和強(qiáng)化學(xué)習(xí)比較類似,通過在參數(shù)空間里做嘗試尋找最優(yōu)配置。這里采用了貝葉斯框架,原因是其能夠利用上一次嘗試的基礎(chǔ),在下次嘗試時(shí)就會(huì)有一些先驗(yàn)的經(jīng)驗(yàn),能夠快速找到較優(yōu)位置。整個(gè)訓(xùn)練過程會(huì)在一個(gè)參數(shù)空間里面進(jìn)行,隨機(jī)采樣一種配置來做驗(yàn)證,然后去運(yùn)行;運(yùn)行之后會(huì)關(guān)注一些指標(biāo),比如使用率、成本等,判斷是不是更優(yōu);然后重復(fù)以上步驟,直到調(diào)優(yōu)完成。模型訓(xùn)練好后,在使用過程中也有一個(gè)取巧的過程,假如新任務(wù)和歷史任務(wù)有一定的相似度,就不需要再去計(jì)算一遍配置,直接采用以往的更優(yōu)配置即可。

      經(jīng)過這兩種方案的嘗試和實(shí)踐,能夠看到取得了一定的效果。對(duì)于已有的任務(wù),按照模型推薦的配置參數(shù)來做修改后,80% 以上的任務(wù)能夠?qū)崿F(xiàn)大概 15% 的資源利用率的提升,部分任務(wù)資源的使用率甚至是翻倍的。但這兩種方案其實(shí)都存在缺陷:學(xué)習(xí)規(guī)則的回歸模型,其優(yōu)化上限較低;全局尋優(yōu)的貝葉斯優(yōu)化模型,缺點(diǎn)是要做各種嘗試,成本太高。

      未來的探索方向有以下幾個(gè):

      語(yǔ)義分析:Spark 語(yǔ)義是比較豐富的,包含不同的代碼結(jié)構(gòu)和算子函數(shù),其與任務(wù)參數(shù)配置、資源消耗息息相關(guān)。但是目前我們利用的只是任務(wù)的歷史運(yùn)行情況,忽略了 Spark 語(yǔ)義本身,這就是一種信息的浪費(fèi)。接下來要做的是滲透到代碼層面,分析 Spark 任務(wù)中包含的算子函數(shù),據(jù)此做更細(xì)粒度的調(diào)優(yōu)。

      分類調(diào)優(yōu):Spark 的應(yīng)用場(chǎng)景很多,比如用于純分析、用于開發(fā)、用于處理等,不同場(chǎng)景的調(diào)優(yōu)空間與目標(biāo)也是不同的,所以有必要做分類調(diào)優(yōu)。

      工程優(yōu)化:在實(shí)踐過程中遇到的一個(gè)困難是樣本較少、測(cè)試成本較高,這需要相關(guān)方共同配合,在工程或流程上做優(yōu)化。

      04 SQL 任務(wù)執(zhí)行引擎智能選擇

      第三個(gè)應(yīng)用場(chǎng)景是 SQL 查詢?nèi)蝿?wù)執(zhí)行引擎的智能選擇。

      背景:

      (1)SQL 查詢平臺(tái)是大多數(shù)用戶接觸最多的、體驗(yàn)最明顯的一個(gè)大數(shù)據(jù)產(chǎn)品,不管是數(shù)據(jù)分析師、研發(fā),還是產(chǎn)品經(jīng)理,每天都會(huì)寫大量 SQL 來獲取自己想要的數(shù)據(jù);

      (2)很多人在運(yùn)行 SQL 任務(wù)的時(shí)候,并不會(huì)去關(guān)注底層的執(zhí)行引擎,比如 Presto 是基于純內(nèi)存的計(jì)算,在一些簡(jiǎn)單查詢的場(chǎng)景下,其優(yōu)勢(shì)就是執(zhí)行速度會(huì)比較快,但缺點(diǎn)就是假如存儲(chǔ)量不夠用的話會(huì)直接掛掉;與它形成對(duì)比的是 Spark,其比較適合執(zhí)行大數(shù)據(jù)量的復(fù)雜場(chǎng)景,即使出現(xiàn)了 oom 也會(huì)使用磁盤的存儲(chǔ),從而避免任務(wù)的失敗。所以,不同的引擎是適合不同的任務(wù)場(chǎng)景的。

      (3)SQL 查詢效果要綜合考慮任務(wù)的執(zhí)行時(shí)間以及資源的消耗,既不能過分追求查詢速度而不考慮資源消耗,也不能為了節(jié)省資源而影響查詢效率。

      (4)業(yè)界傳統(tǒng)的引擎選擇方式主要有三種,RBO、CBO 和 HBO。RBO 是基于規(guī)則的優(yōu)化器,規(guī)則制定困難且更新頻率低;CBO 是基于成本的優(yōu)化,太過于追求成本的優(yōu)化,可能會(huì)導(dǎo)致任務(wù)執(zhí)行失敗;HBO 是基于歷史任務(wù)運(yùn)行情況的一種優(yōu)化器,比較局限于歷史數(shù)據(jù)。

      在功能模塊上的設(shè)計(jì),當(dāng)用戶編寫完 SQL 語(yǔ)句提交執(zhí)行后,由模型自動(dòng)判斷使用哪種引擎并彈窗提示,由用戶最終決定是否采用推薦的引擎執(zhí)行。

      模型的整體方案是基于 SQL 語(yǔ)句本身來推薦執(zhí)行引擎。因?yàn)閺?SQL 本身就能夠看到用了什么表、用到哪些函數(shù)等,這些信息直接決定了 SQL 的復(fù)雜度,從而影響執(zhí)行引擎的選擇。模型訓(xùn)練樣本來自于歷史運(yùn)行的 SQL 語(yǔ)句,模型標(biāo)簽是根據(jù)歷史執(zhí)行情況進(jìn)行標(biāo)注,比如任務(wù)執(zhí)行超長(zhǎng)、涉及數(shù)據(jù)量超大的任務(wù)會(huì)標(biāo)為適合在 Spark 上運(yùn)行,剩下的就是適合在 Presto 上去運(yùn)行的 SQL。樣本特征提取用到 NLP 技術(shù),N-gram 加 TF-IDF 方法,大致原理是提取詞組去看它在語(yǔ)句中出現(xiàn)的頻率,這樣能夠提取出關(guān)鍵詞組。經(jīng)此操作后生成的向量特征非常大,我們先利用線性模型篩選出 3000 個(gè)特征,然后訓(xùn)練生成 XGBoost 模型作為最終的預(yù)測(cè)模型。

      經(jīng)過訓(xùn)練之后,能夠看到模型預(yù)測(cè)的準(zhǔn)確度還是比較高的,大概 90% 以上。

      最終模型在線上的應(yīng)用流程是:用戶提交 SQL 后由模型推薦執(zhí)行引擎,假如與用戶最初選擇的引擎不一樣,則會(huì)調(diào)用語(yǔ)言轉(zhuǎn)換模塊完成 SQL 語(yǔ)句的轉(zhuǎn)換。假如切換引擎之后執(zhí)行失敗,我們會(huì)有 failover 機(jī)制切回到用戶原有引擎去執(zhí)行,保證任務(wù)執(zhí)行成功。

      該實(shí)踐的收益是模型可以自動(dòng)選擇出最適合的執(zhí)行引擎,并且完成后續(xù)的語(yǔ)句轉(zhuǎn)換,不需要用戶再去做額外的學(xué)習(xí)。

      另外,模型推薦的引擎基本上能夠保持原有的執(zhí)行效率不變,同時(shí)又能夠降低失敗率,所以整體上用戶體驗(yàn)會(huì)上升。

      最后就是由于減少了不必要的高成本引擎的使用,以及任務(wù)執(zhí)行失敗率的下降,使得整體資源成本消耗下降。

      第二部分到第四部分,我們分享了 AI 算法在大數(shù)據(jù)平臺(tái)上的三個(gè)應(yīng)用。能夠看到它的一個(gè)特點(diǎn),就是使用的算法并不是特別復(fù)雜,但是效果會(huì)非常明顯。這就啟發(fā)我們要主動(dòng)去了解大數(shù)據(jù)平臺(tái)在運(yùn)行過程中有哪些痛點(diǎn)或者優(yōu)化空間,確定好應(yīng)用場(chǎng)景后就可以嘗試使用不同的機(jī)器學(xué)習(xí)方法去解決這些問題,從而實(shí)現(xiàn) AI 算法向大數(shù)據(jù)的反哺。

      05 AI 算法在大數(shù)據(jù)治理中的應(yīng)用展望

      最后我們展望一下 AI 算法在大數(shù)據(jù)治理中的應(yīng)用場(chǎng)景。

      以上介紹的三個(gè)應(yīng)用場(chǎng)景,比較集中在數(shù)據(jù)處理階段。其實(shí)呼應(yīng)一下第一章講的 AI 和大數(shù)據(jù)的關(guān)系,在整個(gè)數(shù)據(jù)生命周期里,AI 都能發(fā)揮比較好的作用。

      比如在數(shù)據(jù)采集階段,能夠判斷日志是否合理;傳輸時(shí)能夠去做入侵檢測(cè);處理時(shí),還可以再進(jìn)一步的降本增效;交換時(shí)去做一些保障數(shù)據(jù)安全的工作;銷毀時(shí)能夠去判斷銷毀的時(shí)機(jī)與關(guān)聯(lián)影響等。AI 在大數(shù)據(jù)平臺(tái)的應(yīng)用場(chǎng)景是非常多的,這里僅是拋磚引玉。相信未來 AI 與大數(shù)據(jù)的互相支撐關(guān)系會(huì)更加凸顯,AI 輔助大數(shù)據(jù)平臺(tái)更好地去采集處理數(shù)據(jù),更好的數(shù)據(jù)質(zhì)量后續(xù)又能幫助訓(xùn)練更好的 AI 模型,從而實(shí)現(xiàn)良性循環(huán)。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    海報(bào)生成中...

    最新新聞

    熱門新聞

    即時(shí)

    全球頂級(jí)AI創(chuàng)作社區(qū)回歸!海藝AI國(guó)內(nèi)首發(fā)“全民娛樂化創(chuàng)作

    海藝AI的模型系統(tǒng)在國(guó)際市場(chǎng)上廣受好評(píng),目前站內(nèi)累計(jì)模型數(shù)超過80萬(wàn)個(gè),涵蓋寫實(shí)、二次元、插畫、設(shè)計(jì)、攝影、風(fēng)格化圖像等多類型應(yīng)用場(chǎng)景,基本覆蓋所有主流創(chuàng)作風(fēng)格。

    新聞

    市場(chǎng)占比高達(dá)35.8%,阿里云引領(lǐng)中國(guó)AI云增長(zhǎng)

    9月9日,國(guó)際權(quán)威市場(chǎng)調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布了《中國(guó)AI云市場(chǎng),1H25》報(bào)告。中國(guó)AI云市場(chǎng)阿里云占比8%位列第一。

    企業(yè)IT

    華為坤靈發(fā)布IdeaHub千行百業(yè)體驗(yàn)官計(jì)劃,助力中小企

    9月24日,華為坤靈召開“智能體驗(yàn),一屏到位”華為IdeaHub千行百業(yè)體驗(yàn)官計(jì)劃發(fā)布會(huì)。

    3C消費(fèi)

    雅馬哈推出兩款高端頭戴耳機(jī)YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機(jī),分別是平板振膜的YH-4000和動(dòng)圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機(jī)器人出貨量同比暴

    IDC今日發(fā)布的《全球智能家居清潔機(jī)器人設(shè)備市場(chǎng)季度跟蹤報(bào)告,2025年第二季度》顯示,上半年全球智能家居清潔機(jī)器人市場(chǎng)出貨1,2萬(wàn)臺(tái),同比增長(zhǎng)33%,顯示出品類強(qiáng)勁的市場(chǎng)需求。

    中文字幕乱码亚洲精品一区| 国产精品日韩三级| 国内揄拍国内精品| 亚洲一区在线播放| 久久久久999| av免费网站观看| 在线免费观看麻豆| 欧美日韩亚洲一区二区| 免费涩涩18网站入口| 国产又色又爽又黄又免费| 性欧美大战久久久久久久久| 国产精品乱子久久久久| 91在线观看免费观看| 国产情侣自拍av| 57pao国产成人免费| 国产毛片精品视频| 日韩av中文字幕在线| 无码av天堂一区二区三区| 久久婷婷五月综合| 亚洲精品综合久久| 日韩精品视频网| 国产日韩欧美a| 亚洲欧美日韩一区二区在线| 午夜欧美一区二区三区免费观看| 国产一二三四区在线观看| 欧美a一区二区| 日韩精品成人一区二区在线观看| 精品少妇一二三区| 亚洲欧美激情插 | 国产精品久久久久久久天堂第1集 国产精品久久久久久久免费大片 国产精品久久久久久久久婷婷 | 久久精品亚洲精品国产欧美kt∨| 亚洲资源视频| 国产女人18毛片水真多成人如厕| 欧美二区在线播放| 免费成人黄色大片| 国产传媒久久文化传媒| 俺去啦;欧美日韩| 欧美日韩亚洲一区二区三区在线观看| 国产高清在线免费| 国产精品免费一区二区| 国产三区在线成人av| 中文字幕人妻一区| 一区二区三区精品视频在线| 久久久久久久久久久免费| 日韩精品一区三区| 欧美激情中文网| 日韩一级二级三级| 日批免费在线观看| 国产精品久久久久久久美男 | 九九精品视频在线| 一级特级黄色片| 亚洲久本草在线中文字幕| 色一情一乱一伦一区二区三区| 国产99久久久久久免费看农村| 青青青国产在线视频| 日韩一区二区三免费高清| 国产精品成人69xxx免费视频| 欧美日韩大陆在线| 在线成人激情视频| 中文字幕+乱码+中文乱码www| 1024成人网| 国产成人在线网址| 天堂av免费看| 日韩电影视频免费| 国产网站一区二区| 国产午夜久久久| 日韩你懂的在线观看| 久久久久国产一区| 久久久噜噜噜久久久| 亚洲图片欧美日韩| 日韩中文字幕第一页| 三级欧美在线一区| 国产传媒一区| 久久精品女人天堂| 久久av在线看| 黄瓜视频污在线观看| 欧美日韩免费不卡视频一区二区三区| 精品在线一区二区| 国产毛片视频网站| 亚洲日本欧美天堂| 国产在线精品一区免费香蕉 | 日本久久电影网| 欧美中文字幕在线观看视频| 成人自拍视频网站| 欧美一级片在线看| 青青草av在线播放| 国产91免费视频| 特级做a爱片免费69| 国产精品一区二区你懂得| 一道本无吗dⅴd在线播放一区 | 午夜免费福利视频在线观看| 中文字幕亚洲一区二区三区| 久久久国产免费| 黄色一级大片免费| 亚洲图片自拍偷拍| 免费成人在线网站| 欧美成人第一页| 国产成人久久精品77777综合| 欧美精品中文字幕一区二区| 欧美韩日一区二区三区四区| 国产黄色一区二区三区| 国产一区高清在线| 亚洲在线视频免费观看| 九九热精品免费视频| 国产精品成人网| 人人艹在线视频| av之家在线观看| 色94色欧美sute亚洲线路一ni| 天天干免费视频| 女人十八毛片嫩草av| 精品动漫一区二区| 婷婷国产成人精品视频| 性高潮免费视频| 中文字幕99页| 国产女主播在线播放| 蜜臀av.com| 欧美麻豆精品久久久久久| 国精产品一区一区三区免费视频| 欧美日韩在线高清| 97热精品视频官网| 国产精品无码久久久久成人app| 成人小视频在线观看免费| av之家在线观看| 亚洲自拍小视频免费观看| 欧美激情一区二区三区| 韩国女主播成人在线观看| www.亚洲天堂| 日韩大陆毛片av| 精品无码久久久久久国产| 五月天精品一区二区三区| 亚洲偷欧美偷国内偷| 欧美日韩国产精品成人| 久久精品2019中文字幕| 亚洲高清久久久久久| 国产一区二区久久| 国产专区第一页| 性欧美13一14内谢| 日本黄色www| 欧美日韩中文另类| 超碰在线观看91| 日韩 国产 欧美| 亚洲天堂一区二区在线观看| 久久久免费观看| 精品国产1区二区| 久久国产精品无码一级毛片| 成人黄色片视频网站| 欧美xxxxxxxx| 中文字幕高清不卡| 亚洲成人精品久久久| 最新国产精品拍自在线播放 | 欧美人与物videos另类| 国产精品久久在线观看| 国产精品久久久久99| 蜜臀av免费在线观看| 欧美丰满熟妇bbb久久久| 午夜国产一区二区三区| 色呦呦一区二区| 久久网站免费视频| 日韩亚洲欧美中文在线| 国内久久精品视频| 午夜宅男在线视频| 成年人网站大全| y111111国产精品久久婷婷| 国产精品久久久久aaaa九色| 欧美一区二区三区四区视频| 992tv成人免费视频| 色老综合老女人久久久| 欧美日韩午夜影院| 天堂网2014av| 天天综合久久综合| 国产精品人人人人| 日韩在线视频免费播放| 日韩国产欧美亚洲| 欧美日韩国产一二| 91精产国品一二三产区别沈先生| 日韩三级免费看| 亚洲熟妇无码乱子av电影| 成年人视频网站免费| 最新av在线免费观看| 热久久这里只有精品| 在线观看亚洲成人| 亚洲欧美一区二区三区国产精品 | www日韩大片| 东方av正在进入| 欧美日韩精品久久| 欧美亚洲另类久久综合| 国产a级片视频| 永久av免费网站| 欧美日韩一级在线| 国产成人精品无码播放| 久草视频手机在线观看| 久章草在线视频| 91精品久久久久久久久不口人 | 国产精品免费一区二区三区在线观看 | 亚洲精品视频自拍| 亚洲一级视频在线观看| 欧美精品七区| 国产日韩精品在线| 国产91精品不卡视频| 国产精品一区而去| 中文字幕人妻熟女人妻洋洋| a级片一区二区| 精品少妇一区二区三区免费观 | 国产91色在线|免| 欧美亚洲免费电影| 波多野结衣电影免费观看| 天堂中文在线官网| 亚洲精品www久久久久久广东| 午夜精品国产更新| 精品国产一区二区三区不卡 | 色综合网站在线| 精品亚洲免费视频| www.伊人久久| 国产精品999在线观看| 日本熟妇毛耸耸xxxxxx| 久久精品欧美一区二区| 麻豆成人免费视频| 国产色产综合产在线视频| 91精品国产乱码久久蜜臀| 亚洲性无码av在线| www.成人av.com| 少妇性l交大片7724com| 免费成人你懂的| 久久久亚洲福利精品午夜| 在线视频观看一区二区| 久久爱www久久做| 国内精品小视频| 无码免费一区二区三区免费播放| 一区二区久久精品| 欧美 日韩 成人| www.日韩在线观看| 在线日韩国产网站| 内射无码专区久久亚洲| 免费国产羞羞网站视频| 国产一区二区三区免费看| 91黄色免费网站| 精品不卡在线| 美女视频久久黄| 成人高清在线观看| 亚洲这里只有精品| 成年人在线观看av| 国产在线视频卡一卡二| 国产精品久久久久四虎| 欧美激情xxxxx| 一级黄色片在线免费观看| 欧美在线a视频| 国产欧美一区二区三区视频在线观看| 9i看片成人免费看片| 国产午夜亚洲精品羞羞网站| 免费一区二区三区在在线视频| 免费成人深夜夜行p站| 午夜av电影一区| 欧美一级视频免费看| 在线观看亚洲国产| 精品日本高清在线播放| 国产精品久久久久久久久久免费| 一区二区三区国产好的精华液| a天堂在线观看视频| 色婷婷精品大视频在线蜜桃视频 | 久久777国产线看观看精品| av成人免费观看| 欧美在线a视频| 一区二区三区免费在线| 日本熟妇一区二区| 欧美国产成人在线| 成人精品网站在线观看| 福利在线一区二区| 麻豆亚洲av成人无码久久精品| 午夜精品久久久| 另类欧美小说| 极品美女销魂一区二区三区免费| 91理论片午午论夜理片久久| 麻豆精品一二三| 亚洲精品久久久久中文字幕欢迎你| 免费看91视频| 天堂av资源网| 亚洲福利在线视频| 免费观看成人在线视频| 蜜桃视频免费观看一区| 欧美精品日韩三级| 性欧美精品中出| 国产成人亚洲精品自产在线| 色琪琪一区二区三区亚洲区| 午夜精品www| 小泽玛利亚视频在线观看| 国产精品久久久久久久免费看| 亚洲综合丁香婷婷六月香| 国产99在线|中文| 美国黑人一级大黄| 福利一区福利二区微拍刺激| 日韩中文字幕av在线| 中文字幕人妻一区二区三区视频 | 精品在线观看一区| 2019av中文字幕| 久久99久久久欧美国产| 亚洲高清在线观看一区| 懂色av蜜臀av粉嫩av分享吧最新章节| 亚洲欧美精品在线| 中文字幕 自拍| 精品1区2区在线观看| 超碰91在线播放| 一区二区久久久久| 手机在线视频你懂的| 麻豆久久久久久久| 国产精品免费区二区三区观看| 在线观看av大片| 色天使久久综合网天天| 欧美日韩一区在线观看视频| 一区二区三区免费观看视频| 日韩av电影院| 久久亚洲影院| 国产男女猛烈无遮挡91| 国产精品第12页| 秋霞影院一区二区| 亚洲综合自拍一区| 亚洲中文字幕在线观看| 久久久久久97| 永久免费未视频| 色婷婷综合视频在线观看| 91欧美一区二区三区| 狠狠干狠狠久久| 草草草视频在线观看| 久久午夜羞羞影院免费观看| 欧美激情精品久久久久久久变态 | 久久久久久99久久久精品网站| 97在线国产视频| 天天操夜夜操视频| 国产97人人超碰caoprom| 黄色资源网久久资源365| 日韩中文字在线| 手机精品视频在线| 亚洲综合区在线| 在线观看国产免费视频| 国产视频在线一区二区| 这里只有精品免费视频| 99久久精品国产精品久久| 最近中文字幕mv在线一区二区三区四区 | 91久久精品网| 久久久久99精品成人片三人毛片| 高清不卡一区二区三区| 成人永久aaa| 日韩免费av片在线观看| 中文字幕黄色片| 91精品视频在线| 精品一区二区三区久久久| 九九九九久久久久| 草久视频在线观看| 中文字幕欧美日韩精品| 欧美成人免费观看视频| 亚洲久本草在线中文字幕| www插插插无码视频网站| 久久久久久夜精品精品免费| 九一免费在线观看| 亚洲欧美视频在线观看视频| 欧美视频国产视频| 亚洲视频在线观看| 欧美成人久久久免费播放| 精品亚洲成a人| 不卡中文字幕在线| 欧美在线观看一二区| 少妇人妻互换不带套| 午夜精品美女自拍福到在线| 亚洲成人www| 玖玖爱在线精品视频| 久久一区二区精品| 91精品国产色综合久久ai换脸| 97精品人妻一区二区三区| 一区二区91美女张开腿让人桶| 欧美伊人久久大香线蕉综合69 | 五月综合激情网| 国产成人无码一区二区三区在线 | 精品一区二区6| 欧美精品久久久久久久久| 奇米精品一区二区三区在线观看 | 国产一区视频在线播放| 91在线免费播放| 国产又粗又长又大的视频| 五月天婷婷激情| 99re视频在线播放| 中文字幕一区在线观看视频| 人妖粗暴刺激videos呻吟| 亚洲一线二线三线久久久| 男人的天堂官网| 日韩精品黄色网| 亚洲不卡免费视频| 五月天丁香花婷婷| 欧美久久久精品| 亚洲欧洲一区二区在线播放| 亚洲国产精品视频在线| 国产精品9191| 国产999免费视频| 免费一区二区三区在在线视频| 欧美激情在线观看视频| 欧美日韩中文字幕一区| 国产高清精品网站| 日本最新中文字幕| 欧美人与物videos另类| 精品国产乱码久久久久久1区2区| 日本特黄久久久高潮| 中日韩av在线播放| 国产伦精品一区二区三区高清版| 欧美日韩免费一区二区三区| 国产制服丝袜一区| 欧美做受xxxxxⅹ性视频| 国产欧美精品一区二区三区介绍| 久久亚洲精华国产精华液| 91香蕉视频网| av免费观看国产| 亚洲综合自拍一区| 久久av红桃一区二区小说|