近日,首屆1024國際智能投研開發者大會在上海舉行,虎博科技技術副總裁譚悅受邀出席,進行了《理解金融語義的智能搜索引擎應用實踐》的主題分享。虎博科技以NLP自然語言處理為基礎的智能搜索技術,已經開始應用于不同的業務場景,幫助人們更高效地獲取信息,提高工作效率。特別在金融領域中的投研場景,通過虎博科技的智能搜索技術有效解決了標的數據信息獲取效率低、成本高等問題。
虎博科技技術副總裁譚悅從底層邏輯、技術架構、應用效果等方面,對智能搜索在投研場景的應用做出了詳盡的闡釋,并以虎博科技旗艦產品虎博搜索為例,介紹了券商客戶實際應用智能搜索技術所取得的成效。
以下為演講精彩回顧:
一、智能投研需要智能搜索的加持
現階段投研數據信息的獲取主要通過傳統搜索引擎和金融數據終端軟件兩種主流方式,但都存在著不同的弊端:
1、傳統搜索引擎主要針對網頁、圖片、音頻等數據進行單一、淺層次的搜索,難以滿足投研所需的復合性深度信息檢索需求。
2、專業金融數據終端軟件的數據加工模式往往是半自動化半人工的方式,難以第一時間給到用戶時效性強的一手數據信息。
3、專業金融數據終端軟件中的數據信息展示是貨架式形式,需要逐級菜單點選才能找到所需數據,使用體驗較差。
4、專業金融數據終端軟件使用成本高,成本一方面來自軟件或軟件賬號的購買成本,另一方面來自使用軟件的學習成本。
因此,一款能夠快速、準確獲取標的數據信息的搜索引擎,就顯得十分必要。對于爭分奪秒的投研來說,一秒鐘的差距,可能就會錯失一個千載難逢的投資機會。
二、服務智能投研的搜索需要具備三種能力:
1、 全局搜索能力
全局搜索即支持包括網頁、資訊、文檔、圖片等結構化和非機構化數據在內的搜索能力。人能查閱的信息量是有限的,不可能為查詢一個數據翻閱上百頁的文檔,或閱讀幾十篇資訊,這樣的效率十分低下。這就要求智能搜索需要具備全局搜索能力,從各種類型的海量信息中,把用戶最關心的數據找出來,同時又能挖掘出數據的亮點。
2、 智能搜索能力
應用于投研的智能搜索引擎既要兼容傳統的結構化數據庫,還要包括金融領域的各類文檔、公告等非結構化數據以及另類數據,并能夠進行自動計算、數據穿透、知識圖譜推理以及可視化的數據信息展示。
3、語義理解能力
智能搜索獲取信息的過程不同于傳統金融數據終端,需要菜單一個一個點選,而是直接通過提問來獲取;當然也不同于傳統的搜索引擎,在提問后只是簡單的把所有與提問關鍵詞匹配的網頁鏈接丟給你。智能搜索要具備理解用戶意圖的能力,解析出用戶提問中的主體是誰,所需數據與主體的關系如何等等,只有真正知道用戶需要的是什么,才能高效的反饋精準的結果。
三、一個例子說明智能搜索如何快速反饋精準的數據
如果想知道“學而思的學校數量”,傳統的搜索引擎很難直接給到答案,得到的往往是一頁又一頁的新聞報道和網頁鏈接,當真正找到所需要的數據時,可能已經浪費掉了幾十分鐘的時間。因為它是針對你所提出問題中的關鍵詞來進行結果匹配,并不理解你所需要的數據是什么。

(傳統搜索引擎獲取的結果)
智能搜索引擎則會首先會理解你想知道的是“學而思”這個教育品牌的學校數量,同時解析出“學而思”這一教育品牌已經更名為了“好未來”,進而會從好未來的財報這一權威來源提取對應的數據,并結構化的展示出來,讓用戶一眼看到自己所要的數字是多少,從輸入搜索文字到獲取結果,只需要兩到三秒。

(智能搜索引擎虎博搜索獲取的結果,【展開】即可查看更多城市分布和數量)
目前,虎博科技推出的智能搜索引擎虎博搜索(含PC版和App版)即能實現上述的投研信息數據獲取服務,同時,虎博搜索的底層搜索技術也可以實現復用,嵌入到券商、基金公司的內部系統或產品中,讓他們的員工、用戶也能夠享受到同樣的智能搜索服務和體驗。
四、虎博科技針對投研的其他技術服務
1、NLP內容算法中臺
虎博科技把NLP自然語言處理相關的算法包裝成一個個中臺化的算法能力,比如機器翻譯、NER命名實體識別、智能標簽、情感分析等等,并針對不同類型使用場景進行優化。以智能標簽為例,針對風險類的標簽,虎博科技已經歸納了7大類,近90項不同的類型,當某個公司出現類似的風險事件,虎博科技能夠第一時間可以把最準確的標簽打到特定的內容上,為用戶提供顆粒度更細的投研資訊服務,輔助做出更精準的投研判斷。

(虎博科技部分NLP算法能力)
2、用戶感知與個性化
針對金融領域的個性化推薦,要考慮到投研工作者關注的行業標的、風險偏好以及標的對應領域的各方面信息。虎博科技能夠根據用戶感興趣的長期及短期興趣內容,快速進行個性化內容的推薦或者預警,讓用戶實時掌握與標的相關的變化情況,保障投研的時效和精準。

(根據用戶的不同屬性精準推薦信息)
3、另類數據和知識圖譜
智能搜索需要大量的數據采集和知識圖譜構建的基礎,才能更好地解決用戶的數據信息需求。特別在金融領域,需要做大量的數據采集工作,其中包括另類數據,例如企業的招聘信息,二手車、二手房交易數據,電商數據等。這些數據往往分散在全網的不同平臺,傳統的金融數據終端受限于技術無法提供,但這些數據往往又對標的的研究起到關鍵性的作用。

(虎博科技部分另類數據示意)
知識圖譜的構建也同樣重要,例如在半導體領域,如果某一家企業被列入黑名單,可能會導致整個供應鏈斷鏈,那供應鏈中的上下游供應商,有哪些企業會受影響,哪些企業是可以被替代的,在虎博的知識圖譜產品中可一一查看,如果沒有一個完善的產業鏈和供應鏈的圖譜,用戶在進行投研的時候,很多問題就無法得到答案,導致決策時的不確定性大大增加。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。