近日,首屆1024國(guó)際智能投研開(kāi)發(fā)者大會(huì)在上海舉行,虎博科技技術(shù)副總裁譚悅受邀出席,進(jìn)行了《理解金融語(yǔ)義的智能搜索引擎應(yīng)用實(shí)踐》的主題分享;⒉┛萍家訬LP自然語(yǔ)言處理為基礎(chǔ)的智能搜索技術(shù),已經(jīng)開(kāi)始應(yīng)用于不同的業(yè)務(wù)場(chǎng)景,幫助人們更高效地獲取信息,提高工作效率。特別在金融領(lǐng)域中的投研場(chǎng)景,通過(guò)虎博科技的智能搜索技術(shù)有效解決了標(biāo)的數(shù)據(jù)信息獲取效率低、成本高等問(wèn)題。
虎博科技技術(shù)副總裁譚悅從底層邏輯、技術(shù)架構(gòu)、應(yīng)用效果等方面,對(duì)智能搜索在投研場(chǎng)景的應(yīng)用做出了詳盡的闡釋,并以虎博科技旗艦產(chǎn)品虎博搜索為例,介紹了券商客戶實(shí)際應(yīng)用智能搜索技術(shù)所取得的成效。
以下為演講精彩回顧:
一、智能投研需要智能搜索的加持
現(xiàn)階段投研數(shù)據(jù)信息的獲取主要通過(guò)傳統(tǒng)搜索引擎和金融數(shù)據(jù)終端軟件兩種主流方式,但都存在著不同的弊端:
1、傳統(tǒng)搜索引擎主要針對(duì)網(wǎng)頁(yè)、圖片、音頻等數(shù)據(jù)進(jìn)行單一、淺層次的搜索,難以滿足投研所需的復(fù)合性深度信息檢索需求。
2、專業(yè)金融數(shù)據(jù)終端軟件的數(shù)據(jù)加工模式往往是半自動(dòng)化半人工的方式,難以第一時(shí)間給到用戶時(shí)效性強(qiáng)的一手?jǐn)?shù)據(jù)信息。
3、專業(yè)金融數(shù)據(jù)終端軟件中的數(shù)據(jù)信息展示是貨架式形式,需要逐級(jí)菜單點(diǎn)選才能找到所需數(shù)據(jù),使用體驗(yàn)較差。
4、專業(yè)金融數(shù)據(jù)終端軟件使用成本高,成本一方面來(lái)自軟件或軟件賬號(hào)的購(gòu)買成本,另一方面來(lái)自使用軟件的學(xué)習(xí)成本。
因此,一款能夠快速、準(zhǔn)確獲取標(biāo)的數(shù)據(jù)信息的搜索引擎,就顯得十分必要。對(duì)于爭(zhēng)分奪秒的投研來(lái)說(shuō),一秒鐘的差距,可能就會(huì)錯(cuò)失一個(gè)千載難逢的投資機(jī)會(huì)。
二、服務(wù)智能投研的搜索需要具備三種能力:
1、 全局搜索能力
全局搜索即支持包括網(wǎng)頁(yè)、資訊、文檔、圖片等結(jié)構(gòu)化和非機(jī)構(gòu)化數(shù)據(jù)在內(nèi)的搜索能力。人能查閱的信息量是有限的,不可能為查詢一個(gè)數(shù)據(jù)翻閱上百頁(yè)的文檔,或閱讀幾十篇資訊,這樣的效率十分低下。這就要求智能搜索需要具備全局搜索能力,從各種類型的海量信息中,把用戶最關(guān)心的數(shù)據(jù)找出來(lái),同時(shí)又能挖掘出數(shù)據(jù)的亮點(diǎn)。
2、 智能搜索能力
應(yīng)用于投研的智能搜索引擎既要兼容傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)庫(kù),還要包括金融領(lǐng)域的各類文檔、公告等非結(jié)構(gòu)化數(shù)據(jù)以及另類數(shù)據(jù),并能夠進(jìn)行自動(dòng)計(jì)算、數(shù)據(jù)穿透、知識(shí)圖譜推理以及可視化的數(shù)據(jù)信息展示。
3、語(yǔ)義理解能力
智能搜索獲取信息的過(guò)程不同于傳統(tǒng)金融數(shù)據(jù)終端,需要菜單一個(gè)一個(gè)點(diǎn)選,而是直接通過(guò)提問(wèn)來(lái)獲取;當(dāng)然也不同于傳統(tǒng)的搜索引擎,在提問(wèn)后只是簡(jiǎn)單的把所有與提問(wèn)關(guān)鍵詞匹配的網(wǎng)頁(yè)鏈接丟給你。智能搜索要具備理解用戶意圖的能力,解析出用戶提問(wèn)中的主體是誰(shuí),所需數(shù)據(jù)與主體的關(guān)系如何等等,只有真正知道用戶需要的是什么,才能高效的反饋精準(zhǔn)的結(jié)果。
三、一個(gè)例子說(shuō)明智能搜索如何快速反饋精準(zhǔn)的數(shù)據(jù)
如果想知道“學(xué)而思的學(xué)校數(shù)量”,傳統(tǒng)的搜索引擎很難直接給到答案,得到的往往是一頁(yè)又一頁(yè)的新聞報(bào)道和網(wǎng)頁(yè)鏈接,當(dāng)真正找到所需要的數(shù)據(jù)時(shí),可能已經(jīng)浪費(fèi)掉了幾十分鐘的時(shí)間。因?yàn)樗轻槍?duì)你所提出問(wèn)題中的關(guān)鍵詞來(lái)進(jìn)行結(jié)果匹配,并不理解你所需要的數(shù)據(jù)是什么。

(傳統(tǒng)搜索引擎獲取的結(jié)果)
智能搜索引擎則會(huì)首先會(huì)理解你想知道的是“學(xué)而思”這個(gè)教育品牌的學(xué)校數(shù)量,同時(shí)解析出“學(xué)而思”這一教育品牌已經(jīng)更名為了“好未來(lái)”,進(jìn)而會(huì)從好未來(lái)的財(cái)報(bào)這一權(quán)威來(lái)源提取對(duì)應(yīng)的數(shù)據(jù),并結(jié)構(gòu)化的展示出來(lái),讓用戶一眼看到自己所要的數(shù)字是多少,從輸入搜索文字到獲取結(jié)果,只需要兩到三秒。

(智能搜索引擎虎博搜索獲取的結(jié)果,【展開(kāi)】即可查看更多城市分布和數(shù)量)
目前,虎博科技推出的智能搜索引擎虎博搜索(含PC版和App版)即能實(shí)現(xiàn)上述的投研信息數(shù)據(jù)獲取服務(wù),同時(shí),虎博搜索的底層搜索技術(shù)也可以實(shí)現(xiàn)復(fù)用,嵌入到券商、基金公司的內(nèi)部系統(tǒng)或產(chǎn)品中,讓他們的員工、用戶也能夠享受到同樣的智能搜索服務(wù)和體驗(yàn)。
四、虎博科技針對(duì)投研的其他技術(shù)服務(wù)
1、NLP內(nèi)容算法中臺(tái)
虎博科技把NLP自然語(yǔ)言處理相關(guān)的算法包裝成一個(gè)個(gè)中臺(tái)化的算法能力,比如機(jī)器翻譯、NER命名實(shí)體識(shí)別、智能標(biāo)簽、情感分析等等,并針對(duì)不同類型使用場(chǎng)景進(jìn)行優(yōu)化。以智能標(biāo)簽為例,針對(duì)風(fēng)險(xiǎn)類的標(biāo)簽,虎博科技已經(jīng)歸納了7大類,近90項(xiàng)不同的類型,當(dāng)某個(gè)公司出現(xiàn)類似的風(fēng)險(xiǎn)事件,虎博科技能夠第一時(shí)間可以把最準(zhǔn)確的標(biāo)簽打到特定的內(nèi)容上,為用戶提供顆粒度更細(xì)的投研資訊服務(wù),輔助做出更精準(zhǔn)的投研判斷。

(虎博科技部分NLP算法能力)
2、用戶感知與個(gè)性化
針對(duì)金融領(lǐng)域的個(gè)性化推薦,要考慮到投研工作者關(guān)注的行業(yè)標(biāo)的、風(fēng)險(xiǎn)偏好以及標(biāo)的對(duì)應(yīng)領(lǐng)域的各方面信息;⒉┛萍寄軌蚋鶕(jù)用戶感興趣的長(zhǎng)期及短期興趣內(nèi)容,快速進(jìn)行個(gè)性化內(nèi)容的推薦或者預(yù)警,讓用戶實(shí)時(shí)掌握與標(biāo)的相關(guān)的變化情況,保障投研的時(shí)效和精準(zhǔn)。

(根據(jù)用戶的不同屬性精準(zhǔn)推薦信息)
3、另類數(shù)據(jù)和知識(shí)圖譜
智能搜索需要大量的數(shù)據(jù)采集和知識(shí)圖譜構(gòu)建的基礎(chǔ),才能更好地解決用戶的數(shù)據(jù)信息需求。特別在金融領(lǐng)域,需要做大量的數(shù)據(jù)采集工作,其中包括另類數(shù)據(jù),例如企業(yè)的招聘信息,二手車、二手房交易數(shù)據(jù),電商數(shù)據(jù)等。這些數(shù)據(jù)往往分散在全網(wǎng)的不同平臺(tái),傳統(tǒng)的金融數(shù)據(jù)終端受限于技術(shù)無(wú)法提供,但這些數(shù)據(jù)往往又對(duì)標(biāo)的的研究起到關(guān)鍵性的作用。

(虎博科技部分另類數(shù)據(jù)示意)
知識(shí)圖譜的構(gòu)建也同樣重要,例如在半導(dǎo)體領(lǐng)域,如果某一家企業(yè)被列入黑名單,可能會(huì)導(dǎo)致整個(gè)供應(yīng)鏈斷鏈,那供應(yīng)鏈中的上下游供應(yīng)商,有哪些企業(yè)會(huì)受影響,哪些企業(yè)是可以被替代的,在虎博的知識(shí)圖譜產(chǎn)品中可一一查看,如果沒(méi)有一個(gè)完善的產(chǎn)業(yè)鏈和供應(yīng)鏈的圖譜,用戶在進(jìn)行投研的時(shí)候,很多問(wèn)題就無(wú)法得到答案,導(dǎo)致決策時(shí)的不確定性大大增加。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
海報(bào)生成中...
海藝AI的模型系統(tǒng)在國(guó)際市場(chǎng)上廣受好評(píng),目前站內(nèi)累計(jì)模型數(shù)超過(guò)80萬(wàn)個(gè),涵蓋寫(xiě)實(shí)、二次元、插畫(huà)、設(shè)計(jì)、攝影、風(fēng)格化圖像等多類型應(yīng)用場(chǎng)景,基本覆蓋所有主流創(chuàng)作風(fēng)格。
9月9日,國(guó)際權(quán)威市場(chǎng)調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布了《中國(guó)AI云市場(chǎng),1H25》報(bào)告。中國(guó)AI云市場(chǎng)阿里云占比8%位列第一。
9月24日,華為坤靈召開(kāi)“智能體驗(yàn),一屏到位”華為IdeaHub千行百業(yè)體驗(yàn)官計(jì)劃發(fā)布會(huì)。
IDC今日發(fā)布的《全球智能家居清潔機(jī)器人設(shè)備市場(chǎng)季度跟蹤報(bào)告,2025年第二季度》顯示,上半年全球智能家居清潔機(jī)器人市場(chǎng)出貨1,2萬(wàn)臺(tái),同比增長(zhǎng)33%,顯示出品類強(qiáng)勁的市場(chǎng)需求。