国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院

國(guó)脈贛承・時(shí)代匠章 | 江西工藝美術(shù)館煥新開館 致力打造江西文化新地標(biāo)博格華納800V碳化硅技術(shù):讓電動(dòng)車?yán)m(xù)航和充電不再是難題小天互連IM系統(tǒng)安全高效,為政企提供一站式即時(shí)通訊解決方案以新“四方模式” 共建世界級(jí)支付互聯(lián)網(wǎng)絡(luò)與iOS、安卓三分天下!華為鴻蒙OS第三季度份額增至18%網(wǎng)易《陰陽師:百聞牌》明年將停止開發(fā)新內(nèi)容射頻有“新聲”,展銳4G平臺(tái)參考設(shè)計(jì)首次選用國(guó)產(chǎn)濾波器2025全球數(shù)商大會(huì)在滬舉行,數(shù)據(jù)要素成果集中亮相從5G到5G-A,5G產(chǎn)業(yè)價(jià)值加速覺醒Omdia:第二季度中國(guó)大陸云基礎(chǔ)設(shè)施市場(chǎng)增速超20%,阿里云繼續(xù)領(lǐng)跑年終免稅購物盛宴開啟!2025年中免年終盛典打造免稅文旅新體驗(yàn)淘寶閃購將全面取消超時(shí)扣款,年底前覆蓋全國(guó)輕松健康集團(tuán)通過港交所聆訊:上半年?duì)I收同比增85%第五代驍龍8如何憑借全自研內(nèi)核成就全能旗艦云淘協(xié)同,AI硬件的新敘事構(gòu)建數(shù)商生態(tài),打造交流平臺(tái),2025全球數(shù)商大會(huì)在滬舉行,數(shù)據(jù)要素成果集中亮相覆蓋5萬工程師,美的“金剛鉆”大賽推動(dòng)家電服務(wù)專業(yè)化升級(jí)新朋友“藍(lán)”不住 龐巴迪BRP(中國(guó))2026新品預(yù)售開啟4699元起 華為Mate 80系列開售 晨曦金版本成爆款已售罄缺貨AI睡眠黑科技,TCL小藍(lán)翼C7AI健康空調(diào)顛覆臥室舒睡體驗(yàn)
  • 首頁 > 延展閱讀 > 2016歸檔

    一點(diǎn)資訊田明軍:深度融合搜索+個(gè)性化推薦背景下的興趣引擎構(gòu)架

    2016年12月05日 17:45:31   來源:中華網(wǎng)投資

      由InfoQ中國(guó)團(tuán)隊(duì)推出,面向高端技術(shù)管理者和架構(gòu)師的全球架構(gòu)師峰會(huì)(ArchSummit)日前在北京國(guó)際會(huì)議中心舉行。來自騰訊、滴滴出行、一點(diǎn)資訊等互聯(lián)網(wǎng)企業(yè)的技術(shù)專家受邀出席并做主題演講。

      一點(diǎn)資訊高級(jí)技術(shù)總監(jiān)田明軍發(fā)表主題演講

      在本次大會(huì)上,一點(diǎn)資訊高級(jí)技術(shù)總監(jiān)田明軍詳細(xì)詮釋了深度融合搜索和推薦引擎對(duì)獲取用戶閱讀興趣、實(shí)現(xiàn)信息精準(zhǔn)分發(fā)的必要性,并以一點(diǎn)資訊為例,從技術(shù)框架和產(chǎn)品理念角度,分享了興趣引擎將二者有機(jī)融合的心得。

      他認(rèn)為,搜索和推薦兩種獲取信息的途徑和體驗(yàn)缺一不可。一點(diǎn)資訊的興趣引擎系統(tǒng)通過結(jié)合了用戶搜索行為所觸及的全網(wǎng)數(shù)據(jù),不斷學(xué)習(xí)用戶的興趣再進(jìn)行推薦,并由用戶主動(dòng)“訂閱”深化這一興趣,建立興趣之間的連接點(diǎn),從而打通用戶對(duì)信息的主動(dòng)表達(dá)和被動(dòng)接受兩條通道,使信息獲取更加高效、精準(zhǔn),為全方位提升用戶體驗(yàn)打下了堅(jiān)實(shí)的基礎(chǔ)。

      以下為田明軍演講內(nèi)容精編版:

      大家早上好,非常榮幸今天有機(jī)會(huì)與大家分享一點(diǎn)資訊關(guān)于融合搜索和推薦引擎的一些思考和實(shí)踐。

      單一的搜索或推薦引擎不利于全面滿足信息分發(fā)需求

      在移動(dòng)互聯(lián)網(wǎng)時(shí)代,搜索和個(gè)性化推薦都是用戶獲取信息的兩種重要的方式:搜索通常伴隨著用戶的明確表達(dá),用戶輸入關(guān)鍵詞即可找到自己想要的答案;反觀推薦,則是用戶通過產(chǎn)品呈現(xiàn)的內(nèi)容進(jìn)行非目標(biāo)性的興趣瀏覽。但這兩種體驗(yàn)是不能互替的,單純根據(jù)歷史瀏覽記錄進(jìn)行的個(gè)性化推薦并不能了解用戶某時(shí)刻的自身想法,而另一方面,也很難根據(jù)每天一兩次搜索行為總結(jié)出用戶的長(zhǎng)期規(guī)律。

      所以從產(chǎn)品角度來說,搜索和推薦的體驗(yàn)二者不可或缺、關(guān)系緊密。這也是我們致力于實(shí)現(xiàn)二者融合的原因。

      但需要注意的是,二者在意圖表達(dá)方式、訓(xùn)練模型等方面存在著巨大差異,基于這些差異點(diǎn),我們不能簡(jiǎn)單的用其中一種系統(tǒng)來實(shí)現(xiàn)搜索和推薦融合的目的。

      搜索和推薦的融合之路應(yīng)該怎樣走?

      對(duì)于融合的解決之道,一點(diǎn)資訊選擇在搜索和推薦引擎之間加入了一個(gè)基于用戶興趣的任意關(guān)鍵詞訂閱環(huán)節(jié)。通過搜索發(fā)現(xiàn)用戶所查詢的答案同時(shí),我們也提煉、擴(kuò)充出針對(duì)用戶興趣的表達(dá),并以此固定沉淀在用戶畫像里。因此,搜索讓個(gè)性化推薦層面,增加了一條高效地獲取用戶興趣的途徑。

      反過來說,通過推薦系統(tǒng)把共性的有趣、有料的內(nèi)容呈現(xiàn)給用戶,通過推薦產(chǎn)品收集到用戶更多層面的反饋,從而得到這些內(nèi)容的普適性特征。基于這些特征的挖掘,我們也能夠?qū)?nèi)容有更深刻的了解。而再將搜索體驗(yàn)中加入并有效利用這些共性特征,也更加強(qiáng)化、提升了搜索的品質(zhì)。

      接下來,我將從興趣引擎的整體系統(tǒng)架構(gòu)中,選取了幾項(xiàng)關(guān)鍵技術(shù)點(diǎn),闡述一點(diǎn)資訊將搜索和推薦內(nèi)容體驗(yàn)真正融合的方法:

      異構(gòu)索引引領(lǐng)檢索效率提升 針對(duì)搜索+推薦深度優(yōu)化

      為實(shí)現(xiàn)深度融合的目的,針對(duì)搜索和推薦不同的服務(wù)特點(diǎn)和系統(tǒng)性能要求,首先我們提出了異構(gòu)索引結(jié)構(gòu)。

      從上圖可以清楚地看出異構(gòu)索引的數(shù)據(jù)來源和組織形式。我們可以從圖的底部可以看到,產(chǎn)生異性索引數(shù)據(jù)的平臺(tái)一分為三:數(shù)據(jù)平臺(tái)、編輯運(yùn)維平臺(tái)和內(nèi)容平臺(tái)。圖片頂部則展示了不同數(shù)據(jù)的索引構(gòu)建所采用的不同技術(shù)。

      內(nèi)容平臺(tái)方面,對(duì)外網(wǎng)抓取的內(nèi)容和自媒體平臺(tái)生產(chǎn)的內(nèi)容,我們建立了通用的倒排索引。

      在左側(cè)的數(shù)據(jù)平臺(tái),則通過對(duì)用戶行為的挖掘,產(chǎn)生基于協(xié)同過濾信息的挖掘的推薦列表,以及針對(duì)不同人群放置的熱文列表,這部分我們使用通用的KV數(shù)據(jù)庫存儲(chǔ)。

      中間這部分的數(shù)據(jù)來源于內(nèi)容平臺(tái)和編輯運(yùn)維平臺(tái),體現(xiàn)了技術(shù)與人工的結(jié)合。這部分?jǐn)?shù)據(jù)存在內(nèi)容的競(jìng)爭(zhēng)機(jī)制,變化比較靈活,使用了自建的支持排序列表的索引結(jié)構(gòu)。

      大家也許會(huì)問,為什么會(huì)有這樣的區(qū)分?這主要是基于優(yōu)化檢索性能角度的思考。根據(jù)關(guān)鍵詞對(duì)倒排索引進(jìn)行查詢的方式非常成熟,完全夠能夠滿足搜索系統(tǒng)的需求,然而,傳統(tǒng)的倒排索引卻很難對(duì)推薦需求的幾十維以上的特征進(jìn)行查詢。

      在這個(gè)基礎(chǔ)上,我們做了兩個(gè)優(yōu)化:一是針對(duì)稀疏的頻道,實(shí)現(xiàn)了支持WAND(一種介于AND和OR之間的索引查詢操作符)檢索系統(tǒng)加快召回內(nèi)容的效率;而對(duì)于稠密的頭部頻道,則通過開發(fā)頻道文章索引庫,維護(hù)從頻道到排序內(nèi)容列表的映射,將線上查詢壓力轉(zhuǎn)移到線下,提升檢索的效率。

      以u(píng)nified feeder為核心的內(nèi)容處理平臺(tái)解決寫入難題

      剛才看到方方面面的索引,接下來,我們必須要解決里面索引的寫入的問題。這就需要在統(tǒng)一的內(nèi)容處理平臺(tái),把這些內(nèi)容寫到異構(gòu)的索引結(jié)構(gòu)里面。

      我們的內(nèi)容處理平臺(tái)的核心之一,則是unified feeder系統(tǒng),這是內(nèi)容處理平臺(tái)與索引系統(tǒng)之間傳遞信息的橋梁。

      在unified feeder實(shí)際工作中,首先針對(duì)不同的輸入數(shù)據(jù),我們存入了很多不同的索引庫,這個(gè)工作通過統(tǒng)一的配置與模板中心進(jìn)行管理,可以方便的維護(hù)和擴(kuò)展。此外,unified feeder內(nèi)部有一個(gè)checkpoint系統(tǒng),在各個(gè)關(guān)鍵索引內(nèi)容寫入之后,會(huì)向checkpoint系統(tǒng)發(fā)送驗(yàn)證信號(hào),如果任何數(shù)據(jù)寫入失敗,checkpoint系統(tǒng)會(huì)有記錄,系統(tǒng)可以自動(dòng)進(jìn)行數(shù)據(jù)的重新寫入。這種方式有效的解決了系統(tǒng)容錯(cuò)和異構(gòu)索引數(shù)據(jù)一致性的問題。

      雙層架構(gòu)的自適應(yīng)索引召回突破異構(gòu)索引挑戰(zhàn)

      接下來我將講解在有了以上數(shù)據(jù)基礎(chǔ)之后,針對(duì)上面的搜索和推薦請(qǐng)求,我們?nèi)绾瓮ㄟ^自適應(yīng)索引召回技術(shù),從不同的索引里面獲取數(shù)據(jù)?這主要面臨三個(gè)方面的技術(shù)挑戰(zhàn)——決策需要調(diào)用的索引后端、異構(gòu)索引召回效率,以及可擴(kuò)展性與開發(fā)效率。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    [編號(hào): ]
    分享到微信

    即時(shí)

    全球頂級(jí)AI創(chuàng)作社區(qū)回歸!海藝AI國(guó)內(nèi)首發(fā)“全民娛樂化創(chuàng)作

    海藝AI的模型系統(tǒng)在國(guó)際市場(chǎng)上廣受好評(píng),目前站內(nèi)累計(jì)模型數(shù)超過80萬個(gè),涵蓋寫實(shí)、二次元、插畫、設(shè)計(jì)、攝影、風(fēng)格化圖像等多類型應(yīng)用場(chǎng)景,基本覆蓋所有主流創(chuàng)作風(fēng)格。

    新聞

    市場(chǎng)占比高達(dá)35.8%,阿里云引領(lǐng)中國(guó)AI云增長(zhǎng)

    9月9日,國(guó)際權(quán)威市場(chǎng)調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布了《中國(guó)AI云市場(chǎng),1H25》報(bào)告。中國(guó)AI云市場(chǎng)阿里云占比8%位列第一。

    企業(yè)IT

    華為坤靈發(fā)布IdeaHub千行百業(yè)體驗(yàn)官計(jì)劃,助力中小企

    9月24日,華為坤靈召開“智能體驗(yàn),一屏到位”華為IdeaHub千行百業(yè)體驗(yàn)官計(jì)劃發(fā)布會(huì)。

    研究

    IDC:2025上半年全球智能家居清潔機(jī)器人出貨量同比暴

    IDC今日發(fā)布的《全球智能家居清潔機(jī)器人設(shè)備市場(chǎng)季度跟蹤報(bào)告,2025年第二季度》顯示,上半年全球智能家居清潔機(jī)器人市場(chǎng)出貨1,2萬臺(tái),同比增長(zhǎng)33%,顯示出品類強(qiáng)勁的市場(chǎng)需求。

    国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院
    | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | |