国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院

百度Q3總營收312億元:首次披露AI業(yè)務收入 增速50%超預期寧夏·浙江算力產(chǎn)業(yè)鏈供需對接活動 在杭州成功舉辦富士膠片集團發(fā)布2025財年上半年度財務報告三星海外發(fā)布Smart Keyboard無線鍵盤 支持多設備切換與AI快捷鍵功能VAIO推出迪士尼聯(lián)名 F16 / F14 筆記本,A面激光雕刻 IP 插畫松下發(fā)布《最終幻想 14》聯(lián)名 SoundSlayer 無線頸掛式揚聲器天馬發(fā)布全域感光天工屏等新品,支持全屏指紋識別消息稱豐田計劃將旗艦車型換代周期增至 9 年首發(fā)!“雙11”手機市場-全渠道周度銷售快報平板總是斷觸?聯(lián)想想幫幫AI服務智能體一鍵診斷解決主流造車新勢力,進入Next Level聯(lián)想發(fā)布中國首個足球賽事智能體,賦能足球賽事智慧升級多數(shù)據(jù)源融合,所見即所得:睿數(shù)信息發(fā)布手持式三維空間掃描儀新品RayZoom G200,實現(xiàn)移動端高精度實時建模華為Mate X7四配色官圖發(fā)布:獨一無二新設計 最強辨識度卡薩帝冰箱科技名詞為何演變成行業(yè)關(guān)鍵詞?手游愛好者狂喜!安卓17明年將迎重大升級全球OLED顯示器TOP5出爐:華碩擊敗三星首登第一首款星閃音頻耳機!華為FreeBuds Pro 5悅彰耳機配置價格公布亮相第七屆石油石化數(shù)智化大會,海光信息帶來高性能高安全的“芯”方案工信部:我國專精特新“小巨人”企業(yè)超1.76萬家
  • 首頁 > 企業(yè)IT頻道 > 數(shù)字化

    數(shù)倉知識:關(guān)于數(shù)據(jù)倉庫分層設計

    2022年08月17日 10:33:37 來源:讀數(shù)據(jù)

      前言:

      不是做數(shù)倉的,但是也需要了解數(shù)倉的知識。

      其實分層好多因人而異,問了同事好多分層的區(qū)別也不是很清晰。

      所以后續(xù)有機會還是跟數(shù)倉的同事碰一下吧~

      一. 各種名詞解釋

      1.1 ODS是什么?

      ODS層最好理解,基本上就是數(shù)據(jù)從源表拉過來,進行etl,比如mysql 映射到hive,那么到了hive里面就是ods層。

      ODS 全稱是 Operational Data Store,操作數(shù)據(jù)存儲.“面向主題的”,數(shù)據(jù)運營層,也叫ODS層,是最接近數(shù)據(jù)源中數(shù)據(jù)的一層,數(shù)據(jù)源中的數(shù)據(jù),經(jīng)過抽取、洗凈、傳輸,也就說傳說中的 ETL 之后,裝入本層。本層的數(shù)據(jù),總體上大多是按照源頭業(yè)務系統(tǒng)的分類方式而分類的。但是,這一層面的數(shù)據(jù)卻不等同于原始數(shù)據(jù)。在源數(shù)據(jù)裝入這一層時,要進行諸如去噪(例如有一條數(shù)據(jù)中人的年齡是 300 歲,這種屬于異常數(shù)據(jù),就需要提前做一些處理)、去重(例如在個人資料表中,同一 ID 卻有兩條重復數(shù)據(jù),在接入的時候需要做一步去重)、字段命名規(guī)范等一系列操作。

      1.2 數(shù)據(jù)倉庫層DW?

      數(shù)據(jù)倉庫層(DW),是數(shù)據(jù)倉庫的主體.在這里,從 ODS 層中獲得的數(shù)據(jù)按照主題建立各種數(shù)據(jù)模型。這一層和維度建模會有比較深的聯(lián)系。

      細分:

      數(shù)據(jù)明細層:DWD(Data Warehouse Detail)

      數(shù)據(jù)中間層:DWM(Data WareHouse Middle)

      數(shù)據(jù)服務層:DWS(Data WareHouse Servce)

      1.2.1 DWD明細層?

      明細層(ODS, Operational Data Store,DWD: data warehouse detail)

      概念:是數(shù)據(jù)倉庫的細節(jié)數(shù)據(jù)層,是對STAGE層數(shù)據(jù)進行沉淀,減少了抽取的復雜性,同時ODS/DWD的信息模型組織主要遵循企業(yè)業(yè)務事務處理的形式,將各個專業(yè)數(shù)據(jù)進行集中,明細層跟stage層的粒度一致,屬于分析的公共資源

      數(shù)據(jù)生成方式:部分數(shù)據(jù)直接來自kafka,部分數(shù)據(jù)為接口層數(shù)據(jù)與歷史數(shù)據(jù)合成。

      這個stage層不是很清晰

      1.2.2 DWM 輕度匯總層(MID或DWB, data warehouse basis)

      概念:輕度匯總層數(shù)據(jù)倉庫中DWD層和DM層之間的一個過渡層次,是對DWD層的生產(chǎn)數(shù)據(jù)進行輕度綜合和匯總統(tǒng)計(可以把復雜的清洗,處理包含,如根據(jù)PV日志生成的會話數(shù)據(jù))。輕度綜合層與DWD的主要區(qū)別在于二者的應用領(lǐng)域不同,DWD的數(shù)據(jù)來源于生產(chǎn)型系統(tǒng),并未滿意一些不可預見的需求而進行沉淀;輕度綜合層則面向分析型應用進行細粒度的統(tǒng)計和沉淀

      數(shù)據(jù)生成方式:由明細層按照一定的業(yè)務需求生成輕度匯總表。明細層需要復雜清洗的數(shù)據(jù)和需要MR處理的數(shù)據(jù)也經(jīng)過處理后接入到輕度匯總層。

      日志存儲方式:內(nèi)表,parquet文件格式。

      日志刪除方式:長久存儲。

      表schema:一般按天創(chuàng)建分區(qū),沒有時間概念的按具體業(yè)務選擇分區(qū)字段。

      庫與表命名。庫名:dwb,表名:初步考慮格式為:dwb日期業(yè)務表名,待定。

      舊數(shù)據(jù)更新方式:直接覆蓋

      1.2.3 DWS 主題層(DM,data market或DWS, data warehouse service)

      概念:又稱數(shù)據(jù)集市或?qū)挶怼0凑諛I(yè)務劃分,如流量、訂單、用戶等,生成字段比較多的寬表,用于提供后續(xù)的業(yè)務查詢,OLAP分析,數(shù)據(jù)分發(fā)等。

      數(shù)據(jù)生成方式:由輕度匯總層和明細層數(shù)據(jù)計算生成。

      日志存儲方式:使用impala內(nèi)表,parquet文件格式。

      日志刪除方式:長久存儲。

      表schema:一般按天創(chuàng)建分區(qū),沒有時間概念的按具體業(yè)務選擇分區(qū)字段。

      庫與表命名。庫名:dm,表名:初步考慮格式為:dm日期業(yè)務表名,待定。

      舊數(shù)據(jù)更新方式:直接覆蓋

      1.3 APP?

      數(shù)據(jù)產(chǎn)品層(APP),這一層是提供為數(shù)據(jù)產(chǎn)品使用的結(jié)果數(shù)據(jù)。

      主要是提供給數(shù)據(jù)產(chǎn)品和數(shù)據(jù)分析使用的數(shù)據(jù),一般會存放在 ES、Mysql 等系統(tǒng)中供線上系統(tǒng)使用,也可能會存在 Hive 或者 Druid 中供數(shù)據(jù)分析和數(shù)據(jù)挖掘使用。

      如我們經(jīng)常說的報表數(shù)據(jù),或者說那種大寬表,一般就放在這里。

      應用層(App)

      概念:應用層是根據(jù)業(yè)務需要,由前面三層數(shù)據(jù)統(tǒng)計而出的結(jié)果,可以直接提供查詢展現(xiàn),或?qū)胫罬ysql中使用。

      數(shù)據(jù)生成方式:由明細層、輕度匯總層,數(shù)據(jù)集市層生成,一般要求數(shù)據(jù)主要來源于集市層。

      日志存儲方式:使用impala內(nèi)表,parquet文件格式。

      日志刪除方式:長久存儲。

      表schema:一般按天創(chuàng)建分區(qū),沒有時間概念的按具體業(yè)務選擇分區(qū)字段。

      庫與表命名。庫名:暫定apl,另外根據(jù)業(yè)務不同,不限定一定要一個庫。(其實就叫app_)就好了

      舊數(shù)據(jù)更新方式:直接覆蓋。

      1.4 數(shù)據(jù)的來源

      數(shù)據(jù)主要會有兩個大的來源:

      業(yè)務庫,這里經(jīng)常會使用 Sqoop 來抽取

      我們業(yè)務庫用的是databus來進行接收,處理kafka就好了。

      在實時方面,可以考慮用 Canal 監(jiān)聽 Mysql 的 Binlog,實時接入即可。(有機會補一下這個canal)

      埋點日志,線上系統(tǒng)會打入各種日志,這些日志一般以文件的形式保存,我們可以選擇用 Flume 定時抽取,也可以用用 Spark Streaming 或者 Storm 來實時接入,當然,Kafka 也會是一個關(guān)鍵的角色。

      還有使用filebeat收集日志,打到kafka,然后處理日志

      注意: 在這層,理應不是簡單的數(shù)據(jù)接入,而是要考慮一定的數(shù)據(jù)清洗,比如異常字段的處理、字段命名規(guī)范化、時間字段的統(tǒng)一等,一般這些很容易會被忽略,但是卻至關(guān)重要。特別是后期我們做各種特征自動生成的時候,會十分有用。

      1.5 ODS、DW → App層

      這里面也主要分兩種類型:

      每日定時任務型:比如我們典型的日計算任務,每天凌晨算前一天的數(shù)據(jù),早上起來看報表。 這種任務經(jīng)常使用 Hive、Spark 或者生擼 MR 程序來計算,最終結(jié)果寫入 Hive、Hbase、Mysql、Es 或者 Redis 中。

      實時數(shù)據(jù):這部分主要是各種實時的系統(tǒng)使用,比如我們的實時推薦、實時用戶畫像,一般我們會用 Spark Streaming、Storm 或者 Flink 來計算,最后會落入 Es、Hbase 或者 Redis 中。

      1.6 維表層DIM?

      維表層(Dimension)

      最后補充一個維表層,維表層主要包含兩部分數(shù)據(jù):

      高基數(shù)維度數(shù)據(jù):一般是用戶資料表、商品資料表類似的資料表。數(shù)據(jù)量可能是千萬級或者上億級別。

      低基數(shù)維度數(shù)據(jù):一般是配置表,比如枚舉值對應的中文含義,或者日期維表。數(shù)據(jù)量可能是個位數(shù)或者幾千幾萬。

      1.7 層級的簡單分層圖

      見下圖,對DWD層在進行加工的話,就是DWM層(MID層)(我們的數(shù)倉還是有很多dwm層的)

    【漫談數(shù)據(jù)倉庫】 如何優(yōu)雅地設計數(shù)據(jù)分層

      這里解釋一下DWS、DWD、DIM和TMP的作用。

      DWS:輕度匯總層,從ODS層中對用戶的行為做一個初步的匯總,抽象出來一些通用的維度:時間、ip、id,并根據(jù)這些維度做一些統(tǒng)計值,比如用戶每個時間段在不同登錄ip購買的商品數(shù)等。這里做一層輕度的匯總會讓計算更加的高效,在此基礎上如果計算僅7天、30天、90天的行為的話會快很多。我們希望80%的業(yè)務都能通過我們的DWS層計算,而不是ODS。

      DWD:這一層主要解決一些數(shù)據(jù)質(zhì)量問題和數(shù)據(jù)的完整度問題。比如用戶的資料信息來自于很多不同表,而且經(jīng)常出現(xiàn)延遲丟數(shù)據(jù)等問題,為了方便各個使用方更好的使用數(shù)據(jù),我們可以在這一層做一個屏蔽。(匯總多個表)

      DIM:這一層比較單純,舉個例子就明白,比如國家代碼和國家名、地理位置、中文名、國旗圖片等信息就存在DIM層中。

      TMP:每一層的計算都會有很多臨時表,專設一個DWTMP層來存儲我們數(shù)據(jù)倉庫的臨時表。

      二. 問題

      2.1 DWS 與 DWD?

      問答一: dws 和 dwd 的關(guān)系

      問:dws 和dwd 是并行而不是先后順序?

      答:并行的,dw 層

      問:那其實對于同一個數(shù)據(jù),這兩個過程是串行的?

      答:dws 會做匯總,dwd 和 ods 的粒度相同,這兩層之間也沒有依賴的關(guān)系

      問:對呀,那這樣 dws 里面的匯總沒有經(jīng)過數(shù)據(jù)質(zhì)量和完整度的處理,或者單獨做了這種質(zhì)量相關(guān)的處理,為什么不在 dwd 之上再做匯總呢?我的疑問其實就是,dws的輕度匯總數(shù)據(jù)結(jié)果,有沒有做數(shù)據(jù)質(zhì)量的處理?

      答:ods 直接到 dws 就好,沒必要過 dwd,我舉個例子,你的瀏覽商品行為,我做一層輕度匯總,就直接放在 dws 了。但是你的資料表,要從好多表湊成一份,我們從四五份個人資料表中湊出來了一份完整的資料表放在了 dwd 中。然后在 app 層,我們要出一張畫像表,包含用戶資料和用戶近一年的行為,我們就直接從dwd中拿資料, 然后再在 dws 的基礎上做一層統(tǒng)計,就成一個app表了。當然,這不是絕對,dws 和 dwd 有沒有依賴關(guān)系主要看有沒有這種需求。

      2.2 ODS與DWD區(qū)別?

      問:還是不太明白 ods 和 dwd 層的區(qū)別,有了 ods 層后感覺 dwd 沒有什么用了。

      答:嗯,我是這樣理解的,站在一個理想的角度來講,如果 ods 層的數(shù)據(jù)就非常規(guī)整,基本能滿足我們絕大部分的需求,這當然是好的,這時候 dwd 層其實也沒太大必要。 但是現(xiàn)實中接觸的情況是 ods 層的數(shù)據(jù)很難保證質(zhì)量,畢竟數(shù)據(jù)的來源多種多樣,推送方也會有自己的推送邏輯,在這種情況下,我們就需要通過額外的一層 dwd 來屏蔽一些底層的差異。

      問:我大概明白了,是不是說 dwd 主要是對 ods 層做一些數(shù)據(jù)清洗和規(guī)范化的操作,dws 主要是對 ods 層數(shù)據(jù)做一些輕度的匯總?

      答:對的,可以大致這樣理解。

      2.3 app層干什么的?

      問答三:app 層是干什么的?

      問:感覺數(shù)據(jù)集市層是不是沒地方放了,各個業(yè)務的數(shù)據(jù)集市表是應該在 dwd 還是在 app?

      答:這個問題不太好回答,我感覺主要就是明確一下數(shù)據(jù)集市層是干什么的,如果你的數(shù)據(jù)集市層放的就是一些可以供業(yè)務方使用的寬表表,放在 app 層就行。如果你說的數(shù)據(jù)集市層是一個比較泛一點的概念,那么其實 dws、dwd、app 這些合起來都算是數(shù)據(jù)集市的內(nèi)容。

      問:那存到 Redis、ES 中的數(shù)據(jù)算是 app層嗎?

      答:算是的,我個人的理解,app 層主要存放一些相對成熟的表,能供業(yè)務側(cè)使用的。這些表可以在 Hive 中,也可以是從 Hive 導入 Redis 或者 ES 這種查詢性能比較好的系統(tǒng)中。

      三. 總結(jié)

      另一個博主的圖蠻好:

      主題(Subject)是在較高層次上將企業(yè)信息系統(tǒng)中的數(shù)據(jù)進行綜合、歸類和分析利用的一個抽象概念,每一個主題基本對應一個宏觀的分析領(lǐng)域。在邏輯意義上,它是對應企業(yè)中某一宏觀分析領(lǐng)域所涉及的分析對象。例如“銷售分析”就是一個分析領(lǐng)域,因此這個數(shù)據(jù)倉庫應用的主題就是“銷售分析”。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創(chuàng)作社區(qū)回歸!海藝AI國內(nèi)首發(fā)“全民娛樂化創(chuàng)作

    海藝AI的模型系統(tǒng)在國際市場上廣受好評,目前站內(nèi)累計模型數(shù)超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創(chuàng)作風格。

    新聞

    市場占比高達35.8%,阿里云引領(lǐng)中國AI云增長

    9月9日,國際權(quán)威市場調(diào)研機構(gòu)英富曼(Omdia)發(fā)布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發(fā)布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院
    亚洲精选视频免费看| 免费看日韩a级影片| 欧美日韩国产一级二级| 成人国产精品免费观看视频| 韩国女主播成人在线| 奇米色一区二区| 麻豆精品一区二区av白丝在线| 亚洲图片欧美综合| 亚洲精品成人悠悠色影视| 亚洲日本丝袜连裤袜办公室| 1024亚洲合集| 一区二区三区精品在线| 亚洲国产美国国产综合一区二区| 亚洲午夜一区二区| 青娱乐精品视频| 美女mm1313爽爽久久久蜜臀| 久草在线在线精品观看| 国产精品一区二区不卡| 福利一区二区在线| av电影天堂一区二区在线观看| 99re这里只有精品首页| 欧美性生活影院| 日韩午夜在线观看| 久久久久久久综合日本| 国产精品久久久久永久免费观看| 亚洲欧美视频一区| 日精品一区二区| 国产一区二区不卡在线| 97se亚洲国产综合自在线| 欧美中文字幕一区| 精品国产亚洲在线| 1024亚洲合集| 五月天亚洲婷婷| 国产一区二区三区久久久 | 国精产品一区一区三区mba桃花| 韩日av一区二区| 成人黄页毛片网站| 精品视频123区在线观看| 日韩午夜激情视频| 国产精品久久久久影院亚瑟| 亚洲午夜久久久久久久久久久 | 日韩精品亚洲一区二区三区免费| 久久66热re国产| av在线播放一区二区三区| 欧美日韩1234| 国产精品久久久久久久久动漫| 丝袜亚洲另类丝袜在线| 成人不卡免费av| 欧美一区二区黄| ...xxx性欧美| 国产精品18久久久| 91精品午夜视频| 亚洲精品免费一二三区| 国产a区久久久| 日韩欧美专区在线| 一区二区不卡在线播放| 国产99久久精品| 欧美一区二区福利在线| 亚洲制服丝袜在线| av在线不卡观看免费观看| 久久嫩草精品久久久精品一| 偷偷要91色婷婷| 色中色一区二区| 国产精品久线观看视频| 国产精品一级黄| 精品国产乱码久久久久久影片| 午夜欧美一区二区三区在线播放| 成人午夜av在线| 精品国产一区二区精华| 轻轻草成人在线| 欧美高清精品3d| 香蕉影视欧美成人| 欧美日韩一区二区三区免费看| 亚洲欧美视频在线观看视频| 成人黄色大片在线观看| 久久综合狠狠综合久久激情| 另类成人小视频在线| 欧美肥大bbwbbw高潮| 亚洲国产精品久久久久秋霞影院| 在线观看网站黄不卡| 亚洲精品美腿丝袜| 欧美亚洲国产一区二区三区| 一区二区三区日本| 欧美在线小视频| 亚洲成人动漫在线免费观看| 欧洲av在线精品| 亚洲综合区在线| 欧美综合欧美视频| 亚洲图片自拍偷拍| 欧美午夜宅男影院| 亚洲成a人v欧美综合天堂| 在线观看网站黄不卡| 一区二区成人在线观看| 欧美体内she精高潮| 亚洲国产成人91porn| 欧美精品aⅴ在线视频| 久久国产人妖系列| 国产无遮挡一区二区三区毛片日本| 激情图区综合网| 国产亲近乱来精品视频| www.欧美亚洲| 亚洲卡通动漫在线| 欧美日韩国产乱码电影| 精品一区在线看| 欧美韩日一区二区三区四区| 97超碰欧美中文字幕| 亚洲国产精品久久久久秋霞影院 | 中文字幕高清不卡| 色婷婷综合在线| 五月天激情综合| 精品免费视频.| av在线一区二区| 五月天丁香久久| 国产婷婷一区二区| 色婷婷激情综合| 免费人成精品欧美精品 | 欧美日韩在线综合| 九九精品一区二区| 中文字幕一区二区三区av| 欧洲精品在线观看| 国内精品在线播放| 悠悠色在线精品| 日韩欧美一区二区免费| 成人激情文学综合网| 午夜精品久久久久久久久久久| 久久美女高清视频| 欧洲精品一区二区| 国产不卡在线一区| 日韩高清一区在线| 亚洲视频在线一区二区| 精品精品国产高清一毛片一天堂| 色综合色综合色综合| 国产在线麻豆精品观看| 亚洲丶国产丶欧美一区二区三区| 国产校园另类小说区| 欧美夫妻性生活| 色婷婷av一区二区三区大白胸 | 日韩高清一级片| 综合电影一区二区三区| 26uuu久久综合| 5858s免费视频成人| 99精品久久免费看蜜臀剧情介绍| 久久精品国产久精国产爱| 亚洲一卡二卡三卡四卡五卡| 国产精品丝袜在线| 2022国产精品视频| 日韩亚洲欧美中文三级| 欧美熟乱第一页| 色综合久久九月婷婷色综合| 国产一区二区三区久久久| 日产欧产美韩系列久久99| 樱桃国产成人精品视频| 中文字幕一区二区三区四区 | 欧美日本在线观看| 99久久99久久久精品齐齐 | 北岛玲一区二区三区四区 | 精品视频123区在线观看| 99久久精品国产观看| 高潮精品一区videoshd| 国内外成人在线| 韩国女主播成人在线| 蜜桃av一区二区| 偷拍日韩校园综合在线| 一级特黄大欧美久久久| 亚洲欧美国产77777| 亚洲欧美另类图片小说| 亚洲欧美电影一区二区| 亚洲人成在线观看一区二区| ●精品国产综合乱码久久久久| 亚洲国产精华液网站w| 久久久久88色偷偷免费| 久久久久久久久久久99999| 久久综合国产精品| 国产午夜精品久久| 中文字幕中文在线不卡住| 亚洲视频一区在线观看| 一区二区三区精品| 午夜久久久久久电影| 午夜电影一区二区| 蜜桃av一区二区| 国产一区二区三区久久悠悠色av| 国产精品综合av一区二区国产馆| 国产一区二区三区精品欧美日韩一区二区三区 | 91亚洲国产成人精品一区二三| 本田岬高潮一区二区三区| 99精品久久99久久久久| 在线视频亚洲一区| 欧美顶级少妇做爰| 精品捆绑美女sm三区| 国产亚洲欧美在线| 日韩理论电影院| 午夜av一区二区| 国产精品一区二区在线播放 | 日韩精品每日更新| 韩国av一区二区| 99re亚洲国产精品| 欧美精品在线观看播放| 久久久久国产精品免费免费搜索| 国产精品福利av| 日韩成人免费看|