柚子快報(bào)激活碼778899分享:數(shù)倉的幾種設(shè)計(jì)模型
柚子快報(bào)激活碼778899分享:數(shù)倉的幾種設(shè)計(jì)模型
一、簡介
2021年筆記遷移 2023-6-12 20:25:42 是剛開始做數(shù)據(jù)開發(fā)時(shí)留下的筆記,很青澀,當(dāng)時(shí)甚至還不理解什么是碼表,如今回首,滄海桑田。
維度建模
數(shù)據(jù)倉庫的常用建模思想:維度建模。(專用于分析性數(shù)據(jù)庫/數(shù)據(jù)倉庫/數(shù)據(jù)集市建模的方法).
維度建模有三種常用的模式:星型模式、雪花模式和星座模式。
再介紹下維度建模下,表的兩個(gè)重要概念:維度表和事實(shí)表;
維度表,也稱為碼表、維表,可以理解成分析事物的某個(gè)角度。(數(shù)據(jù)量不大,但是每條數(shù)據(jù)的被引用頻率都比較高,是用來跟外面一對(duì)多的)比如時(shí)間維度、地點(diǎn)維度等。
事實(shí)表,fact table,表示對(duì)分析主題的度量。事實(shí)表包含了各維度表內(nèi)的主鍵來做外鍵,可通過join的方式與維度表相關(guān)聯(lián)。
維度表的設(shè)計(jì)是為了以合適的角度來聚合內(nèi)容,事實(shí)表的設(shè)計(jì)是為了正確記錄內(nèi)容。
所以按照我的理解就是,維度表是用來在事實(shí)表中一對(duì)多的,頗有些代碼設(shè)計(jì)原則中“不要重新造輪子”的思想,冗余代碼提取,提高可復(fù)用性。
因此從根本上來講,數(shù)據(jù)倉庫建模的方式,更多的是為了避免冗余,以及增強(qiáng)數(shù)據(jù)復(fù)用性。
數(shù)據(jù)倉庫的其他建模方式
事實(shí)上,數(shù)據(jù)倉庫中,除了維度建模之外,還有很多其他的建模方法,比如說范式建模法(沒錯(cuò),就是我們平時(shí)說的3NF第三范式)、實(shí)體建模法等。
每一種建模方法都代表了哲學(xué)上的一種觀點(diǎn),都代表了一種歸納、概括世界的一種方法。
這個(gè)可以簡單看一下參考文獻(xiàn)3,我看了一下感覺不是很好理解。
二、維度建模
星型模式
星型模式(star schema),是最常見的一種維度建模方式,簡單且高效。
星型模式以事實(shí)表為中心,所有的維度表連接在事實(shí)表上,像星星一樣,事實(shí)表是中心的多邊形,維度表是它的角,起到擴(kuò)展事實(shí)表的作用。
有如下幾個(gè)特點(diǎn):
維度表只跟事實(shí)表相關(guān)聯(lián),維度表之間沒有關(guān)聯(lián);每個(gè)維度表中的主鍵為單列,并且被包含在事實(shí)表中作為外鍵,用來做關(guān)聯(lián);以事實(shí)表為核心,維度表圍繞核心。
如圖(以下圖都是從不同的文獻(xiàn)里收集的,時(shí)間有點(diǎn)久了,有的忘記留出處了):
(上圖來自參考文獻(xiàn)1)
雪花模式
雪花模式(snowflake schema),是對(duì)星型模式的擴(kuò)展。在星型模式的基礎(chǔ)上,雪花模式中,一級(jí)維度表可以擁有自己的二級(jí)維度表,如此進(jìn)行嵌套。
可以這么理解,某些維度表被規(guī)范化,進(jìn)一步細(xì)分出二級(jí)維度表。
但是這種模型的維護(hù)成本比較高,而且使用時(shí)需要關(guān)聯(lián)多層維度表,性能相對(duì)星型模式要更低。所以一般不常用。
之所以命名成雪花模式,多半是因?yàn)槟且欢岩欢逊种О?/p>
星座模式
星座模式是由星型模式延伸而來,星型模式是基于一張事實(shí)表,而星型模式是基于多張事實(shí)表,而且事實(shí)表之間共享維度表。
在業(yè)務(wù)發(fā)展的后期,絕大部分維度建模使用的都是星座模式。因?yàn)閿?shù)據(jù)倉庫注定是多主題的,單個(gè)事實(shí)表根本無法滿足需要。
星座模式,有時(shí)也被稱為星系模式(Galaxy schema)。
三、參考文獻(xiàn)
模塊開發(fā)-數(shù)據(jù)倉庫的設(shè)計(jì) 及星型模型 雪花模型 星座模型三個(gè)例子,讓你看懂?dāng)?shù)據(jù)倉庫多維數(shù)據(jù)模型的設(shè)計(jì)淺談數(shù)據(jù)倉庫建模方法
柚子快報(bào)激活碼778899分享:數(shù)倉的幾種設(shè)計(jì)模型
精彩文章
本文內(nèi)容根據(jù)網(wǎng)絡(luò)資料整理,出于傳遞更多信息之目的,不代表金鑰匙跨境贊同其觀點(diǎn)和立場(chǎng)。
轉(zhuǎn)載請(qǐng)注明,如有侵權(quán),聯(lián)系刪除。