柚子快報(bào)激活碼778899分享:數(shù)據(jù)倉(cāng)庫(kù)——維度表一致性
柚子快報(bào)激活碼778899分享:數(shù)據(jù)倉(cāng)庫(kù)——維度表一致性
數(shù)據(jù)倉(cāng)庫(kù)基礎(chǔ)筆記思維導(dǎo)圖已經(jīng)整理完畢,完整連接為: 數(shù)據(jù)倉(cāng)庫(kù)基礎(chǔ)知識(shí)筆記思維導(dǎo)圖
維度一致性問(wèn)題
從邏輯層面來(lái)看,當(dāng)一系列星型模型共享一組公共維度時(shí),所涉及的維度稱為一致性維度。當(dāng)維度表存在不一致時(shí),短期的成功難以彌補(bǔ)長(zhǎng)期的錯(cuò)誤。 維度時(shí)確保不同過(guò)程中信息集成起來(lái)實(shí)現(xiàn)橫向鉆取貨活動(dòng)的關(guān)鍵。
造成橫向鉆取失敗的原因
維度結(jié)構(gòu)的差別,因?yàn)榫S度的差別,分析工作涉及的領(lǐng)域從簡(jiǎn)單到復(fù)雜,但是都是通過(guò)復(fù)雜的報(bào)表來(lái)彌補(bǔ)設(shè)計(jì)層面帶來(lái)的缺點(diǎn),并且也存在許多問(wèn)題:
開(kāi)展橫向鉆取工作需要特定的知識(shí)除了最具有經(jīng)驗(yàn)的開(kāi)發(fā)者外,大多數(shù)人都不肯呢個(gè)會(huì)采用這類方案去比較過(guò)程運(yùn)用不當(dāng)時(shí),方案會(huì)有出現(xiàn)不一致的風(fēng)險(xiǎn)并形成不正確的結(jié)果方案阻礙了為特定報(bào)表工具橫向鉆取報(bào)表的自動(dòng)生成 維度內(nèi)容的差異一致性的基本要求,結(jié)構(gòu)相同,維度表必須有相同的維度列集合。內(nèi)容相同,維度列存在的值必須具有相同的表示形式。
維度一致性的類型
共享維度,來(lái)那個(gè)維度共享相同的邏輯維度表時(shí),可以時(shí)同一個(gè)維度表,或者兩個(gè)或更多個(gè)等價(jià)表組成。
共享的維度表支持其中任意的維度屬性橫向鉆取相關(guān)的事實(shí)表,結(jié)構(gòu)和內(nèi)容相同的不同維度表也支持對(duì)事實(shí)的橫向鉆取,完全相同的副本也是一致的。當(dāng)一個(gè)共享維度存在多個(gè)副本時(shí),需要單獨(dú)的ETL過(guò)程負(fù)責(zé)處理新的和發(fā)生改變的數(shù)據(jù)共享維度的另一個(gè)版本允許副本包含維度中行的子集,通常與表示實(shí)體的子類對(duì)應(yīng),這一子嘞可以被額外的特殊子類所修飾 一致性上卷,保持一致性并不需要維度表完全相同,表的維度屬性時(shí)其他表的維度屬性的子集,公共維度屬性具有相同的結(jié)構(gòu)與內(nèi)容
確保一致性上卷實(shí)例值與基本維度的實(shí)例值匹配的最好方式時(shí)制定基本維度作為他的來(lái)源,另一種方式是,選擇建立單獨(dú)的程序來(lái)處理數(shù)據(jù)源同時(shí)處理基本維度和上卷中涉及的新增和發(fā)生變化的行,有時(shí)可以允許上卷維度包含除代理鍵之外相同的行 一致的退化維度,對(duì)維度進(jìn)行退化,存儲(chǔ)在事實(shí)表中,公共維度誰(shuí)能狗必須有相同的結(jié)構(gòu)和內(nèi)容,并且需要確保每個(gè)表中出現(xiàn)相同值的組合重疊維度。
交叉屬性,當(dāng)兩個(gè)表共享一組公共屬性,當(dāng)兩個(gè)維度重疊時(shí),將通過(guò)他們的公共屬性保持一致性,公共屬性必須共享相同的內(nèi)容和結(jié)構(gòu)。生成第三個(gè)表來(lái)避免重疊,刪除兩個(gè)表中的公共屬性,并將它們放在第三個(gè)維度表中生成第三個(gè)表并跟蹤關(guān)系,如果問(wèn)題中的維度與其重疊屬性之間的關(guān)系隨著時(shí)間會(huì)發(fā)生改變,并獲得特定時(shí)間點(diǎn)上的維度和重疊屬性關(guān)系的描述是非常重要的,第三個(gè)維度建立可采用跟蹤其關(guān)系的事實(shí)表來(lái)補(bǔ)充生成第三個(gè)表作為支架表,建立與其他兩個(gè)表直接關(guān)聯(lián)的第三個(gè)維度表
規(guī)劃一致性
一致性維度是維度建模的關(guān)鍵,缺乏一致性,就難以對(duì)數(shù)據(jù)倉(cāng)庫(kù)開(kāi)展橫向鉆取分析,將失去協(xié)同增效的可能,并且將會(huì)形成信息孤島。
一致性設(shè)計(jì)
更好的描述一致性維度方式是采用矩陣圖,列代表核心一致性維度,行代表不同的事實(shí)表,可通過(guò)在適當(dāng)?shù)慕徊纥c(diǎn)放置檢查標(biāo)志來(lái)闡明一致性。
增量實(shí)現(xiàn)
一致性矩陣可以作為實(shí)現(xiàn)藍(lán)圖,指明了所有事實(shí)表連接的位置,這允許獨(dú)立地實(shí)現(xiàn)每一個(gè)事實(shí)表,并能可信地與那些已經(jīng)存在的事實(shí)表協(xié)同工作。在完成對(duì)維度框架的構(gòu)建后,在增量實(shí)現(xiàn)時(shí)可不用擔(dān)心存在不一致問(wèn)題。 另一方面,如果在開(kāi)發(fā)一致性維度集之前實(shí)現(xiàn)增量開(kāi)發(fā)的方法,這樣的框架將不可避免地陷入不一致的陷阱。
結(jié)構(gòu)與一致性
維度數(shù)據(jù)倉(cāng)庫(kù)
包含一致性設(shè)計(jì)的策略計(jì)劃,在維度數(shù)據(jù)倉(cāng)庫(kù)中,維度設(shè)計(jì)是戰(zhàn)略活動(dòng),一致性維度是這種設(shè)計(jì)的中心特征,提供了企業(yè)級(jí)的能力?,F(xiàn)實(shí)的壓力,對(duì)于那些才用了維度數(shù)據(jù)倉(cāng)庫(kù)的組織來(lái)說(shuō),這種愿景需要經(jīng)受實(shí)踐的考驗(yàn)。當(dāng)前分析系統(tǒng)中可能包括沒(méi)有被集成的,缺乏一致性的遺留系統(tǒng)。并且商業(yè)壓力也會(huì)影響一致性維度設(shè)計(jì)。
柚子快報(bào)激活碼778899分享:數(shù)據(jù)倉(cāng)庫(kù)——維度表一致性
相關(guān)鏈接
本文內(nèi)容根據(jù)網(wǎng)絡(luò)資料整理,出于傳遞更多信息之目的,不代表金鑰匙跨境贊同其觀點(diǎn)和立場(chǎng)。
轉(zhuǎn)載請(qǐng)注明,如有侵權(quán),聯(lián)系刪除。