柚子快報(bào)邀請(qǐng)碼778899分享:數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)基礎(chǔ)常用問答
柚子快報(bào)邀請(qǐng)碼778899分享:數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)基礎(chǔ)常用問答
1、范式建模中三范式分別是什么?
第一范式:列不可再分
第二范式:在遵循第一范式的基礎(chǔ)上 存在唯一主鍵
第三范式:在遵循第二范式的基礎(chǔ)上 不存在傳遞函數(shù)依賴 。傳遞函數(shù)依賴是指出現(xiàn)非主屬性決定非主屬性。
2、OLAP和OLTP分別是什么,有什么區(qū)別?
OLAP是聯(lián)機(jī)分析處理,OLTP是聯(lián)機(jī)事務(wù)處理。
這兩個(gè)系統(tǒng)的主要區(qū)別在于它們的名稱:分析型與事務(wù)型。每個(gè)系統(tǒng)都針對(duì)該類型的處理進(jìn)行了優(yōu)化。
OLAP 經(jīng)過優(yōu)化,可進(jìn)行復(fù)雜的數(shù)據(jù)分析,從而做出更明智的決策。OLAP 系統(tǒng)專為數(shù)據(jù)科學(xué)家、業(yè)務(wù)分析師和知識(shí)工作者使用而設(shè)計(jì),它們支持商業(yè)智能 (BI)、數(shù)據(jù)挖掘和其他決策支持應(yīng)用程序。
另一方面,OLTP 針對(duì)處理大量事務(wù)進(jìn)行了優(yōu)化。OLTP 系統(tǒng)專為一線工作人員(例如收銀員、銀行出納員、酒店前臺(tái)職員)或客戶自助服務(wù)應(yīng)用程序(例如網(wǎng)上銀行、電子商務(wù)、旅行預(yù)訂)而設(shè)計(jì)。
3、維度建模是什么?
維度建模是根據(jù)實(shí)體事實(shí)之間的關(guān)系來進(jìn)行建模,通常組成星型模型或雪花模型。所謂星型模型是指的事實(shí)表外圍只有一層維度表,數(shù)據(jù)冗余度較大;雪花模型指的是事實(shí)表周圍不止一層維度,有可能存在多層維度,相對(duì)于星型模型,減少了數(shù)據(jù)冗余,但同時(shí)也降低了查詢效率。
4、維度建模與范式建模的區(qū)別?
區(qū)別一:建模方式不同 ,維度建模是根據(jù)實(shí)體事實(shí)之間的關(guān)系來進(jìn)行建模,通常組成星型模型或雪花模型;范式建模使用的是范式建模理論進(jìn)行建模;
區(qū)別二:數(shù)據(jù)冗余不同。維度建模數(shù)據(jù)冗余較大,范式建模冗余較小
區(qū)別三:查詢效率不同。維度建模查詢效率優(yōu)于范式建模
區(qū)別四:常用場(chǎng)景不同。維度建模常用于分析處理場(chǎng)景。
5、什么是事實(shí)表?什么是維度表?
事實(shí)表是維度建模中的概念,事實(shí)表有記錄著業(yè)務(wù)核心真實(shí)的數(shù)據(jù),一般粒度較細(xì),包含著各個(gè)維度的外鍵。
維度表它包含了與業(yè)務(wù)過程相關(guān)的維度信息。維度是描述業(yè)務(wù)過程的屬性,例如時(shí)間、地點(diǎn)、產(chǎn)品等。維度表中的每一行都對(duì)應(yīng)著一個(gè)唯一的維度值,例如某一天、某一地點(diǎn)、某一產(chǎn)品等。維度表通常包含了維度的屬性信息,例如時(shí)間維度表中包含了年、月、日等屬性
6、數(shù)倉(cāng)建模方法:
典型的數(shù)據(jù)倉(cāng)庫(kù)建模方法論
?ER 模型
ER模型即為實(shí)體聯(lián)系模型:按照不同的主題與主題之間的聯(lián)系
采用 ER模型建設(shè)數(shù)據(jù)倉(cāng)庫(kù)模型的出發(fā)點(diǎn)是整合數(shù)據(jù),將各個(gè)系統(tǒng)中的數(shù)據(jù)以整個(gè)企業(yè)角度按主題進(jìn)行相似性組合和合并,并進(jìn)行一致性處理,為數(shù)據(jù)分析決策服務(wù),但是并不能直接用于分析決策。
ER 模型在實(shí)踐中最典型的代表是 Teradata 公司基于金融業(yè)務(wù)發(fā)布 的 FS-LDM(Financial Services Logical Data Model),它通過對(duì)金融業(yè)務(wù)的高度抽象和總結(jié),將金融業(yè)務(wù)劃分為10大主題,并以設(shè)計(jì)面向金融倉(cāng)庫(kù)模型的核心為基礎(chǔ),企業(yè)基于此模型做適當(dāng)調(diào)整和擴(kuò)展就能快速落地實(shí)施。
維度模型
維度建模從分析決策的需求出發(fā)構(gòu)建模型,為分析需求服務(wù),因此它重點(diǎn)關(guān)注用戶如何更快速地完成需求分析,同時(shí)具有較好的大規(guī)模復(fù)雜查詢的響應(yīng)性能。其典型的代表是星形模型,以及在一些特殊場(chǎng)景下使用的雪花模型。設(shè)計(jì)步驟通常如下:
1. 卻定主題; 2. 聲明粒度; 3. 確認(rèn)維度; 4. 確認(rèn)事實(shí)
選擇需要進(jìn)行分析決策的業(yè)務(wù)過程。業(yè)務(wù)過程可以是單個(gè)業(yè)務(wù)事件,比如交易的支付、退款等;也可以是某個(gè)事件的狀態(tài),比如當(dāng)前的賬戶余額等;還可以是一系列相關(guān)業(yè)務(wù)事件組成的業(yè)務(wù)流程,具體需要看我們分析的是某些事件發(fā)生情況,還是當(dāng)前狀態(tài),或是事件流轉(zhuǎn)效率。
選擇粒度。在事件分析中,我們要預(yù)判所有分析需要細(xì)分的程度,從而決定選擇的粒度。粒度是維度的一個(gè)組合。
識(shí)別維表。選擇好粒度之后,就需要基于此粒度設(shè)計(jì)維表,包括維度屬性,用于分析時(shí)進(jìn)行分組和篩選。
選擇事實(shí)。確定分析需要衡量的指標(biāo) ?
4、SQL執(zhí)行順序:
1、from;
2、where
3、group by:
4、聚合函數(shù)計(jì)算;
5、having;
6、select;
7;order by;
柚子快報(bào)邀請(qǐng)碼778899分享:數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)基礎(chǔ)常用問答
推薦文章
本文內(nèi)容根據(jù)網(wǎng)絡(luò)資料整理,出于傳遞更多信息之目的,不代表金鑰匙跨境贊同其觀點(diǎn)和立場(chǎng)。
轉(zhuǎn)載請(qǐng)注明,如有侵權(quán),聯(lián)系刪除。