資料倉儲
维基百科,自由的百科全书
zh-cn:数据仓库;zh-hk:資料倉儲;zh-tw:資料倉儲 zh-cn:数据仓库;zh-hk:資料倉儲;zh-tw:資料倉儲,中國大陸譯作数据仓库,台灣譯作資料倉儲,是一門新興的資訊科技相關理論,以下用二種方式對其作解釋。
目录 |
[编辑] 較簡易的解釋方式
資料倉儲是一種資訊系統的資料儲存理論,此理論強調利用某些特殊資料儲存方式,讓所包含的資料,特別有利於分析處理,以產生有價值的資訊。
利用資料倉儲方式所存放的資料,具有一但存入,便不隨時間而更動的特性,同時存入的資料必定包含時間屬性,通常一個資料倉儲皆會含有大量的歷史性資料,並利用特定分析方式,自其中發掘出特定資訊。
[编辑] 較學術的解釋方式
資料倉儲 ,由資料倉儲之父W.H.Inmon於1990年提出,主要功能乃是將組織透過資訊系統之線上交易處理(OLTP)經年累月所累積的大量資料,透過資料倉儲理論所特有的資料儲存架構,作一有系統的分析整理,以利各種分析方法如線上分析處理(OLAP)、資料採礦(Data Mining)之進行,並進而支援如決策支援系統(DSS)、主管資訊系統(EIS)之建立,幫助決策者能快速有效的自大量資料中,分析出有價值的資訊,以利決策擬定及快速回應外在環境變動,幫助建構商業智慧(BI)。
一般來說,資料倉儲可由關聯式資料庫,或專為資料倉儲開發的多維度資料庫建立,若由關聯式資料庫建立而成,其架構可分為星狀及雪花狀架構,包含數個維度資料表,及一個事實資料表,若以規模分類,則又可分為資料倉儲及資料超市。
資料倉儲的建制不僅只是資訊工具技術面的運用,在規畫和執行面更需對產業知識、行銷管理、市場定位、策略規畫等相關條件有深入的了解,才能真正發揮資料倉儲以及後續分析工具的價值,提升組織競爭力。
[编辑] 資料倉儲的特性
- 主題導向(Subject-Oriented)
- 可整合性(Integrated)
- 時間差異性(Time-Variant)
- 不變動性(Nonvolatile)
[编辑] 資料採礦、OLAP和資料倉儲
資料倉儲可以作為資料採礦和OLAP等分析工具的資料來源,由於存放於資料倉儲中的資料,必需經過篩選與轉換,因此可以避免分析工具使用錯誤的資料,而得到不正確的分析結果。
資料採礦和OLAP同為分析工具,其差別在於OLAP提供使用者一便利的多維度觀點和方法,以有效率的對資料進行複雜的查詢動作,其預設查詢條件由使用者預先設定,而資料採礦,則能由資訊系統主動發掘資料來源中,未曾被查覺的隱藏資訊,和透過使用者的認知以產生知識。