《數據倉庫實踐》


序言

2017 年初,我開始在簡書上寫關於數據倉庫的系列博客,博客主題圍繞大數據場景下數據倉庫的理論和實踐來展開,截止現在已有十篇左右。最初寫作的時候主要是抱着學習和總結的態度,導致很多地方略顯粗糙和不嚴謹,加上這一系列的博客也收到了不少讀者朋友的反饋,我就有了重新整理一遍該系列的想法。因此,17 年底,開始利用周末的時間開始對之前的一些博客進行重寫,並補齊一些之前沒有提到的知識點,將之前的一系列博客變成一本更為系統性的小書奉獻給大家(地址在末尾)。

關於本書

首先,這是一本關於大數據場景下如何實踐數據倉庫的書,以實踐為主並輔以部分的理論知識。書中內容主要側重於這幾個方面:數據建模、數據組織和數據管理。在本書中,我沒有過多地涉及到大數據的技術細節以及數據挖掘的一些算法,原因在於我希望這本書顯得更純粹針對性更強一些。

其次,這是一本小書,說它小是因為它的涵蓋面相對比較窄一點,我希望后面是寫的一個個系列的小書,而不是一個大而全的東西。小,也就意味着更精煉和專注。因此關注於數據倉庫的數據建模和數據管理的童鞋更容易獲得一些共鳴。

最后,希望大家能多交流。寫這本小書,花很多時間來組織內容和語言對我並無太大益處,我所希望的是能有所收獲,知識取之於開源世界而回饋於開源世界,我也希望從這本小書中有所收獲的小伙伴能有一些反饋,不管是正向的還是負向的都能讓我有所成長。

目錄

本系列文章有下面內容:

  • 數據倉庫中的模型設計
  • 詳解唯獨建模
  • 拉鏈表是什么
  • 緩慢變化維度
  • 如何優雅地設計數據分層
  • 別人家的元數據系統是怎么設計的
  • 數據質量監控
  • 聊一聊ETL的設計
  • 重要的代理鍵
  • 時間維表的實踐

小書的gitbook地址:https://www.gitbook.com/book/dantezhao/data-warehouse-in-action/details


作者:木東居士 |簡書 | CSDN | GITHUB

個人主頁:http://www.mdjs.info
也可以關注我:木東居士。

文章可以轉載, 但必須以超鏈接形式標明文章原始出處和作者信息


注意!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系我们删除。



 
粤ICP备14056181号  © 2014-2021 ITdaan.com