之前為大家詳細介紹了兩大數據治理策略:拉式策略(Pull Strategy)與推式策略(Push Strategy)。
而其中拉式策略是一種幫助企業洞察資料問題根因,滿足資料應用需求的敏捷數據治理策略。那麼,本文將從兩個實際案例著手,幫助大家深入理解。
以提升資料應用過程中資料準確性為目標的拉式數據治理建設策略主要包括3個流程:
(1)基於指標體系的資料問題洞察:基於資料指標體系,以“資料流、資訊流、業務流”的基本邏輯框架,在限定的範圍內及時洞察資料質量問題的根源,並逆向推動業務資訊化和業務管理的改善和提升;
(2)穩健的資料架構設計:透過資料倉庫建模、合理的分層設計、ETL 過程開發等,保障資料模型及架構的穩健性和可擴充套件性,提高資料使用的準確性;
(3)資料應用稽核管控機制:建立面向高層管理的資料指標管控及稽核機制,確保資料應用過程中(上報、視覺化分析)關鍵資料必須經過有效稽核,提升資料使用質量及資料準確性。
1. 表象問題:
某集團內部分包導致專案產值及二級單位業績劃分不明確
2. 根因分析:
至此,我們透過“資料流”和“業務流”的分析,將資料問題定位到了“資訊流”層面的系統設計問題。
3. 解決路徑:
4. 治理成果:
最終,透過完善業務系統中專案分級管理的機制,實現專案產值的精準核算,完成了從資料問題洞察到數據治理的過程。
1. 表象問題:
某集團在建專案、完工專案數量各部門資料不一致
2. 根因分析:
資料流層面上,發現在進行資料分析時,從各業務系統中獲取的資料不一致,並且項管部仍存線上下統計資料的現象。進一步分析,發現資訊流層面不同的業務系統,對專案狀態的定義模糊、不一致,例如項管部以專案部發文為開工,商務部以獲取開工報告為開工。
至此,我們已經可以明確問題的根源在於業務流層面,集團內部缺乏統一的制度、流程來明確專案各節點的劃分標準,也沒有明確以固定的流程節點劃分專案狀態。因此,要想治理各部門專案數量的資料問題,就必須在集團管理流程和標準上做出改善。
3. 解決路徑:
4. 治理成果:
最終,實現了跨部門專案資料的統一,規範了專案全生命週期的管理流程,完成了從資料問題洞察到數據治理的過程。
在洞察到資料問題所在並進行了資料側、資訊側或者業務側的改善後,進行穩健的資料架構設計是拉式策略的第二個流程。這裡主要涉及透過資料倉庫建模、合理的分層設計、ETL 過程開發等,保障資料模型及架構的穩健性和可擴充套件性,從而提高資料使用的準確性。關於數倉建模、ETL的相關概念和過程上文已有詳細的描述,在此就不贅述。值得強調的是思考資料架構有三個出發點:穩健性、可擴充套件性和效率。
我們數據治理策略的最後一個流程是建立一個企業內部,面向高層管理者的資料指標管控及稽核機制,確保資料應用過程中(上報、視覺化分析)的關鍵資料必須經過有效稽核,提升資料使用質量及資料準確性。
以某集團的經營分析會資料稽核流程為例,集團總部的填報使用者儲存、提交資料後,資料會被鎖定並流轉至集團總部的稽核使用者處。如果資料稽核透過,它會被定版並做會前使用準備;如果資料稽核不透過,它則會被退回填報使用者處,並且系統會自動推送稽核失敗原因給填報使用者,後臺同步更新稽核記錄和狀態。
子產業集團的填報使用者提交資料後,流程情況與集團總部的填報使用者類似,只是需要額外經過一輪子產業集團稽核使用者的稽核。如果在子產業層面稽核透過,資料將會做會前準備定版,流轉至集團總部稽核使用者處。如果集團總部資料稽核不透過,資料將會被直接退回子產業資料儲存中心,並推送原因給子產業填報使用者。總之,雙重稽核流程保障了子產業集團資料上報的準確性,進而提高了集團總部高層使用資料的質量。
企業表層資料問題的產生往往有深層次的業務系統設計、流程制度管理方面的原因,因此要想透過數據治理提升企業資料的質量,就不能僅僅依靠一個工具或產品解決表象的問題。我們提出了企業數據治理的拉式策略(Pull Strategy)和推式策略(Push Strategy)來滿足不同的數據治理需求。
考慮到當今企業面臨的複雜環境,實施週期更短、治理成本更低的拉式治理策略更能及時滿足企業資料消費的需求,是一種更靈活、更敏捷的數據治理方式。在該策略下,基於指標體系的“資料流-資訊流-業務流”分析邏輯能夠幫助企業發現、洞察、追蹤資料問題產生的根源;穩健的資料架構設計能夠幫助企業解決資料質量的問題;資料應用稽核管控機制的建立能夠幫助企業解決錯誤資料被使用的問題。經過系統化的資料治理,企業資料質量將更能滿足消費的需求,基於資料的決策也將更加精準。
免費資源下載