數據管理知識體系將數據質量 (DQ) 定義為“將質量管理技術應用于數據的活動的規劃、實施和控制,以確保其適合消費并滿足數據消費者的需求。”
由于對 DQ 的期望并不總是口頭表達和為人所知,因此需要進行持續的討論。DQ 取決于上下文和數據消費者的要求。實施有效的 DQ 管理使用 DQ 工具可幫助組織將 DQ 維持和改進到可接受的水平。業務領導者使用數據質量維度來衡量 DQ 并建立對數據的更多信任。
數據質量維度的簡短列表:- 準確性
- 完整性
- 一致性
- 正直
- 合理性
- 及時性
- 唯一性/重復數據刪除
- 有效性
- 輔助功能
其他定義包括:
- “適合一個目的。滿足其作者、用戶和管理員的要求。” (Peter Aiken 博士,改編自 Martin Eppler)
- “依賴數據的準確性、一致性和完整性才能在整個企業中發揮作用。” (米歇爾奈特)
- 用于解析和標準化、廣義“清理”、匹配、分析、監控和豐富的工具和過程(高德納)
- Strong-Wang框架:(麻省理工學院的 Wang 和 Strong和大馬DMBoK)
輔助功能
訪問安全
可解釋性
易于理解
表征一致性
簡明表示
附加值
關聯
完整性
適當的數據量
準確性
客觀性
可信度
名聲
內在的 DQ:
上下文 DQ:
代表性 DQ:
輔助功能 DQ:
一些用途包括:
- 增加的價值組織數據 以及使用它的機會
- 減少風險和成本與低質量數據相關
- 改善組織效率 和生產力
- 保護和提高組織的聲譽
- 數據剖析(建立趨勢并發現數據中的不一致)
- 數據標準化(確保數據使用相同、一致的格式)
- 數據監控(當未達到 DQ 閾值時提醒數據管理員)
- 數據解析(發現數據是否符合可識別的模式)
- 數據清理