
Datavines 是一站式開源數據可觀測性平臺,提供元數據管理、數據概覽報告、數據質量管理,數據分布查詢、數據趨勢洞察等核心能力,致力于幫助用...
Metric 是 Datavines 中一個核心概念,一個 Metric 表示一個數據質量檢查規則,比如空值檢查和表行數檢查都是一個規則。Met...
Datavines是一站式開源數據可觀測性平臺,提供元數據管理、數據概覽報告、數據質量管理,數據分布查詢、數據趨勢洞察等核心能力,致力于幫助用戶...
整體架構 Datavines [github][https://github.com/datavane/datavines] 是一個數據可觀測性...
數據目錄管理 數據源管理 查看、創建、編輯、刪除 元數據獲取手動執行定時執行 數據源類型管理 創建數據源類型時需要添加類型的元數據模型定義,模型...
概述 隨著越來越多的數據在企業中被復制和移動,數據管道成為了數據的高速公路。數據管道的有效性和可靠性將愈發的重要。數據的可觀測性側重于管理數據的...
本文主要通過源碼來了解SparkStreaming程序從任務生成到任務完成整個執行流程以及中間伴隨的checkpoint操作 注:下面源碼只貼出...
Cloudera Engineering Blog 翻譯:Offset Management For Apache Kafka With Apa...
前言 這篇文章的目的如下: HashSet是如何保證元素的不重復和無序 HashSet的增刪(改查?)原理 CopyOnWriteArraySe...