Apache Flink Table Store 0.2.0 發(fā)布

685-383.jpg

作者｜Jingsong Lee jingsonglee0@gmail.com

Apache Flink 社區(qū)很高興地宣布發(fā)布 Apache Flink Table Store 0.2.0。

在這個(gè)版本中，增加了 Hive、Spark 和 Trino 等計(jì)算引擎的對(duì)接支持，并且穩(wěn)定了存儲(chǔ)的格式。歡迎大家試用和反饋！

Flink Table Store 倉(cāng)庫(kù)地址：

https://github.com/apache/flink-table-store

項(xiàng)目文檔和用戶指南請(qǐng)查看：

https://nightlies.apache.org/flink/flink-table-store-docs-release-0.2/

Flink Table Store 是什么

Flink Table Store是一個(gè)數(shù)據(jù)湖存儲(chǔ)，用于實(shí)時(shí)流式 Changelog 攝取 (比如來(lái)自 Flink CDC 的數(shù)據(jù)) 和高性能查詢。

F7490142-221E-4D88-9410-CDAA22E32966.png

作為一種新型的可更新數(shù)據(jù)湖，F(xiàn)link Table Store 具有以下特點(diǎn)：

大吞吐量的更新數(shù)據(jù)攝取，同時(shí)提供良好的查詢性能。
具有主鍵過(guò)濾器的高性能查詢，響應(yīng)時(shí)間最快可達(dá)到百毫秒級(jí)別。
流式讀取在 Lake Storage 上可用，Lake Storage 還可以與 Kafka 集成，以提供毫秒級(jí)流式讀取。

功能

在這個(gè)版本中，我們完成了許多令人興奮的功能。

Catalog

此版本引入了 Table Store 自己的 Catalog，在 Catalog 下創(chuàng)建的表，持久化保存表信息等元數(shù)據(jù)，可以跨 session 訪問(wèn)存量表。

默認(rèn)情況下元數(shù)據(jù)都保存在 DFS 上。也支持配置 Hive Metastore 的自動(dòng)同步。

CREATE CATALOG tablestore WITH (
  'type'='table-store',
  'warehouse'='hdfs://nn:8020/warehouse/path',
  -- optional hive metastore
  'metastore'='hive',
  'uri'='thrift://<hive-metastore-host-name>:<port>'
);

USE CATALOG tablestore;

CREATE TABLE my_table ...

當(dāng)開(kāi)啟 Hive Metastore 時(shí)，你可以比較方便的使用 Hive 引擎來(lái)查詢 Flink Table Store。

生態(tài)

在本版本中，我們不僅支持 Flink 1.15，也支持了 Flink 1.14，并為多個(gè)計(jì)算引擎提供讀取支持。

我們會(huì)保持 Flink 引擎和 Flink Table Store 的全面結(jié)合，構(gòu)建完整的流批一體計(jì)算和存儲(chǔ)的流式數(shù)倉(cāng)。此外，F(xiàn)link Table Store 也支持了更多的計(jì)算引擎，包括 Hive/Spark/Trino 等，從而可以兼容更多的生態(tài)，便于在現(xiàn)有生產(chǎn)環(huán)境中使用。

O1CN01MfOexe1fstzliZBgt_!!6000000004063-0-tps-539-155.jpg

如果你有關(guān)于生態(tài)的需求和想法，比如想讓 Spark 或 Hive 支持寫(xiě)入 Flink Table Store，歡迎通過(guò)掃描文末的二維碼入群交流，或者在 Flink 社區(qū)創(chuàng)建 issue 進(jìn)行討論。

Append-only 表

Append-only 表功能是一種性能改進(jìn)，只接受 INSERT_ONLY 的數(shù)據(jù)以 Append 到存儲(chǔ)，而不是更新或刪除現(xiàn)有數(shù)據(jù)，適用于不需要更新的用例（如日志數(shù)據(jù)同步）。

CREATE TABLE my_table (
    ...
) WITH (
    'write-mode' = 'append-only',
    ...
)

流式寫(xiě)入 Append-only 表也具有異步 Compaction，從而不需要擔(dān)心小文件問(wèn)題。

Bucket 擴(kuò)縮容

單個(gè) Bucket 內(nèi)是一個(gè)單獨(dú)的 LSM 結(jié)構(gòu)，Bucket 的數(shù)量會(huì)影響性能：

過(guò)小的 Bucket 數(shù)量會(huì)導(dǎo)致寫(xiě)入作業(yè)有瓶頸，吞吐跟不上寫(xiě)入速度。
過(guò)大的 Bucket 數(shù)量會(huì)導(dǎo)致有大量小文件，且影響查詢速度。

Flink Table Store 允許用戶通過(guò) ALTER TABLE 命令調(diào)整存儲(chǔ)桶數(shù)量，并通過(guò) INSERT OVERWRITE 重新組織必要的分區(qū)，舊分區(qū)保持不變。

性能測(cè)試

在以下的模塊里，我們創(chuàng)建了關(guān)于流計(jì)算更新和查詢的 Benchmark：

https://github.com/apache/flink-table-store/tree/master/flink-table-store-benchmark

更新性能和查詢性能是互相權(quán)衡的，所以在性能測(cè)試中不能單獨(dú)衡量更新性能或者查詢性能。

如果只考慮查詢性能，那么 Copy On Write (COW) 是最適合的技術(shù)方案，但這種設(shè)計(jì)下更新時(shí)會(huì)覆寫(xiě)所有數(shù)據(jù)，因此是以犧牲更新性能為代價(jià)的。
如果只考慮更新性能，那么 Merge On Read (MOR) 是最適合的技術(shù)方案，但這種設(shè)計(jì)下會(huì)在讀取時(shí)對(duì)數(shù)據(jù)進(jìn)行合并，從而影響查詢的性能。
Flink Table Store 目前只支持 MOR 模式，但通過(guò) Data Skipping 等技術(shù)對(duì)查詢性能做了優(yōu)化。

下面對(duì)比了 Flink Table Store 和 Hudi MOR、Hudi COW，在實(shí)時(shí)更新場(chǎng)景的寫(xiě)入（包含插入和更新）與查詢性能。目前湖存儲(chǔ)中，只有 Hudi 比較好的支持了流更新寫(xiě)入，而 Iceberg 和 Delta 更適合使用批 SQL 的 MERGE INTO 來(lái)完成更新，所以這里只對(duì)比了 Hudi。

測(cè)試方法：

通過(guò) Flink SQL 向定義了主鍵的表里寫(xiě)入定量的隨機(jī)數(shù)據(jù)，測(cè)量耗時(shí)以及平均的 Cpu 消耗，以此衡量存儲(chǔ)的更新性能。
通過(guò) Spark SQL 查詢寫(xiě)好數(shù)據(jù)的表，測(cè)量三種 Query：查詢?nèi)繑?shù)據(jù)、查詢主鍵的某個(gè)范圍、點(diǎn)查某個(gè)主鍵，以此衡量存儲(chǔ)的查詢性能。

測(cè)試用例：

總量：數(shù)據(jù)總條數(shù) 5 億條。
主鍵：隨機(jī)的數(shù)據(jù)，隨機(jī)范圍是 1 億。
大小：每條數(shù)據(jù)大概 150 字節(jié)。

此測(cè)試用例比較簡(jiǎn)單，如有需要可以利用 benchmark 構(gòu)建更復(fù)雜的用例來(lái)貼合自己的生產(chǎn)場(chǎng)景。

測(cè)試環(huán)境：

Flink 版本: 1.14.5
Spark 版本：3.2.2
Flink Table Store 版本: 0.2.0
Hudi 版本：0.11.1
集群：三臺(tái)物理機(jī)的 Hadoop 集群

Flink 集群參數(shù)：

表格1.jpg

Spark 集群參數(shù)：

表格2.jpg

Flink Table Store 參數(shù)：

表格3.jpg

Hudi 參數(shù)：

表格4.jpg

寫(xiě)入性能 (throughput / core)：

80C4AE25-0F0C-4101-B21A-41D1FD855C14.png

查詢性能 (秒) (Flink Table Store vs Hudi MOR)：

A916420C-E0D3-4ADD-A88A-3BB23DB388EB.png

查詢性能 (秒) (Flink Table Store vs Hudi COW)：

C69B173E-A42A-4AC1-BD44-B16A6A65C9EF.png

結(jié)論，面向此測(cè)試用例：

Flink Table Store 對(duì)比 Merge On Read 有著比較好的更新性能和查詢性能。
Flink Table Store 對(duì)比 Copy On Write 有著比較好的更新性能，但是查詢所有數(shù)據(jù)不如 COW，F(xiàn)link Table Store 是一個(gè) Merge On Read 的技術(shù)，有 Merge 的開(kāi)銷(xiāo)，但是 Merge 的效率非常高。
Flink Table Store 因?yàn)楸３至擞行蛐裕苯硬樵儽砜梢杂泻芎玫?Data Skipping，點(diǎn)查甚至可以達(dá)到 100ms 以內(nèi)的延遲。

下一步

在即將發(fā)布的 0.3.0 版本中，您可以期待以下功能：

Lookup：支持 Flink Dim Lookup Join。(即將來(lái)臨)
并發(fā)更新：多個(gè) Flink 作業(yè)寫(xiě)入同一張 Flink Table Store 表。
Compaction分離：?jiǎn)为?dú)的任務(wù)完成Compaction。
物化視圖：Flink Table Store 提供預(yù)聚合模型。
變更日志生成：為各種 MergeEngine 生成準(zhǔn)確的變更日志。
多引擎的寫(xiě)支持：支持 Spark、Hive 寫(xiě)入 Flink Table Store。

Flink Table Store 長(zhǎng)期目標(biāo)是滿足批流一體對(duì)存儲(chǔ)的所有要求，并構(gòu)建實(shí)時(shí)低成本的 Streaming Data Warehouse。

最后編輯于：2022.10.14 16:42:25

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明：文章內(nèi)容（如有圖片或視頻亦包括在內(nèi)）由作者上傳并發(fā)布，文章內(nèi)容僅代表作者本人觀點(diǎn)，簡(jiǎn)書(shū)系信息發(fā)布平臺(tái)，僅提供信息存儲(chǔ)服務(wù)。

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖，帶你破解...
沈念sama閱讀 229,732評(píng)論 6贊 539
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異，居然都是意外死亡，警方通過(guò)查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 99,214評(píng)論 3贊 426
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)，“玉大人，你說(shuō)我怎么就攤上這事。” “怎么了？”我有些...
開(kāi)封第一講書(shū)人閱讀 177,781評(píng)論 0贊 382
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵，是天一觀的道長(zhǎng)。經(jīng)常有香客問(wèn)我，道長(zhǎng)，這世上最難降的妖魔是什么？我笑而不...
開(kāi)封第一講書(shū)人閱讀 63,588評(píng)論 1贊 316
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 72,315評(píng)論 6贊 410
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布。她就那樣靜靜地躺著，像睡著了一般。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上，一...
開(kāi)封第一講書(shū)人閱讀 55,699評(píng)論 1贊 327
城市分裂傳說(shuō)
那天，我揣著相機(jī)與錄音，去河邊找鬼。笑死，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播，決...
沈念sama閱讀 43,698評(píng)論 3贊 446
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來(lái)了？” 一聲冷哼從身側(cè)響起，我...
開(kāi)封第一講書(shū)人閱讀 42,882評(píng)論 0贊 289
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒(méi)想到半個(gè)月后，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 49,441評(píng)論 1贊 335
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 41,189評(píng)論 3贊 356
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 43,388評(píng)論 1贊 372
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 38,933評(píng)論 5贊 363
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 44,613評(píng)論 3贊 348
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧，春花似錦、人聲如沸。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 35,023評(píng)論 0贊 28
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)。三九已至，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 36,310評(píng)論 1贊 293
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個(gè)月前我還...
沈念sama閱讀 52,112評(píng)論 3贊 398
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 48,334評(píng)論 2贊 377

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

Apache Flink Table Store 0.2.0 發(fā)布

Apache Flink Table Store 0.2.0 發(fā)布

Flink Table Store 是什么