
@簡書交友 哈哈,dog是越來越胖。
勁爆!簡書交友2018年上半年精華合集——好看的皮囊在我這里,有趣的靈魂也在我這里這是一個憂傷的故事。 現在是2018年7月1號,下午4點38分,離下午5點20分還有42分鐘。 18年前的一個下午5點20分,小賢我正拉著一個三歲多小姑娘的手,告訴她,如果人...
喜歡動漫,喜歡電影,喜歡旅游 那個妹子 能了解下么 =。=
勁爆!簡書交友2018年上半年精華合集——好看的皮囊在我這里,有趣的靈魂也在我這里這是一個憂傷的故事。 現在是2018年7月1號,下午4點38分,離下午5點20分還有42分鐘。 18年前的一個下午5點20分,小賢我正拉著一個三歲多小姑娘的手,告訴她,如果人...
orc和parquet數據存儲格式很相似,都是列式存儲,footer存數據相關信息和索引等。有一點不同:parquet對復雜數據結構采用了Google的Dremel的嵌套存儲格式。
impala在parquet文件格式上執行count(*)操作parquet是一個支持列式存儲的文件格式,對于大數據量,多維來說,如果只查詢某些具體維來說,有很好的效率。具體體現在自身列式存儲,同一列的數據順序存放,在取某一列數據時,不...
最近一直沉迷于折騰各種錯誤注入,總想著把我們的系統給搞掛,有一天,突發奇想,是不是能通過 SystemTap 來搗亂,因為 SystemTap 能 probe 相關的函數,那...
綜述 GBDT(Gradient Boosting Decision Tree) 又叫 MART(Multiple Additive Regression Tree),是一種...
Paxos算法在分布式領域具有非常重要的地位。但是Paxos算法有兩個比較明顯的缺點:1.難以理解 2.工程實現更難。 網上有很多講解Paxos算法的文章,但是質量參差不齊。...
introduction Vectorized query execution is a Hive feature that greatly reduces the CPU ...
前言 在 TiDB 里面,為了支持分布式事務,我們通過 PD,這個全局的單點服務,為事務分配全局唯一的時間,這個做法就是簡單高效,但獲取 timestamp 的時候會有網絡開...
本文1、2、3節介紹了Spark 內存相關之識,第4節描述了常見錯誤類型及產生原因并給出了解決方案。 1 堆內和堆外內存規劃 Executor 的內存管理建立在 JVM 的內...
前言 雖然提供了很多Estimator/Transformer, 正如這篇文章所顯示的,如何基于SDL+TensorFlow/SK-Learn開發NLP程序,處理的代碼依然是...
和impala結構很像
牟宇航:百度OLAP數據庫——Palo專家視野 | 牟宇航:百度OLAP數據庫——Palo https://mp.weixin.qq.com/s/q8_kdDPdCPwIjI2BCETPZw 3月28日,在工業和...
背景 項目中應用服務直接通過jdbc連接impala做數據查詢,其他遇到一個問題,查詢impala時因為沒有設置查詢超時,有些大sql一直占用連接,同時這個sql在impal...