
1. object ExtractEquiJoinKeys 一個模式匹配,官方注釋是: A pattern that finds joins w...
1. 文章開始之前 先附上一句SQL,使用tpc-ds的表結構,我們圍繞這句SQL講。 SQL: SQL> selectavg(cs_ext_d...
無論是實時處理還是離線處理,都會遇到一個不可避免的問題是,失敗任務如何重做?Storm提供了一個ack機制。首先來看一下ISpout接口的方法。...
本文首發:http://blog.orisonchan.cc/2018/08/16/44 記錄一下Python爬蟲常用庫BeautifulSou...
樹是許多成熟的項目所使用的基本數據結構,也是面試常考、程序員必備的重中之重。 1 底層基礎概念 1.1 平衡樹 所謂平衡樹的平衡,就是樹上某節點...
Spark原本預計在2.3版本實現聚合下推,雖然不知道是何原因最終沒有能夠在2.3版本最終實現,但是因為工作需要,必須要從聚合函數下手優化Spa...
參考文獻: http://www.infoq.com/cn/articles/hdfs-centralized-cache https://bl...
網上有太多此類帖子,然而本帖比他們全面。 背景 有一臺阿里云服務器A,用作測試服務器,一臺華為服務器B,用作生產服務器。均搭建相同配置和版本Ap...
其實本來磁盤掛載這件事情已經做過很多次了,但是從來沒有一個詳細的記錄。借有次機會,做個記錄。 背景 因為做一些自己的項目對服務器的依賴越來越大,...