三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

240 發簡信
IP屬地:北京
  • row_number() 分組去重優化

    筆者最近在做一些任務的優化,大多的場景是因為采用row_number()進行分組去重,所以耗時特別高。樣例代碼如下: 原因 要做這個操作,不得不做的就是shuffle,而且因...

  • 120
    設計模式之Adapter,Proxy,Decorator,Proxy

    再次溫故一下設計模式,這次將比較容易混淆的幾個放在一起比較一下,這4個都是結構型的。

  • 程序員看毛選之用戶分群

    毛選中的大多數文章都是很簡短的,中心明確,沒有廢話。以這篇為例:怎樣分析農村階級(一九三三年十月)[https://www.marxists.org/chinese/maoz...

  • 120
    設計模式之Strategy vs Template Method

    筆者之前對策略模式和模板方法的理解有些模糊,正好有空查查資料搞清楚兩者之間的區別。一句話來說就是: 策略模式:把具體實現都留給子類或者實現類。重子類 模板方法:父類定好算法框...

  • Rust中的repr(C)

    Rust編譯器不會保證類型的布局,但是提供了一個屬性用來對類型添加布局要求,如下所示: #[repr(C)]提供了兼容C/C++編譯器的類型布局,當你在使用FFI的時候會很有...

  • SQL按天輸出累計UV

    筆者今天遇到一個數據需求,計算從2024年1月1日到今天為止每一天的累計UV,即每一天都是一個從2024年1月1日累計到那一天的UV。 暴力法 一種從結果結果的辦法就是制作一...

  • 防御性SQL

    SQL中增加防御性 接到產品一個的臨時跑數需求,如下: 近30天的uva表中條件c1b表中條件c2c表中條件c3 以上業務雖然很簡單,但是對于上述的3個表我個人其實不是很熟悉...

  • 好的開發者應該擁有強大的抽象能力

    筆者在這篇文章[http://www.lxweimin.com/p/3fc9b458bdab]中提到了如何使用SQL來完成時間段的一個合并,在完成該任務的同時不禁感嘆為啥提供...

  • SQL中時間段合并

    問題:現有一堆的時間段,s表示開始時間,e表示結束時間。需要將所有時間段合并。合并規則: 如果2個時間段有重疊則合并成一個時間。 不重疊則作為一個單獨的時間段。

  • SQL中的集合優化

    今天寫SQL的時候有個邏輯是要取2個時間窗口有交集的數據,過濾條件如下:2個時間窗大小 [start_time1, end_time1] 和 [start_time2, en...

  • 利用數據湖特性加速數據校驗

    數據湖自身會提供一些元數據的信息,我們可以利用這些信息進行快速粗略的數據校驗 分區數據數校驗 以Iceberg為例,catalog.db.tb2.partitions可以得到...

  • Rust和大數據

    筆者從事大數據行業,最近對Rust語言比較感興趣,特地關注了一下Rust在大數據生態中的建設情況,以下是一些由Rust編寫的大數據框架,感興趣的同學可以關注相關項目: Apa...

  • 數倉開發的一些業務素養

    近期組內產品分享了關于指標的一些內容,其中最令我印象深刻的就是指標體系的構建,雖說在日常的業務開發中很多概念,比如活躍,留存,激活等都是明白的,但是這些離散的東西很難構成一個...

  • 關于軟件架構設計的幾點想法

    今天在看《Computer Networks:A Systems Approach》,讀到這段的時候有些感觸,基本涵蓋了整個軟件架構(開發)的整個過程。 To start u...

  • 120
    HDFS寫詳解 block、packet與chunk

    block、packet與chunk 在DFSClient寫HDFS的過程中,有三個需要搞清楚的單位:block、packet與chunk; block是最大的一個單位,它是...

  • 留存概念

    這幾天做一個有留存指標的需求,發現對留存的理解有點想當然了。留存是當天有A行為,在第二天有B行為的用戶群體。一般來講A和B是相同的,但是有些時候需求方的留存是有特殊場景的,并...

  • Rust中的Rc

    特點 單線程的引用計數 不可變引用 非線程安全,線程安全請使用Arc 循環引用問題 僅僅使用Rc會遇到循環引用的問題,導致指針沒法被釋放掉,此時可以通過Weak來打破這種引用...

  • 120
    討論什么時候應該做gc調優及意義

    一、背景 線上環境下,jvm經常發生full gc;運維監控方面,服務健康檢測不健康;用戶體驗方面,經常出現大量的慢接口調用。經觀察,這三者是伴隨發生的。起初,我們從慢接口入...

  • SparkSQL應用的一個排錯和重構

    故事背景 數據處理邏輯:將一個json的數組從map結構里面扣出來然后將json數組里面的每一個元素和map結構里面的其他元素重新組成一個新的map,存入一個新表實現方式:采...

  • SparkSQL處理復雜json的例子

    問題 使用SparkSQL將上述的數據根據嵌套提取成3列 解答 主要采用Spark 3.1.0新增的json_object_keys函數拿到key值,然后依次提取,最后輸出如...

主站蜘蛛池模板: 炎陵县| 永嘉县| 乐山市| 丰顺县| 麻栗坡县| 柏乡县| 惠州市| 南华县| 德令哈市| 西峡县| 新密市| 淮阳县| 梅河口市| 恭城| 原平市| 双江| 永福县| 莒南县| 策勒县| 增城市| 彩票| 大冶市| 星座| 萨迦县| 尚义县| 涟源市| 澜沧| 平和县| 宝丰县| 巨鹿县| 灵璧县| 全州县| 揭东县| 上蔡县| 宁海县| 普定县| 卢龙县| 清水县| 汽车| 林州市| 九台市|