火山日常啰嗦學習了一些大數據的相關框架后,發現應用層的東西確實不難,真正難的都是底層原理,所以我查看了很多資料,借鑒了前人的方法再加上自己的理解,寫下了這篇文章。 數據傾斜的...

火山日常啰嗦學習了一些大數據的相關框架后,發現應用層的東西確實不難,真正難的都是底層原理,所以我查看了很多資料,借鑒了前人的方法再加上自己的理解,寫下了這篇文章。 數據傾斜的...
1、特征工程是什么 有這么一句話在業界廣泛流傳:數據和特征決定了機器學習的上限,而模型和算法只是逼近這個上限而已。那特征工程到底是什么呢?顧名思義,其本質是一項工程活動,目的...
hive 中使用grouping SETS時遇見對坑 :hive報錯 Grouping sets aggregations (with rollups or cubes) a...
數據倉庫簡介 一:什么是數據倉庫 數據倉庫,英文名稱為Data Warehouse,可簡寫為DW或DWH。數據倉庫,是為企業所有級別的決策制定過程,提供所有類型數據支持的戰略...
1.在informatic 使用過程中我們有時候需要一個動態的變量去作為一個判斷的條件。在使用過程中自己使用的經歷如下 1.1首先我們需要要創建一個變量: 在這里不得不提醒一...
1. 明天我就要結婚了,新郎是高大帥氣又多金的宏。因為父母的關系,我們從小便認識,青梅竹馬 兩小無猜。 然,我們并沒有愛的轟轟烈烈,有的不過是心心相惜罷了。 我一直以為,自己...