要做數據分析,就要有數據,數據分析的第二步就是根據目標獲取數據。
在數據來源上,一個是公司內部數據,另一個是公司外部數據(競爭對手數據、產業鏈上下游相關數據)。目前,一般情況下,公司的數據分析任務多數是針對自己公司內部數據的分析。在獲取公司內部數據時,通常情況下我們直接從公司的數據庫提取就可以。在獲取外部數據時,常用的有爬蟲、商業交易(花錢買或用其他資源交換,又廢話了)、統計局、相關垂直行業網站等。
在獲取數據后,有時通過簡單觀察或統計分析可以發現某些對決策有價值的東西(或叫做規則),此時可以重新確定需求目標。
數據分析流程的相鄰兩個環節是雙向促進的。
關于如何從數據庫中提取數據,有關書籍和相關文檔講的非常詳細。在這給剛開始接觸/沒有接觸過數據庫(關系型數據庫)的小伙們兒推薦一本書:《SQL必知必會》,作者是Ben Forta,鐘鳴、劉曉霞譯,此書通俗易懂。
下面是對SQL server中SELECT基本查詢語句的總結概括圖:
歡迎各位吐槽!
2018年1月5日下午