數據分析入門:被問最多的問題合集!

如今是2017年,我們大圣眾包的小編經過長期和用戶打交道取得不少收獲,了解了想入行或轉行數據分析的熱愛學習朋友們的關心問題,下面一起盤點下問得最多的問題,推薦給大家看看,你有不同的答案看法歡迎留言!

1.學習統計有沒有用?

肯定是有用的。決策需要數據支撐,而統計學是數據分析的方法論。另一很有用的學科是運籌學,主要做優化方面的東西,但是就LZ經驗來看,運用的廣度和企業的接受度不急統計學(LZ公司統計背景vs運籌背景大概是10:1的比例)。

2.學什么軟件好?

SPSS是上手最快的;SAS是最強大的;R是最靈活且最有潛力的;MATLAB運用的企業很少(有幾個特定的行業比如投行之類的很喜歡它)。

如果你是統計背景的學生,那這幾個軟件應該都會,就不多說了。

如果是非非統計背景,且這幾個都沒接觸過,那我建議你用SPSS,這樣可以把精力專注于統計算法的學習上,而非軟件本身的使用。而且就國內的情況而言,用SAS的公司主要集中于銀行與藥廠(如果說錯了歡迎SAS公司的朋友指正),這樣的企業非統計背景也很難擠進去。

3.報學習班有沒有用?

大部分的學習班都是3,4天這樣的,課程大綱大概是LZ上學時候1-2年學的東西。想在3-4天學會1-2年的東西,困難可想而知。所以想通過一個學習班學會統計是不可能的。踏踏實實選本書學是正道。(LZ的公司每年也會舉辦很多次SPSS培訓,雖然象征性地收幾百塊錢,但LZ覺得對學生而言也算一筆負擔了。學生時間比較多,強烈建議自學,不會的問題到這里或者人大經濟論壇問,基本上問的靠譜的問題LZ都會幫助解答的。)(補充:什么叫做靠譜的問題?比如你要蓋一個房子,”房子要怎么蓋啊“就是不個靠譜的問題;”非承重墻的磚頭要用空心的還是實心的“算是個靠譜的問題。)

4.數學背景弱的人能自學統計嗎?

沒問題的,LZ很多同事(包括LZ本人)都是本科商科/工科然后碩士轉統計的。對于不懂微積分、矩陣運算的同學,可能有些算法理解起來有困難,但是LZ覺得基本不礙大事。進行一個分析有四個很重要的環節:算法的使用前提條件(即assumption),算法的運算邏輯是什么樣子的,如何在軟件中操作,如何解讀軟件的輸出結果。除了第二點以外,高中數學背景完全可以滿足。

弄懂一三四就可以勝任大部分企業的分析工作了,很多業內人士都沒弄清楚。(親身經歷,國內某一線市場調研公司的研究員打來電話問算法的時候順便提了下她正在進行的一個產品測試(A/Btest)的問題,LZ告訴她按照她的數據要用配對t檢驗,她驚呼她們過去10年中一直對這種數據在用獨立樣本t檢驗。這就是典型的沒弄清楚算法的使用前提條件。)

5.做數據挖掘需要精通統計算法嗎?

數據挖掘主要的應用是預測(分類目標、連續目標)、聚類(客戶細分)、關聯規則。LZ個人覺得略懂統計就可以了。因為各個模型都有評估指標,建模完了直接看模型的效果就可以,當然熟悉算法的話可以幫你去優化模型(但是就是錦上添花的東西了)。

LZ個人覺得做數據挖掘比做統計分析容易,因為你不需要非常懂算法。

6.做數據挖掘需要懂編程嗎?

看企業和應用。

比如互聯網企業,做自然語言相關的,不懂編程就沒法做。很多電商,做數據挖掘,要跟現有的系統做對接,也需要編程。

以上這兩種企業特別適合計算機背景的同學。

但是也有很多企業(尤其是企業中做客戶關系管理或者營銷的部門),需要數據分析和數據挖掘來支持企業決策,主定期分析數據然后寫報告。這種企業是各位看見編程就頭大的同學最理想的選擇。

原文地址:http://www.dashengzb.cn/articles/a-367.html

(更多大數據與商業智能領域干貨、或電子書,可添加個人微信號(dashenghuaer))

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容