我是從負責運輸公司的財務轉行成為運輸的數據分析的。轉行大概準備了半年多,不知道能不能算迅速。 首先是數據處理能力,例如京東系統中發車數據、裝貨數據、客戶下單數據,可以用海量形...

IP屬地:上海
我是從負責運輸公司的財務轉行成為運輸的數據分析的。轉行大概準備了半年多,不知道能不能算迅速。 首先是數據處理能力,例如京東系統中發車數據、裝貨數據、客戶下單數據,可以用海量形...
一、概念 人工神經網絡是是一種應用類似于大腦神經突觸聯接的結構進行信息處理的數學模型。這種模型可以適用于分類與回歸。 神經網絡的優點:可以把非線性做的特別好,擬合能力特別強,...
特征處理包括:數據清洗和特征預處理。 一、數據清洗: 1.數據樣本抽樣 ①樣本要具備代表性 ②樣本比例要平衡以及樣本不平衡時如何處理 ③考慮全量數據 2.異常值處理 2.1...
一、概念 LDA:Linear Discriminant Analysis 線性判別式分析 (NOT:在文本分析領域,還有個LDA的概念,全稱為隱含狄利克雷分布(Latent...
特征選擇就是剔除與標注不相關或者冗余的特征,它是數據歸約的思路之一(另一個思路為抽樣) 特征選擇主要包括三種思想:過濾思想、包裹思想和嵌入思想。 編程實現: 第一步,導入必要...
相關分析最常用的方法就是用相關系數直接衡量連續值的相關性,而離散屬性的相關性是用熵增益轉換成相關性的形式來衡量。 一、分析連續值的相關性: Pearson相關系數及Spear...
分析思路: 1.導入必要的包(pandas,numpy,scipy.stats,matplotlib.pyplot,seaborn) 2.讀取文件,為df 3.按 depar...