
IP屬地:江蘇
AUC是一種衡量機器學習模型分類性能的重要且非常常用的指標,其只能用于二分類的情況.AUC的本質含義反映的是對于任意一對正負例樣本,模型將正樣本...
涉及一些數據集中存在中文字符, 原始的matplotlib繪圖會出現中文亂碼的問題.試了很多辦法,最后這里找到一個可以完美解決的方案,親測有效:...
一. 為什么要參加競賽? 二. 需要哪些技能? 三. 怎么選擇比賽合適的比賽? 建議去kaggle學習. 里面大牛分享的想法 , 還有開源.c...
pandas 中的merge是一種功能比較強大的用于兩個DataFrame或者Series進行合并的方法. 合并時會將所有的列進行合并,但是指定...
pandas中DataFrame結構的索引分為行索引和列索引,因此在不同的用法下索引指代的操作也是不一樣的.這里記錄一下,后面忘記了再回來看. ...
這是實現將數據正態分布化,然后整體One-Hot化的代碼
OrdinalEncoder / OneHotEncoder /get_dummies 三個方法都能夠將離散的類別特征轉換成由數字代表的類別特征...
?這邊文章主要是記錄自己對于Ridge & Lasson & Elastic Net的理解和總結.內容較為粗淺,偏向應用而沒有太多的數學理論.?...
在機器學習中,模型的欠擬合和過擬合是需要格外注意的問題,同時也是經常發生的問題,其中過擬合最為常見. 欠擬合,即訓練出的算法模型不足以表達數據間...