一、簡介 1、數據獲取 我是直接在這里下載數據[https://www.datafountain.cn/datasets/196],這個網站還有類型的數據,總體還是比較全面的...

IP屬地:廣東
一、簡介 1、數據獲取 我是直接在這里下載數據[https://www.datafountain.cn/datasets/196],這個網站還有類型的數據,總體還是比較全面的...
一、前言 其實爬取頁面的思路都差不多,觀察爬取頁面源碼,獲取頁面內容,根據源碼的格式規(guī)律將自己需要的內容提取出來,提取后美化輸出或者保存!之前寫過了如何爬取淘寶和京東的評論,...
一、前言 寫這個文章將自己在安裝pyinstaller時所踩過的坑和解決方法記錄一下,方便以后查閱! 先說一下自己的問題: 已經使用pip install pyinstall...
一、前言 有了之前爬取淘寶評論的基礎,我想如果換個URL和cookie等參數是不是一套一個準,然后就跑去京東測試了一下,結果失敗了!因為頁面編碼不一樣所以爬取淘寶所用的正則化...
一、前言 淘寶的反爬比較嚴格,且淘寶協議好像不允許爬取它的評論,我查了一下好像也不建議直接用自己的淘寶號去爬取(好像有封號風險),我在測試的時候,可能是太頻繁了淘寶賬號被強制...
主動學習 利用訓練集中已標記的樣本訓練一個模型,利用這個模型隨機的選取一個未標記樣本,通過與外界交互得到該樣本的標記,然后加入已標記數據重新訓練一個模型,不斷的重復上述過程,...
上一章我們提到了維度災難,維度災難會導致距離計算困難和樣本稀疏等問題,緩解維度災難的兩個主要方法,一個就是降維上一章已經介紹過了,這一章主要介紹另一種方法特征選擇。 11.1...
這一章全是理論知識和公式,個人感覺有點難。這一章主要介紹了計算學習理論,即如何判斷一個算法能否得到目標概念類,針對一個算法得到的假設空間分為有限和無限,而有限分為兩種情形為可...