在使用過多種爬蟲軟件后,終于找到一個簡單易用且免費的數據采集器。對于編程基礎不是很強的數據分析人員來說,爬一爬采集器簡直像是量身定做。在使用過程中有幾點感受必須大贊特贊。
免費 / 操作簡單 / 跨平臺 / 高效率
下面簡單給大家介紹下使用方法,讓更多人用最簡單的方式采集到所需的數據。
1.首先去爬一爬官網(http://www.pa1pa.com)下載爬一爬采集器的谷歌瀏覽器插件。
2.點擊瀏覽器工具欄右側按鈕->更多工具->擴展程序?;蛟诘刂窓谥休斎耄?b>chrome://extensions/ ?
3. 把下載好的插件拖入瀏覽器中“擴展程序”的頁面,點擊“添加擴展程序”,這樣插件就安裝完成了?!芭馈睒酥境霈F在右側插件欄。
4. 確保賬號已登錄,打開要采集的網站,點擊瀏覽器插件欄的“爬”圖標,啟動插件。
5. 依次點擊選取所要抓取的元素。如果色彩框沒有包含所有的任務數據,點擊所選元素右側的“轉換”按鈕,切換算法,直到選中所有的任務數據。
6. 如果要抓取多個頁面,點擊分頁設置的箭頭,選中頁碼所在的區域。
7. 確認色彩框選中全部數據后,先點擊“完成”按鈕,再點擊“測試”按鈕,測試數據采集是否成功。(注:測試模式下最多抓取5頁數據)
8. 確認測試成功后,點擊”OK”關閉測試窗口。填寫任務名稱(長度為4-32的字符,必填),并根據個人需要修改列名。
9. 點擊“提交”按鈕,任務創建成功。您可在網站的“任務”頁面下運行并管理該任務。
10. 在任務運行的同時,您可點擊該任務的"管理"頁面查看任務運行的狀態及日志。
11. 任務運行結束后,點擊"任務”頁面的數據選項即可查看并下載數據。
? ? 教程就簡單給大家分享一下,操作很簡單,又是免費的,功能也很強大。希望這次分享能給一些需要采集數據工作者或者需要數據支持的企業有所幫助!