教程一:Python爬蟲(chóng)學(xué)習(xí)系列教程
這個(gè)博主的這個(gè)爬蟲(chóng)學(xué)習(xí)系列教程,很詳細(xì)啊,從入門(mén)到實(shí)戰(zhàn)、進(jìn)階等都有詳細(xì)的文檔介紹,對(duì)爬蟲(chóng)感興趣的小伙伴推薦一看。
教程二:學(xué)習(xí)網(wǎng)站上的爬蟲(chóng)教程
實(shí)驗(yàn)樓的爬蟲(chóng)教程不是太多,但是都有詳細(xì)的講解和代碼,而且有在線(xiàn)開(kāi)發(fā)環(huán)境,對(duì)于學(xué)習(xí)者是非常不錯(cuò)的。其中最喜歡的就是那個(gè)
,因?yàn)槲易约撼矚g看電影。還有一個(gè)
也挺好的 ,算是福利吧,哈哈。
教程三:GitHub - facert/awesome-spider: 爬蟲(chóng)集合
這是一個(gè)收集各種爬蟲(chóng) (默認(rèn)爬蟲(chóng)語(yǔ)言為 python)的集合,其中還有蠻多爬蟲(chóng)蠻有趣的,而且每個(gè)爬蟲(chóng)都有詳細(xì)的開(kāi)源代碼以及一些說(shuō)明講解,如果想寫(xiě)個(gè)爬蟲(chóng)的話(huà),倒是可以參照寫(xiě)寫(xiě)。
教程四:Python爬蟲(chóng)入門(mén)教程
這個(gè)入門(mén)教程主要是簡(jiǎn)單的介紹如何使用Python的相關(guān)模塊如urllib2來(lái)實(shí)現(xiàn)網(wǎng)絡(luò)爬蟲(chóng),和剛才介紹的第一個(gè)爬蟲(chóng)教程有點(diǎn)類(lèi)似,不過(guò)沒(méi)有第一個(gè)那么系統(tǒng)完善,但是新手也是可以看看的。
上面是教程,這里介紹一些爬蟲(chóng)軟件,不想自己寫(xiě)爬蟲(chóng)的,可以用,較為方便。
1.Java開(kāi)源Web爬蟲(chóng)分類(lèi)列表
列表主要是一些開(kāi)源的WEB爬蟲(chóng),感興趣的可以看看。
2.33款可用來(lái)抓數(shù)據(jù)的開(kāi)源爬蟲(chóng)軟件工具
這篇文章對(duì)較為知名及常見(jiàn)的開(kāi)源爬蟲(chóng)軟件進(jìn)行梳理,按開(kāi)發(fā)語(yǔ)言進(jìn)行匯總。有需求的可以看看。
關(guān)于這方面,你也可以看看知乎上的這篇文章:GitHub 上有哪些優(yōu)秀的 Java 爬蟲(chóng)項(xiàng)目?
-
說(shuō)到這里,也可以看看知乎上關(guān)于爬蟲(chóng)的話(huà)題:
爬蟲(chóng)(計(jì)算機(jī)網(wǎng)絡(luò)) - 索引 - 知乎,可以學(xué)到很多的。
爬蟲(chóng)可以做很多有用的事情,方便快捷,同時(shí)也可以做很多有趣的事情,分享幾個(gè)有趣好玩的爬蟲(chóng)教程:
有趣的爬蟲(chóng)一:怎樣借助Python爬蟲(chóng)給寶寶起個(gè)好名字
最近看到的一篇文章,深深覺(jué)得有個(gè)程序員爸爸是多門(mén)的方便啊,連取名字都可以這么自動(dòng)化……
有趣的爬蟲(chóng)二:我用爬蟲(chóng)一天時(shí)間“偷了”知乎一百萬(wàn)用戶(hù),只為證明PHP是世界上最好的語(yǔ)言
這是比較久以前的一篇文章了,也算是比較有趣吧,當(dāng)時(shí)看到后就兩個(gè)字“佩服”,學(xué)PHP的小伙伴可以看看哈。
- 說(shuō)到有趣,推薦看看知乎上的這個(gè)問(wèn)題:利用爬蟲(chóng)技術(shù)能做到哪些很酷很有趣很有用的事情?,發(fā)現(xiàn)廣大知友果然超厲害的啊,很有趣。
其他:
Python爬蟲(chóng):一些常用的爬蟲(chóng)技巧總結(jié)
前面介紹的主要是詳細(xì)的爬蟲(chóng)教程,這篇文章呢,主要是總結(jié)一些常用的爬蟲(chóng)技巧的代碼,如果經(jīng)常涉及到寫(xiě)爬蟲(chóng)腳本,都可以直接拿去復(fù)用的,很方便。
當(dāng)然,有爬蟲(chóng),肯定就有反爬蟲(chóng)啦:
超輕量級(jí)反爬蟲(chóng)方案
文章列出的是一種簡(jiǎn)單的反爬蟲(chóng)方案,可以當(dāng)做概念示例或者是救急方案,如果需要進(jìn)一步深化,還需要在其他方面加強(qiáng)才行。
轉(zhuǎn)載自知乎:林梓