三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

<sub id="gugoy"></sub>

<cite id="gugoy"></cite>

登錄注冊寫文章

由Java爬蟲所想到的

由Java爬蟲所想到的

爬蟲，聽起來似乎很高端，然而也就那么回事，有很多爬蟲框架，Java實現的有crawler4j，WebCollector，webMagic，Python實現的最著名的應該是Scrapy，工作中用到，但是沒用什么爬蟲框架，整個工作基于HttpClient和Jsoup。

流程
1. HttpClient去模擬get和post請求；
2. 獲取返回的數據，
  - 如果是json或者XML，直接解析；
  - 如果是html，使用Jsoup去分析；
技能要求
1. 熟悉HTML，JavaScript，jQuery
2. 熟悉HttpClient，Jsoup
使用工具
1. FireFox（FireBug）/ chrome : 用于觀察HTML文檔結構
2. WireShark：抓數據包（不是十分常用，在爬取不成功的時用于對比瀏覽器數據和模擬數據）
3. 一些插件，如 RESTClient（不常用）
額外的一些記錄
1. HttpClient與jsonp

最近在爬取某市圖書館，發現其中有一個jsonp的請求，期初以為是一個普通的get請求，但是url感覺很奇怪，就搜了下，發現是jQuery的jsonp請求


#host地址已改

api.baidu.com/book/isbn/978-7-5442-4725-2/?glc=P2HBJ0315013&returnType=json&callback=insertAllBookMetaInfo&jsoncallback=jQuery1620053801810543760764_1464099784203&_=1464099796349

也了解了下jsonp，具體請參看：

1. [跨域JSONP原理及調用具體示例](http://blog.csdn.net/yuebinghaoyuan/article/details/32706277)

2. jsonp原理：[說說JSON和JSONP，也許你會豁然開朗，含jQuery用例](http://www.cnblogs.com/dowinning/archive/2012/04/19/json-jsonp-jquery.html)

最后編輯于：2017.12.03 05:52:15

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明：文章內容（如有圖片或視頻亦包括在內）由作者上傳并發布，文章內容僅代表作者本人觀點，簡書系信息發布平臺，僅提供信息存儲服務。

推薦閱讀更多精彩內容

揭秘Java網絡爬蟲程序原理
隨著互聯網+時代的來臨，越來越多的互聯網企業層出不窮，涉及游戲、視頻、新聞、社交、電商、房產、旅游等眾多行業。如今...
JackChen1024閱讀 10,753評論 2贊 49
Ajax的運用
AJAX 原生js操作ajax 1.創建XMLHttpRequest對象 var xhr = new XMLHtt...
碧玉含香閱讀 3,265評論 0贊 7
Spring Cloud
Spring Cloud為開發人員提供了快速構建分布式系統中一些常見模式的工具（例如配置管理，服務發現，斷路器，智...
卡卡羅2017閱讀 134,915評論 18贊 139
從此，你可以躺在沙發上玩大型 PC 游戲了 -- Remotr #Android #iOS
雖然很多人覺得在手機上玩擦屏幕的虛擬按鍵游戲非常不爽，但是俗話說蘿卜青菜各有所愛，除了喜歡玩在手機上玩游戲而不喜歡...
最美應用閱讀 1,555評論 0贊 2
每逢佳節倍思親
2017.10.初當初選擇的遠嫁，雖說沒什么后悔的；可隨著年齡的增長，越發的思念家中的老父母，越...
含紫煙閱讀 399評論 0贊 0

1贊2贊

贊賞

手機看全文

主站蜘蛛池模板：德化县| 大田县| 绩溪县| 定边县| 宜昌市| 鄂伦春自治旗| 和龙市| 定日县| 岫岩| 吉安县| 新营市| 台南县| 西吉县| 介休市| 克东县| 枣强县| 彰武县| 高雄市| 玉门市| 双桥区| 西林县| 贺州市| 昆山市| 海淀区| 兰考县| 和龙市| 吐鲁番市| 宁城县| 聂拉木县| 北碚区| 望都县| 贞丰县| 新余市| 三江| 乡城县| 涡阳县| 和顺县| 娄底市| 突泉县| 平江县| 昔阳县|

<p id="s8ugx"><li id="s8ugx"></li></p>