顶弄裸睡的丹丹第二部分,挪威的森林电影,国产精品无码dvd在线观看

永遠保持一顆求知的心，不要被已知所束縛。

第二篇就不想寫了，這樣不行的。

A任務(wù)：爬取stackoverflow的問題和詳細內(nèi)容數(shù)據(jù)并保存csv文件

用Firefox分析網(wǎng)頁元素：

圖一主目錄網(wǎng)頁元素分析

可以看到我們要爬取的所有鏈接可以由這個目錄進，查詢到目的網(wǎng)頁的鏈接地址：

圖二主目錄下目的網(wǎng)頁鏈接元素分析

進入目的子網(wǎng)頁并分析元素：

圖三目的子網(wǎng)頁元素分析

網(wǎng)頁分析完成以后編寫一簡單爬蟲進行試驗：

import scrapy

class StackOverflowSpider(scrapy.Spider):

????? name = "Stackoverflow"

????? start_urls=["https://stackoverflow.com/questions?sort=votes"]

????? def parse(self,response):

????? ????? for href in response.css('.question-summary h3 a::attr(href)'):

????? ????? ????? full_url = response.urljoin(href.extract())

????? ????? ????? yield scrapy.Request(full_url,callback=self.parse_question)

????? def parse_question(self,response):

????? ????? yield {

????? ????? ????? 'title':response.css('.inner-content h1 a::text').extract()[0],

????? ????? ????? 'votes':response.css(".vote .vote-count-post::text").extract()[0],

????? ????? ????? 'body':response.css(".post-text").extract()[0],

????? ????? ????? 'tags':response.css('.post-taglist .post-tag::text').extract(),

????? ????? ????? 'link':response.url,

????? ????? ????? }

執(zhí)行爬蟲并保存為csv文件：

> scrapy runspider scrapy1.py? -o abc.csv

就可以在文件夾下發(fā)現(xiàn)已經(jīng)存有數(shù)據(jù)的abc.csv，需要重點學(xué)習(xí)css選擇器的使用規(guī)則。

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

scrapy學(xué)習(xí)筆記（二）

scrapy學(xué)習(xí)筆記（二）

推薦閱讀更多精彩內(nèi)容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

scrapy學(xué)習(xí)筆記（二）

推薦閱讀更多精彩內(nèi)容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频