查漏補缺

generator(生成器)

  1. 什么是生成器:

    • 把一個列表推倒式l = [x for x in range(10)]改成l = (x for x in range(10))就變成了一個生成器。
    • 一個函數中只要有yield那么也是一個生成器。
  2. 可迭代對象:

    • 一類是集合數據類型,如list、tuple、dict、set、str等;(字典遍歷,打印出鍵)
    • 一類是generator,包括生成器和帶yieldgenerator function

生成器和迭代器的區別:
可以理解為可以被next()函數調用并不斷返回下一個值的對象稱為迭代器,生成器一定是一個迭代器;生成器只是一個保存的一個算法。

beautifulsoup4常用方法

語法:soup = BeautifulSoup(html,"lxml")

  1. find_all:返回所有元素的列表,bs4語法

    • soup.find_all("a")
    • soup.find_all(["a","b"])
    • soup.find_all(id="abc")
    • soup.find_all("input", attrs={"name":"_xsrf"})
    • soup.find_all('div', class__='t')
  2. select:返回所有元素的列表,完全是CSS語法

    • soup.select("div")
    • soup.select(".nav")
    • soup.select("#nav")
    • soup.select("p #nav")
    • soup.select(".abc, .def")
    • soup.select("div[class='nav']")
    • soup.select("a[href='http://www.baidu.com']")
  3. 獲取內容用get_text(),獲取屬性值get("value ")

創建多線程的方式

  1. threading模塊

    import threading
        
    
    def func():
        print "hello world"
    l = []  
    for i in range(5):
        thread = threading.Thread(target=func, args=[])
        thread.start()
        l.append(thread)
    for thread in l:
        thread.join()
    
  2. multiprocessing.dumpy模塊

    from multiprocessing.dumpy import Pool
    
    def func(a):
        print a
    pool = Pool(5)
    pool.map(func, [1,2,3,4,5]) -----> 它的結果是一個列表
    pool.close()
    pool.join()
    
  3. gevent版本

    import gevent
    from gevent import monkey
    mankey.patch_all()
    # 使用列表推導式將每個協程放到列表內
    job_list = [gevent.spawn(func, args) for i in range(5)]
    gevent.joinall(job_list)
    
  4. tesseract庫的使用

    安裝好以后,在終端輸入:

    $ tesseract XXX.jpg text # 就會在該路徑下生成一個text.txt文件
    
  5. subprocess的用法

    這個模塊可以實現在代碼中輸入執行終端的命令。

    import subprocess
    subprocess.call(["ls","l"])  # 逗號就相當于終端中輸入空格
    
  6. 通過meta傳參數

    def parse(self, response):
        yield scrapy.Request(url, callback=self.func, meta={"haha":item})
    
    def parse_item(self, response)
        # 取出傳遞過來的meta
        item = response.meta['haha']
    
  7. 字典的get()方法

    In [1]: dict = {'name':'johnny','age':'27'}
    In [2]: print(dict.get('name'))
    johnny
    In [3]: dict.get('sex')
    In [4]: print(dict.get('sex'))
    None
    
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 229,117評論 6 537
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,860評論 3 423
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 177,128評論 0 381
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,291評論 1 315
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,025評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,421評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,477評論 3 444
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,642評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,177評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,970評論 3 356
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,157評論 1 371
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,717評論 5 362
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,410評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,821評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,053評論 1 289
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,896評論 3 395
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,157評論 2 375

推薦閱讀更多精彩內容

  • 數據類型(也是對象來的) 整數(0xffe3)、浮點數(1.23e5==1.23*10的5次方)、字符串、True...
    Gunter1993閱讀 277評論 0 0
  • 前言:C語言是Java、Objective-C、C++等高級語言的基礎、也是跨平臺開發的基礎,指針是C語言的重中之...
    androidjp閱讀 1,684評論 8 39
  • 參考文獻:《Java瘋狂講義》(第三版) run()方法:方法體即線程執行體 線程Target 執行體:run或c...
    houc閱讀 215評論 0 0
  • 要說冬天雪景哪兒最美 很多人肯定首選大東北 的確,東北雪景名不虛傳 但今天小編要給大家說的這個地兒 比大東北可神奇...
    酷活動閱讀 402評論 0 0
  • 對于一位母親來說,為了孩子所做的一切是無悔的。 當一個嶄新的生命來到她的懷抱,除了感激還是感激,小時候母親心甘...
    了了無諍閱讀 154評論 0 1