京東表示很無奈,爬蟲都用它練手
登錄時,瀏覽器發(fā)送了一個POST請求,在請求頭上帶了基本參數(shù),并不是所有參數(shù)在模擬時都需要,一般需要cookie,Referer,和User-Agent
會話對象requests.Session能夠跨請求地保持某些參數(shù),比如cookies,即在同一個Session實例發(fā)出的所有請求都保持同一個cookies,而requests模塊每次會自動處理cookies,這樣就很方便地處理登錄時的cookies問題。
如果header中包含用戶cookie的話,不需用戶名密碼即可登錄,可繞過驗證碼問題
源碼返回json響應值,‘success’。copy的時候發(fā)現(xiàn)這里result返回值為整個頁面str代碼,并不是json響應,所以及其暴力地用find(‘我的訂單’)判斷
京東的登錄,在第一次其認為有安全風險問題時,才會出現(xiàn)驗證碼,這里之后的登錄均沒有用到驗證碼。
原文:http://blog.csdn.net/weixin_38206454/article/details/78655209