摘要:登錄知乎后通過獲取模擬登錄登錄知乎
#encoding=utf8 import requests,time #登錄知乎后通過document.cookie獲取cookie cookie = "_zap=78503ecc-9420-482c-a747-5761a7c9de8c; _za=de220e47-6e79-4c2d-80c6-74a86eb567ce; _ga=GA1.2.932820854.1429357203; udid="xxxxxxxxxxx";" Default_Header = {"X-Requested-With": "XMLHttpRequest", "Referer": "http://www.zhihu.com", "User-Agent": "Mozilla/5.0 (X11; Ubuntu; Linux x86_64; " "rv:39.0) Gecko/20100101 Firefox/39.0", "Host": "www.zhihu.com", "Cookie":cookie} _session = requests.session() _session.headers.update(Default_Header) header = {"X-Requested-With": "XMLHttpRequest", "Referer": "http://www.zhihu.com", "User-Agent": "Mozilla/5.0 (X11; Ubuntu; Linux x86_64; " "rv:39.0) Gecko/20100101 Firefox/39.0", "Host": "www.zhihu.com"} url = "https://www.zhihu.com/noti7/stack/default?limit=10&r=1473558020498" cookies={} for line in cookie.split(";"): name,value=line.strip().split("=",1) cookies[name]=value #r = requests.get(url, headers=Default_Header) r = requests.get(url, headers=header,cookies=cookies) #r = _session.get(url) #print(r.content) #print(cookies) print(r.json()) #模擬登錄 def login(): """登錄知乎""" username = "xxx" password = "xxx" cap_content = _session.get("https://www.zhihu.com/captcha.gif?r="+str(int(time.time())*1000)+"&type=login").content cap_file = open("cap.gif","wb") cap_file.write(cap_content) cap_file.close() captcha = input("capture:") data = {"email":username,"password":password,"captcha":captcha} r = _session.post("https://www.zhihu.com/login/email", data) print ((r.json())["msg"])
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/38175.html
摘要:下面我們傳入多個參數構建一個來感受一下在這里我們通過四個參數構造了一個,即請求,在中指定了和,傳遞的參數用了和方法來轉成字節流,另外指定了請求方式為。運行結果如下通過觀察結果可以發現,我們成功設置了,以及。用于處理重定向。 上一篇文章:Python3網絡爬蟲實戰---19、代理基本原理下一篇文章:Python3網絡爬蟲實戰---21、使用Urllib:處理異常 學習爬蟲,最初的操作便...
摘要:比如我們以知乎為例,直接利用來維持登錄狀態。測試后,發現同樣可以正常登錄知乎。上一篇文章網絡爬蟲實戰基本使用下一篇文章網絡爬蟲實戰正則表達式 上一篇文章:Python3網絡爬蟲實戰---24、requests:基本使用下一篇文章:Python3網絡爬蟲實戰---26、正則表達式 在前面一節我們了解了 Requests 的基本用法,如基本的 GET、POST 請求以及 Response...
摘要:爬蟲和反爬蟲就是一個貓和老鼠的游戲,道高一尺魔高一丈,兩者反復糾纏。由于協議的無狀態性,登錄驗證都是通過傳遞來實現的。通過瀏覽器登錄一次,登錄信息的是就會被瀏覽器保存下來。模塊就是這樣一個從瀏覽器提取保存的的工具。 showImg(https://segmentfault.com/img/bVbsjnC?w=741&h=488); 很多用Python的人可能都寫過網絡爬蟲,自動化獲取網...
摘要:前言利用實現抓取微博評論數據,廢話不多說。讓我們愉快地開始吧開發工具版本相關模塊模塊模塊模塊模塊模塊以及一些自帶的模塊。環境搭建安裝并添加到環境變量,安裝需要的相關模塊即可。 ...
摘要:所以只要得到登錄后的并必要時進行更新,服務器就會認定其為登錄狀態。看看人家知乎,加密到連名字都沒有了,還混淆,如何下手綜上,適用于沒有加密的登錄或者加密算法比較簡單并且不常更新的網站。遇上無解的加密算法要么手操拷貝,要么請大佬出場。 某些網站,登錄和沒登錄,用戶的權限是不一樣的,帳號登錄之后才能獲取更多的信息。更有甚者一上來就是登錄界面,不登錄就不給你進去(如p站)。爬取目標不用登錄固...
閱讀 2373·2021-11-18 10:07
閱讀 2330·2021-09-22 15:59
閱讀 3088·2021-08-23 09:42
閱讀 2287·2019-08-30 15:44
閱讀 1201·2019-08-29 15:06
閱讀 2324·2019-08-29 13:27
閱讀 1224·2019-08-29 13:21
閱讀 1423·2019-08-29 13:13