selenium-python如何捕獲網(wǎng)絡(luò)流量的響應(yīng)
您可以訪問瀏覽器或chromedriver日志,它們在網(wǎng)絡(luò)響應(yīng)方面略有不同。稱為瀏覽器日志,稱為performance驅(qū)動程序日志driver。它們返回一個類似json的對象,您可以解析該對象以使用其中的Network方法提取事件:
{’level’: ’INFO’, ’message’: ’{'message':{'method':'Page.frameStoppedLoading','params':{'frameId':'FB10764A3ABF7FFC83110C39C5F7BF77'}},'webview':'C2D13BD13CF743B6D0695B35E9CC935C'}’, ’timestamp’: 1538607113832}, {’level’: ’INFO’, ’message’: ’{'message':{'method':'Page.frameDetached','params':{'frameId':'FB10764A3ABF7FFC83110C39C5F7BF77'}},'webview':'C2D13BD13CF743B6D0695B35E9CC935C'}’, ’timestamp’: 1538607113838}, {’level’: ’INFO’, ’message’: ’{'message':{'method':'Network.requestwillBeSent','params':{'documentURL':'https://stackoverflow.com/questions/52633697/selenium-python-how-to-capture-network-traffics-response','frameId':'C2D13BD13CF743B6D0695B35E9CC935C','hasUserGesture':false,'initiator':{'type':'other'},'loaderId':'5331BFDC4F466FCED920CFC9F033D2EC','request':{'headers':{'Upgrade-Insecure-Requests':'1','User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36'},'initialPriority':'VeryHigh','method':'GET','mixedContentType':'none','referrerPolicy':'no-referrer-when-downgrade','url':'https://stackoverflow.com/questions/52633697/selenium-python-how-to-capture-network-traffics-response'},'requestId':'5331BFDC4F466FCED920CFC9F033D2EC','timestamp':104499.729,'type':'Document','wallTime':1538607113.838206}},'webview':'C2D13BD13CF743B6D0695B35E9CC935C'}’, ’timestamp’: 1538607113839},...}
您需要啟用登錄DesiredCapabilities,然后使用JSON模塊進行解析:
import jsonfrom selenium import webdriverfrom selenium.webdriver.common.desired_capabilities import DesiredCapabilitiescaps = DesiredCapabilities.CHROMEcaps[’loggingPrefs’] = {’performance’: ’ALL’}driver = webdriver.Chrome(desired_capabilities=caps)driver.get(’https://stackoverflow.com/questions/52633697/selenium-python-how-to-capture-network-traffics-response’)def process_browser_log_entry(entry): response = json.loads(entry[’message’])[’message’] return responsebrowser_log = driver.get_log(’performance’) events = [process_browser_log_entry(entry) for entry in browser_log]events = [event for event in events if ’Network.response’ in event[’method’]]
我不知道是否可以使用此方法訪問響應(yīng)數(shù)據(jù)本身,但是可以獲取響應(yīng)的URL。
解決方法我正在使用pythonDjango創(chuàng)建一個Web應(yīng)用程序。我正在使用selenium來啟動無頭瀏覽器(phantomjs)并單擊幾次,直到到達特定頁面。我希望捕獲網(wǎng)絡(luò)流量并獲得特定網(wǎng)絡(luò)呼叫的響應(yīng)。該網(wǎng)絡(luò)調(diào)用實際上包含一個html文檔作為其響應(yīng)。
有什么辦法可以做到這一點?
相關(guān)文章:
1. python GUI庫圖形界面開發(fā)之PyQt5動態(tài)(可拖動控件大小)布局控件QSplitter詳細使用方法與實例2. CSS3實例分享之多重背景的實現(xiàn)(Multiple backgrounds)3. CSS清除浮動方法匯總4. 不要在HTML中濫用div5. 父div高度不能自適應(yīng)子div高度的解決方案6. js開發(fā)中的頁面、屏幕、瀏覽器的位置原理(高度寬度)說明講解(附圖)7. XML 非法字符(轉(zhuǎn)義字符)8. Python數(shù)據(jù)分析JupyterNotebook3魔法命令詳解及示例9. ASP動態(tài)include文件10. vue跳轉(zhuǎn)頁面常用的幾種方法匯總
