国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁(yè)技術(shù)文章
文章詳情頁(yè)

python selenium 獲取接口數(shù)據(jù)的實(shí)現(xiàn)

瀏覽:132日期:2022-07-02 18:52:32

python selenium 獲取接口數(shù)據(jù)。

selenium沒(méi)有直接提供查詢的函數(shù),但是可以通過(guò)webdriver提供的API查詢,使用的函數(shù)是Network.getResponseBody

webdriver提供的API文檔:https://chromedevtools.github.io/devtools-protocol/tot/Network/

Network.getResponseBody文檔說(shuō)明:

python selenium 獲取接口數(shù)據(jù)的實(shí)現(xiàn)

Network.getResponseBody的參數(shù)是requestid,requestid是webdriver每個(gè)請(qǐng)求自動(dòng)生成的惟一ID,拿到requestid就能拿到請(qǐng)求返回的內(nèi)容。

如何獲取requestid?創(chuàng)建webdriver對(duì)象時(shí)配置信息設(shè)置獲取performance,即可獲取每個(gè)請(qǐng)求的日志信息,然后通過(guò)對(duì)日志信息的檢索找到對(duì)應(yīng)的requestid。

獲取日志信息的webdriver創(chuàng)建代碼(注意,必須傳入配置信息才能獲取日志信息):

from selenium import webdriverfrom selenium.webdriver.common.desired_capabilities import DesiredCapabilitiesimport time caps = { ’browserName’: ’chrome’, ’loggingPrefs’: { ’browser’: ’ALL’, ’driver’: ’ALL’, ’performance’: ’ALL’, }, ’goog:chromeOptions’: { ’perfLoggingPrefs’: { ’enableNetwork’: True, }, ’w3c’: False, },}driver = webdriver.Chrome(desired_capabilities=caps) driver.get(’https://partner.oceanengine.com/union/media/login/’)# 必須等待一定的時(shí)間,不然會(huì)報(bào)錯(cuò)提示獲取不到日志信息,因?yàn)樾踹兜人姓?qǐng)求結(jié)束才能獲取日志信息time.sleep(3) request_log = driver.get_log(’performance’)

打印request_log是一個(gè)數(shù)組,然后遍歷request_log檢索需要獲取的url對(duì)應(yīng)的requestid,比如需要獲取https://s3.pstatp.com/bytecom/resource/union_web2/media/manifest.json對(duì)應(yīng)的requestid,并且獲取接口內(nèi)容:

for i in range(len(request_log)): message = json.loads(request_log[i][’message’]) message = message[’message’][’params’] # .get() 方式獲取是了避免字段不存在時(shí)報(bào)錯(cuò) request = message.get(’request’) if(request is None): continue url = request.get(’url’) if(url == 'https://s3.pstatp.com/bytecom/resource/union_web2/media/manifest.json'): # 得到requestId print(message[’requestId’]) # 通過(guò)requestId獲取接口內(nèi)容 content = driver.execute_cdp_cmd(’Network.getResponseBody’, {’requestId’: message[’requestId’]}) print(content) break

完整代碼:

import jsonfrom selenium import webdriverfrom selenium.webdriver.common.desired_capabilities import DesiredCapabilitiesimport time caps = { ’browserName’: ’chrome’, ’loggingPrefs’: { ’browser’: ’ALL’, ’driver’: ’ALL’, ’performance’: ’ALL’, }, ’goog:chromeOptions’: { ’perfLoggingPrefs’: { ’enableNetwork’: True, }, ’w3c’: False, },}driver = webdriver.Chrome(desired_capabilities=caps) driver.get(’https://partner.oceanengine.com/union/media/login/’)# 必須等待一定的時(shí)間,不然會(huì)報(bào)錯(cuò)提示獲取不到日志信息,因?yàn)樾踹兜人姓?qǐng)求結(jié)束才能獲取日志信息time.sleep(3) request_log = driver.get_log(’performance’)print(request_log) for i in range(len(request_log)): message = json.loads(request_log[i][’message’]) message = message[’message’][’params’] # .get() 方式獲取是了避免字段不存在時(shí)報(bào)錯(cuò) request = message.get(’request’) if(request is None): continue url = request.get(’url’) if(url == 'https://s3.pstatp.com/bytecom/resource/union_web2/media/manifest.json'): # 得到requestId print(message[’requestId’]) # 通過(guò)requestId獲取接口內(nèi)容 content = driver.execute_cdp_cmd(’Network.getResponseBody’, {’requestId’: message[’requestId’]}) print(content) break

到此這篇關(guān)于python selenium 獲取接口數(shù)據(jù)的實(shí)現(xiàn)的文章就介紹到這了,更多相關(guān)python selenium 獲取接口數(shù)據(jù)內(nèi)容請(qǐng)搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!

標(biāo)簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 双辽市| 临泽县| 楚雄市| 邵阳市| 吐鲁番市| 牟定县| 丰城市| 合肥市| 佛学| 永城市| 太原市| 高要市| 察哈| 依安县| 和林格尔县| 田林县| 兴城市| 宜丰县| 昌吉市| 青海省| 大荔县| 满城县| 民和| 汝南县| 泗阳县| 扎囊县| 龙井市| 当涂县| 安义县| 新昌县| 康乐县| 怀宁县| 枣强县| 光山县| 红原县| 内乡县| 平凉市| 来安县| 六枝特区| 京山县| 长阳|