国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁技術文章
文章詳情頁

python - 如何爬取跳轉網站的數據

瀏覽:106日期:2022-06-30 14:37:44

問題描述

目前在學習一些爬蟲的知識,對于一些復雜的網站使用selenium進行爬取。碰到一個問題,我需要爬取的工單網站(不知道密碼)需要先通過登錄一個鑒權系統,然后鑒權系統頁面點擊其中的工單系統連接,就會自動免登錄跳轉到工單系統網站,這種系統的數據我該如何使用爬蟲進行抓?。恳韵率氰b權系統selenium拿到關于工單系統的html

<a href='http://www.intensediesel.com/link-test001' target='_blank' rel='link-test001' data='1' datasrc='工單系統|||/files/link/test001.gif|||new|||/link-test001'> <img src='http://www.intensediesel.com/files/link/test001.gif' alt='工單系統' align='absmiddle'><span>工單系統</span></a>

問題解答

回答1:

用firefox的擴展selenium ide錄制一遍操作。然后導出為python文件。改改運行就可以了。

建議你去讀讀蟲師寫的書。

回答2:

例如使用requests庫作為爬蟲的話,先創建session(),A登錄,B是跳轉的頁面即可。

T=requests.session()A=T.post(url=url,data=data)B=T.get(url=url)

創建的T就代表存儲的cookie,會一直保留

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 岳普湖县| 专栏| 门头沟区| 汉寿县| 永川市| 武穴市| 泸西县| 镶黄旗| 辰溪县| 江北区| 松原市| 桃源县| 泊头市| 抚宁县| 东丰县| 张家港市| 耒阳市| 抚远县| 太和县| 扶余县| 江永县| 百色市| 天长市| 浪卡子县| 新野县| 河源市| 云浮市| 商河县| 阜城县| 从江县| 泽普县| 来安县| 阳原县| 榆社县| 博乐市| 红河县| 南皮县| 义马市| 新和县| 灵川县| 湄潭县|