文章詳情頁(yè)
網(wǎng)頁(yè)爬蟲 - Python爬蟲返回狀態(tài)碼與實(shí)際情況不符?
瀏覽:198日期:2022-09-03 18:57:11
問(wèn)題描述
import urllib2opener = urllib2.build_opener()html = Noneresponse = Noneresponse = opener.open(’http://www.sxxrcs.com/was5/web/’)html = response.codeprint html
比如這個(gè)爬蟲,輸出狀態(tài)碼是200。
可是直接訪問(wèn)http://www.sxxrcs.com/was5/web/是404,抓包響應(yīng)的也是404,請(qǐng)問(wèn)這是為什么?
問(wèn)題解答
回答1:用requests吧
import requestsr = requests.get(’http://www.sxxrcs.com/was5/web/’)print r.status_codeprint r.text回答2:
200正常啊,requests方便快捷。
相關(guān)文章:
1. mysql - AttributeError: ’module’ object has no attribute ’MatchType’2. php自學(xué)從哪里開始?3. javascript - 百度echarts series數(shù)據(jù)更新問(wèn)題4. MySQL客戶端吃掉了SQL注解?5. 求大神幫我看看是哪里寫錯(cuò)了 感謝細(xì)心解答6. javascript - JS設(shè)置Video視頻對(duì)象的currentTime時(shí)出現(xiàn)了問(wèn)題,IE,Edge,火狐,都可以設(shè)置,反而chrom卻...7. javascript - 圖片能在網(wǎng)站顯示,但控制臺(tái)仍舊報(bào)錯(cuò)403 (Forbidden)8. python小白的基礎(chǔ)問(wèn)題 關(guān)于while循環(huán)的嵌套9. phpstady在win10上運(yùn)行10. python - Django分頁(yè)和查詢參數(shù)的問(wèn)題
排行榜

熱門標(biāo)簽