国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁技術文章
文章詳情頁

Python爬取YY評級分數(shù)并保存數(shù)據(jù)實現(xiàn)過程解析

瀏覽:5日期:2022-07-23 16:44:35

前言

當需要進行大規(guī)模查詢時(比如目前遇到的情形:查詢某個省所有發(fā)債企業(yè)的YY評級分數(shù)),人工查詢顯然太過費時,那就寫個爬蟲吧。

由于該爬蟲實在過于簡單,就只簡單概述下。

一、請求端

通過觀察YY評級的網(wǎng)頁信息,如下圖(F12或右擊進入檢查,點擊network—>XHR—>headers)。

紅色框表明是個get請求(其實這種網(wǎng)頁基本都是Ajax get,需要總結實際url的規(guī)律的)。

綠色框即為實際URL,通過分析該URL,其由兩部分組成。前半部分為“https://web.ratingdog.cn/v1/search?”,后半部分為黃色框內內容用“&”符號連接后的結果。黃色框內的內容,只有企業(yè)名稱為變量,且為已知變量,那URL即可據(jù)此確定了。

Python爬取YY評級分數(shù)并保存數(shù)據(jù)實現(xiàn)過程解析

另外需注意,YY評級需要登錄才可查詢數(shù)據(jù),在構建頭部信息進行訪問時,一定要提前登錄,并在頭部信息中放入登錄信息和登錄狀態(tài)。

二、響應端

通過觀察網(wǎng)頁的響應信息(F12或右擊進入檢查,點擊network—>XHR—>response),如下圖。響應信息及其簡單,我們所需要的YY評級分數(shù)安詳?shù)靥稍谀抢?,簡單到一個正則表達式就可以提取出該數(shù)據(jù)。正則如下:

'msg'.*?'IssuerName':'(.*?)','YYRating':'(.*?)/10','IntrinsicRating'.*?'

Python爬取YY評級分數(shù)并保存數(shù)據(jù)實現(xiàn)過程解析

三、代碼

所需數(shù)據(jù)較少,代碼相對簡單,就不建立函數(shù)了,直接一路到底吧。如下:

Python爬取YY評級分數(shù)并保存數(shù)據(jù)實現(xiàn)過程解析

運行代碼后,得到結果如下。安徽省的100多條數(shù)據(jù),就到了本地了

Python爬取YY評級分數(shù)并保存數(shù)據(jù)實現(xiàn)過程解析

Python爬取YY評級分數(shù)并保存數(shù)據(jù)實現(xiàn)過程解析

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持好吧啦網(wǎng)。

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 中方县| 射阳县| 司法| 宁乡县| 昭苏县| 育儿| 苏尼特左旗| 嵊州市| 措美县| 柳江县| 平顺县| 海盐县| 峨眉山市| 大庆市| 甘孜| 永川市| 正蓝旗| 富宁县| 景洪市| 大埔区| 于田县| 察雅县| 汉寿县| 白朗县| 铜川市| 岳阳县| 封开县| 边坝县| 安阳县| 台南市| 陵水| 花莲市| 荥经县| 诏安县| 栖霞市| 黄龙县| 专栏| 广南县| 泰来县| 安图县| 饶河县|