文章詳情頁

Python爬取YY評級分數(shù)并保存數(shù)據(jù)實現(xiàn)過程解析

瀏覽：5日期：2022-07-23 16:44:35

前言

當需要進行大規(guī)模查詢時（比如目前遇到的情形：查詢某個省所有發(fā)債企業(yè)的YY評級分數(shù)），人工查詢顯然太過費時，那就寫個爬蟲吧。

由于該爬蟲實在過于簡單，就只簡單概述下。

一、請求端

通過觀察YY評級的網(wǎng)頁信息，如下圖（F12或右擊進入檢查，點擊network—>XHR—>headers）。

紅色框表明是個get請求（其實這種網(wǎng)頁基本都是Ajax get，需要總結實際url的規(guī)律的）。

綠色框即為實際URL，通過分析該URL，其由兩部分組成。前半部分為“https://web.ratingdog.cn/v1/search?”，后半部分為黃色框內內容用“&”符號連接后的結果。黃色框內的內容，只有企業(yè)名稱為變量，且為已知變量，那URL即可據(jù)此確定了。

Python爬取YY評級分數(shù)并保存數(shù)據(jù)實現(xiàn)過程解析

另外需注意，YY評級需要登錄才可查詢數(shù)據(jù)，在構建頭部信息進行訪問時，一定要提前登錄，并在頭部信息中放入登錄信息和登錄狀態(tài)。

二、響應端

通過觀察網(wǎng)頁的響應信息（F12或右擊進入檢查，點擊network—>XHR—>response），如下圖。響應信息及其簡單，我們所需要的YY評級分數(shù)安詳?shù)靥稍谀抢?，簡單到一個正則表達式就可以提取出該數(shù)據(jù)。正則如下：

'msg'.*?'IssuerName':'(.*?)','YYRating':'(.*?)/10','IntrinsicRating'.*?'

Python爬取YY評級分數(shù)并保存數(shù)據(jù)實現(xiàn)過程解析

三、代碼

所需數(shù)據(jù)較少，代碼相對簡單，就不建立函數(shù)了，直接一路到底吧。如下：

Python爬取YY評級分數(shù)并保存數(shù)據(jù)實現(xiàn)過程解析

運行代碼后，得到結果如下。安徽省的100多條數(shù)據(jù)，就到了本地了

Python爬取YY評級分數(shù)并保存數(shù)據(jù)實現(xiàn)過程解析

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支持好吧啦網(wǎng)。

Python 編程

上一條：Python如何在main中調用函數(shù)內的函數(shù)方式下一條：基于Python繪制個人足跡地圖

相關文章：

1. ASP使用MySQL數(shù)據(jù)庫的方法2. ASP中解決“對象關閉時,不允許操作?！钡脑幃悊栴}……3. 解決ASP中http狀態(tài)跳轉返回錯誤頁的問題4. xml中的空格之完全解說5. WMLScript的語法基礎6. msxml3.dll 錯誤 800c0019 系統(tǒng)錯誤:-2146697191解決方法7. XML入門的常見問題(四)8. ASP中if語句、select 、while循環(huán)的使用方法9. html小技巧之td,div標簽里內容不換行10. ASP動態(tài)網(wǎng)頁制作技術經(jīng)驗分享

排行榜

					
					Java 生成帶Logo和文字的二維碼
SSM框架整合之Spring+SpringMVC+MyBatis實踐步驟
詳解Java執(zhí)行groovy腳本的兩種方式
Python word文本自動化操作實現(xiàn)方法解析
ant design vue datepicker日期選擇器中文化操作
詳解如何實現(xiàn)phpoffice的excel導入功能解耦
vue異步更新dom的實現(xiàn)淺析
前后端ajax和json數(shù)據(jù)交換方式
Android 使用騰訊X5瀏覽器上傳圖片的示例
Windows Phone 支持 Android 應用程序？來看看第三方開發(fā)者怎么說
詳解PHP實現(xiàn)HTTP服務器過程