国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁技術文章
文章詳情頁

java如何爬取js處理后的代碼

瀏覽:138日期:2023-12-07 11:18:37

問題描述

頁面地址: http://acm.hdu.edu.cn/showpro...

爬取的目標:java如何爬取js處理后的代碼

想要爬取這些個公式的代碼,Chrome按F12看到的代碼:java如何爬取js處理后的代碼

但是爬取到的代碼如下:

java如何爬取js處理后的代碼

這個代碼并不能顯示正確的公式,貌似這些代碼都是js生成的,該如何爬取到這些代碼。

問題解答

回答1:

這是MathJax工具解析的。在HTML代碼中查看公式p的下一個id為MathJax-Element-X的script,復制里面的內容,在公式前后加兩個$$(前后都是兩個美元符,所以一共是四個)最后使用MathJax解析就可以了。說再多不如上圖:java如何爬取js處理后的代碼

java如何爬取js處理后的代碼

java如何爬取js處理后的代碼

回答2:

先抓包,把ajax請求抓出來,關鍵是看怎么構造該請求,主要是一些參數的確定。套路大概下面幾個:1 在上下文搜搜相關參數是否存在,如果是服務器返回的,就直接請求服務器獲得該參數;2 如果該參數很明顯不變或者變化有規律,可以直接偽造;3 如果參數很復雜且沒規律,那么需要搜索參數的key,找到加密的js,然后構造參數的值,得到ajax url;4 實在難度太大那么用selenium等自動化工具驅動瀏覽器來訪問,它會直接給你渲染好所有js

標簽: java
相關文章:
主站蜘蛛池模板: 北京市| 扎赉特旗| 宁都县| 大名县| 翼城县| 寿阳县| 沈丘县| 德清县| 蓝山县| 射阳县| 广宗县| 汶上县| 顺平县| 平山县| 禹城市| 大宁县| 贡嘎县| 连城县| 丁青县| 潍坊市| 额敏县| 潮安县| 容城县| 阆中市| 教育| 军事| 同心县| 南昌市| 交口县| 斗六市| 沁阳市| 肥东县| 宜丰县| 水富县| 平陆县| 河南省| 灵山县| 平顺县| 遵义市| 扎鲁特旗| 安乡县|