a標簽 url 正則怎么寫(python 或者js)
問題描述
<a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a>
我要取 href里的鏈接
6個鏈接 前三個符合條件 正則怎么寫(即鏈接中必須帶有參數viewkey page viewtype category)
第二個和第三個鏈接相同 怎么去重復(python下)
問題解答
回答1:# python 2.7import rea = ’’’<a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a>’’’print set(re.findall(’’’(?=.*(?:viewkey))(?=.*(?:page))(?=.*(?:viewtype))(?=.*(?:category))href=['’]([^’']+)’’’, a))回答2:
提取前三個鏈接:
links= re.findall(r’href='http://www.intensediesel.com/wenda/(.*?=rf)'’,l_string,re.S)
去重:
new_links=set(links)
相關文章:
1. javascript - 使用form進行頁面跳轉,但是很慢,如何加一個Loading?2. javascript - ES6規范下 repeat 函數報錯 Invalid count value3. javascript - JS 里面的 delete object.key 到底刪除了什么?4. docker-machine添加一個已有的docker主機問題5. angular.js - 輸入郵箱地址之后, 如何使其自動在末尾添加分號?6. javascript - html5的data屬性怎么指定一個function函數呢?7. mysql - 電商如何存儲營業額數據8. 管理員信息修改時的密碼問題9. html5 - 為什么使使用vue cli 腳手架,post-css 沒有自動對css3屬性自動添加瀏覽器前綴呢?10. javascript - 如何使用nodejs 將.html 文件轉化成canvas
