国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁技術文章
文章詳情頁

a標簽 url 正則怎么寫(python 或者js)

瀏覽:149日期:2022-07-17 17:06:50

問題描述

<a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a>

我要取 href里的鏈接

6個鏈接 前三個符合條件 正則怎么寫(即鏈接中必須帶有參數viewkey page viewtype category)

第二個和第三個鏈接相同 怎么去重復(python下)

問題解答

回答1:

# python 2.7import rea = ’’’<a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a>’’’print set(re.findall(’’’(?=.*(?:viewkey))(?=.*(?:page))(?=.*(?:viewtype))(?=.*(?:category))href=['’]([^’']+)’’’, a))回答2:

提取前三個鏈接:

links= re.findall(r’href='http://www.intensediesel.com/wenda/(.*?=rf)'’,l_string,re.S)

去重:

new_links=set(links)

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 深圳市| 府谷县| 清新县| 榆林市| 瑞丽市| 普格县| 年辖:市辖区| 正阳县| 晋江市| 平谷区| SHOW| 尚志市| 开化县| 阆中市| 石棉县| 财经| 班戈县| 剑川县| 上林县| 南郑县| 法库县| 珲春市| 天峻县| 新晃| 临洮县| 五台县| 桐城市| 长治市| 湖北省| 来安县| 淅川县| 怀安县| 昌图县| 平阳县| 林州市| 赫章县| 旺苍县| 临漳县| 盖州市| 新乡市| 东丽区|