国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁技術(shù)文章
文章詳情頁

python - 要抓取的網(wǎng)頁內(nèi)容在括號里,正則怎么寫?

瀏覽:99日期:2022-09-02 08:56:00

問題描述

<dt> <span class='gray6 '>名稱:</span> <a target='_blank'>安現(xiàn)</a> ( <a href='http://www.intensediesel.com/ho-a021551/' target='_blank'> 中間 </a><a href='http://www.intensediesel.com/ho-a011551-b03497/' target='_blank'> 草原牧場 #這是我要抓取的內(nèi)容我把它放到組(.*?)里面。 </a> ) [ <a href='http://www.intensediesel.com/wenda/acchor'>圖文</a> ] </dt>

我就是想抓取第9行那里的中文內(nèi)容,放到一個組里面。本來應(yīng)該很簡單,但是試了好多次就是抓不到,報錯是沒有內(nèi)容。估計和第5行,和11行的括號有關(guān)。請問怎么寫正則才能抓得到?我原來這樣寫

d = re.search(r’<a id='agatdesf_B02_10'.*?>s*(.*?)s*</a>’, s).group(1)

抓不到,誰幫我看下錯在哪里?

問題解答

回答1:

python3

html=’’’ <dt> <span class='gray6 '>名稱:</span> <a target='_blank'>安現(xiàn)</a> ( <a href='http://www.intensediesel.com/ho-a021551/' target='_blank'> 中間 </a><a href='http://www.intensediesel.com/ho-a011551-b03497/' target='_blank'> 草原牧場 #這是我要抓取的內(nèi)容我把它放到組(.*?)里面。 </a> ) [ <a href='http://www.intensediesel.com/wenda/acchor'>圖文</a> ] </dt>’’’import rep=re.compile(r’<as+?[^>]*?id='agatdesf_B02_10'[^>]*>([^<]*)</a>’)print(p.findall(html)[0].strip())##草原牧場 #這是我要抓取的內(nèi)容我把它放到組(.*?)里面。回答2:

推薦一本書 精通正則表達式 看看就都會了!

標簽: Python 編程
主站蜘蛛池模板: 广宗县| 呼伦贝尔市| 乌鲁木齐县| 潼南县| 新晃| 天全县| 太仓市| 阜南县| 台南县| 独山县| 彭山县| 孟津县| 太仓市| 乐平市| 手游| 东安县| 平定县| 米泉市| 永安市| 云林县| 万荣县| 南城县| 云龙县| 伊通| 乌鲁木齐县| 东丰县| 山阴县| 双峰县| 广昌县| 永年县| 科尔| 吉林市| 开江县| 龙泉市| 德令哈市| 资阳市| 宾阳县| 海淀区| 专栏| 静海县| 宣恩县|