国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁技術文章
文章詳情頁

python如何獲得一個url地址對應的跳轉后的最終網址

瀏覽:108日期:2022-06-30 14:37:33

問題描述

在python中,如何獲取短鏈對應最終網址,現在有很多淘寶短鏈,我需要獲取短鏈跳到的最終網址,這個有什么好辦法嗎?有的是302 有的是直接在網頁用js進行跳轉,,這些如何獲取

問題解答

回答1:

用selenium+phantonjs...

http://stackoverflow.com/ques...

#!/usr/bin/python2.7from twisted.internet import reactorfrom twisted.internet.defer import Deferred, DeferredList, DeferredLockfrom twisted.internet.defer import inlineCallbacksfrom twisted.web.client import Agent, HTTPConnectionPoolfrom twisted.web.http_headers import Headersfrom pprint import pprintfrom collections import defaultdictfrom urlparse import urlparsefrom random import randrangeimport fileinputpool = HTTPConnectionPool(reactor)pool.maxPersistentPerHost = 16agent = Agent(reactor, pool)locks = defaultdict(DeferredLock)locations = {}def getLock(url, simultaneous = 1): return locks[urlparse(url).netloc, randrange(simultaneous)]@inlineCallbacksdef getMapping(url): # Limit ourselves to 4 simultaneous connections per host # Tweak this as desired, but make sure that it no larger than # pool.maxPersistentPerHost lock = getLock(url,4) yield lock.acquire() try:resp = yield agent.request(’HEAD’, url)locations[url] = resp.headers.getRawHeaders(’location’,[None])[0] except Exception as e:locations[url] = str(e) finally: lock.release()

而且可以試試pip包

https://pypi.python.org/pypi/...

from urlunshort import resolveresolve('http://bit.ly/qlKaI') 結果 ’http://bitbucket.org/runeh/urlunshort/’

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 民乐县| 南陵县| 芒康县| 西乌珠穆沁旗| 梁河县| 沈丘县| 崇礼县| 景宁| 南昌市| 尉犁县| 孟村| 华安县| 永吉县| 镇沅| 娱乐| 涿鹿县| 云阳县| 金沙县| 东丰县| 浪卡子县| 博湖县| 杨浦区| 峨山| 石阡县| 邻水| 朝阳市| 方山县| 阳江市| 芒康县| 花莲县| 龙井市| 南丹县| 黔江区| 炉霍县| 高唐县| 赣州市| 紫云| 灵川县| 武冈市| 定远县| 伽师县|