2016-02-27 145 views
0

我是一個python新手。我目前正在進行基本的網絡抓取。在瀏覽幾個GitHub項目時,我發現了一個讓用戶下載srt文件的例子。如何從網站獲取哈希值?

以下是疑問。假設url是這樣的:

http://www.opensubtitles.org/en/subtitles/6528547/silicon-valley-the-lady-bs 

如何獲得隨機哈希值6528547?在附註中,我請求了關於如何開始使用API​​的提示

+0

使用['urlparse'(https://docs.python.org/2/library/urlparse.html#urlparse.urlsplit)找到了'path'。在該字符串上,執行'.split('/')'。可能不完美,但很不錯。 –

+0

如果你希望能夠在你訪問該頁面之前獲得該散列,你不能預測散列值,因爲它是與特定事物相關的索引ID,在這種情況下是電影。如果你想在你已經知道URL的時候得到哈希,你可以像@BrianCain建議的那樣做。 – aneroid

+0

下面的代碼,該項目used.def get_hash(FILE_PATH): read_size = 64 * 1024 張開(FILE_PATH, 'RB')爲f: 數據= f.read(read_size) f.seek(-read_size ,os.SEEK_END) data + = f.read(read_size) return hashlib.md5(data).hexdigest()
我認爲它是使用一些API來獲取散列值 –

回答

0

假設你有url並且只想獲得「hash」,獲得hash的最簡單方法是使用'/ '作爲參數,然後返回列表的第5個元素。

url = "" #suppose you have the url here 
hash = url.split('/')[5] 

Screenshot