如何從網站獲取哈希值？

我是一個python新手。我目前正在進行基本的網絡抓取。在瀏覽幾個GitHub項目時，我發現了一個讓用戶下載srt文件的例子。如何從網站獲取哈希值？

以下是疑問。假設url是這樣的：

http://www.opensubtitles.org/en/subtitles/6528547/silicon-valley-the-lady-bs

如何獲得隨機哈希值6528547？在附註中，我請求了關於如何開始使用API的提示

來源

2016-02-27 Rohan Mishra

使用['urlparse'（https://docs.python.org/2/library/urlparse.html#urlparse.urlsplit）找到了'path'。在該字符串上，執行'.split（'/'）'。可能不完美，但很不錯。 –

如果你希望能夠在你訪問該頁面之前獲得該散列，你不能預測散列值，因爲它是與特定事物相關的索引ID，在這種情況下是電影。如果你想在你已經知道URL的時候得到哈希，你可以像@BrianCain建議的那樣做。 – aneroid

下面的代碼，該項目used.def get_hash（FILE_PATH）： read_size = 64 * 1024 張開（FILE_PATH， 'RB'）爲f：數據= f.read（read_size） f.seek（-read_size ，os.SEEK_END） data + = f.read（read_size） return hashlib.md5（data）.hexdigest（）
我認爲它是使用一些API來獲取散列值 –

假設你有url並且只想獲得「hash」，獲得hash的最簡單方法是使用'/ '作爲參數，然後返回列表的第5個元素。

url = "" #suppose you have the url here 
hash = url.split('/')[5]

Screenshot

來源

2016-02-27 19:10:22 Shuvojit

如何從網站獲取哈希值？

回答

相關問題