0
我是一個python新手。我目前正在進行基本的網絡抓取。在瀏覽幾個GitHub項目時,我發現了一個讓用戶下載srt文件的例子。如何從網站獲取哈希值?
以下是疑問。假設url是這樣的:
http://www.opensubtitles.org/en/subtitles/6528547/silicon-valley-the-lady-bs
如何獲得隨機哈希值6528547
?在附註中,我請求了關於如何開始使用API的提示
使用['urlparse'(https://docs.python.org/2/library/urlparse.html#urlparse.urlsplit)找到了'path'。在該字符串上,執行'.split('/')'。可能不完美,但很不錯。 –
如果你希望能夠在你訪問該頁面之前獲得該散列,你不能預測散列值,因爲它是與特定事物相關的索引ID,在這種情況下是電影。如果你想在你已經知道URL的時候得到哈希,你可以像@BrianCain建議的那樣做。 – aneroid
下面的代碼,該項目used.def get_hash(FILE_PATH): read_size = 64 * 1024 張開(FILE_PATH, 'RB')爲f: 數據= f.read(read_size) f.seek(-read_size ,os.SEEK_END) data + = f.read(read_size) return hashlib.md5(data).hexdigest()
我認爲它是使用一些API來獲取散列值 –