0
A
回答
2
第一個幼稚的猜測是獲取內容並創建一個哈希。但是,如果內容有任何動態行爲,這不是一個好的指標。
require 'open-uri'
require 'digest/md5'
f1 = open("http://rubyonrails.org/?id=1")
c1 = f1.read
d1 = Digest::MD5.hexdigest(c1)
f2 = open("http://rubyonrails.org/");
c2 = f2.read
d2 = Digest::MD5.hexdigest(c2)
d1 == d2 # true
如果我們重複使用同樣的事情說:www.google.com和google.com哈希將不匹配,因爲有可能是內容的細微變化。
對於字符串,您可以使用Jaro Winkler度量值,該度量值爲0和1之間的值,表示兩個字符串的相似程度。 紅寶石中還有一個純粹的implementation算法。本地實現速度更快。我過去使用過amatch庫。
require 'open-uri'
require 'fuzzystringmatch'
f1 = open("http://www.google.com/")
c1 = f1.read
f2 = open("http://google.com/")
c2 = f2.read
delta = 0.1
jarow = FuzzyStringMatch::JaroWinkler.create(:pure)
distance = jarow.getDistance(c1, c2) # 0.85 .. that is the text looks to be 85% similar
相關問題
- 1. 是否可以使網頁網址與iFrame網址相同?
- 2. 檢查兩個字符串是否相同的VB網。
- 3. 如何檢查兩個地址是否相同?
- 4. 如何檢查兩個端點地址是否相同?
- 5. 查找所有與窗口網址相同的網頁網址
- 6. 如何確定兩個網頁是否相同?
- 7. 不同網址上的相同網頁
- 8. 兩個網站,相同的網址,相同的Cookie
- 9. 檢查兩個查詢是否相同
- 10. 如何檢查網頁是否滾動?
- 11. 如何檢測URL是否導航到相同的網頁
- 12. 兩個網址是否相同?忽略param順序
- 13. 檢查兩個URL是否是相同的頁面
- 14. 兩個結構相同的網址
- 15. Android的網頁瀏覽器,檢查網址是否是一個文件
- 16. Swift:檢查兩個NSDates是否相同
- 17. 檢查兩個json是否相同
- 18. 檢查兩個ID是否相同
- 19. 檢查兩個jar類是否相同
- 20. 檢查兩個Dask是否相同
- 21. 找出兩個網址是否導航到同一頁面
- 22. 如何檢查網站地圖是否包含一些網址
- 23. 具有相同網址的兩頁。如何抓取?
- 24. 檢查網頁名稱的網址
- 25. 如何檢查網址或網頁是否存在於ajax或jquery
- 26. 這兩個MDX查詢是否會返回相同的結果?
- 27. 如何檢查一個網址是否有效
- 28. 如何檢查兩個字典是否包含相同的值?
- 29. 如何檢查兩個PictureBox是否具有相同的圖像?
- 30. 如何檢查列表中的兩個數字是否相同