我想創建一個能夠確定一些文字是通過讀取兩個文件的文本,並比較他們兩個文件之間進行復制的應用程序。我想知道是否有人曾試圖做到這一點,以及處理這種情況的最佳方式是什麼。如果涉及機器學習和自然語言處理:到什麼程度?創建一個文件比較軟件
2
A
回答
0
我相信Copyscape使用4克幫助確定唯一性。
這些字符串被稱爲N-Grams。
然而,another SO answer鏈接到language independent algo comparing bi-grams角色的基礎上。它已經在Java中實現,這將有助於節省時間。
+0
謝謝。我正在檢查它 – Goodman
1
相關問題
- 1. 文檔比較軟件
- 2. 文本文件比較軟件
- 3. 軟件來比較zip文件
- 4. 比較兩個文件,並創建一個列表
- 5. 比較我創建的python文件
- 6. 比較文件創建日期
- 7. 軟件比較標準
- 8. 我想爲我們的軟件創建一個.deb軟件包
- 9. AWK比較一個文件與另一個文件
- 10. 我需要什麼軟件來創建一個Flash文件
- 11. 創建一個比較多個服務器中的多個文件的腳本
- 12. 文件比較
- 13. 文件比較
- 14. 文件比較
- 15. c#比較2個文件 - 創建和更新函數
- 16. 通過比較兩個文件創建列表
- 17. 如何比較兩個文件的創建日期?
- 18. 一次用Vista比較多個文件?
- 19. 比較2個文件一行
- 20. 比較2個文件一行
- 21. XMLDocument與另一個文件比較
- 22. 比較列在同一個文件
- 23. 比較一個文件名模式
- 24. 兩個文件夾的文件比較
- 25. Excel - 比較兩個文件?
- 26. 比較兩個文件
- 27. 比較2個文件夾
- 28. 比較兩個文件
- 29. 比較兩個文件
你有沒有試過'md5_file()'? – Karo
很多人都試過這個。 turnitin.com只是一個例子。 – emory
希望通過這兩個文件 – Goodman