比方說,你想比較學生的散文,看看其中的一篇散文是否被抄襲。你會如何以一種天真的方式去解決這個問題(即不是太複雜的方法)?當然,比較文章中使用的詞語和使用壓縮功能這些複雜的方法有很多簡單的方法,但是在沒有太多複雜性/理論的情況下,還有其他一些方法可以檢查抄襲嗎?天真的方法來檢測剽竊?
0
A
回答
1
你可以看看Dick Grune的similarity comparator,它聲稱也使用自然語言文本(我只在軟件上試過)。算法也被描述。 (順便說一下,他的分析的書真的很好,在我看來)。
2
有幾篇論文給出幾種方法,我建議你閱讀this 本文顯示了基於內置在整個索引結構 算法文件集合。
所以他們說他們的算法可以用來在大型軟件系統中找到類似的代碼片段。在索引建立之前, 集合中的所有文件都被標記。這是一個簡單的解析問題,並且可以在線性時間內解決 。對於集合中的每個N文件,文件F_i的標記器 的輸出是一串n_i標記。
here是其他紙,你可以閱讀
其他好的算法is a scam based algorithm,它由上通過使上一組測試文檔 和登記文件之間是常用詞的比較來檢測抄襲。我們的抄襲檢測系統,像許多信息檢索系統一樣,通過精確度和召回率來評估。
相關問題
- 1. 剽竊檢測機器下的算法
- 2. CSS剽竊檢查
- 3. 剽竊探測器問題
- 4. difflib可以用來製作剽竊檢測程序嗎?
- 5. 如何開發剽竊探測器?
- 6. 剽竊檢測與搜索API的數百萬文本項目
- 7. 使用谷歌搜索引擎API創建剽竊檢測器
- 8. Wopyfind for python - 剽竊軟件?
- 9. 簡單的遞歸剽竊探測器陣列
- 10. 在WordPress中剽竊htaccess文件
- 11. 今天應該使用errno/perror方法來檢測錯誤嗎?
- 12. 剽竊分析儀(對網頁內容進行比較)
- 13. 你會如何編寫一個反剽竊網站?
- 14. 如何檢測哪個UILabel被竊聽?
- 15. MSTest測試方法來檢查集合
- 16. 檢測()方法
- 17. NER天真算法
- 18. 最有效的方法來創建一個天真的文本總結算法
- 19. Python:有沒有方法來檢測方法調用中的missing()?
- 20. 最快的方法來檢查C#中的文件真實性
- 21. Freeswitch以編程方式檢測傳真
- 22. MATLAB:優雅的方法來檢查'if'語句是不是真
- 23. 最好的方法來檢查是否今天是本月的第一天
- 24. 檢測類方法
- 25. 最好的方法來檢測iphone方向
- 26. 有沒有一種標準的方法來檢測方向性?
- 27. 測試後的方法春天
- 28. 如何更改email2sms腳本搜索限定符警告:blatant剽竊
- 29. 檢測電腦的方法
- 30. 方法的檢測線
這是一件很糟糕的事情,可能比根本沒有做得更糟。當我上大學的時候,我曾經在紙上被賦予一個F,並被指控在這些天真的抄襲檢測器的基礎上進行抄襲 - 我被指控抄襲的這篇文章引用了我的論文*,並加以歸屬!抄襲檢測器只包含匹配部分,並將背景(包括引文)從其他論文中刪除!只是不要這樣做。 –
只要您不讓探測器做出任何最終決定,只要找到類似的文檔供用戶查看,它應該仍然有幫助。 – fgb
我同意。這更多的是理論上的東西而不是實際的應用。我不打算建立一個基於這個哈哈剽竊探測器 – user1921187