我試圖對抄襲做一些算法比較。我發現很多TEXT比較剽竊。如何混淆C++變量和函數
但是在算法中它是非常不同的。假設某些算法使用了大量的變量,函數和用戶定義的結構。如果有人從別人那裏複製源代碼,他至少會改變變量和函數名稱。通過簡單的文本比較算法,函數和變量字母之間的這種差異將被視爲「差異」,從而使算法爲抄襲提供「假」。
我想要做的是在C++源代碼中「泛化」(我不知道這是否是正確的詞)所有變量,函數和用戶定義的結構名稱。所以這些變量將被命名爲「a」,「b」,對於函數「... fa(...)」,「... fb(...)」也是如此。 我有PHP中的字符串變量的C++源碼算法進行比較。
我知道應該對許多其他事情進行分析以獲得準確的源代碼比較,但這對我來說就足夠了。
我也想給在換行符一些額外的重要性, 「;」後面的換行符,以及大括號的位置。我知道某些類型的算法很難以某種「不同的方式」製作,例如在一些簡單的初始示例中,「2個值的總和」。 但全文比較也是一個問題。 而且由於它在Web主機上運行,我無法編譯代碼。 – IPValverde 2012-02-10 12:01:06