我正在尋找一種自動化方法來檢測代碼是否作爲開發的一部分複製和粘貼到大型代碼庫上。我們主要使用C++。其目的是以自動化的方式以高概率和少量誤報來檢測這種情況,從而可以拒絕這樣做的變化。如何在大型代碼庫中自動檢測複製的代碼?
這是所有容易爲開發商擔心的一些代碼未知,而是複製他們的使用率,並取代上,對於所有工作的方式的主副本工作一個小的調整。我想檢測並停止這樣的捷徑,這會使代碼難以維護。
任何人都可以提出一種自動化的方式來嘗試和檢測這種情況?這可以在事實之後應用,以找到在引入此自動化解決方案之前已經溜過的領域。