我看到已經有一些研究調查了這一點。他們可能會幫助。
科塔,J.,Shevertalov,M.,施特勒,E.,Mancoridis,S.,「A概率方法對源代碼的作者身份識別」,在關於信息技術的國際會議論文集, pp.243-248,IEEE,2007年
可在線here
從抽象報價:
我們乞求通過計算一組度量來爲使用經驗證爲真實的代碼樣本的已知作者羣構建配置文件。然後,我們計算未經確認的源代碼度量來確定最接近的匹配配置文件。 [...]在我們的案例研究中,我們可以用 來確定作者身份,選擇最接近的匹配的準確率高於70%,並且選擇排名前三的最接近的匹配的準確度高於90%。
Shevertalov,M.,科塔裏,J.,施特勒,E.,Mancoridis,S.,「關於利用離散源代碼度量爲作者標識的」,在程序中的第一屆國際研討會的基於搜索的軟件工程,pp.69-78,IEEE,2009。
可在線here,這是以前的研究的後續。
蘭格,R.,Mancoridis,S.,「使用代碼度量直方圖和遺傳算法進行作者標識爲軟件法醫」,在訴訟遺傳與進化計算的第九屆年會暨,pp.2082 -2089,ACM,2007。
可在線here
這也與第一參考值(共同作者),和更詳細地討論的指標。再次引用摘要:
我們的方法涉及測量代碼度量的直方圖分佈差異。識別有效區分開發人員風格的度量組合是該技術實用性的關鍵。我們的案例研究涉及18個指標。
您還可以使用Google Scholar其他參考資料,並尋找基於以上這樣的(使用選項「被引用次數」)等論文。
它值得等待答案,非常感謝,波格丹 – 2012-04-04 12:25:40