通過軟件指標來識別開發人員的編碼風格

傳統軟件software metrics處理軟件質量問題。我正在尋找可用於通過代碼識別開發人員的指標，與剽竊軟件一樣，stylometry可用於通過他們的寫作風格來識別作者。我可以想象，某些現有指標也可以在此處使用，例如評論比率。我也可以想象一些與質量觀點無關的指標，例如（過度）使用某些方法或設計模式，變量名稱的平均長度等。通過軟件指標來識別開發人員的編碼風格

我對指向這些指標或研究的集合或個別指標。它們可能是語言不可知的或與語言或編程範式相關的。

我想用它來理解和分析不同的編碼風格，而不是檢測抄襲。

來源

2012-02-13 Adam Schmideg

我看到已經有一些研究調查了這一點。他們可能會幫助。

科塔，J.，Shevertalov，M.，施特勒，E.，Mancoridis，S.，「A概率方法對源代碼的作者身份識別」，在關於信息技術的國際會議論文集， pp.243-248，IEEE，2007年

可在線here

從抽象報價：

我們乞求通過計算一組度量來爲使用經驗證爲真實的代碼樣本的已知作者羣構建配置文件。然後，我們計算未經確認的源代碼度量來確定最接近的匹配配置文件。 [...]在我們的案例研究中，我們可以用來確定作者身份，選擇最接近的匹配的準確率高於70％，並且選擇排名前三的最接近的匹配的準確度高於90％。
Shevertalov，M.，科塔裏，J.，施特勒，E.，Mancoridis，S.，「關於利用離散源代碼度量爲作者標識的」，在程序中的第一屆國際研討會的基於搜索的軟件工程，pp.69-78，IEEE，2009。

可在線here，這是以前的研究的後續。
蘭格，R.，Mancoridis，S.，「使用代碼度量直方圖和遺傳算法進行作者標識爲軟件法醫」，在訴訟遺傳與進化計算的第九屆年會暨，pp.2082 -2089，ACM，2007。

可在線here

這也與第一參考值（共同作者），和更詳細地討論的指標。再次引用摘要：

我們的方法涉及測量代碼度量的直方圖分佈差異。識別有效區分開發人員風格的度量組合是該技術實用性的關鍵。我們的案例研究涉及18個指標。

您還可以使用Google Scholar其他參考資料，並尋找基於以上這樣的（使用選項「被引用次數」）等論文。

來源

2012-04-01 21:48:01

它值得等待答案，非常感謝，波格丹 – 2012-04-04 12:25:40

如果您正在尋找潛在指標，您可以嘗試查看一些編碼標準。由於這些規定了特定的風格，因此它們所談論的內容（間距，花括號，標識符長度，強制性評論等）都可能用於從代碼中標識開發人員。

此外，如果您對.NET代碼感興趣，您可能會發現NDepend是一個有用的工具。它使您能夠針對代碼庫運行查詢，並支持82個指標。

來源

2012-02-15 22:34:41

通過軟件指標來識別開發人員的編碼風格

回答

相關問題