2010-11-11 63 views
1

是否有命令行實用工具或php/py腳本會生成html diff,以便比較多個文件以比較4個或更多文件。比較4個或更多文件

我的每個文件最多都有10k行。

注意:這些文件是純文本文件。不是HTML。僅包含A-Za-z0-9 =。,。並且沒有HTML標籤

+1

http://stackoverflow.com/questions/86905/suggestions-on-how-build-an-html-diff-tool – ArK 2010-11-11 06:23:08

+0

問題是要比較2個html文件。我在這裏比較純文本文件 – Sairam 2010-11-11 06:30:37

+0

很好的問題,但HTML輸出有點不可讀?比較2個文件稍微少一點混淆,簡單的方法'diff A B> /tmp/diff.a.b; diff A C> /tmp/diff.a.c; diff A D> /tmp/diff.a.d; cat /tmp/diff.a。*;'你以後可以用HTML對其進行美化,不完全是你想要的,也許只是一個錯誤的嘗試 – ajreal 2010-11-11 06:56:23

回答

0

這取決於您正在比較/分析的數據類型。

基本的解決方案是

  • file_get_contents爲您提供了文件數據的串
  • strcmp會做數據的「二進制安全比較」

你可能會想explode()您的數據以某種方式對其進行分隔,並比較數據的各個部分。

另一種選擇是分隔,循環並製作一個「比較係數」,用於指示文件偏離規範的程度。例如,文件1的cc = 3,文件4的cc = 8。文件4將更接近匹配。

您將遇到的最後一個問題是服務器計算機上的內存限制。你可以在php.ini中更改。

//編輯

只注意到了diff標籤,但在情況下,它有助於在某種程度上無論如何,我會離開這個了。