2011-12-04 61 views
0

有人可以推薦一個快速的基於unix的實用程序(理想情況下用C語言編寫),以獲得高效的流式交叉/工會製表符分隔文本文件?例如,允許查詢,例如「給我所有文件A中具有列值K並且不出現在文件B的任何列K中的條目」的查詢。快速交集,補充和結合製表符分隔的文本文件?

例如,如果文件A是:

bob sally sue 
bob mary john 

和文件B爲:

john sally sue 
foo bar quux 

然後補充文件的A相對於B於柱2將返回 「鮑勃瑪麗·約翰」 時,由於這是文件B中第2列中的值不在文件B中的唯一值。

我不想使用數據庫,但希望使用基於命令行的實用程序。 awk是答案還是有一些簡單的? 謝謝。

回答

0

如果只是針對那個特別的查詢,我可能會使用awk,hash B的2.列和基於hash的過濾器A.

相關問題