快捷的方式我有含2列〜1萬行的文件:替換字符串對文件
org_string1 \t replacement_string1
org_string2 \t replacement_string2
什麼是替代的最佳方式(速度/便利),所有與各自replacement_string這些org_string另一個文本文件(在第二個文件中做10k替換)?
我打算將它們轉換爲sed替換命令,但不確定速度性能以及它是否會超過linux中的最大命令行限制。
假設:
- 所有org_string和replacement_string是唯一的。
- org_string是輸入文件中的單個單詞(由空格包圍)。
所以你想在第二個文件中做10K不同的替換?根據我的經驗,'sed'會變得很慢,即使你給它一個10k'/ org_string1/replacement_string1 /'行的文件。我沒有嘗試使用10k的正則表達式和替換的Perl或Python。 –
我想這不會是perl中的轉換/替換問題,因爲perl會以毫秒爲單位執行此操作。 – ssr1012
單個替換將會很快。但檢查每條線對10k模式將總結。 –