我有一個原始文件列表和一個包含985257行和984997行的重複驅動器。使用sed來刪除類似文件中存在的行
由於行數不匹配我確定某些文件沒有重複。
爲了確定哪些文件不存在我希望使用sed通過從源列表中刪除重複列表中存在的任何行來過濾原始文件列表。
我曾考慮過在Excel中使用匹配公式,但由於程序崩潰的行數。我認爲在sed中使用這種方法將是一個可行的選擇。
但是到目前爲止,我的方法還沒有成功。
echo "Start"
# Cat the passed argument which is the duplicate file listing
for line in $(cat $1)
do
#sed the $line variable over the larger file and remove
#sed "${line}/d" LiveList.csv
#sed -i "${line}/d" LiveList.csv
#sed -i '${line}' 'd' LiveList.csv
sed -i "s/'${line}'//" /home/listings/LiveList.csv
done
存在被創建並填充到列表文件的103.4mb但是上市文件本身並沒有根本改變的臨時文件。
我的其他問題是,因爲在Windows中創建了列表,因此'\'字符可能會逃避導致不匹配的字符串,因此不會進行任何更改。
Example path:
Path,Length,Extension
Jimmy\tail\images\Jimmy\0001\0014\Text\A0\20\A056TH01-01.html,71982,.html
請大家幫忙。
完美。它的運行速度也非常快。非常感謝。 –