我有一個巨大的製表符分隔的文件,我正在使用,我試圖根據字符串'汽車'的可用性在第45列中的表子集。這是文件的樣子在Linux中的子集中awk失敗
col1 col2 ... col44 col45
JPO JIO ... JKU car
JKO LIC ... YHI car/kcar
KJG KLE ... HIY tm/car/kcar
我申請以下命令來執行子集
awk 'BEGIN{IGNORECASE=1} $45 ~ /^car$/ ' filepath | wc
我得到的有90行作爲文件中的「車」,雖然我以前知道(從excel中查看文件),超過1500行的col45
爲car
。
任何想法這裏發生了什麼?
謝謝!
我不知道awk是什麼,但是在你的命令裏面是'4',而不是'45'。另外,你混淆了'^'和'$'。 '$'意味着結束,'''開始(至少在我知道的所有正則表達式引擎中)。 –
你想在你的輸出中選擇3個樣品行中的哪一行?你想要$ 45 ==「car」嗎?你想要$ 45包含* word * car:'$ 45〜/ \ /'?你想要$ 45包含人物車:'$ 45〜/ car /'? –
抱歉,我想提出一個簡單的問題,然後我決定詢問原始案例,它是第45欄。結果我仍然得到90。感謝您的更正 – Error404