我有一個很大的文本文件,我只想提取某些短語/單詞之後的數字。在文本文件中抽取特定單詞後的數字
有在以下格式這個巨大的文本文件,幾十行:
Best CV Model for car: 15778 is order:2 threshold: 0 with AUC of : 0.7185 gene aau_roc: 0.466281
一種解決辦法是隻看數量後,「汽車:X」,「是爲了:X」,「門檻:X「,」Y gene aau_roc:X「!
最後,我想每行有15778,2,0,0.7185,0.466281。
這種模式肯定比我想出的模式簡單,但它的缺點是它會匹配與提問者所尋找的行結構不匹配的行上的數字。 – Blckknght
@Blckknght在理論上你的解決方案可能是更完美的解決方案,在現實生活中,採取'較柔和'的解決方案通常是明智的,因此也解析了可能存在拼寫錯誤的行,如'threhsold'而不是'threashold'。我會在這裏使用這個解決方案。 – erikbwork