檢查部分行是否與數據集中的行匹配

我有一個數據庫，它包含一個包含汽車品牌，模型和大量垃圾以及其他一些乾淨信息的行。我還擁有大多數汽車品牌和型號的數據庫，並且我想檢查這些品牌和型號是否出現在骯髒的線路中，並用品牌和型號替代。檢查部分行是否與數據集中的行匹配

我或多或少對Python很陌生，所以很高興能得到一些支持。

來源

2013-06-25 ticktack

讓我們調用髒和乾淨的兩個文件。你可以有一個通過Dirty索引的循環，然後循環中的另一個循環通過clean進行索引，以查看你正在搜索的行是否存在。

如果Clean中存在該行，則將其寫入一個名爲NEWDATABASE的新文件，如果不寫入已存在於Dirty中的文件。

如果你對你的問題更具體，並提供線條的樣子，我可以幫助更多。

來源

2013-06-25 19:40:44 dakillakan

謝謝。線條看起來像「大衆高爾夫Plus 1.2 TSI 105 PK DSG AUTOMAAT MATCH CLIMA/CRUISE/PDC *清潔數據*」，我想要「大衆高爾夫Plus *清潔數據*」。這是一個相當大的文件，超過50萬行。 – ticktack

我仍然困惑於你在問什麼。你可以在你的問題中具有超級特定性並給出詳細的例子嗎？ – dakillakan

我有一個包含超過50萬條髒線的數據庫，例如「Volkswagen Golf Plus 1.2 TSI 105 PK DSG AUTOMAAT MATCH CLIMA/CRUISE/PDC」，然後是選項卡，然後是一些乾淨的數據。另外，我有一個簡潔的數據集，比如「大衆高爾夫Plus」。我想用乾淨的線替換髒線，並在標籤後面保留乾淨的數據。 – ticktack

檢查部分行是否與數據集中的行匹配

回答

相關問題