2013-06-25 40 views
0

我有一個數據庫,它包含一個包含汽車品牌,模型和大量垃圾以及其他一些乾淨信息的行。我還擁有大多數汽車品牌和型號的數據庫,並且我想檢查這些品牌和型號是否出現在骯髒的線路中,並用品牌和型號替代。檢查部分行是否與數據集中的行匹配

我或多或少對Python很陌生,所以很高興能得到一些支持。

回答

0

讓我們調用髒和乾淨的兩個文件。你可以有一個通過Dirty索引的循環,然後循環中的另一個循環通過clean進行索引,以查看你正在搜索的行是否存在。

如果Clean中存在該行,則將其寫入一個名爲NEWDATABASE的新文件,如果不寫入已存在於Dirty中的文件。

如果你對你的問題更具體,並提供線條的樣子,我可以幫助更多。

+0

謝謝。線條看起來像「大衆高爾夫Plus 1.2 TSI 105 PK DSG AUTOMAAT MATCH CLIMA/CRUISE/PDC *清潔數據*」,我想要「大衆高爾夫Plus *清潔數據*」。這是一個相當大的文件,超過50萬行。 – ticktack

+0

我仍然困惑於你在問什麼。你可以在你的問題中具有超級特定性並給出詳細的例子嗎? – dakillakan

+0

我有一個包含超過50萬條髒線的數據庫,例如「Volkswagen Golf Plus 1.2 TSI 105 PK DSG AUTOMAAT MATCH CLIMA/CRUISE/PDC」,然後是選項卡,然後是一些乾淨的數據。另外,我有一個簡潔的數據集,比如「大衆高爾夫Plus」。我想用乾淨的線替換髒線,並在標籤後面保留乾淨的數據。 – ticktack

相關問題