我有一個網址列表:file_url_list
,打印到這一點:如何以更高效和pythonic的方式編寫以下代碼?
www.latimes.com, www.facebook.com, affinitweet.com, ...
和頂部1M的URL的另一個列表:top_url_list
,打印到這一點:
[1, google.com], [2, www.google.com], [3, microsoft.com], ...
我想找到file_url_list
中有多少個網址在top_url_list
。我寫了下面的代碼,但我知道這不是最快的方法,也不是最Python的方法。
# Find the common occurrences
found = []
for file_item in file_url_list:
for top_item in top_url_list:
if file_item == top_item[1]:
# When you find an occurrence, put it in a list
found.append(top_item)
我怎樣才能以更高效和pythonic的方式來寫?
爲什麼你存儲一個計數器作爲列表的第一個元素?這實際上使事情變得複雜。有沒有理由這樣做? –
如果目標是「找到top_url_list中有多少個URL」,爲什麼你不計算任何東西?你有什麼特別的原因讓你將它們追加到列表中? –
[查找兩個列表的交集?](http:// stackoverflow。com/questions/642763/find-intersection-of-two-lists) – fafl