我在每行中都有一個包含空格分隔數字的文件。每行對應於一個數字列表。
現在有大約300,000這樣的行(每行平均包含大約100個數字)。
我想找到所有這些列表的相互交集,即第一個列表與所有其他列表相交,然後第二個列表與所有其他列表相交,依此類推。
我使用在python中查找大量列表的交集
set(a) & set(b)
其中A和B都列出我得到一個雙循環迭代。
但這需要太多時間。例如:對於與所有其他列表相交的第一個列表,大約需要3分鐘。
我該如何有效地做到這一點? (可能是與其他一些語言/工具)
我們可以看到你的代碼嗎? –
您是否在找到相交b相交....? 「相互交叉」是什麼意思? – sidi
300,000 x 300,000 = 900億列表。即使你設法計算所有可能的組合,我想知道你將如何存儲它們。 – georg