2014-03-25 41 views
1

我停留在這可能很容易出現問題,所以一切我所要求的是開始的想法:文件名之間執行同樣的操作,一個聯動的蟒蛇

在蟒蛇,我已經生成的鏈接。每個文件名與字典名稱中的至少兩個數字相關聯。編號{fileName:[list of numbers]}不同的文件名可以具有一些相關的共同數字。爲了看到這一點,我創建了一個字典numberName {number:[list of associated fileNames]}。我想要做的是某種單鏈接:重新組合所有至少有一個共同號碼的文件名。這個分組必須是高效的,因爲我擁有數百萬個文件名。

回答

1

你可以嘗試使用networkx的圖表。

每個文件名將是圖形的一個節點(G.add_node()),並且您可以鏈接具有常用數字的文件名與邊緣。 networkx應該可以讓你找到你的派系圖。