這是我剛剛遇到的一個問題,或者更確切地說,它是捕獲核心問題的簡化。高效地確定電子表格中行之間的關係
想象一下,我有一個電子表格,其中包含許多列,每個列都標有標籤,還有一些行。
我想確定一列中的值何時可以從另一列中的值推斷出來。例如,我們可能會發現每次在列a中出現'1'時,總是在列d中出現'5',但是隻要在列a中出現'2',3總會出現在列d。我們觀察到列a中的值可靠地預測了列c中的值。
目標是確定列之間的所有這些關係。 (a,b),(a,c),(a,d)...(b,c),(b,d)的列對開始列表, ... 等等。我們稱這些爲「合格」列表。
對於這些配對中的每一對,我們都會跟蹤配對中第一對的值和第二對中的對應值。如果我們注意到我們看到第一對貨幣的價值相同,而第二個貨幣對的價值不同,那麼這對貨物不再符合條件。
無論在這個過程結束時剩下的是一組有效的關係。
不幸的是,隨着列數的增加,這很快就變得不切實際,因爲我們必須存儲的數據量是按列的平方數量的順序排列的。
任何人都可以想到一個有效的方法來做到這一點?
您提出了一個很好的觀點,即根據我的定義,每列都是唯一的列,然後可以預測所有其他列,但這並不是我想要的,因爲它沒有什麼實際預測價值。我想我需要改進我對問題的定義。 – sanity 2010-10-13 15:54:58