我在文本文件中有兩列。我將它們讀入Python,分成兩個單獨的列表。我想要做的是計算每一對的出現次數並基於它建立關聯規則。python讀取數據建立關聯規則
例子:
colA = [a,b,c,d,...]
colB = [c,y,d,e,...]
我只來這麼遠來的數據讀入兩份名單,但什麼是計數的出現次數,並建立規則的最佳方式?
代碼:
pred = []
succ = []
for line in open('arsample.txt'):
lst = line.split('\t')
pred.append(int(lst[0]))
succ.append(int(lst[1]))
規則是這樣的,並且降序排序:
P S Probability
---------------------
a > c count(a>c)/n
... ...
這並不完全清楚你想要做什麼。根據您提供的樣本數據,您的預期結果是什麼? – unholysampler