-1
我正在尋找一種算法來給出元組的第一個元素的最可能的2元組。用於構建最可能的元組的廉價AI算法
最有可能的是當兩個元素以前在一批中更經常見到的時候。
比方說,你有批次的無限流:
BATCH 1:
border
color
border-radius
dispaly
BATCH 2:
width
height
left
top
color
border
BATCH 3:
border
border-radius
width
height
BATCH 4:
[ and so on ... ]
批次連續流中,並永遠不會結束。該算法必須訓練能夠知道批次中哪兩個元素最有可能一起出現。
例如,當新批次進來時,我問算法「請將批次拆分成一組2元組,以便它們可能在一批中」。
比方說批次編號4來自於如下
BATCH 4:
border
width
border-radius
height
該算法將批料分成兩個2-元組,如下所示:
[border, border-radius]
[width, height]
因爲這些元素歷史更可能一起進入一個批次。
該算法不一定是確切的,但相當便宜和操作概率。
這僅僅是一個例子,或者這與實際數據的大小有些相似嗎?或者更清楚:平均/最大批量?不同元素的數量?舊批次是否與新批次不相關? – sascha
你研究並考慮了哪些算法?什麼是您的特定應用程序的權衡?有很多關於N-gram的文獻,N = 2是一個(相對)簡單的介紹示例。 – Prune
查看[關聯規則挖掘]中的頻繁項目集(https://en.wikipedia.org/wiki/Association_rule_learning)。在wiki頁面上描述的算法(Apriori,FP growth,..)可能就是您正在尋找的。 – SND