2017-10-12 70 views
-1

我正在尋找一種算法來給出元組的第一個元素的最可能的2元組。用於構建最可能的元組的廉價AI算法

最有可能的是當兩個元素以前在一批中更經常見到的時候。

比方說,你有批次的無限流:

BATCH 1: 

border 
color 
border-radius 
dispaly 


BATCH 2: 

width 
height 
left 
top 
color 
border 


BATCH 3: 

border 
border-radius 
width 
height 


BATCH 4: 

[ and so on ... ] 

批次連續流中,並永遠不會結束。該算法必須訓練能夠知道批次中哪兩個元素最有可能一起出現。

例如,當新批次進來時,我問算法「請將批次拆分成一組2元組,以便它們可能在一批中」。

比方說批次編號4來自於如下

BATCH 4: 

border 
width 
border-radius 
height 

該算法將批料分成兩個2-元組,如下所示:

[border, border-radius] 
[width, height] 

因爲這些元素歷史更可能一起進入一個批次。

該算法不一定是確切的,但相當便宜和操作概率。

+0

這僅僅是一個例子,或者這與實際數據的大小有些相似嗎?或者更清楚:平均/最大批量?不同元素的數量?舊批次是否與新批次不相關? – sascha

+0

你研究並考慮了哪些算法?什麼是您的特定應用程序的權衡?有很多關於N-gram的文獻,N = 2是一個(相對)簡單的介紹示例。 – Prune

+1

查看[關聯規則挖掘]中的頻繁項目集(https://en.wikipedia.org/wiki/Association_rule_learning)。在wiki頁面上描述的算法(Apriori,FP growth,..)可能就是您正在尋找的。 – SND

回答

1

它被稱爲頻繁2項目集。

但是對於元組的限制,它簡直歸結爲計數。

相關問題