我已經運行了https://github.com/percyliang/brown-cluster以及python實現https://github.com/mheilman/tan-clustering的棕色聚類算法。他們都給每種獨特的令牌提供某種二進制和另一個整數。例如:布朗聚類算法輸出意味着什麼?
0 the 6
10 chased 3
110 dog 2
1110 mouse 2
1111 cat 2
二進制和整數是什麼意思?
從第一link,二進制稱爲一個bit-string
,看到http://saffron.deri.ie/acl_acl/document/ACL_ANTHOLOGY_ACL_P11-1053/
但我怎麼從輸出告訴dog and mouse and cat
是一個集羣,the and chased
是不一樣的集羣中?
,它說,每一行是:<簇表示爲一個位串><在輸入中出現單詞的次數> !! –
carla
它甚至意味着什麼?簇表示爲位串? – alvas
你可以提供一些關於你想要分類的細節嗎?在這種情況下,我可以嘗試尋找一些參考。否則,可能沒有任何一般程序,我想這更多是關於專家知識和/或預定義的措施。 –