使用Springer等在線圖書館搜索紙張時,返回的結果還會顯示從本文自動提取的相關概念以及基於這些知識的關係圖概念。以下是搜索輸出的屏幕截圖。爲搜索到的文章生成概念和概念圖的工具
我想知道哪種算法和軟件能夠產生這種輸出。有沒有開源工具可以做到這一點?
使用Springer等在線圖書館搜索紙張時,返回的結果還會顯示從本文自動提取的相關概念以及基於這些知識的關係圖概念。以下是搜索輸出的屏幕截圖。爲搜索到的文章生成概念和概念圖的工具
我想知道哪種算法和軟件能夠產生這種輸出。有沒有開源工具可以做到這一點?
正在使用的算法是K均值。 K-Means是一種無監督聚類算法。文章按主題聚類。一些文章包含多個主題,其中許多文章之間是相同的。那些共同的主題是從最初的主題出現的分支。 SKLearn是一個非常好的聚類非常好的Python庫。 R對集羣也很有用。希望這可以幫助!
在這裏使用K-Means極不可能。首先,K-Means(通常)具有一對一的關係。在這個例子中情況並非如此。無論是言辭還是文件。其次,k-means受* Measure of Concentration *和* Curse of Dimensionality *的影響,這使得它不適合文本分類。 – CAFEBABE
[Neo4J](http://stackoverflow.com/questions/tagged/neo4j)就是其中之一。以下主題可能會很有趣:http://stackoverflow.com/questions/1000162/has-anyone-used-graph-based-databases-http-neo4j-org – Val
[交叉驗證](https://stats.stackexchange .com /)社區可能會提供幫助。 – raulk
嗨瓦爾,非常感謝你與我分享這些信息,這非常有用。 – user785099