我想選擇文本類型(文章)(例如sport,economic),字符串,並且我想知道是否使用函數similar_text()或其他方法的最佳方式。我需要比較文本。一篇文章是應該分配給類別的描述。第二個文本實際上是描述類別的所有關鍵詞的文本。比較給定相似百分比的兩個文本。 與特定類別最相似的文本實際上就是該類別。我應該做這個密碼similar_text()或其他嗎? (soory for my eng
的羣集我有一個(不完全)聚集串數據,其中在一個集羣中的項目可能是這樣的: [
Yellow ripe banana very tasty,
Yellow ripe banana with little dots,
Green apple with little dots,
Green ripe banana - from the market,
Y