2011-03-10 56 views
1

我開始學習使用SQL Server進行數據挖掘,我很好奇SQL Server Integration Services能夠從英文文本中執行術語提取。不過,我有興趣從非英語文本中進行文本挖掘,基本上來自烏克蘭語。所以這些都是非常的問題:針對非英文文本的SSIS術語提取

  1. 有沒有一種方法可以從SSIS中的非英文文本中實現術語提取?如果是的話,任何合適的資源將不勝感激:)
  2. 如果第一個問題的答案是肯定的,我想知道是否已經有一些非英文文本的自定義解決方案。

感謝提前:)

回答

0

文檔states,術語提取,轉換隻支持英文,並且有添加其他語言沒有提到的機制。

因此,我認爲您需要找到某種可以對烏克蘭文字進行術語提取的工具,並研究如何將其集成到SSIS中。找到這樣的工具並不是一個真正的SSIS問題,這是一個普通的NLP或語言學問題,所以你可能會在另一個論壇中得到更好的答案。