2013-01-16 16 views
0

我正在考慮實施袋的文字處理方式處理電子郵件存儲爲文本文件。我想使用可能表明電子郵件需要回復的關鍵字,使用二進制分析電子郵件(類似於1 | 0 | 1 | 0 | 0等,具體取決於是否使用該單詞),然後獲取我可以使用的特徵向量不同的ML算法。使用袋字

我正在考慮使用PHP來獲取特徵向量,但我找不到任何現有的實現。是否有可能在PHP中做這樣的事情?

+3

它甚至有可能在PHP中做這樣的事情嗎?是! –

+0

你的問題是什麼?只是'是否有可能在PHP中做這樣的事情?'? –

+0

我在網上查了一下,似乎所有的實現都是Java或Python,在PHP中沒有找到一個,所以我想知道試圖在PHP中實現一個是不是沒有意義。 – dmae

回答

1

對於製作分類器來說,一大堆詞彙是很有意義的。我也在做關於文本分類的論文,我使用php和mysql。我有點困惑於創造一袋文字。但過了一段時間就可以完成了。