我以textmining開頭。 我有成千上萬的數據爲「技能類別」在mysql數據庫上打包數據
- 每個「技能」兩個數據庫表..
一表「技能」和一張桌子屬於技能categorie。
- 「技能」是數據庫中的physicaly,varchar(200)字段,其中有一些描述技能的文本。
下面是從技能上表中提取的一些技巧:
「PHP(良好水平),爪哇(intermediaite),C++」 「PHP5」 「項目管理和質量管理」 「開頭的Javascript 「 ‘水工程’ ‘dfsdf zerze rzer’ ‘cibling客戶’
我想要做的就是從這些領域中提取知識,我的意思是隻提取了真功夫,而忽略無用文字的其餘部分。 對於上面的例子我想只能用數組:
「PHP」 的 「Java」 「C++」 「PHP5」 「項目管理」 「質量管理」 「使用Javascript」 「水工程「 」兄弟客戶「
我該怎麼做才能從噸數據中提取技能? 你知道具體的算法嗎? ex:k-means ...?
在此先感謝。
你能展示一些現實世界的數據例子嗎? – 2010-03-31 13:14:05
任何答案都是可行的解決方案? – 2010-04-02 14:34:04