2011-06-22 95 views
0
從字符串+分類

英文單詞檢測我有URL的大型數據庫,我想從這個數據中提取的英文單詞,然後分類,包含在URL中的話英語單詞分類

如apple.com - >蘋果:水果和應用程序:計算機

還有其他的PHP腳本我最好每串的話,但我需要幫助是英語單詞分類

如忍者=門派開放的數據源

PHP部分他們只是做一個查詢。 我已經看過用於分類頁面內容的貝葉斯腳本,但這更多地涉及到幾個字。它可能比需要的更復雜。

乾杯提前,

+2

我建議你把它想成完成句子「a 」。它導致更好的和可以說更有用的分類。一個蘋果是一種水果。一個應用程序不是一臺電腦,它只與它相關聯。而忍者實際上是一個戰士。 – Leif

+0

您是否嘗試使用其域名的重要部分對網站的內容進行分類?如果是這樣,祝你好運。你的錯誤分類率會很高。例如,在google中鍵入「鞋子」,並查看名稱與「鞋子」概念無關的域的百分比。 – Tim

+0

不是這是一個域名的列表出售和通過分類,然後我可以聚類他們出售的類別/標籤以及添加「你也很喜歡」,因爲這些是巨大的數據庫,這是不切實際的手工 – Jaybest

回答

0

你應該看看Wordnet。這是一個詞彙資源,通過將它們與它們的同義詞集合(synset)進行分組來對它們進行分類。它應該可以幫助你獲得有意義的分類。