首先,我需要從我的帖子的標題和描述以編程方式獲取標籤(不同於在此完成的在stackoverflow上)。我不想讓常用詞出現在關鍵詞中。有沒有這樣做的有效方式?編程從標題,描述和相關項目獲取標籤(關鍵字)
獲得好標籤後,我想將它們保存在MySQL DB中。
現在,我如何高效使用這些自動創建的標籤獲取相關的帖子?例如。這裏做了什麼。
首先,我需要從我的帖子的標題和描述以編程方式獲取標籤(不同於在此完成的在stackoverflow上)。我不想讓常用詞出現在關鍵詞中。有沒有這樣做的有效方式?編程從標題,描述和相關項目獲取標籤(關鍵字)
獲得好標籤後,我想將它們保存在MySQL DB中。
現在,我如何高效使用這些自動創建的標籤獲取相關的帖子?例如。這裏做了什麼。
我會建議不要使用這種方法。您可以使用它來建議標籤,但自動標籤將非常非常難以正確和準確地實現。
其中一個原因是因爲計算機不理解語義。在這裏採取任何問題,並嘗試這樣做。 95%的時間無法工作。
好吧,我明白了。將不得不忘記該功能 – 2010-08-15 02:14:32
我猜在線API服務可能會有所幫助。檢查:
OpenCalais - 在這裏嘗試粘貼的文章:http://viewer.opencalais.com/
或雅虎的長期提取API:http://developer.yahoo.com/search/content/V1/termExtraction.html
希望這有助於!
我不明白如果沒有某種列表,這將是怎麼可能的。您的應用程序如何知道要使用哪些單詞而不使用?我想你可以找到一個你可以API調用的theauau,並使用它來查找標籤,如果你希望這樣做是出於搜索引擎優化的原因,它會變得相當複雜,你可以讓該應用根據關鍵字列表查找單詞,如從谷歌關鍵字工具獲得的一個..
至於如何做到這一點,我一直在使用PHP,並認爲它非常適合構建web應用程序,但對於這類事情(處理很多正則表達式等)我傾向於在PHP中遇到問題,也許它只是我,但我更喜歡使用perl
headup也可以幫助完成此任務(就像Open Calais一樣)。你可以看看這裏,看看它是否適合你:
http://labs.headup.com/Services/RealTime/API/EntitiyExtraction/Playground.aspx
如果需要的話,這裏還有一個API。
(聲明:我是開發人員@SemantiNet並致力於此產品...我們很樂意提供幫助)。
祝你好運!
我需要提供代碼,即時通訊只是試圖處理一個算法...什麼是-1。該死的 – 2010-08-15 01:58:05
你的問題非常含糊。例如,您不指明您正在使用的是哪種應用程序。沒有一些細節,像「標籤」,「帖子」,「關鍵字」這樣的詞彙毫無意義。 – 2010-08-15 02:05:26
@Jeff,我可能不是一個標籤專家....這就是爲什麼我首先要問這個問題。這樣我的會員就不會被迫輸入標籤 – 2010-08-15 02:11:40