2009-10-17 62 views
1

如果我有一組博客文章,例如我想過濾掉那些可能是關於我自己或與某些標準無關的關鍵字的專業領域是什麼?我知道我可以列出要查找的單詞列表(其中大部分是關於我自己或任何其他內容 - 組合不會結束),以便按照我的過濾條件執行操作,但這不是可擴展的策略。 levenschtein算法也會派上用場,但我認爲這是整個研究領域?根據某些條件過濾掉文本內容,例如關於我自己

感謝

回答