我正在嘗試將全文搜索功能添加到我的RoR應用程序,但在涉及到阿拉伯語時遇到一些問題。 AFAIK,那裏沒有很多搜索引擎支持阿拉伯詞幹,詞法和其他高級全文搜索。我唯一發現的是帶有AraMorph標記器的Lucene。RoR中的阿拉伯文全文搜索
acts_as_solr插件(solr基於lucene,這個插件將它與Rails集成)似乎被放棄了,而且我找不到任何有用的文檔。
我已經看過獅身人面像,xapian,雪貂,和acts_as_searchable,但他們都沒有提供高級阿拉伯文搜索功能,據我所知。
任何幫助將非常感激
==更新
我有建議使用獅身人面像,而我卻用它在早期的一個項目,它工作得很好。但是,它不提供任何高級搜索功能。
例如,詞語:كتاب(書),مكتبة(圖書館)和كاتب(作家)都來源於相同的詞幹كتب。我想有能力搜索「作家」,並獲得從同一詞幹衍生的所有單詞的結果。
另外,我想讓搜索考慮到常見的阿拉伯語聽寫風格。有些人使用「hamza」(همزة),有些人則沒有。其他人用字母「taa marboota」(التاءالمربوط)寫字,而其他人用字母「haa」(الهاء)寫字。一個好的阿拉伯語搜索引擎應該意識到這些微妙的差異並尋找它們。
隨着獅身人面像,你只能得到你所尋找的東西,而我發現的唯一引擎,以阿拉伯文的語言來容納這些問題,是帶有AraMorph標記器的Lucene。但是,acts_as_solr(用於rails的lucene插件)被放棄。所以我的問題是:任何搜索引擎是否還有其他此類標記器?
KandadaBoggu提到的黑子,我給一個去,並進行迴應
Thanx爲鏈接。我早些時候遇到過,並且設法讓獅身人面像在阿拉伯語網站上運行。請檢查我的問題的更新,以更好地解釋我的問題。 – Faisal 2010-03-11 10:25:33
我會接受這個答案,因爲它提供阿拉伯文搜索和字符摺疊。但是,干擾並沒有解決。 – Faisal 2010-04-21 09:24:16