2011-08-01 74 views
3

我正在重新搜索Solr的Whoosh搜索應用程序。我現在從快速入門瞭解到。但我一直在每一次我不得不處理字符串是否需要所有字符串都是unicode?

>>>writer.add_document(iden=fil, content=F2T.file_to_text(fil_path)) ValueError: 'File Name.doc' is not unicode or sequence

,然後遇到了問題:

>>>query = QueryParser("content", ix.schema).parse("first") 
AssertionError: 'first' is not unicode 

和線從快速啓動turorial來直!飛快請求所有字段都在unicode?讓我的應用程序能夠識別unicode(甚至不值得),這將是一件非常辛苦的工作。至於「不是unicode或序列」,我知道字符串也是一個序列數據類型。

+0

你爲什麼不郵件列表或論壇上嗖問? –

+0

嗯,這是Whoosh查詢的最佳選擇嗎? – aitchnyu

+0

好吧,如果您對特定軟件有疑問,您可以通過詢問知道該軟件的人而不是將其發佈到常規編程問答網站上來獲得答案。 –

回答

8

是的,它需要字符串是Unicode。

query = QueryParser("content", ix.schema).parse("first") 

修改成:

query = QueryParser("content", ix.schema).parse(u"first") 
相關問題