2012-09-25 80 views
2

使用Drupal/Search API模塊/ Solr/Tika,我們試圖索引大量文件。Tika和Solr Drupal 7在Cron上索引

我已經設置了索引,一切正常,直到我包含搜索API附件模塊。

當我們運行cron時,tika未被調用。我們知道這一點,因爲我們在一段PHP代碼中寫入了tika模塊末尾的系統日誌,並且該消息從不出現。它在手動運行索引時顯示。

此外,在cron運行後,項目數index沒有增加。

我們也注意到,如果我們在命令行中,我們在輸出的頂部出現以下錯誤蒂卡運行: 信息 - 不支持/禁用操作:EI

該指數按預期工作沒有檢查框在cron上索引附件並通過手動索引來索引附件。

任何想法可能是什麼問題?

謝謝!

網站建置日期:

  • 的Drupal 7

模塊問:

  • 搜索API
  • 搜索API附件

索引有:

  • Apache Solr實現使用

索引附件:

  • 提卡圖書館

回答

0

我有同樣的問題。但它似乎並不是一個問題,因爲該文檔似乎無論如何都得到索引。

我想這是一個Tika問題,因爲一些文檔(pdf)運行良好,其他不是。也許這取決於pdf版本。嘗試更簡單的事情。 I.E.我寫了一個示例文本,並使用打印功能在我的Mac上獲得一個簡單的PDF文檔。或者使用Word文檔。我們還必須應用real-path patch才能讓Tika處理文件...和transliteration模塊以獲得乾淨的文件名。爲了調試search_api,我使用了devel的dd()函數。在search_api_solr/includes/solr_httptransport.inc performHttpRequest()中,我呼籲 dd($url); dd($options);之前$response = drupal_http_request($url, $options);(行:92)...希望這可以幫助。