0
我試圖用Apache Nutch抓取數據並用Apache Solr對其進行索引。將Apache Tika應用於Solr而不是Nutch有什麼好處
作爲這一部分我也想分析內容。我試圖找出將Tika應用於Nutch,Solr還是兩者都更好。
我試圖用Apache Nutch抓取數據並用Apache Solr對其進行索引。將Apache Tika應用於Solr而不是Nutch有什麼好處
作爲這一部分我也想分析內容。我試圖找出將Tika應用於Nutch,Solr還是兩者都更好。
儘早應用它,但一定要保留原始的全保真文檔。
如果你知道最終你將把它減少到一組元數據字段並擺脫其餘部分,那麼沒有必要傳遞一個二進制文件。