2011-11-25 180 views
0

我想要一個緩存/索引網站html頁面的機制。 因此,如果再次請求該頁面,我可以簡單地從緩存或索引中獲取該頁面併發送它。 Solr可能嗎?因爲Solr似乎總是將顯示(文本)部分存儲在html中,而不是整個HTML Dom。 是否有其他開源技術可以幫助我以快速的性能實現這一目標?緩存HTML頁面

+0

嗯,我想在這裏「緩存代理」。你想放置這個緩存在哪裏?你的問題涉及索引html文件進行搜索嗎? – aitchnyu

回答

1

在這個問題中有很多遺漏的細節,但是關於Solr的問題的答案尤其是Solr可以存儲原始HTML。通常情況下,您使用stored =「true」的字段可以檢索原始HTML,indexed =「true」以及HTML filter以僅保留文本可搜索。