open-search-server

    0熱度

    1回答

    我在OpenSearchServer中使用Web搜尋器,在爬網時,它在Extracting url list操作期間卡住了。在結束會議時它也會卡住。有無論如何設置時間限制或超時,以便如果某些事情需要太長時間才能中止運行?

    0熱度

    1回答

    我使用的是opensearchserver抓取網站。現在我想爲特定的網址獲取所有相關的網址。這個想法是,當某人在網站上閱讀一篇文章時,他們會在頁面底部獲得相關文章選項。我如何使用opensearchserver來做到這一點?這甚至有可能嗎?如果沒有,是否有任何其他網絡爬蟲可以做這樣的事情? 謝謝

    0熱度

    1回答

    我需要一個替代Google自定義搜索的網站,我需要的是抓取網站,索引它,允許優先級擺弄,然後允許通過REST進行搜索查詢或類似的東西,並返回XML或JSON等,它需要在Windows Server實例上運行。 所以,我和http://www.opensearchserver.com/一起運行,它似乎在做伎倆,但不能爲我的生活找出如何在結果中獲得縮略圖?我搜索了文檔並閱讀了所有可能的內容,但無法找到

    0熱度

    1回答

    我有一個基本的渲染器設置。然而,我發現很難找到關於此的任何文檔。 如何讓Open Search Server使用HTTPS而不是HTTP來管理所有連接和工作? 這讓我很難過,我可以看到它在後端使用apache和tomcat,但是我沒有看到我期望的任何conf文件。 我公司已通過此處列出的所有文檔的:http://www.opensearchserver.com/documentation/READ

    0熱度

    1回答

    當在OSS中訪問我的渲染器並搜索某些內容時,它會向我顯示找到了多少個文件以及哪些類型的文件,但它不會顯示文件本身。 的頁面是空白出於某種原因(看起來像這樣:http://i.imgur.com/kcoq3Lf.png)

    0熱度

    1回答

    如何使用RESTFul API在Open Search Server中使用方面過濾搜索結果? 我使用以下網址(搜索領域的模板,我的模板被命名爲「搜索」,我從代理的Apache /搜索到Tomcat): http://domain.com:8080/search/services/rest/index/intranet/search/field/search 以下JSON的工作原理: $json =

    0熱度

    1回答

    我一直在嘗試抓取和索引內聯網和互聯網。但它根本不起作用,我認爲這是由於代理/安全限制。我得到的索引解析爲true,但內容長度爲-1,因此它什麼都不爬。無論如何,我可以把我在內聯網上的credentiels在開放式搜索服務器上抓取它,知道它只有基本/摘要或NTLM身份驗證嗎? 有沒有辦法在oss上配置代理而不僅僅是在crawler選項卡上的代理? 我已經設置了憑據,但它似乎並不像oss認出公司的代理