2015-12-15 42 views
2

GET未能抓住這個網站...爲什麼?GET永遠不會完成與Umlaut的網址ü

require(httr) 
GET("http://www.atelco.de/1546/Bügeln.search") # Never finishes 
GET(URLencode("http://www.atelco.de/1546/Bügeln.search")) # works fine 

我試圖在他們的網址有ü其他網站:

GET("http://www.bosch-home.com/de/produkte/bügeln.html") 

對我來說,像接縫的錯誤。但我不知道它是什麼。我在這裏錯過了什麼嗎?

我的會話信息是:

R version 3.2.2 (2015-08-14) 
Platform: x86_64-apple-darwin13.4.0 (64-bit) 
Running under: OS X 10.11.1 (El Capitan) 

locale: 
[1] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8 

attached base packages: 
[1] stats  graphics grDevices utils  datasets methods base  

other attached packages: 
[1] httr_1.0.0 

loaded via a namespace (and not attached): 
[1] R6_2.1.1  magrittr_1.5 tools_3.2.2 curl_0.9.4 stringi_1.0-1 stringr_1.0.0 XML_3.98-1.3 
+1

看起來像一個捲曲/ httr問題。請提交一個錯誤。 – hadley

+0

完成:https://github.com/hadley/httr/issues/297 – Rentrop

回答

1

您可以輕鬆地與curl命令行實用程序測試相同的URL排除R:

curl -Lv http://www.atelco.de/1546/Bügeln.search 

這看起來像一個服務器端的配置問題。他們正在運行不斷重定向到相同的URL一些定製的Tomcat/Java Web應用程序:

* Connected to www.atelco.de (81.7.220.137) port 80 (#0) 
> GET /1546/Bügeln.search HTTP/1.1 
> Host: www.atelco.de 
> User-Agent: curl/7.43.0 
> Accept: */* 
> 
< HTTP/1.1 302 Moved Temporarily 
< Server: Apache-Coyote/1.1 
< Set-Cookie: JSESSIONID=46E977E738A6DBC8BD0EB8084912163F.www1; Domain=.atelco.de; Path=/ 
< Location: http://www.atelco.de/1546/Bügeln.search 
< Content-Length: 0 
< Date: Wed, 16 Dec 2015 12:17:43 GMT 

當你發現你自己,你可以通過逃避URL解決該問題,但是這不應該被時下需要。

+0

謝謝。 「現在不應該需要」是什麼意思?底線這是一個捲毛蟲? – Rentrop

+0

不,這是一個服務器錯誤。它適用於bosch-home.com服務器,對嗎? – Jeroen

+0

嗨Jeroen,這是我的理解。但由於我沒有自己的網頁,我無法解決這個問題。所以對我來說,抓取網頁,錯誤是'httr :: GET'或'curl'掛起,並且不會拋出我可以捕獲的錯誤。所以我的問題是我如何獲得'httr'來報告服務器錯誤? – Rentrop

相關問題