我試圖解析一個URI中有括號 - [和] - 在其中。我試圖用URI.parse直接解析這個,但括號會導致失敗。因此,我嘗試使用CGI :: escape編碼URI來處理括號,但是當我嘗試使用URI.parse解析這個編碼的URI時,它似乎無法將其識別爲URI並將整個URI放入路徑中目的。如何解析Ruby中的編碼URI?
在irb會話中演示;
irb(main):001:0> require 'uri'
=> true
irb(main):002:0> require 'cgi'
=> true
irb(main):003:0> name = "http://www.website.com/dir1/dir[2]/file.txt"
=> "http://www.website.com/dir1/dir[2]/file.txt"
irb(main):004:0> encoded_name = CGI::escape(name)
=> "http%3A%2F%2Fwww.website.com%2Fdir1%2Fdir%5B2%5D%2Ffile.txt"
irb(main):005:0> parsed_name = URI.parse(encoded_name)
=> #<URI::Generic:0x00000001e8f520 URL:http%3A%2F%2Fwww.website.com%2Fdir1%2Fdir%5B2%5D%2Ffile.txt>
irb(main):006:0> parsed_name.scheme
=> nil
irb(main):007:0> parsed_name.host
=> nil
irb(main):008:0> parsed_name.path
=> "http%3A%2F%2Fwww.website.com%2Fdir1%2Fdir%5B2%5D%2Ffile.txt"
irb(main):009:0> URI.split(encoded_name)
=> [nil, nil, nil, nil, nil, "http%3A%2F%2Fwww.website.com%2Fdir1%2Fdir%5B2%5D%2Ffile.txt", nil, nil, nil]
不管怎樣,我的工作圍繞此刻以下難看,但有效的,黑客
encoded_name = name.gsub(/\[/,"%5B").gsub(/\]/,"%5D")
與URI.parse解析這將產生期望的結果,但如果其他奇怪的字符將不迭找到他們的方式到我的URI。所以我的問題是,是否有堅實的方法來做到這一點不會倒下?
你想從那個URI準確得到什麼? – khelll 2009-11-23 11:58:17
我想將它分成主機名和路徑名。 – brad 2009-11-23 22:17:50