我正在使用hpricot來讀取HTML。我遇到了分段錯誤錯誤,我搜索了一些,並且有人說升級到最新版本的Ruby。我使用rails 2.3.2和ruby 1.8.7。如何解決這個錯誤?hpricot中的分段錯誤
回答
那麼,根據你自己的問題,我會說「升級到最新版本的Ruby」。但是,我也遇到了hpricot segfaulting問題,這似乎與我使用線程有關。
這似乎是bug列表中的一個突出問題。我曾經歷過。我的理論與HTML結構或文件中的壞/損壞字符有關,但我沒有找到確切的地方。
這裏是鏈接到的問題:
如果你可以自由選擇你的HTML解析庫,打開它。 爲什麼Hpricot的創造者最近宣佈,現在應該更好地使用Nokogiri而不是HPricot。
你也可以看看HTTParty。
我有同樣的段錯誤問題,但可悲的是無法諮詢上面引用的問題,甚至通過谷歌緩存 - 從我一直在使用google搜索parse.rb segfaults必須做與編碼實體或ALT字符集(重音字符也許)
的sanitize方法LIB遇到了同樣的問題,在這裏發表猴補丁:一年前 http://github.com/rgrove/sanitize/blob/1e1dc9681de99e32dc166f591343dfa60fc1f648/lib/sanitize/monkeypatch/hpricot.rb
從記憶,因爲我最後一次使用它一下:
角度來說,Hpricot店屬性在一個固定大小的緩衝區中,一些框架會生成outrag在文檔屬性中存在很長的哈希。在解析之前可以設置一些靜態字段,以便設置此緩衝區的大小。
我記得它在網頁上的文檔中相當突出,儘管它現在已經消失了。
我試圖解析HTML頁面中有許多unicode字符和Hpricot不斷崩潰。最後,我使用sanitize中的猴子補丁,並將其放入我的rails應用程序的environment.rb中。目前還沒有一個單一的崩潰,因爲我加入這個補丁:
關於Ruby 1.8.5嘗試使用角度來說,Hpricot -v 0.6.161
爲我工作。
- 1. Hpricot錯誤分析URI中的特殊字符
- 2. 分段錯誤處理程序中的分段錯誤
- 3. BST中的分段錯誤錯誤
- 4. iOS中的分段錯誤錯誤
- 5. 結構中的分段錯誤錯誤
- 6. C中的分段錯誤
- 7. unicodedata.category中的分段錯誤
- 8. c中的分段錯誤
- 9. qt中的分段錯誤
- 10. X509_STORE_add_lookup()中的分段錯誤
- 11. boogle中的分段錯誤
- 12. C中的分段錯誤
- 13. getc中的分段錯誤
- 14. PHP中的分段錯誤?
- 15. _dl_runtime_resolve()中的分段錯誤
- 16. Z3中的分段錯誤
- 17. getc()中的分段錯誤
- 18. vkCmdBlitImage中的分段錯誤
- 19. g ++中的分段錯誤
- 20. AVIFileInit()中的分段錯誤
- 21. pthread_create中的分段錯誤
- 22. c中的分段錯誤
- 23. strtok中的分段錯誤
- 24. Linux中的分段錯誤
- 25. 分段錯誤
- 26. 分段錯誤
- 27. 分段錯誤
- 28. 分段錯誤
- 29. 分段錯誤()
- 30. 分段錯誤
但是我已經使用了幾乎最新版本的ruby。另外,我沒有在我的代碼中使用任何線程:( – user85748 2009-05-30 22:18:43
唉,沒有。Ruby的最新版本是1.9.1 – 2009-05-30 22:21:06
我的主機正在使用1.8.5 即使我在我的開發機器上升級到1.9.1,我也無法在生產環境中部署代碼 – user85748 2009-05-30 22:28:23