我在Perl中使用LWP::Simple模塊。使用getstore
函數,我將給定URL的內容下載到文件中。有時URL的語言是非英文的,即使當我將URL加載到瀏覽器中時,我也看到了這個內容的英文翻譯。我如何每次獲得英文翻譯而不是原始內容? getstore
函數是否有任何選項可以執行此操作,或者是否有任何其他Perl函數可以執行此操作?如何讓Perl的LWP獲取英文版網頁?
0
A
回答
1
這是HTTP content negotiation的一部分。您需要使用LWP::UserAgent來指定具有該請求的適當標題。
-1
看來你是指的「網址」以及頁面上的實際「內容」。我認爲它更多的是你需要解決的方法。
如果一個URL是非英文的,如果它是一個有效的網址,它仍然指向相同的IP-ADDRESS。因此,只需編寫一個函數來檢測語言並將地址轉換爲其IP地址。
如果它關於網站的實際內容。您必須首先考慮問題網站如何存儲該網頁的不同版本。一種常見的方式是類似這樣的: .example.com的
在這種情況下
連接 .example.com的
ES .example.com的
,所有你需要做的是使用上述網址獲取正確的內容,如下所示:
my $c = "en.example.com"
但是,如果頁面沒有預先翻譯,可能會變得有點複雜。您需要使用在線翻譯器或其他東西來翻譯頁面。也許看看Google Translate API。
相關問題
- 1. 使用LWP獲取網頁內容
- 2. 如何僅使用LWP獲取網頁的開頭?
- 3. perl的獲得與LWP網頁錯誤:簡單
- 4. 如何使用Perl LWP通過歡迎頁面進行爬網?
- 5. 網站的英文和英文版
- 6. 使用Perl LWP
- 7. 用LWP和Perl登錄網站
- 8. 如何在不使用Perl和LWP獲取頁面的情況下獲得最終的URL?
- 9. 如何使用perl獲取網頁中的所有鏈接?
- 10. Perl的LWP:簡單的獲取URL字符串Varilable
- 11. 獲取當前版本的網頁
- 12. 獲取網頁的壓縮版本
- 13. XPATH - 如何從網頁獲取文本?
- 14. Perl的網頁抓取
- 15. 爲什麼我無法使用Perl的LWP :: Simple獲取www.google.com?
- 16. Perl獲取的圖像LWP未在Firefox或Chrome中顯示
- 17. perl保存lwp下載的文件
- 18. 如何使用Perl從JavaScript動態生成的網頁中獲取文本?
- 19. 如何獲取本網頁的網址
- 20. 如何使用Perl動態獲取網頁內容?
- 21. 如何獲取HTTPS網頁?
- 22. 如何獲取html網頁?
- 23. 如何使用Perl的LWP提取非標準的HTTP頭文件?
- 24. LWP :: Simple&LWP :: UserAgent不返回完整的網頁內容
- 25. 如何獲取英文IIS7管理器?
- 26. 獲取英文版本的本地化文本
- 27. 如何使用Javascript知道網頁是英文還是非英文的?
- 28. 如何讓eclipse perl項目使用特定的perl版本?
- 29. Perl網頁抓取框架
- 30. 如何讓LWP :: UserAgent顯示安裝Flash?