在webspiders/crawlers中,我怎樣才能得到實際的初始用戶在HTML文檔中看到的字體的渲染大小,在記住CSS。如何獲取網頁上字體的大小?
0
A
回答
3
渲染文本大小? 用戶可以使用他/她的瀏覽器設置隨意更改文字大小。 更不用說不同的瀏覽器呈現相同的內容略有不同。
0
如果你滿意的答案是爲「默認」,爲了這個目的沒有用戶自定義視圖(這很可能),我相信你正在尋找一個相當痛苦的情景:
嵌入在您的蜘蛛中支持CSS 的渲染引擎。希望 使用與您的用戶的大多數 匹配的引擎,或者使用 所有三種通用引擎,並存儲 所有這些引擎的信息。您的消費技術在 嵌入方便程度差異很大。
將正在爬行的URI加載到 渲染引擎中。
使用引擎的API,查詢它的 字體規格包含你認爲 代表文本元素 (選擇這 爲此我甚至不會 開始預測策略的運動)。 如何訪問此操作完全取決於 您的 引擎的嵌入方案。
我希望這是'硬道路',但我不確定是否有'簡單'的方法。
相關問題
- 1. 如何獲取網頁中元素的文字字體大小
- 2. 在網頁上獲取圖像大小
- 3. 如何從CMFCPropertyFontProperty獲取字體大小
- 4. 如何獲取iText7上表單字段的字體大小?
- 5. 基於字體和字體大小的網頁抓取
- 6. 獲取字體大小
- 7. Java獲取字體大小
- 8. 如何獲取UILabel的字體大小和字體名稱?
- 9. 網頁的字體大小和行高
- 10. 獲取網頁的下載大小
- 11. CSS - 提高網頁字體大小
- 12. 網站上的不同字體大小
- 13. SVG - 獲取TextElement的字體大小
- 14. 獲取div的計算字體大小
- 15. 如何使用自定義字體大小獲取字符大小
- 16. ASP.net無法獲取字體大小
- 17. 獲取html元素字體大小
- 18. Ruby代碼獲取網頁的字節大小
- 19. 如何獲取頁面大小
- 20. 如何將字體大小綁定到變量網格大小
- 21. 如何獲取字符串的大小?
- 22. 如何在自定義UITableViewCell中獲取UILabel的字體大小?
- 23. 如何在Android中獲取文本視圖的字體大小
- 24. Java - 如何獲取JTextPane的默認字體大小
- 25. 如何獲取html標籤的字體大小
- 26. 如何獲取ace編輯器的當前字體大小?
- 27. 如何從瀏覽器中的字體大小獲取行高?
- 28. 如何獲取HTML中的字體大小
- 29. 如何從網頁大小
- 30. 如何獲取網頁上可見DOM元素的可視大小
將使用瀏覽器的默認大小,除非它設置在某處。通常CSS中的字體總是至少設置一次。爬蟲應該查看DOM層次結構來確定使用了哪種CSS設置,除非它被HTML本身的內聯CSS覆蓋。相當多的工作,但可能的。雖然將標題與普通文本分開以便更好地瞭解是什麼,但可能會更容易。 – Alec 2009-06-19 21:26:02