1
Q
提卡信息提取
A
回答
0
那麼你可以在tika中提取網頁。爲此,您可以使用apache-tika's
HTMLParser
。你會得到你需要的一切here
那麼你也可以使用AutoDetectParser
這將autodetect content type and extract content
。 AutoDetectParser
可以檢測任何種類的文件/ URL並將應用提取。
我可以知道如何使用Tika在網頁中以表格形式提取數字等信息嗎?
- > tika提取的內容就像是raw
文本。我不認爲你會以表格的形式得到它。
相關問題
- 1. 提取信息
- 2. 提取信息
- 3. 提取信息
- 4. 提取信息
- 5. 提取信息
- 6. Alexa JSON響應 - 提取卡信息
- 7. prolog - 提取信息
- 8. 提取json信息
- 9. 信息提取mac
- 10. Jython - 提取信息
- 11. bashscript提取信息
- 12. Maestro信用卡:從MSR轉儲(任何語言)提取信息
- 13. 從mongoDB中提取信息
- 14. 從xml中提取信息
- 15. 從html提取信息greasemonkey
- 16. DOMXpath查詢提取信息
- 17. SQL邏輯提取信息
- 18. 從dictionary.description中提取信息?
- 19. 從XML中提取信息
- 20. 從api中提取信息
- 21. 從array_count_values中提取信息
- 22. 食品信息提取
- 23. pyPdf從IndirectObject提取信息
- 24. 提取鍵/值信息
- 25. 使用XPath提取信息
- 26. 信息提取工具包
- 27. 從DTD中提取信息
- 28. 提取正確的信息
- 29. Abinitio圖提取信息
- 30. 提取各種信息
謝謝。我的問題是,我可以使用tika來提取來自youtube.com的評論,還是僅用於提取元數據? – user1586205 2012-08-16 17:53:14