0
A
回答
1
Logstash無法讀取.docx,.xls或.pdf文件,因爲這些文件不是文本文件,它們是二進制文件,在解析它們的應用程序解釋後似乎很簡單。
Logstash是專門用來處理那些純文本,一個很好的測試,以確定是否可以通過Logstash輕鬆地讀取一個文件,如果你能在一個文本編輯器打開該文件,如昇華,記事本或文件原子並讀取內容,那麼Logstash也可以。
嘗試在記事本中打開一個.docx文件,這應該清楚。
+0
這是否意味着我只能通過elasticsearcfh –
+0
來做到這一點我只是仔細看着那個附件映射器工具,看起來好像可以做到,但Logstash肯定不能 –
相關問題
- 1. Logstash無法讀取文件
- 2. 正在讀取* .WAR文件
- 3. 正在讀取kml文件
- 4. Logstash輸入文件 - 從桌面文件讀取
- 5. 從文檔庫sharepoint讀取xsl文件
- 6. 在ubuntu中讀取複合文檔文件V2文檔(.msg)文件
- 7. 在.NET中讀取文檔
- 8. 讀取XML文檔
- 9. 如何正確讀取Apple iOS文檔?
- 10. BeautifulSoup沒有正確讀取文檔
- 11. VBA代碼讀取文檔文檔
- 12. 使用Logstash刪除文檔
- 13. 正在寫文件時正在讀取文件
- 14. 正在寫入文件時正在讀取文件
- 15. 用rvest讀取文檔正文的原始文本?
- 16. 從javascript文檔文件夾中讀取JSON文件
- 17. 正確讀取文本文件
- 18. Logstash讀取大量的靜態xml文件(輸入文件插件)
- 19. lib讀取java文檔
- 20. 從文檔中讀取plist
- 21. JAXB讀取XML文檔
- 22. 從xml文檔讀取值
- 23. 正在讀取文件的進度
- 24. Heroku App正在讀取database.yml文件
- 25. 正在讀取文件內容
- 26. 駱駝正在連續讀取文件
- 27. 正在更換文件時讀取
- 28. 正在讀取和寫入文件C++
- 29. 正在讀取二進制.SAVE文件?
- 30. 正在讀取android MANIFEST.MF文件
這個問題有點含糊。理論上你可以使用文件輸入讀取任何文件,然後使用適當的過濾器來解析它們。 – pandaadb
如何閱讀docx和pdf文件,因爲它們不是純文本文件。我只知道如何琢磨csv和txt文件的模式。 –
我相信你將無法做到這一點。 Logstash只是讀取文本並將其調整爲它。你可以定義一個編解碼器,或者你可以編寫自己的輸入,但我認爲這不會很好。我建議做一個預處理階段,在這個階段中,您編寫自定義代碼將文件轉換爲文本格式,然後將它們添加到logstash – pandaadb