0
我看過這個鏈接: http://www.lucidimagination.com/Community/Hear-from-the-Experts/Articles/Content-Extraction-Tika 我得到的是純文本,沒有Tika for Solr的任何風格來搜索。 是否有可能從Solr獲得文本樣式? 換句話說,我們需要在solr搜索後以原始樣式顯示文本。Solr Tika,文字與風格
我看過這個鏈接: http://www.lucidimagination.com/Community/Hear-from-the-Experts/Articles/Content-Extraction-Tika 我得到的是純文本,沒有Tika for Solr的任何風格來搜索。 是否有可能從Solr獲得文本樣式? 換句話說,我們需要在solr搜索後以原始樣式顯示文本。Solr Tika,文字與風格
如果你仔細想想,pdf中的「原創風格」是什麼?你想保留哪些「風格」的組成部分?
它不僅僅是字體和重量,它是筆畫,填充,角度,路徑,圖形,跟蹤,透明度,轉換等等。如果你有這些,你會如何在你的用戶界面/網頁上顯示它?
除了顯示原始PDF之外,您無法真正複製原始樣式。這就是人們通常如果想要原始格式的話。
否則,他們只是使用純文本。