我基本上想要的是在行標題下的PDF數據或簡化我所說的,我想從PDF文件創建一個數據庫。每個PDF由25 -40頁取決於選民的數量。 A page of pdf file I am talking about 我想從箱子中提取數據(或者不管你說什麼他們)到Access/EXCEL/SQL使各盒 名稱下名稱列 關係出現關係列等出現在其他數據下 但是我不知道應該學習哪種編程語言才能做到這一點。我嘗試過搜
我寫了Python代碼,從PDF文件中刪除所有的數據。這裏的問題是,一旦被刮掉,這些詞會失去語法。如何解決這些問題? 我附上了代碼。 from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.converter import TextConverter
from pdfminer.la