0
我試圖提取PDF文件的「內容」頁面(例如頁面2)作爲表格,並提出一個跟蹤項目與其對應起始頁碼的數據框。有人建議使用「Tabula」。我試了幾行,但似乎得到錯誤,無論是找不到read_pdf模塊或獲得一個空的數據框。感謝任何幫助,使其發揮作用?如何使用Tabula將PDF表格提取到數據框中
from tabula import wrapper
MYFILE = 'http://www.hkexnews.hk/listedco/listconews/SEHK/2017/0410/LTN201704101126_C.pdf'
df = wrapper.read_pdf(myfile)
@褲子:謝謝。現在有了一個不同的錯誤。 RuntimeError:'path'必須是None或列表,而不是。 –
sunytest
@sunytest我似乎無法重現該錯誤。我正在使用python 3.6和tabula-py 1.0.0。你在用什麼? – Pants