0
Python PDFMiner package
是否有很好的API
定義?我在哪裏可以找到PDFMiner API定義?
例如我可以從源代碼看到LTText包含x0, y0, x1, y1
和一些文本,並且有一個返回文本的get_text()
方法 - 但是打算直接訪問x0 ...?
在這種情況下,爲什麼使用_text和get_text()
來包裝文本?
Python PDFMiner package
是否有很好的API
定義?我在哪裏可以找到PDFMiner API定義?
例如我可以從源代碼看到LTText包含x0, y0, x1, y1
和一些文本,並且有一個返回文本的get_text()
方法 - 但是打算直接訪問x0 ...?
在這種情況下,爲什麼使用_text和get_text()
來包裝文本?
該項目沒有大量記錄,所以你必須自己弄清楚。然而,對主要類別和結構的基本解釋形式是some documentation。
對於你的具體問題,LTText
函數就像一個抽象基類。從LTText
覆蓋的get_text
方法繼承,做更復雜的東西,像LTTextContainer
一些對象:
class LTTextContainer(LTExpandableContainer, LTText):
def __init__(self):
LTText.__init__(self)
LTExpandableContainer.__init__(self)
return
def get_text(self):
return ''.join(obj.get_text() for obj in self if isinstance(obj, LTText))
通常getter和setter方法包裝功能,可能是在子類中重寫或更新取決於輸入狀態很有用。例如,LTComponent.set_bbox
更新了self.bbox
之外的其他六個屬性。