2017-08-10 70 views
0

Python PDFMiner package是否有很好的API定義?我在哪裏可以找到PDFMiner API定義?

例如我可以從源代碼看到LTText包含x0, y0, x1, y1和一些文本,並且有一個返回文本的get_text()方法 - 但是打算直接訪問x0 ...?

在這種情況下,爲什麼使用_text和get_text()來包裝文本?

回答

0

該項目沒有大量記錄,所以你必須自己弄清楚。然而,對主要類別和結構的基本解釋形式是some documentation

對於你的具體問題,LTText函數就像一個抽象基類。從LTText覆蓋的get_text方法繼承,做更復雜的東西,像LTTextContainer一些對象:

class LTTextContainer(LTExpandableContainer, LTText): 
    def __init__(self): 
     LTText.__init__(self) 
     LTExpandableContainer.__init__(self) 
     return 

    def get_text(self): 
     return ''.join(obj.get_text() for obj in self if isinstance(obj, LTText)) 

通常getter和setter方法包裝功能,可能是在子類中重寫或更新取決於輸入狀態很有用。例如,LTComponent.set_bbox更新了self.bbox之外的其他六個屬性。

相關問題