我有一個Python列表組成的字符串包含屬性地址和每個屬性的多個屬性。列表與字典vs類與DataFrame在Python數據格式化
'Date of Sale', 'January 1, 2017', 'Phone Number', '111-344-2343', 'Color', 'Brown', 'Garage Size', '2', 'Date Listed', 'September 23, 2016', 'Loan From', 'Example Mortgage Services', 'Street Address', '751 Example Drive', 'City', 'Chicago', 'Number of Windows', 'Attorney', 'Shaping LLP', 'Township', 'Dundee', 'Zip Code', '99999', 'List Price', '$83,301.87', 'Bid Amount', '$110,199.00', 'Miscellaneous', 'Long Driveway', 'Date of Sale', ...
這是一個「入口」。該列表通過其餘屬性(每個以'銷售日期'開始)以相同的模式繼續,但如果字段留空,它們將被完全跳過。例如,如果沒有出價「出價金額」,則直接跟隨「雜項」,而不是金額。
目標是能夠輕鬆解析信息。例如,我想列出所有我沒有出價的物業。
的主要問題是什麼數據格式使用(class
,列表,字典,或數據幀):
class Property(object):
def __init__(self,dateOfSale,phoneNumber...):
self.dateOfSale = 'dateOfSale'
self.phoneNumber = 'phoneNumber'
...
,但我不確定我會怎麼利用這個來獲得對多個屬性信息。
OR
組合關於每個屬性的所有信息到一個list
項目。我不知道你如何看待這個信息。
OR
使用dictionary
被解決的關鍵,和所有其他信息的價值,儘管這似乎並不在任何容易重複。
OR
利用熊貓dataframe
。我將不得不做更多的研究,但似乎「電子表格」數據在這種格式下運作良好。
你的榜樣數據似乎有一個錯誤:沒有與''Number of Windows''鍵關聯的值。這很可能會破壞你對它的任何解析。 – Blckknght
感謝您的回覆@Blckknght我應該添加更好的評論。有些條目不包含與它們相關的值,即使有一個鍵。如果任何字段沒有答案(在本例中爲「windows」),則列表中的下一個項目將僅僅是下一個項目。最終,目標是能夠找到列表中沒有其中一個鍵的值的所有地址。 – Coby