我對Python很新,所以我想問你一些關於正確策略的建議。 我有一個固定的數據位置的文本文件,就像這樣。 它可以有超過10000行。最後,數據庫(SQL)表應該如下所示。 File & Tablepython不尋常的文本文件到數據庫:策略
重要的欄是nr。它定義了這一行中的數據類型。 012-(2->標題,3->文本6->數量和價格)。所以數據來自不同的行。
問題:
- 讀數據:由於總有超過4行 包含數據,對它們進行處理一行行,只要一個SQL 陳述完畢後,發送或:閱讀將所有行列入 列表的列表中,然後遍歷這些列表?或者:讀取 一個列表中的所有行並重復?
- 將數據轉換爲csv或json而不是準備sql語句,然後使用數據庫軟件導入到db會更好嗎? (或使用NoSQL數據庫)
我希望我明確了我的問題,如果不是,我會嘗試..... 每個建議都非常感謝。
你正在使用什麼類型的SQL平臺? (MSSQL,MySQL) –
@RichardBoyce:這應該是開放的,我個人使用MySQL(或MariaDB)。 NoSQL可以是MongoDB。 – nanuuq
您的複雜性大部分可能會在閱讀結束時出現。與其說是數據的解析,是因爲你需要在多行中跟蹤你的狀態 - 也就是說如何知道你什麼時候讀了你所需要的,並準備好將另一行插入到數據庫中。 db或csv並不重要。 json可能會有所幫助,但是它首先會產生它的複雜性,並在標題/文本部分處理任意文本。同意Cyb ...,剛開始。 –