我有一個約6000萬行的文件。我正在嘗試編寫一個需要不斷查詢文件以查找名稱列表信息的腳本。文件中的每一行都包含一個名稱,後跟相關的信息。我試圖建立一個字典,但文件太大了。
我搜索了一堆論壇,並聽到許多人建議SQlite for python-我只是想知道,在我開始學習SQlite之前,有誰知道這是否對這個大小的文件有幫助? 謝謝使用大數據
Q
使用大數據
0
A
回答
0
你可以使用Linux Power工具。 Awk可以很輕鬆地完成你的工作。
假設你的文件看起來像這樣
name1 a b c
name2 e d r t
name3 x y
,你想找到名2信息。然後使用這個命令你可以找到
awk -F" " -v name=name2 '{if(name==$1){$1=""; print $0}}' filename
將只輸出這樣
e d r t
名2的信息,您可以通過多個名稱和管理邏輯
+0
謝謝我試試這個 – user2906979
+0
你可以在一個文件中編寫你的腳本並使用-f選項調用該文件。 awk -f script_filename input_filename –
相關問題
- 1. 使用大型數據庫/數據集
- 2. 使用大量數據
- 3. H2O使用大數據集大小
- 4. 使用Android應用大型數據庫
- 5. 使用c讀取excel的大數據#
- 6. 使用sparkR合併大數據集
- 7. 使用jquery獲取大量數據
- 8. 插入大量數據的使用Hibernate
- 9. 使用Node.js的大量數據加載
- 10. 使用JMSSerializerBundle導出大量數據
- 11. 使用來自mysql的大量數據
- 12. 對'大'數據使用'狀態'和REDX
- 13. 使用Java從MySql處理大數據
- 14. 傳輸使用Java的巨大數據
- 15. 使用bash處理大量數據
- 16. 使用大熊貓多級數據幀
- 17. 使用地圖來計算大數據
- 18. 使用AngularJS加載大型數據集
- 19. 數據庫使用率最大%
- 20. 使用Java EE處理大量數據
- 21. 使用大數據進行SVM建模
- 22. 使用Azure處理大量數據
- 23. 使用Microsoft SQL Server的大數據
- 24. 使用android包裝大型數據庫
- 25. 使用sparklyr進行大數據滾動
- 26. 使用python清理大數據
- 27. 使用webGL加載大數據
- 28. 使用Hadoop匹配大型數據集?
- 29. 將數據寫入使用大會
- 30. 使用Hive清理大數據
使用'numpy'從中獲取信息文件。 –
numpy可以存儲那麼多信息嗎? – user2906979
線條有多大?所需的內存量是行長度和記錄數量的函數。 –