我想開發一個軟件,用戶在其中打開一個充滿數據的txt文件。
我想讀取數據,但我不知道如果txt文件是分隔符或固定字段,並且如果分隔字段分隔符(或;或/ etc)或行分隔符(CR + LF或CR或CF等)。
我知道如何讀取文件,如果我知道所有這些,但我能以自動方式找出這些特徵嗎? 感謝識別txt文件的特徵
0
A
回答
0
您可以讀取該文件,並做出一些猜測。
是否有CR/LF?
如果不是,它很可能是固定長度,誰將指定另一行分隔符。
如果是這樣,請閱讀所有行並單獨計算所有字符的數量。
是否有在每行上出現相同次數的字符? 如果是這樣,它可能是字段分隔符。 如果不是,它可能是固定長度的字段。
如果它是固定長度的字段,請使用統計信息構建一行。對於每個角色,所有行上的空白百分比和所有行上的非空白百分比是多少?查找索引從非常高的空白百分比跳到非常低的空白百分比的點,這可能是一個字段邊界(最後一個字段以空格結尾,因爲它不是「完整的」,下一個字段以非空白,因爲它是填充的。)
+0
我會嘗試它,讓你知道 – Nianios
1
相關問題
- 1. dLib和識別特徵的名稱
- 2. PE部分特徵的識別
- 3. 特徵值在人臉識別中通過特徵臉表示
- 4. 在RubyMine中,你如何識別Cucumber特徵文件?
- 5. 文本特徵標識符
- 6. 物體識別用SIFT特徵
- 7. 圖像處理手特徵識別
- 8. AS3臉部特徵識別庫
- 9. 識別多個面(特徵臉opencv)
- 10. 逐行讀取.txt文件,識別特定字符
- 11. 文件I/O Java程序無法識別src文件夾中的.txt文件
- 12. 如何修改scikit-learn的特徵臉識別示例
- 13. 用於識別2D特徵的圖像處理
- 14. 什麼是PCA特徵臉的識別率?
- 15. 如何正常化面部識別中的特徵臉?
- 16. Netlogo:識別超出線性特徵的所有修補程序
- 17. 用於圖像點識別的特徵矢量PCA
- 18. java如何識別txt文件中的行結尾
- 19. 識別文件
- 20. 識別文件
- 21. 編碼類別特徵
- 22. Griaule生物特徵識別DLL控制無法在64位O.S
- 23. 是否有云服務支持圖像特徵識別?
- 24. 如何根據瀏覽器特徵識別訪問者?
- 25. 解釋gprof輸出並識別該特徵函數
- 26. gcc - 無法識別的文件:文件格式不被識別
- 27. 特徵工程和特徵提取有什麼區別?
- 28. 識別.patch文件
- 29. 識別XPS文件
- 30. 如何從特徵文件中提取標籤/類別?
相當困難的任務,也是Microsoft要求您(用戶)指定如何在嘗試導入其某些應用程序時格式化文本文件 – Steve
如果您創建該文件,則您將知道如何閱讀.. – matzone
也許計算每行共同分隔符的數量,然後確定每行的分隔符計數是否與所有行相同* may *可以在一定程度上指示這一點。但是,由於數據和數據類型的複雜性(特別是在考慮像這樣的隨機文件時),最好限制接受的格式並確保用戶知道它。 –