我是哥倫比亞大學的研究助理,我一直在使用有關Campaign Lobbying的Open Secret大量數據。我最近遇到了一個數據問題,他們提供的.txt文件由於格式錯誤而無法正確轉換爲.csv文件。我已經解決了由額外逗號和括號引起的大部分錯誤,但是,一個錯誤仍然存在問題。在一個數據集(包含超過3百萬行數據)中,應該在單個行中的單個列中包含特定於問題的信息。但是,文本文件的排列方式使得這些文本中的某些文本被換行符分隔,從而導致某些信息應該出現在單個列中,並且已經在不同的行之間進行了分割。下面的附件是EmEditor中提供的一個示例。我想知道是否有一個程序或代碼,我可以通過運行,以便快速解決這些錯誤?它可以像查看每行的第一個字符的代碼行一樣簡單,並且如果它不是數字值,或者是字母或符號,則簡單地退格一次以便將信息放置在前一行上。我有很少的編碼經驗,任何幫助將不勝感激。將文本轉換爲CSV時出錯
0
A
回答
0
你可以使用正則表達式。
在查找和替換窗口中,選中「使用正則表達式」框。
在查找和替換文本框中使用下面的表達式。
查找:\n([^\d])
替換:\1
該搜索換行符後跟一個非數字字符出現的所有與只有非數字字符替換它,從而去除換行符。
相關問題
- 1. 將csv轉換爲文本
- 2. 將.xls文件轉換爲.csv文件時出錯
- 3. 將CSV文件轉換爲DataTable時出錯將.txt添加到csv文件名
- 4. 使用c將csv文件轉換爲html時出錯#
- 5. 將json轉換爲csv文件時出錯python
- 6. CSV-JSON轉換時出錯
- 7. 將文本文件轉換爲VCF格式時出錯
- 8. 嘗試在Python中將dbf轉換爲csv時出錯
- 9. 使用weka jar將csv轉換爲arff時出錯
- 10. 將csv股票數據轉換爲xts時出錯
- 11. 將XML轉換爲CSV時出現內存不足錯誤
- 12. 將json轉換爲csv時出現「List index not in range」錯誤?
- 13. 使用tm_map(...,tolower)將文本轉換爲小寫時出錯
- 14. 將文本轉換爲QR碼時出錯
- 15. 將Windows文本文件轉換爲Unix文本文件時出錯
- 16. 將MSQL導出日期時間整數轉換爲CSV文件
- 17. 文本CSV轉換
- 18. 在將.csv文件轉換爲XDocument時錯誤的編碼
- 19. 將純文本轉換爲XML(例如CSV轉換爲XML)的腳本
- 20. 將file.ui轉換爲file.py時出錯
- 21. 將mysql轉換爲sqlite時出錯
- 22. 將nvarchar轉換爲int時出錯
- 23. 將int轉換爲NSNumber時出錯
- 24. 將Java.io.File轉換爲org.core.resource.IFile時出錯?
- 25. 將JSONArray轉換爲JSONObject時出錯
- 26. 將nvarchar轉換爲datetime時出錯
- 27. 將ppt轉換爲PDF時出錯
- 28. 將映像轉換爲Base64時出錯
- 29. 將IplImage轉換爲Mat時出錯
- 30. 將Qimage轉換爲Mat時出錯opencv
@Nagraj非常感謝你的幫助。你的建議完全按照我的意願工作。行已成功合併,並刪除了多餘的行。 – user8126887