我有困難來了一個簡單的解決方案,以一個漂亮的簡單的數據幀與從文本在下面的格式轉換工作數據:在文本文件中數據幀
Dose [Gy] Relative dose [%] Structure Volume [cm³]
0 0 45888.7
0.1 0.166667 27061.7
0.2 0.333333 18911.6
0.3 0.5 14907.6
0.4 0.666667 12602.7
0.5 0.833333 11127.8
0.6 1 10041.9
0.7 1.16667 9184.75
0.8 1.33333 8480.96
0.9 1.5 7885.19
1 1.66667 7382.82
1.1 1.83333 6947.77
1.2 2 6570.69
1.3 2.16667 6242.93
1.4 2.33333 5959.37
1.5 2.5 5713.12
1.6 2.66667 5497.12
1.7 2.83333 5305.86
1.8 3 5135.8
1.9 3.16667 4983.65
2 3.33333 4846.38
2.1 3.5 4720.5
2.2 3.66667 4604.54
2.3 3.83333 4496.7
2.4 4 4396.11
2.5 4.16667 4303.21
我在做什麼是直接索引每一行上的值,如:
for line in lines:
value1 = line[10:20]
value3 = line[55:70]
但是,它不是很pythonic,而且根本不健壯。
現在我正試圖讓熊貓做繁重的工作,並努力讓數據正確地出來。例如:
df = pd.read_csv(StringIO.StringIO(data), sep=" ",engine='python')
它輸出的東西仍然包含新行「\ n」和「'」以及數字。
有沒有更聰明的方法來解決這個問題?還是在大熊貓可以使用它之前需要做大量的預處理?
感謝您的任何幫助/建議!
你能後的原始文本文件原樣,並不像你這樣做,因爲這混淆的事情,感謝 – EdChum
完成的列表,希望那是你意思? – Ciaran