我想清理一些有趣的格式的數據。基本上,數據幀是這樣的:根據一個值的分組數據框
1 2 3
NaN | a | b |
|foo | bar |
|foo2 | bar2|
NaN | c | d |
|foo3 | bar3|
每一次我有一個楠塔1的時候,我想,以填補什麼,我都在列A和B的組合列,直到我遇到另一個的NaN 。最後我想擺脫那個包含NaN的行。
產生的數據幀將如下所示:
1 2 3
a_b |foo | bar |
a_b |foo2 | bar2|
c_d |foo3 | bar3|
我設法得到我想要通過解析字符串,但代碼是巨大的,我相信有一種更快的方式使用大熊貓做到這一點。
這是我在SO上的第一篇文章,如果我不清楚或者沒有遵循書寫標準,特別是如果標題不明確,我表示歉意。我會感謝任何評論,使我改進。
請告訴我們你有什麼到目前爲止已經試過。 – MrLeeh