1
我是新來的Python和Pandas,並且正在通過UCI玩一個心臟疾病數據集。 https://archive.ics.uci.edu/ml/machine-learning-databases/heart-disease/hungarian.data重塑大熊貓數據框:每76個入口新行
每個人和303人有76個屬性,所以我想結束每個人作爲一個行和76列。我無法安排到一個數據幀,因爲數據似乎是呈現在行9。
我試過導入數據集到一個熊貓數據框使用空格或換行符作爲分隔符,但我仍無法阻止想要每8個值後,分割數據:
df = pd.read_table('https://archive.ics.uci.edu/ml/machine-learning-databases/heart-disease/hungarian.data', sep=' ')
DF 導致表是這樣的:
1254 0 40 1 1.1 0.1 0.2
-9.0 2 140.0 0.0 289 -9.0 -9.0 -9.0
0.0 -9 -9.0 0.0 12 16.0 84.0 0.0
0.0 0 0.0 0.0 150 18.0 -9.0 7.0
172.0 86 200.0 110.0 140 86.0 0.0 0.0
0.0 -9 26.0 20.0 -9 -9.0 -9.0 -9.0
我會很感激的任何建議,您可能對如何將其拆分後創建一個新行第76個價值。每個第76個值都是字符串'name',這表示一個人數據的結尾。謝謝!
這是可行的,但痛苦的數據幀rubikscubing。由於輸入文件不是那麼大,我會處理輸入字符串並替換\ n和名稱以獲得對齊的行以提供read_table – Boud