我對熊貓非常陌生。到目前爲止,我一直在使用csv文件和excel電子表格學習熊貓。pandas將undefined文本文件讀取到數據幀
現在我面臨着將文本文件轉換爲數據框。文本文件就是我所說的連續數據。該文件的格式是:
State Name
City Name
State Name
City Name
City Name
City Name
...
所有50個州加上美國領土被列出,但城市數量不盡相同。我需要將其轉換成數據幀像
[[State Name, City Name1],[State Name, City Name2],...]
使用大熊貓read_table()方法,我已經能夠至少文件讀入到一個數據幀,但現在我不能確定如何讓它進入正確的州名城市名稱格式。
我也有一個州名/州2字母縮寫可用字典。該詞典的格式是
{'OH':'OHIO', 'KY':'Kentucky',...}
有沒有一種方法,我可以使用這本字典,遍歷文件並分開州和城市?還是有更簡單的方法來完成這個?
謝謝
編輯 - 文本文件 文本文件的採樣樣本如下所示。另外,請不要說我無法修改文件。
Alabama[edit]
Auburn (Auburn University)[1]
Florence (University of North Alabama)
Jacksonville (Jacksonville State University)[2]
Livingston (University of West Alabama)[2]
Montevallo (University of Montevallo)[2]
Troy (Troy University)[2]
Tuscaloosa (University of Alabama, Stillman College, Shelton State)[3][4]
Tuskegee (Tuskegee University)[5]
Alaska[edit]
Fairbanks (University of Alaska Fairbanks)[2]
Arizona[edit]
Flagstaff (Northern Arizona University)[6]
Tempe (Arizona State University)
Tucson (University of Arizona)
@han 。如果有的話,你引用的問題應該被標記爲重複。這個問題在那之前被問及並得到了答覆。只是說 –