我想讀入熊貓文本文件,但它爲所有行創建所有NaN。我嘗試使用分隔符來分隔由\分隔的變量,但這不能正常工作。下面是數據文件看起來像在文本文件中使用熊貓閱讀txt文件使用分隔符創建NaNs列
數據:
Date Name Group Direction
2015-01-01 Smith.John - In
2015-01-01 Smith.Jan Claims Out
2015-01-01 - Claims In
2015-01-01 Smith.Jessica Other In
這是我第一次在數據讀取嘗試:
pd.read_csv('C:\Users\Desktop\skills.txt',
names=['Date','AgentName','Group','Direction'])
然而,這產生
Date AgentID AssignedWorkGroup CallDirection
0 Date\tAgentID\tAssignedWorkGroup\tCallDire... NaN NaN NaN
1 2015-09-01\Smith.John\t-\tIn NaN NaN NaN
所以我試着擺脫了\做:
pd.read_csv('C:\Users\Desktop\skills.txt',
names=['Date','AgentName','Group','Direction'],delimiter='\\')
但是,這仍然產生相同的結果。所以有幾件事情。一個是我無法打破'\'。此外,看起來像讀取的第一行是標題。我嘗試使用header = None來擺脫它們,但是這對我來說也不是很好。還可以看出他們是(我假設的文本?)是發生在每一個變量
前我感覺好像我處理這個錯誤
你指定的列名,但是這會混淆分析器,因爲它是解釋第一行數據,也看起來你有製表符分隔值。試試這個:'pd.read_csv('C:\ Users \ Desktop \ skills.txt', names = ['Date','AgentName','Group','Direction'],skiprows = 1,sep ='\ T')' – EdChum