2015-10-19 226 views
1

下面是數據快照:轉換一個熊貓系列串

enter image description here

我想找到被包含的子頁面獲得的總要求「爲XXXXX」(假設)

每當我嘗試在PAGE_NAME變量進行任何字符串操作,顯示屬性爲float和我正在一個error.Here是錯誤: Error

我從一個CSV文件中得到的數據。它有600萬條記錄。它顯示的數據類型爲: 「語言」:對象, 「PAGE_NAME」:對象, 「請求」:Int64的

我試圖將其轉換爲字符串使用:english_data['page_name'].astype(basestring)

似乎不是正在工作。

+3

而是發佈數據幀的截圖總數,如果您直接複製並粘貼數據,其他人可以更容易地重現您的問題。另外,請更新拋出錯誤的代碼以及您收到的錯誤。 –

+0

它確實有助於發佈實際代碼而不是圖片。 – Leb

回答

2

您可以使用Seriesstr屬性以矢量化方式應用字符串方法。要查找的行與一些字符串'xxx''page_name'列,你可以做

df.page_name.str.contains('xxx') 

GET請求到該頁面,你可以這樣做

df.requests[df.page_name.str.contains('xxx')].sum()