2017-01-25 73 views
1
使用分析器的時候

我有以下HTML解析器:錯誤類型在Python

from HTMLParser import HTMLParser 

class MLStripper(HTMLParser): 
    def __init__(self): 
     self.reset() 
     self.fed = [] 

    def handle_data(self, d): 
     self.fed.append(d) 

    def get_data(self): 
     return ''.join(self.fed) 

def strip_tags(html): 
    s = MLStripper() 
    s.feed(html) 
    return s.get_data() 

我想用這以下data.frame:

df = pd.DataFrame([['<br> test </br>', 1]], columns=('body', 'ticketID')) 

我的假設將是它會這樣工作:

for row in df.iterrows(): 
    input = row['body'] 
    print(strip_tags(input) 

但是,這給了我一個類型錯誤。任何想法,這出錯了?

+2

能否請您添加_whole_錯誤信息? – Lafexlos

+2

@Frits請更慷慨,使用4個空格作爲縮進。 1空間太低。 – MYGz

+0

包含輸入和輸出。 – MYGz

回答

1

從(Docs):

DataFrame.iterrows()

Iterate over DataFrame rows as (index, Series) pairs. 

所以,你得到的指數,與行一起。

工作代碼:

for index, row in df.iterrows(): 
    input = row['body'] 
    print(strip_tags(input))