2016-09-05 63 views
2

我第一次使用BeautifulSoup:熊貓pd.DataFrame轉換成元組,而不是數據幀

mydivs = soup.findAll('div', {"class": "content"}) 

使得mydivs每個mydiv看起來像這樣的例子:

<div class="content">A number of hats by me <br/><br/>three now though ... </div> 

我再要存儲每個每個div中的文本塊作爲數據幀中的行。我想數據框看起來是這樣的:

index posts 
0  <div class="content">A number of <br/><br/>three ... </div> 
1  <div class="content">Stack ... <br/><br/>overflow ... </div> 
... 

這是我嘗試

A=[] 
indices=[] 
j=0 

for div in mydivs: 
    A.append(div) 
    indices.append(j) 
    j+=1 

DF = pd.DataFrame({'index': indices, "posts": A}) 

的代碼時,我然後打印出shape我得到

print DF.shape() 
TypeError: 'tuple' object is not callable 

不過,我想DF成爲數據幀,而不是tuple。我怎樣才能解決這個問題?

回答

3

形狀是DF的屬性。該屬性是tuple。你正試圖用()來調用它,這是拋出錯誤。如果你想要的形狀只是做DF.shape

print DF.shape 

print DF.shape()