我正在使用python和beautifulsoup刮表...我有一個相當不錯的句柄來獲取我需要的大部分信息。縮短了我正試圖抓取的內容。刮表和從鏈接獲取更多信息
<tr> <td><a href="/wiki/Joseph_Carter_Abbott" title="Joseph Carter Abbott">Joseph Carter Abbott</a></td> <td>1868–1872</td> <td>North Carolina</td> <td><a href="/wiki/Republican_Party_(United_States)" title="Republican Party (United States)">Republican</a></td>
</tr>
<tr> <td><a href="/wiki/James_Abdnor" title="James Abdnor">James Abdnor</a></td> <td>1981–1987</td> <td>South Dakota</td> <td><a href="/wiki/Republican_Party_(United_States)" title="Republican Party (United States)">Republican</a></td> </tr> <tr> <td><a href="/wiki/Hazel_Abel" title="Hazel Abel">Hazel Abel</a></td> <td>1954</td> <td>Nebraska</td> <td><a href="/wiki/Republican_Party_(United_States)" title="Republican Party (United States)">Republican</a></td>
</tr>
http://en.wikipedia.org/wiki/List_of_former_United_States_senators
我想名稱,描述,多年來,國家,黨。
說明是每個人頁面上的第一段文字。我知道如何獨立完成此任務,但我不知道如何將其與名稱,年份,州,黨整合,因爲我必須導航到不同的頁面。
哦,我需要將它寫入csv。
謝謝!
您必須編寫一些代碼才能讀取這兩個網頁並結合其中包含的信息。哦,並將其寫入CSV。 –