-3
有關文章URL列表,我需要刮掉文章的標題,作者,日期,出版物和正文。然後每篇文章需要出現在Word中,根據模板格式(粗體標題,斜體出版物,頂部帶有超鏈接的目錄等)。刮新聞文章數據並在Word中格式化結果
有關文章URL列表,我需要刮掉文章的標題,作者,日期,出版物和正文。然後每篇文章需要出現在Word中,根據模板格式(粗體標題,斜體出版物,頂部帶有超鏈接的目錄等)。刮新聞文章數據並在Word中格式化結果
我用一些這在過去,我會建議你兩件事情來清潔HTML代碼和獲取文本:
(請謹慎使用正則表達式,它可能會錯過一些數據,或者在某些情況下,某些字符串)
對於Word,我會建議這樣的:
PS:這只是一個簡單的簡歷。如果你只是使用SO搜索器,你會得到很多結果。
那麼你到目前爲止嘗試過什麼? – thefragileomen
你好。我們鼓勵海報向我們展示他們到目前爲止所嘗試的內容,部分原因是爲了鼓勵他們嘗試,部分原因是我們可以看到特別需要幫助的內容,並且阻止那些根本無法做出努力的海報。考慮到這一點,如果你可以編輯你有什麼,它將不勝感激。 – halfer