2011-06-25 76 views
1

我在單個HTML文檔中有超過50頁的篇幅很長的文章。我想知道是否有算法可以將HTML文檔按頁面(A4大小的頁面)(如打印預覽功能)拆分爲每個頁面的較小文件,同時保持正確的格式。按頁面拆分大型HTML文檔

我使用.NET 4.0 C#

回答

0

這並不總是工作,但有時你可以打印的文檔爲PDF,拆分PDF成每頁一個PDF,並轉換這些PDF到HTML文件。但結果並不總是很好。

0

您可以使用HTMLDOC分裂成HTML頁面:

Here's a blogpost explaining the process

+0

它看起來像是通過標題拆分它,而不是通過將被打印的頁面。 – icktoofay

+0

不僅如此,HTMLDOC的鏈接似乎指向HTML操作軟件以外的其他東西。更像是一個幫助你的論文網站。 –

0

您是否嘗試過使用虛擬打印機,如CutePDF和打印文檔爲PDF?另外,根據我鏈接的網站,CutePDF有它自己的SDK。

+0

輸出必須是html。 – Alice

0

目前尚不清楚您爲什麼要這樣做,但只需在Microsoft Word中打開您的頁面即可。 Microsoft Word具有「打印佈局」,您可以在其中逐頁查看文檔。最終你將能夠編輯它,使其適合。