假設我們有一個.doc &.docx文件。我想在PHP中使用LiveDocx來加載文件,讀取它的內容並從文件中剝離文本。然後將其保存爲HTML字符串。如何使用PHP中的LiveDocx來讀取.doc&.docx文件並讀取其中的文本並保存爲HTML?
可以這樣做嗎?
我搜索了文檔,並且它接近LiveDocx只加載.doc & .docx模板文件!
假設我們有一個.doc &.docx文件。我想在PHP中使用LiveDocx來加載文件,讀取它的內容並從文件中剝離文本。然後將其保存爲HTML字符串。如何使用PHP中的LiveDocx來讀取.doc&.docx文件並讀取其中的文本並保存爲HTML?
可以這樣做嗎?
我搜索了文檔,並且它接近LiveDocx只加載.doc & .docx模板文件!
我想你可以在this example找到你需要的。
我可能是錯的,但我認爲他們稱之爲「模板」文件,因爲它們的行爲就像一個模板,但仍然是正常的.doc/.docx文件。我建議你只是試着運行這個例子。
我認爲你可以使用TextControl改善phpLiveDocx TextControl link
使用這個,你還可以導入PDF文檔和DOCX
可以節省使用外部庫,只是抓住從文件中的XML文本: http://www.webcheatsheet.com/PHP/reading_the_clean_text_from_docx_odt.php
當您在LiveDocX上進行文檔轉換時,您需要執行mailmerge然後檢索文檔。即使您沒有插入任何新內容,您仍需要使用虛擬內容替換虛擬佔位符的郵件合併。
所以,這個過程中我會建議是:
1)設置你的源文件爲本地模板
2)合併一個虛擬場與虛擬內容
3)檢索您的文檔作爲HTML
4 )使用腳本服務器端刪除html並僅保留內容(類似於,刪除HEAD標記之間的所有內容,然後刪除其餘部分中的所有內容) 5)您應該將內容保留爲簡單字符串 - 我是不確定它會太有意義,但可能對構建搜索索引等有用。
其他plattform呢?我的意思是你可能會發現其他具有比LiveDocx更多功能的平臺。 – Kevin 2011-04-12 12:10:56