2010-03-24 131 views
0

我想使用webservice api上傳pdf文件。但是這個api不能用於pdf文件。它工作正常的文本文件。當我嘗試上傳PDF文件,它給錯誤 Client-SOAP-ERROR:編碼:字符串'%PDF-1.4%\ xc7 ...'不是一個有效的utf-8字符串如何將pdf轉換爲utf-8

所以我們可以將這個pdf文件轉換爲utf8字符串。 我使用PHP作爲腳本語言。

回答

1

一個PDF是一個二進制文件。這聽起來像你把它視爲純文本。

你確定你按照你應該的方式上傳了嗎?這聽起來像是將原始PDF文件放入您的SOAP請求中 - 如果出現這種情況,您似乎應該對Base64進行編碼。否則,你會遇到各種特殊的XML字符出現在文件中的麻煩,完全搞亂了文件。

換句話說,仔細檢查API並確保你不應該對文件做些什麼(提示:如果這個東西接受這樣的文件,你可以肯定你需要做 )。

0

聽起來像API只支持純文本。您需要更改API以支持其他文件格式。

...假設你不希望將PDF轉換爲純文本,這可能與東西可以做這樣pdftotext

+0

@David可以將PDF文件轉換爲utf-8字符串,因爲此api支持它。 – Apple 2010-03-24 07:52:23