0
二進制文件經常附加到美國證券交易委員會文件(see example here),我正在編寫一個解析器來捕獲此文本並重新創建該文件。什麼是在這裏使用的文件編碼方法?
如果文件是Excel電子表格或PDF(下面是示例並鏈接到該示例),則無關緊要,編碼方法看起來相同。它不是Base64;我不認識它。
是嗎? TIA。
<DOCUMENT>
<TYPE>LETTER
<SEQUENCE>1
<FILENAME>filename1.pdf
<TEXT>
<PDF>
begin 644 filename1.pdf
M)5!$1BTQ+C4-)>+CS],-"C,W(#`@;V)J#3P\+TQI;F5A<[email protected],2],(#$T
M-C0S,2]/(#,[email protected],[email protected],2]4(#$T-C$R,R]((%[email protected]#8X(#$V,ET^
M/@UE;F1O8FH-("`@("`@("`@("`@("`@#0HT-R`P(&]B:@T\/"]$96-O9&50
M87)M<SP\+T-O;'5M;G,@-2]0<F5D:6-T;W(@,3(^/B]&:6QT97(O1FQA=&5$
M96-O9&4O241;/#`T-#$S,4$Q.#`Q-D,X-#!!-S$X0S-%,T$X1D5$0S!!/CQ!
M,31&,S%#,T(Y-T(T-#0P.3)"-#<P148U,D8W0C,X13Y=+TEN9&5X6S,W(#,R
....
...<snip>...
....
M``$F1B;-S0Q,#`S,"2"2-PU$,O:!2(:C0-E_QTS!;`;&H4$R/0&1C`P``08`
M_(\&40T*96YD<W1R96%M#65N9&]B:@US=&%R='AR968-"[email protected]*)25%3T8-
!"C\_
`
end
</PDF>
</TEXT>
</DOCUMENT>