空白的刮結果（python）

我試圖用python2.7和beautifulsoup4刮網站。我使用的代碼在一臺機器上工作，另一方面，我得到了在這些字母之間添加了三個空格的「湯」。我得到類似如下（無論是在終端，如日食/ PyDev的。任何想法是什麼引起的？空白的刮結果（python）

   i f  ( w i n d o w . D o m L o a d e d ) 
      { 
       D o m L o a d e d . l o a d ( f u n c t i o n ( ) { b a n n e r S y n c ( ' t b ' ) ; } ) ; 

       d o c u m e n t . w r i t e ( ' d i v  i d = " d o m L o a d e d "  s t y l e = " d i s p l a y : n o n e " &gt; \ / d i v &gt; ' ) ; 
      } 
    / s c r i p t &gt; 
     ! - -  S e r v e r :  P h o b o s ,  S e r v e r  t i m e :  0 , 0 9 2 7  s  ( C :  0 , 0 5 2 0 ;  Q :  7 ;  0 , 0 0 2 2 ;  E :  5 2 ;  0 , 0 3 1 1  s ,  M :  3 ;  0 , 0 0 1 1  s ,  A :  0 ;  0 , 0 0 0 0  s ) ,  M e m :  1 2 3 0 1  K B ,  E n g i n e s :  ( S )  p h o b o s  ( 5 2 )  - - &gt; 
/ b o d y &gt;

/HTML >

來源

2013-01-05 Iris Steenhout

相關的代碼片段可以幫助你得到更好的答案。儘可能小，在準備你的例子時，你可能自己偶然發現了答案 – Nathan

@Nathan認真地說，它不能顯示輸出中出現什麼問題，而不是顯示輸出的剪切。代碼顯然不是問題，也不是被刮掉的網站。正如文中明確提到的，它在另一臺機器上完美無缺。我已經將這些空格留在了剪輯中，因爲這些都是問題... –

這很可能是兩臺機器都安裝了不同的HTML解析器庫，請如你所知，不同的解析器可能會有不同的解析結果，特別是那些格式不對的HTML

來源

2013-01-05 00:46:00

Zeng謝謝。我確信我幾乎準確地在兩臺機器上覆制了環境，所以我沒有想到最明顯的。現在像魅力一樣工作。我不敢相信我在這個上花了這麼多時間：s。 –

空白的刮結果（python）

回答

相關問題