2013-01-05 108 views
0

我試圖用python2.7和beautifulsoup4刮網站。我使用的代碼在一臺機器上工作,另一方面,我得到了在這些字母之間添加了三個空格的「湯」。我得到類似如下(無論是在終端,如日食/ PyDev的。任何想法是什麼引起的?空白的刮結果(python)

   i f  ( w i n d o w . D o m L o a d e d ) 
      { 
       D o m L o a d e d . l o a d ( f u n c t i o n ( ) { b a n n e r S y n c ( ' t b ' ) ; } ) ; 

       d o c u m e n t . w r i t e ( ' d i v  i d = " d o m L o a d e d "  s t y l e = " d i s p l a y : n o n e " > \ / d i v > ' ) ; 
      } 
    / s c r i p t > 
     ! - -  S e r v e r :  P h o b o s ,  S e r v e r  t i m e :  0 , 0 9 2 7  s  ( C :  0 , 0 5 2 0 ;  Q :  7 ;  0 , 0 0 2 2 ;  E :  5 2 ;  0 , 0 3 1 1  s ,  M :  3 ;  0 , 0 0 1 1  s ,  A :  0 ;  0 , 0 0 0 0  s ) ,  M e m :  1 2 3 0 1  K B ,  E n g i n e s :  ( S )  p h o b o s  ( 5 2 )  - - > 
/ b o d y > 

/HTML >

+0

相關的代碼片段可以幫助你得到更好的答案。儘可能小,在準備你的例子時,你可能自己偶然發現了答案 – Nathan

+0

@Nathan認真地說,它不能顯示輸出中出現什麼問題,而不是顯示輸出的剪切。代碼顯然不是問題,也不是被刮掉的網站。正如文中明確提到的,它在另一臺機器上完美無缺。我已經將這些空格留在了剪輯中,因爲這些都是問題... –

回答

0

這很可能是兩臺機器都安裝了不同的HTML解析器庫,請如你所知,不同的解析器可能會有不同的解析結果,特別是那些格式不對的HTML

+0

Zeng謝謝。我確信我幾乎準確地在兩臺機器上覆制了環境,所以我沒有想到最明顯的。現在像魅力一樣工作。我不敢相信我在這個上花了這麼多時間:s。 –