2013-03-12 68 views
-2

我有一個變量(類型爲unicode),其中包含一些文本。我從另一個類型爲'bs4.element.Tag'的類型的變量(美麗的湯)取得了這段文字。在這種可變文本的如何在python(unicode類型)中逐行處理文本段落?

例子是:

1234單詞

1234 words1 words2

我試圖做的是通過操縱該行文本行,所以我修剪的每一行分爲兩部分:一部分包含前四個字符,即1234,另一部分僅包含文本。

問候

+0

http://docs.python.org/2/library/stdtypes.html – 2013-03-12 08:35:01

+0

@FallenAngel我已經把它在裏面<>和計算器刪除它。 – Honesta 2013-03-12 08:48:43

+0

@ZagorulkinDmitry爲什麼不給我www.google.com。我嘗試了第一次搜索,但找不到任何東西,這就是爲什麼我要問一個問題。 Jeez,我們是什麼社區。 – Honesta 2013-03-12 08:50:23

回答

0

您可能正在尋找類似方法「分裂()」或「分裂線()」(根據您的變量)。

這將是這樣的:

var.split() # if you want to split using the space 
    # or 
    var[:4] # if you are sure that you need the first 4 characters. 
+0

我已經試過這些方法,但沒有工作,因爲我的變量包含多行,我想修剪每一行。我也嘗試了splitline(),但顯示屬性錯誤:AttributeError:'unicode'對象沒有屬性'splitline' – Honesta 2013-03-12 08:56:06