這裏是字符串:爲什麼我不能按空間分割?
u'\u041a\u0440\u0430\u0441\u0438\u043b\u044c\u043d\u0438\u043a\u043e\u0432 \u0421\u0435\u0440\u0433\u0435\u0439 \u0410\u043b\u0435\u043a\u0441\u0430\u043d\u0434\u0440\u043e\u0432\u0438\u0447'
,如果我嘗試.split()
的是,這是行不通的 - 返回只是其中的一部分。這裏有什麼可能是錯的?
Upd。完整的代碼:
page = urllib.urlopen('http://www.rea.ru/Main.aspx?page=Krasil_nikov_Sergejj_Aleksandrovich')
soup = BeautifulSoup(page.read(), fromEncoding="utf-8")
full_name = soup.find('div', {'class': 'flagPageTitle'}).text.strip().split()
self.response.out.write(str(full_name) + '<br>')
請發佈可測試代碼。 – 2012-01-27 20:03:27
嗯爲我工作,也許你可以發佈更多的代碼? – 2012-01-27 20:03:44
我通過使用split()來獲得所有三個部分。請告訴我們你的代碼。 – taskinoor 2012-01-27 20:04:06