2011-04-03 59 views
0

所以我的代碼如何把一個字符串的某些部分到列表

op = urlopen('http://example.com/download_music/' + mus + '-1.html') 

ops = op.read() 
af = file('mus.txt', 'w') 
asv = file('mu.txt', 'w') 
af.write(str(ops)) 
if 'charset="utf-8">var playlist' in ops: 
    print 'yes' 
    cal = ops.split('charset="utf-8">var playlist',1) 
    del cal[0] 
    asv.write(str(cal)) 
    cv = str(cal) 
    cals = cv.split('},];</script><div',1) 
    del cals[1] 


cals = str(cals) 
v = cals.replace('{', ''' 

''') 


vn = v.replace('[','') 
vnm = vn.replace(']','') 

print vnm 

然後,我有作者,標題,歌曲的文件和ID的類型和我分隔每一首歌曲以\ ñ。

所以在每一個換行符後,我想把每個文本放入一個列表中。

此外,如果你看到我的代碼中的任何地方,我可以改善,請告訴我。

,我想單獨的字符串是:

'\'=

筆者: 「諾亞和鯨魚」,標題: 「Lifegoeson」,鍵入: 「穩健」,文件:「HTTP ://www.themusiciv.com/wp-content/uploads/2011/02/LIFEGOESON.mp3" ,ID: 「efca2792fc0dc9c076e5ef96c6b88d62」},

筆者: 「諾亞和鯨魚」,標題: 「Lifegoeson」鍵入:「sound」,file:「http://www.maestrobilly.com/SFTMCHN/natw_lgo.mp3",id:」8da985a2a5757f3e54c20341a01a2a3e「},

作者:「諾亞和鯨魚」,標題:「陌生人」,類型:「聲音」,文件:「http://www.tittletunes.com/wp-content/uploads/08%20Stranger.mp3",id: 「473f4056c8ca5afb61677b86cda7ce82」},

作者:「諾亞和鯨魚」,標題:「瑪麗」,類型:「聲音」,文件:「http://veradio.com/sounds/Noah%20And%20The%20Whale %20-%20Peaceful - %5b2008%5D%5bCD + SkidVid_XviD +冠狀病毒%5D/10%20%20Noah%20於是%第二十條%20Whale%20-%20Mary.mp3" ,ID: 「824ef3d3d87088cebc18205cf02187f3」},

作者:「諾亞和鯨魚」,標題:「Lifegoeson」,類型:「聲音」,文件:「http://www.directcurrentmusic.com/storage/mp3s-11/noah%20%20the%20whale%20 - %20l.ifegoeson.mp3「,id:」92765bf124a4575950293ac24181daed「},

作者:「諾亞和鯨魚」,標題:「Jocasta」,類型:「聲音」,文件:「http://veradio.com/sounds/Noah%20And%20The%20Whale%20-%20Peaceful-- %5b2008%5D%5bCD + SkidVid_XviD +冠狀病毒%5D/02%20%20Noah%20於是%第二十條%20Whale%20-%20Jocasta.mp3" ,ID: 「230b4eaea4bc076e4aa71e0722dfd294」},

作者:「諾亞和鯨魚「,標題:」分子中的原子「,類型:」聲音「,文件:」http://veradio.com/sounds/Noah%20And%20The%20Whale%20-%20Peaceful--%5b2008%5d% 5bCD + SkidVid_XviD +冠狀病毒%5D/01%20%20Noah%20於是%第二十條%20Whale%20-%202%20Atoms%20英寸%20A%20Molecule.mp3" ,ID: 「1b078ccba9a0cd060723a6aeb6f475f7」},

作者:「諾亞和鯨魚「,標題:」岩石和匕首「,類型:」聲音「,文件:」http://veradio.com/sounds/Noah%20And%20The%20Whale%20-%2 0Peaceful - %5b2008%5D%5bCD + SkidVid_XviD +冠狀病毒%5D/08%20%20Noah%20於是%第二十條%20Whale%20-%20Rocks%20於是%20Daggers.mp3" ,ID: 「3b8b6bb05150b29dadcd183cb6ff8f48」},

作者:「諾亞和鯨魚」,標題:「岩石和匕首」,類型:「聲音」,文件:「http://earitnow.com/uploads/mp3s/noahandthewhale/05-noah_and_the_whale-rocks_and_daggers.mp3」, ID: 「b67153c57290f324576ec0aca73e8f32」},

筆者: 「諾亞和鯨魚」,標題: 「瑪麗」,鍵入: 「穩健」,文件:「http://www.rcdc.it/audio/maps/Audio //諾亞和鯨 - 瑪麗。MP3" ,ID:‘6428201fca47fa66a902fc6779992e2e’'

+0

我認爲你試圖解析HTML您解析HTML與解析器,而不是由搜索和替換..? – Blender 2011-04-03 23:06:37

+1

如果不知道music.html文件是什麼樣子的話,這真的很難說。 – 2011-04-04 01:13:18

回答

0

快速黑客會像

# x is your string 
import re 
parsed = re.findall('author : "([^"]+)",title : "([^"]+)",type : "([^"]+)",file : "([^"]+)",id : "([^"]+)', x) 
print parsed 
相關問題