2009-07-17 44 views
1

我需要從該圖像與名稱類似這樣的相關聯的文檔分離出一堆圖片網址:正則表達式去掉圖像url?

bellpepper = "http://images.com/bellpepper.jpg" 
cabbage = "http://images.com/cabbage.jpg" 
lettuce = "http://images.com/lettuce.jpg" 
pumpkin = "http://images.com/pumpkin.jpg" 

我以爲我可以檢測一個鏈接的開始:

/http:[^ ,]+/i 

但是,我怎樣才能獲得從文檔分離的所有鏈接?

編輯:澄清問題:我只是想從文件中減去變量名,等號和雙引號的URL,所以我有一個新的文件,只是一個URL列表,每行一個。

+0

在從文檔刪除並把它們放在一個新的? – Victor 2009-07-17 00:13:02

+0

我想從文件中刪除除圖像URL之外的所有內容。 – boysenberry 2009-07-17 00:24:40

回答

1

嘗試......

(http://)([a-zA-Z0-9\/\\.])* 
1

如果格式是固定的,那麼這應該工作(蟒蛇):

import re 
s = """bellpepper = "http://images.com/bellpepper.jpg" (...) """ 
re.findall("\"(http://.+?)\"", s) 

注:這是不是「查找文件中的圖像」正則表達式,只是一個問題的答案:)

0

你的意思是說你在文檔中有這種格式,而你只想得到http部分?您可以在「=」分隔符只是分裂沒有正則表達式

$f = fopen("file","r"); 
if ($f){ 
    while(!feof($f)){ 
     $line = fgets($f,4096); 
     $s = explode(" = ",$line); 
     $s = preg_replace("/\"/","",$s); 
     print $s[1]; 
    } 
    fclose($f); 
} 

在命令行上:

#php5 myscript.php > newfile.ext 

,如果您使用的不是PHP等其他語言,也有類似的字符串分割方法可以使用。例如Python/Perl的split()。請閱讀您的文件,找出

0

你可以試試這個,如果你的工具支持正回顧後

/(?<=")[^"\n]+/