2013-07-06 74 views
0

我很熟悉,但與Python不完全是巨大的。如何在網上搜索網址和目錄蟒蛇

我想知道是否有方法/模塊在python,這將允許我搜索本地文件夾(和/或網站目錄)的文件,其名稱中有一定的模式(例如,所有文件開始與「w1020」)。

如果你有一個代碼,請你解釋一下各種模塊和他們的確切功能......或者離開這可以解釋的鏈接。

非常感謝。

回答

0

一般來說,你可以使用regular expressions找到匹配某種樣式的字符串,但對於示例應用程序,給這可能是有點過重。

對於您可以使用內置的字符串函數的本地文件夾:

for file_path in os.listdir(r"C:\temp"): 
    if file_path.startswith("w1020"): 
     print(file_path) 

對於一個網站,那你最好尋找一個預製的模塊。不過,this tutorial舉了幾個例子,你可以結合上面的代碼。

0

的本地目錄中的代碼將是相當簡單:

import os 

PATH = '/tmp' 

for f in os.listdir(PATH): 
    if os.path.isfile(f) and f.startswith('w1020'): 
     print f 

輸出例如:

w1020bob.doc 
w1020abc.test 

os模塊包含很多有用的功能操作文件和目錄。 os.listdir給出了目錄中所有文件的列表。我認爲其餘的代碼是不言自明的。

一個網站目錄是一個整體的其他球賽。它取決於網絡服務器,無論它們是否給你一個文件列表,並且這些文件將以html顯示,但是網絡服務器需要。所以你必須解析html來獲取它。 BeautifulSoup很不錯。

這也有可能是你在談論WebDAV在這種情況下,它很可能是最簡單的辦法,將其安裝作爲本地目錄,並使用上面的代碼。

+0

非常感謝你的幫助!可以請你解釋一下'/ tmp'是不是。 – user2555377

+0

'''/ tmp'''只是一個unix目錄。如果你在windows上,你可能會用'''r'C:\ Temp \''''。 '''r'''使它成爲一個原始字符串,所以你不必逃避所有的''''''。 – korylprince