2015-07-02 181 views
0

我如何提取這是我的一個保存在一個文本文件中的一個在我的其他代碼中使用它鏈接: -從文本文件中提取的URL

在一個文本文件的鏈接的例子是: -

http://www.barneys.com/givenchy-poplin-field-shirt-504068255.html 

我在我的文本文件中只有網址,在一行中沒有多個網址。

而且在我所使用的鏈接(S)我的其他代碼是: -

import requests, re 
from bs4 import BeautifulSoup 
url=" " #here I have to use the links one by one 
r=requests.get(url) 
+2

你知道如何打開和讀取文件嗎?您從中獲取網址的事實**完全不相關**。 – jonrsharpe

+0

你的文本文件是什麼?是否只有網址或其他文字?在任何給定的行上是否可以有多個URL? – msturdy

+0

我沒跟着你。我需要做的是,將鏈接保存在文本文件中,然後在我的其他代碼中使用它們以逐個獲取該鏈接的相關詳細信息。 –

回答

1
with open(file_name) as f: 
    urls = f.readlines() 

urls = ([s.strip('\n') for s in urls ]) 


for url in urls: 
    # insert code here to do whatever you want with one url 

這是你想要的?這將讀取每行並將其存儲到此列表中。

編輯去除列表元素中的'\ n'字符

+0

我想在我的其他代碼中一一使用它! –

+1

好吧,你現在有一個列表的URL,所以列舉他們 – Dportology

+0

你需要'.strip()'來轉義'\ n' – LittleQ