2015-04-30 43 views
-4

我在Excel工作表中有大量的公司名稱。我需要寫一個Python腳本來提取:在python腳本中使用關鍵字獲取網站地址

  1. 公司網站的名稱,
  2. 電子郵件ID和
  3. 電話號碼

能否請您提供指導?

+0

本網站通常面向更具體的問題。這是一個非常廣泛的問題。你能否至少提供你的數據樣本? –

+0

歡迎來到StackOverflow。爲了獲得幫助,你需要顯示你的輸入是什麼樣的,你的期望輸出是什麼,以及你迄今爲止做了什麼。 –

+0

很抱歉,如果沒有更多信息,它太難以幫助您。請讓我們知道您的輸入是什麼樣的,以及您的預期輸出是什麼。同時嘗試完善並專注於你所擁有的問題,最具體的你是我們能夠幫助你的更多。 –

回答

0

這將幫助你得到你的Excel數據導入的Python:

http://www.python-excel.org/

例子:

from openpyxl import Workbook 
wb = Workbook() 

# grab the active worksheet 
ws = wb.active 

# Data can be directly to cells 
ws['A1'] = 42 

# Rows can also be appended 
ws.append([1, 2, 3]) 

# Python types will automatically be converted 
import datetime 
ws['A2'] = datetime.datetime.now() 

# Save the file 
wb.save("sample.xlsx") 

嘗試使用此方法返回根據您的關鍵字通過利用谷歌的URL:

from google import search 
for url in search('put your search query here', stop=15): 
    print(url) 

您可以使用限制網址的數量任何你想要的號碼。

或者,捕捉到你需要的所有數據,你可以嘗試使用類似cURLlxml,或其他「刮痧」的工具和刮網站,例如Crunchbase通常編目以結構化的格式信息。您可以通過編程將您的Excel文件中的關鍵字傳遞到準備好的Crunchbase URL中。這也可能適用於像yellowpages.com或whitepages.com這樣的網站。