2013-06-20 68 views
-4

在excel表格中,有許多網站與其他數據一起存儲。網站URL分散在不同行的列單元格中,即使在某些單元格中,URL也與空間後的其他數據一起存儲。數據抽取技巧

A1:www.yahoo.com 
A2:www.gmail.net evening 
A3:www.google.sg morning 
A4:Night 
B1:www.yah.com www.goo.com 
B2:Sample 

假設所有的網站都帶有前綴或者www.com後綴是它可以只提取所有這些網站網址&商店,他們列出到一個新的電子表格或文本文件?

我試圖找到命令,它只能列出所有的URL,但它不能幫助提取這些URL。

+0

你想只得到URL轉換成片?您也許可以使用另一張僅填充公式的表格,然後您會在第一張表單中的單元格中獲取每個網址。讓我知道是否適合你,我會輸入答案。另外,是否有可能在一個單元中有多個URL? – Jerry

+0

另一張填充公式的表格也可以。我稍後可以合併或合併它們以在單個列/行中具有列表。 – jackopen

+0

是的,有多個URL也在單個單元格內的機會。 我能想到的一個選擇就像是在下,但不確定是否還有其他出路? = IF(SEARCH(「com」,A1)> 0,A1) – jackopen

回答

0

由於單元格中可以有多個鏈接,因此使用MS Word的正則表達式功能可能會更好。我建議的是:

  1. 複製你的excel表格並粘貼到MS Word中。
  2. 命中按Ctrl +˚F,點擊更多>>,勾選 「用戶通配符」。
  3. 在「查找內容」,放在www\.*\.com並單擊查找>主文檔
  4. 文檔中單擊一次,這樣你可以看到所有的高亮/選擇的網址。打按Ctrl +ç

然後,您可以將其粘貼無論你需要它,記事本,EXCEL,另一個工作文檔等

+0

這是一個非常酷的把戲。如果後綴不是重複的,例如某處「com」或「net」或「gov」等...... – jackopen

+0

@jackopen我似乎無法找到通常可用於通用正則表達式引擎的操作符,但我可以做的最多(後者更好,但要求網址後面有一個空格,或者要求使用'www \。* \。[comnetrg] {3}'或'www \。* \。[comnetrg] {3}一個標點符號)。 – Jerry