2015-05-19 65 views
-4

的聯繫是https://instagram.com/p/Tud_psln-Yrn什麼是正確的正則表達式該字符串

我不能提取下劃線_或減號 - 。

下劃線可能也可能不在鏈接的最後部分以及負號。他們也可能在鏈接的最後部分。

Dim rgxPhoto As New Regex("instagram.com/p\w*\d*\D*/>") 
Dim mchPhoto As Match = rgxPhoto.Match(strPageContent) 

Do While mchPhoto.Success 
    intPhotoCount += 1 
    mchPhoto = mchPhoto.NextMatch 
Loop 

基本上,正則表達式應該從鏈接的最後部分提取_and /或 - 。它現在提取542個URL,但實際用戶的照片數量是564.這是因爲這些網址中有_和 - 。

感謝您的任何建議。

+2

正確的正則表達式來處理字符串? – Guffa

+0

我從instagram中提取照片。 – user3646458

+1

@ user3646458你不清楚。你的預期產出是多少?提取_和 - 意味着你的輸出將是_和 - 。你想要什麼,具有/不具有這些特徵的URL?或刪除了字符的網址? – Molx

回答

1

要匹配在URL中的最後一個字,用 「([\w\-]+)\/*$

要匹配完整的URL,用 「^https:\/\/instagram\.com\/p\/[\w\-]+\/*$

編輯:要在你的代碼行:

Dim rgxPhoto As New Regex("instagram.com/p/[\w\-]*/>") 
+0

感謝您的回覆,但該正則表達式無效。 – user3646458

+1

請注意' - '前的反斜線。你是什​​麼意思,它不起作用?你能顯示你的代碼嗎? –

+0

Dim rgxPhoto As New Regex(「https://instagram.com/p/\w*\d*\D*/>」) Dim mchPhoto As Match = rgxPhoto.Match(strPageContent) 雖然mchPhoto.Success intPhotoCount + = 1 mchPhoto = mchPhoto.NextMatch Loop – user3646458

0

您可以在「 - 」和「_」中找到「/[-_]/g」,然後將其替換爲無。

相關問題