我需要一個與Twitter用戶名匹配的正則表達式。爲Twitter用戶名廢棄HTML
所以我想抓取頁面的HTML來獲取所有有效的Twitter用戶名。 因此,不應該返回電子郵件,也無效的用戶名,因爲我知道有一些字符不允許在Twitter用戶名。
如果提供C#示例,則爲獎勵。
編輯:
我直到現在是:
Regex regex = new Regex(@"/(?<=^|(?<=[^a-zA-Z0-9-_\.]))@([A-Za-z]+[A-Za-z0-9]+)/i");
string html = GetPageHtml(uri);
Match match = regex.Match(html);
我檢查這一點,但它不工作的罰款。此外,我得到的信息,嘰嘰喳喳庫有功能,但我找不到它。
我並不真正熟悉的正則表達式
你嘗試過什麼嗎?我們不是爲了免費服務。我可能會利用[Html Agility Pack](https://htmlagilitypack.codeplex.com/),解析出文本內容,並與該數據進行匹配,而不是拼湊HTML內容。 – hwnd
你檢查了這個答案嗎? http://stackoverflow.com/a/5768768/1400768根據作者,它來自Twitter的圖書館 – nhahtdh