2016-03-07 45 views
0

是否有任何java庫或正則表達式模式提取instagram媒體標題的hashtag和用戶提到?我知道Twitter的文字API,但它不能處理沒有空間標籤。提取hashtag和從instagram提起

+0

你應該從這裏開始'https:// www.instagram.com/developer'。如果它仍然不起作用,請發佈代碼來證明問題。 – SubOptimal

回答

0

這一個應該工作(^|\s)(#[a-z\d-]+)

無論如何,如果你使用的是Instagram的API,有結果的一部分,當你調用它,讓你所有的主題標籤(從here得到它):

["data"]=> 
    array(14) { 
    ["attribution"]=> 
    NULL 
    ["tags"]=> 
    array(3) { 
     [0]=> 
     string(13) "workingermany" 
     [1]=> 
     string(18) "trabajarenalemania" 
     [2]=> 
     string(10) "radeberger" 
    } 

如果在您的評論的要求,你需要韓國字符,只需將它們添加到正則表達式是這樣的:(^|\s)(#[a-z\p{Hangul}\d-]+) 你想,集合更多的字符,你應該添加,更字母像\p{Hiragana}\p{Katakana},或\p{Latin}

+0

它無法處理沒有空格標籤和韓國,中國,日本..語言。像「#你好#世界#안녕하세요」 – Seongju

+0

見編輯@Seongju – SpongePablo