2015-01-08 41 views
0

我提取微博僅在英語語言編寫的,我用下面的過濾器錯誤而過濾英語鳴叫只有

stream.filter(stall_warnings=True, track=['#brain'], languages=['en']) 

但不幸的是這個過濾器返回鳴叫是英文的組合和其他一些語言

請參閱鳴謝here

如何提取僅以英文書寫的推文?

注意:如果連接別人的推文時出現錯誤,我很抱歉。

回答

0

推文以Twitter或其他語言分類。他們的分類並不總是正確的。如果推文使用多種語言,則只需將其分配給其中的一個。

因此,您需要在您的應用程序中對照字典或使用某些語言檢測庫對它們進行過濾,以100%確定只有英語用於您收到的推文。

來源:https://blog.twitter.com/2013/introducing-new-metadata-for-tweets