我正在做類似的事情,用戶將輸入任何URL並獲取文本。從URL中統計出每個單詞的每一次出現的有效方法
然後文本將被解析,單詞將被計數。
我目前正在讀這篇文章從微軟: https://msdn.microsoft.com/en-us/library/bb546166.aspx
我現在可以得到的文本,目前我想嘗試的一種有效的方法來計算每字。
該文章示例需要搜索數據,但我需要搜索每個單詞而不是特定的單詞。
這裏是我的想法:
- 獲取文本,並將其轉換爲字符串
- 將它們分割(分隔符),並存儲在陣列遍歷數組
- 然後檢查它的每一個事件。
這會有效嗎?
OOO好嗎謝謝 –
乘坐看RegEx。這可以在一次調用中搜索整個頁面。 –
爲什麼*效率*更重要?你每秒做數十億次? –