我想知道是否有人可以指向我可以用來測試一些高性能字符串數據結構的隨機單詞的非常大的字典?我發現一些在〜2MB的範圍內......但是如果可能的話,我想要一些更大的。我猜測必須有一些可以使用的大型標準字符串數據集。謝謝!用於基準測試的隨機單詞的大型文本文件字典?
4
A
回答
4
上面的鏈接是在弱勢族羣的拼寫檢查文章中提到 - http://norvig.com/spell-correct.html
1
我建議採取通過材料一看可在TREC(文本檢索會議)。一些好的數據集可能會滿足您的要求。
相關問題
- 1. 用於測試的基本.emacs文件
- 2. 字典GUI中的隨機單詞
- 3. 字典單詞的隨機選擇
- 4. Java:使用隨機數字創建大型文本文件?
- 5. 生成基於字典的特定大小的文本文件(可讀)文件
- 6. 用於測試目的的大型樣本mbox文件
- 7. 使用多個字典更改文本文件中的單詞
- 8. Hadoop InputSplit適用於大型基於文本的文件
- 9. Python基於文本的隨機問題測驗
- 10. 如何用android中的隨機字母創建字典單詞?
- 11. 經典ASP隨機文字
- 12. 文本文件詞典Java
- 13. 如何從文本文件打印隨機單詞
- 14. Java - 從文本文件打印隨機單詞
- 15. 基於單詞創建字典
- 16. 隨機生成可變大小的測試文件
- 17. C++中的基本文件I/O用於字節塊的隨機讀寫
- 18. Python中基於文本的機制:類,字典或列表?
- 19. 牛津詞典的單詞表文件
- 20. 基於字典的文本分析與大致匹配
- 21. 表單漏洞測試的典型文本
- 22. Python 3.3配置文件 - 詞典充滿了隨機的東西
- 23. 創建csv文件詞典的字典
- 24. 隨機文本/ URL大名單 - Opi
- 25. 基於文本文件中使用蝙蝠腳本的單詞複製行
- 26. 測試基於持久性的文件
- 27. 從字符串數組文本文件中獲取一個隨機單詞
- 28. 創建文本字詞典
- 29. 可用於C的基準測試庫#
- 30. 用於測試性能的C++單元測試(合成基準測試)