1
object NGram{
def main(args: Array[String]) {
//args(0) = textfile //args(1) = size of n-grams //args(2) = the number of words to generate
val F = scala.io.Source.fromFile(args(0)) // take from args[0]
for (line <- F.getLines()){
val words = line.split("[ ,:;.?!-]+") map (_.toLowerCase)
var ngram : Set[String] = Set()
//make n-gram
for(i <- 0 to words.size - args(1)) {
// first make sequence by args(1)
for(j <- i until i + args(1)){
ngram = ngram + words(j) // not works it is my problem stage
}
}
}
}
}
我用scala製作n-gram算法。起初如何通過在scala中映射來創建字符串序列?
- 使字符串序列,並檢查它是在原始字符串。
- 它是有效的工作。
我想ň串序列不重複(因爲它必須有效地工作)
如何通過地圖從N串序列?