human-language

0熱度

1回答

我已發現在某些句子雙字母組的使用frequecny： import nltk from nltk import ngrams mydata = 「xxxxx" mylist = mydata.split() mybigrams =list(ngrams(mylist, 2)) fd = nltk.FreqDist(mybigrams) print(fd.most_common())

1熱度

1回答

Can Cassandra能夠爲特定的人類語言對列進行排序嗎？

看起來，當它歸結爲在卡桑德拉表格排序連續列就像我們只能有四個不同的數據類型。四種類型的，我可以看到的是： BytesType，AsciiType，UTF8Type，IntegerType 然而，要正確在給定的語言排序，一個使用strcoll()，這使得使用的語言環境，並結束了根據語言對某些字符在其他字符之前或之後進行排序。例如，在法國的語言，你有被整理如下的Ë字符口音： ...從E E E電子網