1
我在Octave/Matlab中創建MinHash和LSH。但我試圖從一個給定的文檔中得到一個k個大小的集合(單元數組或數組),我不知道該怎麼做。從文本文件(八度)創建一組帶狀皰疹
我現在所擁有的就是這個簡單的代碼:
doc = fopen(document);
i = 1;
while (! feof(doc))
txt{i} = strread(fgetl(doc), '%s');
i++;
endwhile
fclose(doc);
這一切從文件的每一行,這是一個說法,我想要做的功能的話創建一個單元陣列。
而且什麼問題或問題? – Andy
問題是創建一個MinHash和局部敏感散列來查找類似的項目(使用Jaccard相似性),並且爲此我需要從文檔創建一組帶有參數的帶狀皰疹。我想返回一個帶有k大小的瓦片的集合,例如5個瓦片意味着每個單元格將有5個單詞。 – nkt09
請解釋在這種情況下術語帶狀皰疹的含義。一個特定的輸入/輸出例子會有所幫助。 –