2
我試圖用大小爲50 MB的數據來訓練我的模型。 我只是想知道是否有規則/算法來確定算法的維度的大小。對於50 MB數據,word2vec算法向量的維數應該是多少
我試圖用大小爲50 MB的數據來訓練我的模型。 我只是想知道是否有規則/算法來確定算法的維度的大小。對於50 MB數據,word2vec算法向量的維數應該是多少
我會假設50mb的文本文件爲500,000個句子或500萬個標記。 這對於培養有意義的嵌入來說太小了,但是這裏是您可以參考的經驗數據(在6億令牌上訓練)。