word2vec

    0熱度

    1回答

    我是TensorFlow,word2vec和神經網絡的新手,我正在嘗試瞭解它們。我正在研究這個TensorFlow教程:https://www.tensorflow.org/tutorials/word2vec。我運行了這個教程中的word2vec_o​​ptimized.py代碼:https://github.com/tensorflow/models/blob/master/tutorials

    1熱度

    1回答

    我嘗試構建Char-RNN的Word-RNN等價物,網絡應該在句子中生成下一個單詞。 作爲輸入我使用預先訓練過的word2vec 100-dim向量,隱藏層大小爲200.我的主要問題是輸出層,它應該如何設計? 在char-rnn中,輸出它是具有字符概率分佈(softmax)的詞彙大小(唯一字符數)向量。所以產生下一個字符就是這個分佈的簡單抽樣。 但是當我的單詞詞彙量超過300k時使用word2ve

    0熱度

    1回答

    我有很多詞矢量的Word2Vec模型。我可以像這樣訪問一個單詞向量。 word_vectors = gensim.models.Word2Vec.load(wordspace_path) print(word_vectors['boy']) 輸出 [ -5.48055351e-01 1.08748421e-01 -3.50534245e-02 -9.02988110e-03...] 現在

    1熱度

    2回答

    我發現成功的權重主題爲增加這似乎是一句比較在我的情況下工作的詞矢量: query1 = vectorize_query("human cat interaction") query2 = vectorize_query("people and cats talk") query3 = vectorize_query("monks predicted frost") query4 = vect

    0熱度

    1回答

    我使用分佈式word2vec算法創建了詞向量。現在我有單詞和相應的向量。如何使用這些單詞和向量來構建gen​​sim word2vec模型?

    0熱度

    1回答

    我正在使用gensim library for word2vec。我想用與文本無關的例子來訓練模型,例如:「貓是棕色的,現在幾點?」 我所創建的輸入模型如下: [["The", "cat", "is", "brown"], ["What", "time", "is", "it"]],但我不知道該模型是否假設「棕色」,並在相同的情況下「是什麼」。 試圖在api中找到答案,但找不到它。

    4熱度

    4回答

    我很抱歉,我的天真,但我不明白爲什麼字符嵌入是神經網絡訓練過程(word2vec)的結果實際上是矢量。 嵌入是降維的過程,在訓練過程中,NN將字的1/0數組減少爲更小的數組,該過程沒有采用任何適用矢量算術的處理。 因此,我們得到的只是數組而不是矢量。爲什麼我應該將這些數組看作向量?儘管我們得到了矢量,爲什麼每個人都將它們描述爲來自原點(0,0)的矢量? 再次,如果我的問題看起來很愚蠢,我很抱歉。

    3熱度

    2回答

    我目前正在嘗試爲我的公司培訓word2vec模型。 爲此,我使用了https://github.com/tensorflow/models上的代碼,特別是https://github.com/tensorflow/models/blob/master/tutorials/embedding/word2vec.py。 我下載了德文維基百科轉儲並從中提取了文本信息。任務是用這些數據訓練一個模型。 我使

    1熱度

    1回答

    我正在學習使用TensorFlow教程的Word2Vec。我爲Word2Vec運行的代碼也來自TensorFlow教程:https://github.com/tensorflow/models/blob/master/tutorials/embedding/word2vec_optimized.py。當我運行15個紀元的代碼時,測試精度爲30%左右。當我跑100個紀元時,測試精度達到了39%左右。

    2熱度

    1回答

    我正在做一個項目,我需要跳過克模型的預先訓練好的矢量。我聽說還有一個名爲skip-n-gram模型的變體,它提供了更好的結果。 我在想我自己需要什麼來訓練模型?因爲我只是需要它們爲我的模型初始化嵌入層。 我已經搜索了足夠的,但沒有得到很好的例子。我需要你的建議。我在哪裏可以獲得這種預先訓練的模型,或者沒有預先訓練過的模型。