question-answering

    -1熱度

    1回答

    我正在爲我的Final Year項目創建一個句子分類程序。根據預期的答案,我的目標是將問題分爲10類。我需要在矢量中表示問題,同時保持單詞的順序。 Conciser這個例子 我可以訂購匹薩 當在單詞或袋的袋i表示可以訂購匹薩 上述兩個句子具有相同的字向量特徵表示。是否有任何其他表示技術來表示問題。 那種分類器可以被告知單詞'i'在'can'之前,因此它們可以被區分。 請注意,這不是分類問題和句子的

    0熱度

    1回答

    我想構建一個問答系統,它只能回答是或否。 假設我有一個問題和一個文本文件。在文本文件中,有4-5個片段。有了這些片段,我可以回答這個問題。 所以,我想建立一個系統,得到一個問題,一個文本文件作爲輸入,並提取asnwer(是或否) 我怎麼能開始? 我的工具有: 的Python(NLTK) 序言 MySQL的(如果需要)

    -1熱度

    2回答

    我想導入太多的matlab文本文件。 129013個文件! 我使用以下代碼: for i=1:129013 k=importdata('filename.txt') eval(['A', num2str(i) , ' = ' ,k) ,';']); end whos 當然,不接受可變數目129013。 問題是代碼?以及定義了多少變量? 預先感謝您!

    0熱度

    1回答

    我嘗試了一些基本的東西,比如問題是以「who/what/..」開頭,但是有很多句子不是以疑問詞開始,而是要求像「新加坡酒店」這樣的答案。 我弄清楚了這樣一個邏輯,即那些沒有提供某些信息但在這個意義上不完整的句子只能屬於疑問類。有沒有這個主題的一些參考?

    0熱度

    1回答

    我的系統從一組句子中生成問題。根據句子的質量,可以爲單個句子生成多個問題。人類也被賦予相同的句子來產生問題。 例如: 句子:俄羅斯的首都是莫斯科。 ============#系統生成的問題#============= 問題1:俄羅斯的首都是什麼? 問題2:什麼是莫斯科? ============#人類產生的問題#============= 問題1:什麼是俄羅斯的首都? 問題2:什麼是莫斯科? 問題

    -2熱度

    1回答

    我正在考慮驗證我即將開設的課程網站中測試的免費答案的最佳方式。 我不想讓所有的單選按鈕格式的問題,所以我決定使用文本框的一些答案,因爲它感覺更自然的用戶。 現在的問題出現時,是時候驗證這樣的答案來產生分數。 我想到了以下方法 正則表達式 嘗試匹配特定的結構,一個正確的答案是很可能有,也可能只是某些單詞和得分問題,如果一定比例相似性被發現。 同行審議 讓其他用戶在某種獎勵的匯率其他同行的答案。 我會

    4熱度

    1回答

    最近我一直在閱讀NLP,到目前爲止,我已經得到了一個從句子拆分到POS標籤的各種工作原理的基本概念(非常) ,還有知識表示。 據我所知,有很多NLP庫(主要是Java或Python),並且已經找到了.NET實現(SharpNLP)。實際上它很棒。無需編寫任何自定義處理邏輯;只是使用他們的功能和瞧!用戶輸入是很好的分離和POS標記。 如果我的主要動機是建立一個問題回答系統(類似於聊天機器人),我不明

    2熱度

    1回答

    它是否存在從谷歌或維基百科或其他服務器提供簡短的答案給你的問題的版本? 我編碼類似的Siri助理,我希望能夠問他誰是美國總統,並得到如下:巴拉克奧巴馬(信心:0.8345)或類似 是那裏有提供這種答案的東西嗎?

    3熱度

    2回答

    我正在研究一個基本上是基於知識的問答系統的項目。我的系統從用戶處獲取查詢,從維基百科下載相關文檔,去除所有html標籤並提取純文本。在此之後,它將文檔標記爲句子,然後形成術語 - 文檔(TD)矩陣(查詢也作爲句子傳遞)。這個TD矩陣然後被轉發到pLSA(概率潛伏體系分析)算法。然後,最終計算文檔(語句)向量與查詢向量之間的餘弦相似度。基於與查詢向量的相似性,最相關的句子被顯示爲答案。 (在TD M

    0熱度

    1回答

    我試圖找出問題中的關鍵短語以及預期的答案類型。我使用斯坦福分析器來生成問題的分析樹。我需要遍歷這個分析樹,並根據一些啓發式在每個節點上做出選擇,不管它是否是關鍵短語。 如果只有我有權訪問斯坦福分析器中使用的完整CFG,我可以擴展啓發式以涵蓋可能出現在樹中的所有節點的子節點。 The Stanford Parser: A statistical parser