2017-08-22 132 views
0

我正在用rasa-nlu構建聊天機器人。我閱讀了教程,並構建了一個簡單的機器人。但是,我需要大量的訓練數據來構建能夠預訂出租車的聊天機器人。所以我需要數據來構建一個特定的機器人。構建聊天機器人的對話數據

是否有預訂出租車的資料庫或語料庫? 或者有沒有辦法來生成這種數據集?

回答

3

這是來自Rasa創始人之一的博客文章,我認爲它有一些非常出色的建議。我想你會以錯誤的方式尋求預先建立的訓練集。自己開始,然後加上朋友等,直到你建立了一個最適合你的機器人的訓練集。

Put on your robot costume

除此之外拉沙文檔當rasa_nlu服務器運行這個improving model performance

下,它會跟蹤所有的 預測它是由它們保存到一個日誌文件。默認情況下,日誌 文件被放置在日誌/中。該目錄中的文件每行包含一個 json對象。您可以修復任何不正確的預測,並將它們添加到您的訓練集以改善解析器。

我想你會感到驚訝,只要你可以自己想出的訓練集可以得到多遠。

祝您找到語料庫,但希望這些鏈接和代碼片段都有幫助。這樣做的

+0

謝謝你把我在正確的方向 – jsphdnl

1

的一種方法,這是,頭部到LUIS.AI

使用Office 365的登錄,製作自己的出租車預訂應用程序,在意圖給予和話語象下面這樣:

enter image description here

enter image description here

現在培訓併發布模型後,下載如下所示的語料庫: enter image description here

現在,下載的語料後,它會是這個樣子: enter image description here

安裝RASA NLU,我的Windows 8.1我的機器上,這樣的步驟如下:

這些是配置RASA的步驟:

首次安裝: Anaconda 4.3.0用於安裝Python 3的64位Windows。6翻譯:https://repo.continuum.io/archive/Anaconda3-4.3.0-Windows-x86_64.exe

&

Python的工具爲Visual Studio 2015年:https://ptvs.azureedge.net/download/PTVS%202.2.6%20VS%202015.msi

接下來,在命令提示符下安裝順序以管理模式下面的軟件包:

  1. Spacy機器學習套餐:pip安裝-U spacy
  2. Spacy Englis^h語言模型:蟒蛇-m spacy下載連接
  3. Scikit套餐:PIP安裝-U scikit學習
  4. numpy的包數學計算:PIP安裝-U numpy的
  5. SciPy的包裝:PIP安裝-U SciPy的
  6. Sklearn軟件包意圖識別:PIP安裝-U sklearn-crfsuite
  7. NER小鴨的更好的實體識別與Spacy:PIP安裝-U小鴨
  8. RASA NLU:PIP安裝-U rasa_nlu == 0.10.4

成功安裝上述所有包後,做一個spaCy配置文件將由RASA閱讀,就像如下:

{ 
    "project": "Travel", 
    "pipeline": "spacy_sklearn", 
    "language": "en", 
    "num_threads": 1, 
    "max_training_processes": 1, 
    "path": "C:\\Users\\Kunal\\Desktop\\RASA\\models", 
    "response_log": "C:\\Users\\Kunal\\Desktop\\RASA\\log", 
    "config": "C:\\Users\\Kunal\\Desktop\\RASA\\config_spacy.json", 
    "log_level": "INFO", 
    "port": 5000, 
    "data": "C:\\Users\\Kunal\\Desktop\\RASA\\data\\FlightBotFinal.json", 
    "emulate": "luis", 
    "spacy_model_name": "en", 
    "token": null, 
    "cors_origins": ["*"], 
    "aws_endpoint_url": null 
    } 

下,作出這樣的目錄結構:

數據文件夾 - >將包含所有LUIS格式化語​​料庫

模式 - >將包含所有訓練的模型

日誌 - >將包含主動學習日誌和RASA框架日誌

像這樣,

enter image description here

現在,爲培訓和啓動RASA NLU服務器創建批處理文件腳本。

請通過記事本或Visual Studio代碼一個TrainRASA.bat和寫:

python -m rasa_nlu.train -c config_spacy.json 
pause 

現在,通過記事本或Visual Studio代碼進行StartRASA.bat和寫:

python -m rasa_nlu.server -c config_spacy.json 
pause 

現在通過點擊您剛剛創建的批處理文件腳本來訓練並啓動RASA Server。

現在,一切準備就緒,只火了鉻,併發出HTTP GET請求,你enpoint /解析

像:http://localhost:5000/parse?q= &項目=

你會得到對應於LUISResult類JSON響應Bot Framework C#的。

enter image description here

現在處理你想這樣做後執行業務邏輯。

或者,您可以看看RASA Core,它主要是爲此目的而構建的。

RASA Core, which uses machine learning to build dialogs instead of simple if-else statements.