2009-08-17 29 views
1

我正在編寫一種特殊的聊天/論壇軟件,需要模擬對話來源以用於屏幕截圖,演示和測試。對話模擬數據 - 從何處獲取或如何生成

他們不應該包含真實姓名或其他可能有害的信息,應該是100%正確的英語,並且應該至少在某種程度上相互關聯。

例子:

消息#1主題:你好,約翰,怎麼 約檸檬水品脫? Text:嗨 約翰,只是想檢查你是否有 下週某個晚上的免費晚上。我們 可能會出去喝點檸檬水。 你覺得呢?最好,蘇

消息#2文字:嗨蘇, 星期二怎麼樣。

等,但這些數百...

的是否有這樣的事情在線來源?我想過要刮自己的電子郵件和刪除名字,但這是很多工作。還想過把兩個聊天機器人相互對抗,但不知道從哪裏開始。任何線索?

回答

1

你想要:

  • 一個遊戲,分成(演講者,單詞)元組。它應該很簡單,可以使用Gutenberg的(f'rinstance)Macbeth和一些正則表達式將文本轉換爲這種格式。直接使用場景作爲聊天線程,或者...
  • 一個馬爾科夫鏈文本生成器,訓練每個角色的語音,這將給你一個無限量的數據來玩。
0

讓你的朋友和兄弟姐妹使用你的聊天軟件。

+0

最終我希望這樣做,但現在它是一個雞和雞蛋的問題。我需要這些數據來幫助我開發和測試軟件。 – 2009-08-17 20:53:40

1

您也可以下載現成的聊天機器人的一個腳本,並適應他們使用HTTP聊天界面,其中一個例子是Chatbot-Elisa的Perl模塊,甚至包括有兩個機器人說話的例子:

Sally: Do you think coming here will help you not to be sad? 
Harry: We were discussing you -- not me. 
Sally: Does someone else believe I -- not you? 
Harry: You're not really talking about me -- are you? 
Sally: Do you sometimes wish you were not really talking about you -- are me? 
Harry: Why do you think I -- are you? 
Sally: Oh, I? 
Harry: Do you say you for some special reason? 
Sally: You're not really talking about me -- are you? 
Harry: What makes you think I am not really talking about you -- are me? 

所以你只需要添加將它們粘合到你的聊天引擎上的代碼,並看看他們可以想出什麼:)(或者,如果你所看到的只是「內容」,那麼你可以使用「雙人遊戲機「example。

相關問題