我們已經構建了一個系統,可以分析一些數據並以簡單英語輸出一些結果(即無圖表等)。目前的實施依賴於大量的模板和一些隨機化,以儘可能多的文本。自然語言生成 - 如何超越模板
我們希望切換到更高級的東西,希望生成的文本重複性更低,聽起來更少機器人。我在谷歌上搜索了很多,但我找不到具體的東西。有任何想法嗎?
編輯:提供給NLG機制的數據是JSON格式。這裏是一個關於網站分析數據的例子。 json文件可能包含一個度量指標(例如訪問量),它是最近X天的價值,是否預期最後一個值,以及哪個維度(例如國家或銷售渠道)影響其變化。
當前的實現可以給這樣的事情:
在英國總體訪問主要來自ABC的電子郵件廣告系列達到10K(+ 20%DOD)和預期值以上10%。用戶主要登陸XXX頁面,而各個設備的增長保持一致。
我們正在尋找一種方法來減少對模板的依賴,聲音更加自然,並增加詞彙量。
那麼什麼樣的數據是你的工作與,這些結果是什麼樣子?你是否想要聽起來更自然的句子,還是僅僅將詞彙混合起來? – patrick
@patrick編輯我的文章 – Stergios
這是一個相當廣泛的問題,所以我不確定它是否適合堆棧溢出。這就是說,爲什麼,特別是,你想擺脫模板?沒有更多的模板能夠幫助聽起來更自然,增加詞彙量,同時保持易維護性和可測試性? –