parsey-mcparseface

    5熱度

    3回答

    我擁有數十萬份法律文件(主要來自歐盟)的法律文件 - 法律,評論,法庭文件等。我試圖通過算法對其進行一些理解。 我已經建模了已知的關係(時間,this-changes-that等)。但是在單文檔層面上,我希望我有更好的工具來允許快速理解。我很樂意提供想法,但是這裏有一個更具體的問題: 例如:是否有NLP方法來確定與樣板文件相關/有爭議的部分?最近泄露的TTIP論文有成千上萬張帶有數據表的頁面,但在