brat

    0熱度

    1回答

    我使用Brat軟件(http://brat.nlplab.org)來註釋我的數據。我有我的註釋文件,並希望手動更改它們,例如。刪除一些實體,編輯實體類型等。 每次進行更改,頁面重新加載大約需要5-10秒。這是因爲孩子在網絡服務器上工作(http://brat.nlplab.org/installation.html),所以當做出更改時,它會將更改後的文件上載到服務器上,然後重新加載。 我需要做一些

    0熱度

    1回答

    以下異常的原因是什麼? DOMException: Failed to execute 'getStartPositionOfChar' on 'SVGTextContentElement': The charnum provided (0) is greater than or equal to the maximum bound (0). 實際上,我試圖將https://github.co

    -2熱度

    1回答

    在Brat中,要註釋一個文本,您應該參考一個名爲'annotation.conf'的配置文件,我有超過150個標記來註釋特定於域的文本的語義和這些註釋標記的應在不同的配置文件分開,因此註釋不會分心,如果所有的標籤存儲在一個單一的「annotation.conf」文件從一個長的列表中進行選擇。 一個典型的情況是,該註釋將上傳文本,然後爲每個語句有哪些應該從我創建了組織我的語義標籤組觸發一個annot

    1熱度

    2回答

    如何在google nl api中爲語法分析開發一棵樹。像斯坦福corenlp使用小子註釋工具來生成樹。我們可以使用類似的東西爲google nl api生成json響應的依賴分析樹,如果是這樣的話? 感謝提前:)

    3熱度

    1回答

    這是一個自我回答的問題,它描述瞭如何解決安裝brat annotation tool時出現的問題,該問題用於創建用於NLP的註釋語料庫,一臺啓用了SELinux的普通Linux機器。這是基於該工具的1.3版本。 安裝過程如documented包括以下步驟: 拆開.tar.gz文件在(Apache)的web服務器的目錄,通常/var/www/html或$HOME/public_html 可能源自br

    1熱度

    1回答

    我有一個使用brat註釋的數據。我想將.ann文件轉換爲.xml以簡化計算。 有沒有工具? 謝謝

    0熱度

    1回答

    我想註釋多個實體的標籤爲單個單詞。 在小夥子的關於"the Colorado Richly Annotated Full Text Corpus (CRAFT)"的例子中,「膠原蛋白」一詞由多個標籤註釋,如「RR」和「GC CC」。 現在,我儘量多批註實體的標籤,一個字,但小子說的錯誤與 "AnnotationError: Error [LABEL A] cannot have identical

    2熱度

    2回答

    我有170本荷蘭文學小說的語料庫,我將在其上應用命名實體識別。對於荷蘭語的現有NER標籤的評估,我想手動註釋這個語料庫的隨機樣本中的命名實體 - 爲此我使用brat。手動註釋的隨機樣本將作爲我評估NER標籤的「黃金標準」。我寫了一個Python腳本,在句子級別輸出我的語料庫隨機樣本。 我的問題是:根據每部小說的句子數量,隨機樣本的理想大小是多少?就目前而言,我每條小說使用了100個句子,但是這導致

    1熱度

    1回答

    當使用快速註釋器工具brat時,看起來創建的註釋文件將按註釋由用戶執行的順序顯示註釋。如果您從文檔的開始處開始執行註釋,那麼註釋自然會處於正確的偏移順序。但是,如果您需要在文檔的前面添加另一個註釋,則輸出.ann文件中註釋的偏移順序將失序。 怎樣才能重新排列.ann文件,使得註釋在完成時按偏移順序排列?在小朋友面前有什麼選擇可以讓你做到這一點,還是人們必須編寫自己的腳本來執行?