linguistics

    6熱度

    2回答

    我一直在玩Haskell大約一個月。對於我的第一個「真正的」Haskell項目,我正在編寫一個詞性標註器。作爲該項目的一部分,我有一個名爲Tag類型代表部分的詞性標記,實現如下: data Tag = CC | CD | DT | EX | FW | IN | JJ | JJR | JJS ... 以上是我已經標準化部件的詞性標記一長串故意截斷。然而,在這個標準的標籤集中,有兩個以美元符號($

    2熱度

    9回答

    我想用C語言編寫一個程序,它會要求用戶輸入一個數字,然後用英文輸出該數字。 例如: if(INPUT == 1) then print ONE if(INPUT == 2) then print TWO 等。它可以使用開關大小寫,否則它會使代碼冗長。對於少數數字,這很好,但如果我們必須寫入100,那麼它會很長。 是否有一個簡短的算法或想法呢?

    4熱度

    1回答

    我正在爲我的項目嘗試使用wordnet進行詞義消歧。作爲該項目的一部分,我想將衍生的形容詞或副詞形式轉換爲它的根名詞形式。 例如 美麗==>美 精彩==>難怪 我怎樣才能做到這一點?除了提供這種轉換的wordnet以外是否還有其他字典? 如果我可以將確切的意義上的形容詞詞語映射到名詞形式,那麼這對我來說是一個額外的好處。那可能嗎? 謝謝

    2熱度

    1回答

    我有一堆域名,我想將其分解爲單詞。我從wordlist.sourceforge.net下載wordlist,並開始編寫蠻力類型的腳本以通過字典列表運行每個域。 問題是我不能讓它產生足夠好的結果。我做的簡單腳本如下所示: foreach($domains as $dom) { $orig_dom = $dom; foreach($words as $w) { $pos

    12熱度

    2回答

    我可以非常快速地敲擊發現句子的大風扇幾個詞組合。例如,「必須讀一點維基百科」或「不想在一個麥芽瓶中纏上水溝。」 (喬治·沃茨基) 我想用Python語言編寫一個程序,使我能夠找到的單詞(或單詞的組合),可以掛接這樣說話時聽起來非常快。 我最初認爲具有高音節與字母比例的單詞是最好的,但是在編寫Python程序來找到這些單詞時,我只檢索了非常簡單的單詞,但其實並不快。 所以我在什麼實際上使話聽起來快的

    23熱度

    3回答

    我們都看到了您在使用裸機「heroku創建」將應用部署到Heroku時自動分配的有趣子域。一些例子:熾烈的霧4652,電夜4641,早霜5543,輻射河7322,等等。 看來他們都遵循形容詞 - 名詞-4數字模式(大部分)。他們只是簡單地列出一些形容詞和名詞詞典,然後在推送應用程序時隨機選擇它們的組合?是否有一個Ruby的寶石完成了這一點,或許提供了一個可以通過詞類進行搜索的字典,或者這是手動完成

    9熱度

    2回答

    語言語法樹的輸入是之一: (1)樹的括號內表示與諸如標記內部節點: (S (N John) (VP (V hit) (NP (D the) (N ball)))) 與輸出: (是否虛線以及標題是否存在並不重要) 或輸入可以是: (2)上的話一個包圍沒有標籤,例如: ((John) ((hit) ((the) (ball)))) 具有輸出與上述相同的(沒有內部標籤。此時,正好樹結構)。 輸入

    3熱度

    1回答

    我正在尋找字典源文件格式,這是方便在通用文本編輯器(我使用Emacs)編輯,並可以存儲在版本控制(並允許輕鬆合併) 。 所以我可以分享我與其他人的字典工作。 不支持該轉換字典源索引的形式與詞典軟件文件格式,使用的工具是不可用的。 由於客戶端詞典軟件我用GoldenDict:http://goldendict.org/dictionaries.php該明白了許多索引類型的字典文件格式,但我切換到另一

    5熱度

    1回答

    有沒有免費的數據庫/地方有英文單詞的通用/使用率? (英國或美國英語,無所謂) 我不在乎確切的數字,只是相對於彼此。例如: the | 0.2 汽車| 0.08 chroma | 0.005 overspread | 0.0000007 編輯: 我發現http://en.wiktionary.org/wiki/Wiktionary%3aFrequency_lists我可以刮的數據。不過,我寧願一個

    2熱度

    2回答

    我正在寫一段代碼在C++中,我需要一個字到音節轉換器是否有任何開源的標準算法可用或任何其他的鏈接,可以幫助我建立一個。 for a word like invisible syllable would be in-viz-uh-ble 它應該是理想的,甚至可以解析複雜的詞,如「隱形」。 我已經找到了一個鏈接到一個Perl和Python的算法,但我想知道是否有庫是在C++中 非常感謝。