2011-03-23 46 views
2

我計劃參加在印度舉辦的項目導向的高級夏季研討會,內容涉及自然語言處理。 在研討會開始之前,我必須從以下四個方面中選擇一個項目,而這些方面我對這方面的知識有限。我應該選擇哪些項目參加夏季NLP培訓班?

機器翻譯開發一個英語和印度語翻譯 系統。

解析構建印度語言(IL)解析器。

形態分析開發和測試形態分析器爲 印度語言。

語音口語對話系統,出於情感/韻律檢測,合成 和轉換

我已在人工智能課程而NLP引入和基本的子主題,如詞性標註(轉型學習),使用N-gram的詞預測,隱馬爾可夫模型,維特比算法,自然語言分析,上下文無關語法,CKY算法

我明白這是一個稍微模糊的問題,並選擇將主要依賴於我的興趣,但希望哪個區域將在研究範圍,實際應用中,行業機會等

方面更好的指導編輯:在NLP以外的項目中工作時獲得的技能/經驗的應用也將成爲決定的一個因素。

回答

2

讓我們首先將四個選項分組爲一個類別中的前三個-NL-文本和另一個-NL-語音中的四個選項,因爲追求這些選項所需的技能和傾向稍有不同。 所以首先使用你喜歡在第一組或第二組工作的標準。一旦你完成了,你選擇語音。你完成了。 但是,如果你在另一邊,現在有兩類MT和剩餘的MA和IL解析。建立一個MT將着重於使用現成的組件,並使它們適應你的語言對。如果你應該統計數據,那麼在數據方面就更少了,你並沒有獲得太多的收穫,我的意思是學習/工作和其他兩種方法一樣。如果這是基於規則的,那麼很少有人把它變大 - 但是你會學到很多。構建一個IL語法分析器是一個不錯的選擇,對於未來的任務來說可能很有用,因爲在IL中有大量數據,文本處理行業將蓬勃發展。所以考慮未來的行業範圍考慮我的+1。形態分析也是一樣。

+0

感謝Prakash,這真的縮小了我的選擇範圍。我對Speech沒有特別的經驗,所以會避免這種情況。 關於MA,我只懂一種印度語言(印地語),我在這裏實習的研究中心已經建立了一個形態分析儀。根據我的理解,你必須熟練掌握MA的語言,所以MA也是一樣。我對這個演繹是否正確? – 2011-04-01 09:07:42

+0

是的相當真實。深入理解語言和它的語法是非常必要的。另外請考慮研究市場上的工作機會,因爲最終你會投入一個夏天的時間。祝你好運。 – 2011-04-15 08:38:01

0

我個人認爲他們都非常實際和相關,它歸結爲您的個人利益。我個人去發言,因爲它似乎是四個最廣泛的(相對無限的改進空間),所以研究範圍非常有趣。如果您更喜歡針對更具體的應用,那麼解析和機器翻譯似乎就是一種方法。

祝你好運,無論你選擇什麼,這看起來像一個驚人的機會和一個巨大的挑戰。

4

我會去形態分析儀。形態分析器是用有趣的單詞結構來做任何NLP語言的先決條件,並且有很多很多的語言在那裏幾乎沒有工作完成。爲你熟悉的語言建立一個良好的形態分析器是一個合理的暑期項目,所以你可能會走出研討會,建立一個有用的軟件,其他人會喜歡。

其它區域更熱的話題這些天,可能會更好看你的簡歷,但他們也更開放式的,是一個相對的初學者做出任何真正的貢獻更難。

+2

+1 - 我的經驗對應rmalouf's - 由於你的夏天是有限的,建立一個形態分析器可以讓你的手迅速變髒;其評估和調試周期將是最短的;另外,您的經驗也可能會在以後在NLP內部或外部的其他領域爲您服務 - 自動機和HMM(兩種用於形態分析的常用工具)都是其他任務的常用工具。 – 2011-03-24 08:58:09

+0

感謝您的指導。我想澄清的一點是,儘管夏季學期爲2周,但我仍然可以選擇在夏季學校之後繼續進行該項目。此外,正如你所建議的,我正在尋求在一個可能服務於NLP內部或外部領域的經驗。 – 2011-03-24 10:53:15

0

首先我不知道印度人。根據你所學到的子主題,解析將是一個更好的選擇。然而,對於許多語言來說,句法分析高度依賴於形態分析。和英語不同,許多語言都有複雜的形態。此外,對於很多語言來說,在三個月內既不需要編寫解析器也不需要從頭開始編寫形態分析器。

所以,如果印度形態不復雜,去分析儀。這是NLP的基本水平,你會學到很多東西。如果它非常困難,並且有足夠的分析器可用於分析項目,那麼可以使用解析器。

最後,您可以選擇解析器或分析器,減少目標或項目並按時完成。例如,不要試圖編寫一個完整的分析器,而是嘗試編寫一個僅用於屈折後綴的分析器。

順便說一句stemmer怎麼樣?

相關問題