2011-12-25 21 views

回答

4

它分割一個字分爲兩個部分:stemend。有三種情況:

  1. 字結尾ss(甚至更多s):stem <- wordend <- ""
  2. 這個詞用單s結束:stem <- word without "s"end <- "s"
  3. 這個詞不s結束:stem <- wordend <- ""

這是通過使用正則表達式,其捕獲完成全字(由於^....$)。第一部分(即stem)包含儘可能多的結尾爲ss.*ss)或儘可能少的部分(.*?)。然後可能結束s被認爲是end部分。

請注意,在第一種情況下(儘可能多地以ss結尾),end零件不會有額外的s