text-segmentation

    11熱度

    5回答

    我有一串不同長度和內容的字符串。 現在我正在尋找一種簡單的方法來從每個字符串中提取最後一個單詞,而無需知道該單詞的長度或字符串的長度。 類似的東西; array.each{|string| puts string.fetch(" ", last)

    3熱度

    3回答

    這是對this response和用戶發佈的僞代碼算法的後續問題。由於年齡的原因,我沒有評論這個問題。我只想驗證一個字符串是否可以分解成單詞。該算法不需要實際分割字符串。這是來自鏈接問題的響應: 設S [1..length(w)]是一個帶有布爾條目的表。如果 單詞w [1..i]可以拆分,S [i]爲真。然後設置S [1] = isWord(w [1])並且對於 i = 2到長度(w)計算 S [

    0熱度

    2回答

    可能重複: How do I display the first letter as uppercase? PHP capitalize first letter of first word in a sentence 我要首字母大寫爲一個句子和一段時間後。任何人都可以建議如何做? 例如, //I have the following in a language class. "%s needs

    6熱度

    2回答

    我想解決分詞問題(從沒有空格的長字符串中分析單詞)。 舉例來說,我們希望從somelongword到[some, long, word]之間抽取單詞。 我們可以通過字典的一些動態方法來實現這一點,但我們遇到的另一個問題是解析模糊性。即orcore =>or core或orc ore(我們沒有考慮詞組的含義或詞性)。所以我想到使用一些統計或ML方法。 我發現樸素貝葉斯和維特比算法與火車集可用於解決這

    1熱度

    3回答

    我有一個基本上包含段落的字符串。可能會有換行符。 現在我想只得到字符串中的第一個句子。 我想我會嘗試 indexOf(". ") 是有空間的一個點。 問題是,雖然在諸如firstName. LastName之類的行上這不起作用。 我正在使用.Net。有沒有一種好的方法可以實現這一目標?我也標記Java,看看我是否可以縮小我的搜索範圍。

    10熱度

    8回答

    我一直在使用 explode(".",$mystring) 拆分成段的句子。但是這不包括以不同的標點符號結尾的句子,例如! ? :; 有沒有使用數組作爲分隔符而不是單個字符的方法?另外還有另一種使用各種標點符號的簡單方法嗎? 我試圖 explode(("." || "?" || "!"),$mystring) 希望,但它沒有工作...

    3熱度

    3回答

    我試圖從使用python中的正則表達式的段落中提取句子。 通常,我正在測試的代碼正確地提取了該語句,但是在下面的段落中該句子沒有正確提取。 段落: 「但是,在瘧疾感染和敗血症,樹突狀細胞在整個身體都集中在提醒免疫系統,以防止它們從檢測和響應任何新的感染的情況下,」 一種新型疫苗? 代碼: def splitParagraphIntoSentences(paragraph): import re

    6熱度

    2回答

    假設我有一個字符串text = "A compiler translates code from a source language"。我希望做兩件事情: 我需要通過每個字進行迭代,並使用NLTK庫幹。阻止的功能是PorterStemmer().stem_word(word)。我們必須通過「單詞」這個論點。我怎樣才能解決每個單詞並找回句子? 我需要從text字符串中刪除某些停用詞。包含停用詞列表存

    1熱度

    1回答

    我想寫一個將經歷一段文本並給我一次一句話的枚舉器。我試着用NSStringEnumerationBySentences使用stringEnumerate,但只是看期間和失敗。例如,可以說我有以下的文本塊: 「參議員約翰·博納A.決定不往前走他也決定不叫國會新聞記者雖然說......。」 我想我的功能,打破上面的段落在下面的句子: 參議員約翰·博納A.決定不繼續前進 他還沒有決定噸至調用大會(無第三

    1熱度

    1回答

    我需要找到一種方法來取出一個句子並刪除除第一個單詞之外的所有單詞。 如果一句話就是「大家好,我的名字是野狗」 我需要得到只有兩個字「你好」