我希望你能幫我創建一個算法。 我需要的是從人類輸入的字符串中提取數據(某人並不在意我必須這樣做)。在這個字符串中他提出了語言要求。數據已經存在,所以要求用戶輸入正確的信息已經太晚了。字符串可能看起來像這樣:從非常可變的字符串中提取數據
"English good arabic good german basic knowledges"
"good in english, a little bit german"
"english, german"
"english - very good, german - preferred"
現在我只想關注德語結尾英語在這裏。我想知道他們是否需要,以及如果可能的話,多少(可能是一個等級形式 - 「知道一點點」到5--「完美無缺」)
I想到一種算法將字符串分解爲單詞(這不是問題),然後循環遍歷它們,檢測這個單詞是指德語還是英語(可能通過一些正則表達式,如/(deu|ger)/Ui
和/(eng)/Ui
),然後獲得需求的級別棘手的部分),它應該放在下面或之前的詞語中(或者根本不存在)。
對於如何創建這樣的功能你有什麼想法嗎?
它應該運行在PHP7順便說一句,但它是關於算法的想法在這裏,而不是實現(還)。
更好的給力一致的輸入不是試圖破譯任何可以想象的組合。 – AbraCadaver
可悲的是太遲了。數據庫已經填滿。它不一定非常完美。如果可能,我只是想檢測。 –