2012-01-01 107 views
-1

我有很長的單詞,例如:如何將長單詞分成單詞?

welcometostackoverflow 

betweenparagraphs 

如何獲得字符串或數組像這樣在PHP?

Welcome to Stack Overflow 

between paragraphs 

樣品結果: http://www.bing.com/images/search?q=betweenparagraphs&go=&qs=n&sk=&form=QBIR

+2

你不能,不只是正則表達式。您需要一個字典文件/數組來分割,即使如此,Stack和Overflow上的大寫也不會適用,以及其他許多問題。這很難做,我感覺到[XY問題](http://meta.stackexchange.com/questions/66377/what-is-the-xy-problem)。爲什麼你需要像這樣分割一個字符串? – Bojangles 2012-01-01 14:10:28

+0

@JamWaffles謝謝你的建議.. 我需要拆分長單詞才能生成唯一的關鍵字。 嘗試搜索bing中關鍵字「welcometostackoverflow」的圖片 – tanyadong 2012-01-01 14:19:02

+2

嘗試在bing處搜索關鍵字「welcometostackoverflow」的圖像......這是可行的,因爲搜索引擎可以識別熱門關鍵字和熱門搜索詞組。否則,正如@Asif所說,沒有辦法確定像「溢出」這樣的詞是「溢出」,「溢出」還是「低於」。搜索引擎通常理解,在這種情況下,它更可能是「溢出」而不是任何其他選擇。但是他們沒有辦法100%確定。 – 2012-01-01 14:27:07

回答

6

這幾乎是不可能的,因爲你的代碼無法知道一個字結束。即使有字典,也會有不明確的情況。

+0

嘗試在bing處搜索關鍵字「welcometostackoverflow」的圖像 – tanyadong 2012-01-01 14:13:05

+2

如果你是一個搜索引擎,你將擁有一個足夠大的可重寫字典,它可以幫助你,猜測用戶想要寫什麼。 – rekire 2012-01-01 14:28:33

+0

他有機會獲得這樣的機會有多大? ;) – ThiefMaster 2012-01-01 14:32:34

0

簡單..你不能這樣做,即使在數組或文件或其他東西的大量樣本單詞收集。

的原因是:

  1. 你輸入的字符串,因爲我以爲不會 welcometostackoverflow每次。
  2. 這將導致大模糊不清的情況。的情況。

    例如: 溢出:這可能是overflowoverflowlow ..

+0

bing和其他高級搜索引擎_may_使用排列和組合在非常高的水平,加上_relevant data_和_last搜索_ – Asif 2012-01-01 14:24:10

+0

高級別的比較並不意味着它不可能做到,謝謝Asif。 – tanyadong 2012-01-01 14:30:40

+0

off_sourse在編程中_impossible_的可能性非常小,但我只是試圖詳細說明你的bing建議。 – Asif 2012-01-01 14:34:20