有沒有一種方法可以搜索不刪除標點符號的網頁?例如,我想搜索window.window-> window(是的,我其實是這樣做的,這是一個mozilla插件中的結構)。我認爲這是一個相當罕見的字符串。代碼相關的網頁搜索
不幸的是,Google,Bing,AltaVista,Yahoo和Excite都刪除了標點符號,只顯示任何帶有「window」的字詞。根據Google的說法,至少在他們的網站上,沒有圍繞IT的方式。
一般來說,搜索代碼塊必須很難爲此...任何人都有任何提示?
有沒有一種方法可以搜索不刪除標點符號的網頁?例如,我想搜索window.window-> window(是的,我其實是這樣做的,這是一個mozilla插件中的結構)。我認爲這是一個相當罕見的字符串。代碼相關的網頁搜索
不幸的是,Google,Bing,AltaVista,Yahoo和Excite都刪除了標點符號,只顯示任何帶有「window」的字詞。根據Google的說法,至少在他們的網站上,沒有圍繞IT的方式。
一般來說,搜索代碼塊必須很難爲此...任何人都有任何提示?
google codesearch("window.window->window"但它似乎並沒有得到任何相關的結果了這個請求的)
有類似的工具遍佈像codase或koders互聯網,但我不知道他們讓你準確地搜索這個字符串。無論如何,他們可能對你有用,所以我認爲他們值得一提。
編輯:這是不太可能你會找到一個通用的搜索引擎,它可以讓你搜索像「window.window->窗口」,因爲大多數搜索引擎會在文檔之前做一些處理存儲它。例如,他們可能會在內部將其表示爲詞的向量(一個vector space model),並用它來執行搜索,而不是實際的原始字符串。創建這樣一個向量涉及首先根據標點符號和其他生物切割文檔。這是一個非常複雜和有趣的主題,我不能告訴你更多的內容。自從我在學校學習後,我的糟糕記憶做得相當不錯。
順便說一句,他們可能也會對你的查詢做同樣的處理。您可能想要了解有關tf-idf的信息,這可能與谷歌和他的朋友在做什麼有關,但可以爲您提供有關查詢發生的提示的提示。
沒有辦法做到這一點,本身在主要的谷歌引擎,因爲你發現 - 但是,如果你正在尋找關於Mozilla的信息,那麼最好的辦法就是構建你的查詢更像這樣:
"window.window->window" +Mozilla
OR +XUL
+ Another search string related to what you are
trying to do.
SymbolHound是一種網絡搜索,不會從查詢中刪除標點符號。有一個選項可以搜索源代碼庫(比如現在停止使用的谷歌代碼搜索),但它也可以選擇在因特網上搜索特殊字符。 (主要是與編程相關的網站,如StackOverflow)。
這裏試試吧:http://www.symbolhound.com
- 湯姆(聯合創始人)
因爲我讀,我是不會足夠快的問題,我馬上就知道了。 ;) – 2010-02-25 20:40:24
+1很高興知道這不僅僅是搜索google託管的代碼庫(我認爲它在我看到這個名字的時候做過) – 2010-02-25 20:44:30
@我也喜歡,這就是我沒有想到的原因! – 2010-02-25 20:46:09