2013-10-04 28 views
0

我想知道是否有可能編寫一個PHP腳本,通過一個非常大的數據集(1億+)來嘗試查找數據集中的特定字符串?檢測是否存在,然後自動處理

如果可行的話,它是否是在數據集中識別關鍵字的有效形式?

如果沒有處理,通過這些大型數據集更好的方式來嘗試的檢測字符串,我所有的耳朵

+0

一切都是可能的編程。 – vikingmaster

+0

這是一個有趣的問題,但很廣泛,可能很快就會關閉。你能指定一些關於約束條件,文件類型,數據庫連接等的信息。 –

+0

是的Sébastien,我被一位Google代表詢問,試圖找到檢測和自動處理谷歌違反策略的方法。例如,如果有人將版權內容放入他們的Google Adwords內容中。現在據我所知,谷歌使用BigTable作爲他們的數據庫,所以我認爲所有的數據都在這個數據庫中。如果你有更好的方式,除了使用腳本,正如我所說的那樣,所有的耳朵! – Ciaran

回答

2

那麼像傑瑞說,一切皆有可能的編程。

我通過Hadoop,MapReduce等處理大量數據。

相關問題