2011-08-08 66 views
2

搜索並摧毀/捕獲非法數據...途徑查找/控制非法數據

環境:
我管理幾個非常「開放」的數據庫。訪問類型通常是全選/插入/更新/刪除。訪問數據的機制通常是通過定製構建MS Access數據庫中的鏈接表(到SQL-Server)。

規則
沒有社會安全號碼等(例如,認爲FERPA/HIPPA)。

的問題
在用戶輸入/隱藏在創造性的方式非法數據(例如,爲ssn在中間名稱字段中,等);行政/紀律控制薄弱/無效。一般的態度(甚至從大多數老闆)是安全是一個麻煩,如果你找到一個方法,然後對你有好處,等我需要一個(更好)的方式來找到之後的數據它已被輸入。

我已經試過

起初,我所做的修改,以各種定製的用戶界面鄉親(我知道的),一路下跌到他們的鏈接表結構到我們的數據庫服務器。例如,SSN不再擁有自己的領域,等等。然而......我仍然發現他們埋在了其他數據領域。

經過祕密審計後,我所在機構的一些人做了,他們發現了這些埋藏數據,我寫了一些sql(字面上)檢查數據庫每個表中每個字段字段中的每個字符,尋找匹配ssn模式。運行需要很長時間,用戶正在尋找解決我的模式定義的方法。

我的問題
當然,真正的解決方案將需要執行政策。這必須在我的頭上解決,但是,這超出了我的立場和範圍。

您是否知道或您將使用任何針對FERPA & HIPPA數據進行審計的(免費或商業)工具? (或者,如果沒有這些政策明確,那麼一般只是數據模式?

我想找到我可以按計劃運行的東西,並一直陪着新格局的定義更新。

回答

1

我將監測對用戶來說,有兩種方式。

  1. 同樣的用戶很可能是輸入相同的數據,所以跟蹤誰是圍繞roadbloacks獲得,並識別它們,確保它們被記錄爲結垢的系統,使他們受到了適當的懲罰,他們的努力爲整個組織創造了風險(貨幣和法律,這成爲了貨幣)
  2. 查看用戶發出的查詢。如果他們成功地搜索信息,那麼它以某種方式存儲在存儲庫中。

如果您無法跟蹤用戶,請開始提供密碼。

然而,從長遠來看,您的組織需要升級其用戶。

+0

謝謝 - 我一般都同意,並通過審計表確定了誰在做這件事,但不幸的是,我能做的最多的事情就是讓他們失望 - 他們保證不再做這件事,並且我們走了。黃銅不會對此進行約束,所以除非有所改變,否則這是不可預防的。我只是*希望*有一種更簡單的方法來搜索和摧毀非法數據比我的本土解決方案...啊,呃... – Chains

+1

順便說一句 - 我沒有考慮做一個更短的搜索只是爲了數據來自某些問題用戶 - 我想這有點像反病毒「快速掃描」,而不是「全掃描」,這實際上可能會使這一點更加成立,因爲它會更快我會以這種方式抓住80%然後不要經常進行全面掃描,以便找到其餘的部分。 – Chains

+0

如果是來自問題用戶,並且您不會因此而陷入困境,只需向您的總法律顧問辦公室發送便條,詢問您對該用戶及其管理層的情況。只是要小心,它看起來並不像你在做什麼,而是在尋找公司。 :) – Iterator

1

最後,你正在爲一場不可能的戰鬥而戰,除非你得到管理層的支持。如果在您的數據庫中存儲SSN是非法的,那麼這條規則必須得到頂層的明確支持。 @Iterator是正確的,記錄誰輸入這些數據並記錄他們的行爲:實施審計跟蹤。

跨審計跟蹤搜索不是數據庫本身。這應該更快,你只有一天(或一小時或...)的數據進行搜索。每個違規記錄和發佈。

你可以加緊一些驗證。沒有數字字段我猜需要和SSN一樣長。沒有名稱字段需要數字。沒有地址字段需要更多5或6個數字(66號線上有多少房屋?)嗯電話號碼可以用來代表SSN嗎?麻煩的是你可以阻止某人進入acaaabdf等(編碼131126等),總有辦法打敗你的支票。

你永遠不會達到完美,但你至少可以抓住意外的罪犯。

1

另外一個建議:你可以發表一個新的問題,詢問你選擇的數據庫(MS Access)的機器學習插件(基本上是統計模式識別)。通過將某些數據庫更新標記爲好/差,您可能可以利用自動化工具來查找不良內容並引起您的注意。

這類似於垃圾郵件過濾器,可以找到不良內容並將其從注意力中移除。然而,爲了得到這個好的答案,你可能需要在問題中提供更多的細節,比如你有的樣本數量(如果它不是很多,那麼ML插件就沒用),你的編程技巧(用於所謂的特徵提取)等等。

儘管有這個建議,我認爲最好是針對用戶行爲,而不是建立一個更聰明的捕鼠器。