什麼是最有效的方法或工具來隨機化數據庫表列以隱藏敏感信息?如何清理或隨機化敏感數據庫字段
我有一個Django應用程序被幾個客戶使用,我需要在開發承包商的工作上做一些工作。當他們處理錯誤時(例如,頁面/ admin/model/123有錯誤),理想情況下他們需要客戶端數據庫的快照以重現和修復錯誤。但是,由於他們是非現場承包商,我想在他們公開客戶數據庫(無意或無意)的情況下降低風險。我不想向客戶解釋爲什麼他們的所有數據都是在網上發佈的,因爲外國合同商將他的筆記本電腦留在未上鎖的汽車中。
爲此,我想查找或編寫一個工具來「隨機化」數據庫中的敏感字段,如用戶名,電子郵件地址,帳號,公司名稱,電話號碼等,以便數據得到維護,但所有個人身份信息都被刪除。
可能這是許多其他人不得不做的任務,但我不確定技術術語是什麼,所以我沒有通過Google找到太多東西。是否有任何現有工具可以通過運行MySQL或PostgreSQL後端的Django應用程序來執行此操作?
這可能適用於簡單的字段,但這不適用於更復雜的字段,如地址,電話號碼或帳戶號碼需要匹配特定的格式,但仍然是全球唯一。 – Cerin