我正在使用boto將分佈式文件系統移動到aws simpledb中,而且我遇到了一個問題,它對我沒有明確的解決方案。我的代碼的當前狀態爲:根據內存大小拆分Python中的字典
def insert(documents):
data = {hash_doc(d): _decode(d) for d in documents if hash_doc(d)}
domain.batch_put_attributes(data)
基本上是我打的問題是最多的batch_put_attributes
功能提出AWS要求有1MB的最大尺寸。很明顯,我想盡量減少我所做的請求數量,但我也無法達到1MB的限制。
有什麼好的Python的方式從根本上說
拆分這個迭代成塊,從而均低於某一內存 大小,但數塊地
我覺得有點不包括更多的代碼,但我只是沒有找到一個可以處理這個問題的東西,我覺得應該有一個非常簡單的解決方案。
我不能想到一個簡單的解決方案。但是你是否嘗試過使用sys.getsizeof(VAR_NAME)來嘗試自己完成分塊? –