我使用CouchDB存儲抓取的網站。例如:在couchdb中管理大陣列
{
"_id": "doc-http:80-example.com/2012/09/",
"_rev": "2-532ce885cdb56261cb6d21903cd74c56",
"contentType": "text/html; charset=UTF-8",
"lastModified": "2013-11-22T17:41:33.471Z",
"schema": "document",
"hostname": "example.com",
"uri": "/2012/09/",
"port": 80,
"protocol": "http:",
"source": [
"http://example.com/page/1",
"http://example.com/page/2",
],
"_attachments": {
"content": {
}
}
}
「source
」元素是存儲鏈接到該特定網頁的所有網頁的陣列。該數組可以非常快速地增長,我不想每次只添加一個鏈接時都將GET和PUT整個文檔。
是否可以更新文檔和插入另一個鏈接源,而無需重新發送整個「source
」?