我正在調查分塊我的數據源優化數據導入到solr,並想知道是否有可能使用分段數據的主要URL。Solr DataImportHandler Chunked UrlDataSource
例如文件1可以
<chunks>
<chunk url="http://localhost/chunker?start=0&stop=100" />
<chunk url="http://localhost/chunker?start=100&stop=200" />
<chunk url="http://localhost/chunker?start=200&stop=300" />
<chunk url="http://localhost/chunker?start=300&stop=400" />
<chunk url="http://localhost/chunker?start=400&stop=500" />
<chunk url="http://localhost/chunker?start=500&stop=600" />
</chunks>
與每個塊的URL導致類似
<items>
<item data1="info1" />
<item data1="info2" />
<item data1="info3" />
<item data1="info4" />
</iems>
我與500+萬條記錄工作,所以我認爲,數據將需要被分塊以避免內存問題(在使用SQLEntityProcessor時遇到這個問題)。我也想避免500+百萬網頁請求的,可以讓貴我覺得