我擁有大約2100000行的數據。完全進口所花費的時間約爲2分鐘。對於表中的任何更新,我使用增量導入來索引更新。增量導入需要6分鐘的時間。solr中delta導入的效率方面
考慮到效率方面,最好進行全面導入而不是增量導入。那麼,三角洲進口的需求是什麼?有沒有更好的方式來使用增量導入來提高效率?
我按照documentation中的步驟操作。
數據-config.xml中
<dataConfig>
<dataSource type="JdbcDataSource" driver="com.dbschema.CassandraJdbcDriver" url="jdbc:cassandra://127.0.0.1:9042/test" autoCommit="true" rowLimit = '-1' batchSize="-1"/>
<document name="content">
<entity name="test" query="SELECT * from person" deltaImportQuery="select * from person where seq=${dataimporter.delta.seq}" deltaQuery="select seq from person where last_modified > '${dataimporter.last_index_time}' ALLOW FILTERING" autoCommit="true">
<field column="seq" name="id" />
<field column="last" name="last_s" />
<field column="first" name="first_s" />
<field column="city" name="city_s" />
<field column="zip" name="zip_s" />
<field column="street" name="street_s" />
<field column="age" name="age_s" />
<field column="state" name="state_s" />
<field column="dollar" name="dollar_s" />
<field column="pick" name="pick_s" />
</entity>
</document>
告訴我們dih config – Persimmonium
我更新了問題。 –
您的deltaquery返回多少行?如果您在Solr之外運行deltaquery,運行多長時間?這聽起來像你的deltaquery不是很優化(即沒有適當的索引等) – MatsLindh