我不確定是否已正確理解Term Vectors API。「期限矢量API」需要澄清
文件開始說:
返回在特定文檔領域方面的信息和統計數據。文檔可以存儲在索引中或由用戶人爲提供。術語向量是默認實時的,而不是實時的。這可以通過將
realtime
參數設置爲false來更改。
我猜,長期這裏refered什麼其他一些人也許會叫令牌?或者是term由我們在文檔中獲得的時間定義,我錯過了它?
然後將文檔說繼續有三段的返回值:期限信息,期限統計,並現場統計。我猜意思是term信息和統計信息不是這個API返回的唯一東西,對嗎?
然後期限信息包括一個名爲payloads
場,這是沒有定義,我不知道這意味着什麼。
然後在現場統計,有文檔頻率的總和與總詞頻一個相當混亂的解釋總和:
設置field_statistics爲false(默認爲true)會忽略:
文件計數(多少文件包含此字段)文件frequen的
總和資本投資者入境計劃我想他們只是總和(文檔頻率的所有方面在這一領域的總和)
合計項頻率(每學期總詞頻在這一領域的總和)
超過其在期間統計的報告的相應數值?
然後在部分行爲它說:
術語和領域的統計數據是不準確的。沒有考慮刪除的文件。該信息僅爲所請求文檔所在的分片檢索。因此,術語和字段統計信息僅作爲相對度量值使用,而絕對值在此情況下無意義。默認情況下,當請求仿真文檔的術語向量時,隨機選擇一個從中獲取統計信息的分片。僅使用
routing
才能擊中特定的分片。
那麼哪一個呢?是否實時?或者是的期限信息是實時的還是期限統計和現場統計僅僅是實際的近似值?